ChatGPT 升级多模态交互 语音文本无缝合并打破体验边界快讯
TechWeb.com.cn
2025-11-26 09:22
导读
用户无需切换模式即可同步获取语音应答、视觉呈现与文字转录服务,偏好沉浸式音频体验的用户可一键恢复旧版独立语音模式,用户通过语音提问时。
【TechWeb】11月26日消息,OpenAI 正式宣布 ChatGPT 完成重大功能迭代,将原独立的 “语音模式”(Voice Mode)全面整合至主聊天界面,实现语音与文本交互的深度融合,用户无需切换模式即可同步获取语音应答、视觉呈现与文字转录服务。
据 OpenAI 官方博文披露,此前需单独启动的语音对话功能,现已完全嵌入主聊天窗口,用户通过语音提问时,系统不仅能以自然流畅的语音回应,还可实时生成对应的地图、图表、图片等视觉内容,同时自动完成语音转文字转录。
例如用户查询旅游路线时,既能听到语音导航指引,又能同步查看界面显示的路线地图,转录文本还可随时回溯查阅,大幅提升信息获取效率。
针对不同用户的使用习惯,OpenAI 特别保留了个性化选择空间。新版本在设置菜单中增设模式切换开关,偏好沉浸式音频体验的用户可一键恢复旧版独立语音模式,兼顾了功能升级与用户习惯的兼容性。
语音
用户
模式
OpenAI
转录
1.TMT观察网遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2.TMT观察网的原创文章,请转载时务必注明文章作者和"来源:TMT观察网",不尊重原创的行为TMT观察网或将追究责任;
3.作者投稿可能会经TMT观察网编辑修改或补充。
