FOREXBNB獲悉,在首次公開展示將近七個月後,OpenAI正式針對廣大付費用戶推出ChatGPT類人高階人工智慧(AI)語音助理的新功能,即時視訊對話。在周四的直播中,該公司表示,ChatGPT類似人類的對話功能Advanced Voice Mode正在實現。Advanced Voice由OpenAI的多模態模型GPT-4o支援。

OpenAI宣告,在ChatGPT的行動端應用程式App中,上線ChatGPT高級語音模式Advanced Voice的視訊和分享螢幕功能,即使用ChatGPT應用程式,訂閱ChatGPT Plus、 Team或Pro的用戶可以將他們的手機指向對象,並讓ChatGPT近乎即時地回應。

OpenAI的研究員在直播中示範了任何運用新功能,點選ChatGPT 聊天欄旁邊的語音圖標,然后點選左下角的视频图标,就可以啟動視訊對話。如果想共享螢幕,手机用户要點選打开一个有三个喧嚣的菜单,選擇其中的“共享螢幕”。Advanced Voice可以透過螢幕分享來理解裝置螢幕上的內容。例如,它可以解釋各種設定選單,或對數學問題給予建議。

OpenAI表示,大多數ChatGPT Plus和 Pro套餐的訂閱用戶以及所有Team用戶都將可以在今後幾天內透過ChatGPT的App造訪週四推出的新功能,預計歐盟、瑞士、冰島、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用戶也將很快可以運用新功能。ChatGPT的企業版和教育版Enterprise和Edu將於明年1月上線新功能。

Advanced Voice已經被推遲了好幾次,據報道部分原因是OpenAI在產品準備就緒之前就宣布了這項功能。今年4月,OpenAI承諾,“Advanced Voice”將在“幾週內”向用戶推出。幾個月後,該公司表示需要更多時間。

OpenAI在6月末向一小批Plus計劃用戶推出此語音模式,6月又宣布延後一個月發布,以便確保該功能安全有效地處理來自數百萬用戶的請求。當時OpenAI稱,計劃今年秋季讓所有Plus使用者都可以存取該功能,確切的時間表取決於是否達到內部對安全性和可靠性的高標準。7月末,OpenAI對有限的部分付費Plus用戶推出高級語音模式下的ChatGPT,稱语音模式无法模仿他人的说话方式,並且增加了新的過濾器,確保軟體能夠發現並拒絕某些生成音樂或其他形式受版權保護音訊的請求。

另外,Google(GOOGL.US)和Meta(META.US)等競爭對手也在為各自的聊天機器人產品開發類似的功能。本週,Google推出了实时视频分析对话式人工智能功能Project Astra,供一群“值得信賴的測試者”使用。