要實現電話通話,至少需要以下幾個關鍵能力:語音識別;語音合成;3、實時交互;這些技術OpenAI都有了,現在就看最終的產品了。
OpenAI 似乎正在努力在 chatGPT 中實現電話通話。這可能是周一宣布的活動的一小部分,這一點從OpenAI網站一些后臺代碼就可以發現
現在,OpenAI 也已配備了 webRTC 服務器來實現這一目標,這些服務器最近也進行了配置
起初大家以為webrtc被用于他們的純語音模式,但事實證明那是由Livekit完成的
早就2月份,OpenAI前開發者關系負責人就提及,ChatGPT的終極形態不是聊天,看起來和現在的信息對應上了
要實現電話通話,至少需要以下幾個關鍵能力:
1、語音識別 - 將語音信號轉換為文本
2、語音合成 - 將文本轉換為自然語音輸出
3、實時交互 - 能夠在通話過程中實時處理對方的語音輸入并作出響應
這些技術OpenAI都有了,現在就看最終的產品了
OpenAI語音技術負責人也轉發了周一發布會的推文