OpenAI發布全新生成式 AI 模型GPT-4o：語音對話更流暢，免費提供

分類：科技

瀏覽數：9694

2024-05-14

it之家 5 月 14 日消息，openai 宣布推出其最新旗艦生成式 ai 模型 gpt-4o，該模型將在未來幾周內分階段集成至 openai 的各個產品之中。最讓人驚喜的是，gpt-4o 將免費提供給所有用戶使用。

openai 首席技術官穆里・穆拉蒂 (muri murati) 表示，gpt-4o 將提供與 gpt-4 同等水平的智能，但在文本、圖像以及語音處理方面均取得了進一步提升。

“gpt-4o 可以綜合利用語音、文本和視覺信息進行推理，”穆拉蒂在 openai 公司總部舉行的主題演講中表示。gpt-4 是 openai 此前的旗艦模型，可以處理由圖像和文本混合而成的信息，並能完成諸如從圖像中提取文字或描述圖像內容等任務，gpt-4o 則在此基礎上新增了語音處理能力。

gpt-4o 的運行速度將大大提升，最大亮點在於其語音交互模式採用了新技術。openai 一直致力於讓用戶通過語音與 chatgpt 進行交流，彷彿與真人對話一般。然而，之前的版本由於延遲問題，嚴重影響了對話的沉浸感。gpt-4o 則採用了全新的技術，讓聊天機器人對話的響應速度大幅提升。

it之家注意到，發布會上 openai 展示了使用 gpt-4o 進行語音對話的演示。演示者提問結束後，gpt-4o 幾乎可以即時回應，並通過文本轉語音功能進行朗讀，讓對話感覺更加自然逼真。

另一個演示展示了 gpt-4o 根據要求調整說話時語氣，gpt-4o 可以根據指令改變聲音，從誇張戲劇到冰冷機械，展現了出色的可塑性。最後，演示還展示了 gpt-4o 的唱歌功能。

以往，openai 發布新版 chatgpt 模型時，通常會將其置於付費牆之後。不過這次 gpt-4o 將免費提供給所有用戶，付費用戶則可以享受五倍的調用額度。

此外，openai 還發布了桌面版的 chatgpt 和新的用戶界面。“我們認識到這些模型正變得越來越複雜，” 穆拉蒂說道，“但我們希望用戶與人工智能模型的交互體驗能夠更加自然、輕鬆，讓用戶可以將注意力完全集中在與模型的協作上，而無需在意界面本身。”

“OpenAI發布全新生成式 AI 模型GPT-4o：語音對話更流暢，免費提供”相關視頻

科技分類資訊推薦