品玩5月8日訊,據9to5Mac 報道,OpenAI正式發布三款全新的實時語音模型,旨在為開發者解鎖新一代語音應用形態。此次發布的模型分別為GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,分別針對推理對話、實時翻譯和語音轉錄三大核心場景。
其中,GPT-Realtime-2是首款具備GPT-5級推理能力的語音模型,能夠在保持對話流暢的同時處理復雜請求、調用工具并應對用戶打斷。GPT-Realtime-Translate支持將70多種輸入語言實時翻譯為13種輸出語言,且能跟上說話者語速。GPT-Realtime-Whisper則專注于低延遲流式轉錄,實現邊說邊轉文字,適用于即時字幕與會議記錄。
三款模型均已集成至Realtime API。定價方面,GPT-Realtime-2音頻輸入為每百萬Token 32美元,輸出為64美元;翻譯與轉錄模型則分別按每分鐘0.034美元和0.017美元計費。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.