<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      AI有嘴了!OpenAI連發三語音模型

      0
      分享至



      昨天凌晨,OpenAI發布了三款音頻模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。

      OpenAI官網的表述是,新模型可以讓開發者構建能在用戶說話時“推理、翻譯和轉寫”的實時語音產品。三款模型已經開放給開發者測試。



      這次更新的重點在于三款模型不同場景分工。

      GPT-Realtime-2面向實時語音Agent場景,它是OpenAI首個具備“GPT-5級推理”的語音模型,可以處理復雜請求,調用工具,處理中途打斷,并在更長語音會話中維持上下文。

      GPT-Realtime-Translate面向實時語音翻譯場景,支持70多種輸入語言到13種輸出語言。

      GPT-Realtime-Whisper面向實時語音轉寫,可以在人說話時生成文本,用于字幕、會議記錄和工作流更新。

      價格也同步公布。GPT-Realtime-2按token計費,音頻輸入起價為32美元/百萬token,音頻輸出為64美元/百萬token;GPT-Realtime-Translate按分鐘計費,價格為0.034美元/分鐘;GPT-Realtime-Whisper同樣按分鐘計費,價格為0.017美元/分鐘。

      相關報道顯示,一些企業用戶包括Zillow、Priceline和德國電信在內的知名廠商已經在測試這些模型。

      這是OpenAI過去一年語音路線的一次延伸。

      2024年,OpenAI先把ChatGPT高級語音模式背后的低延遲語音能力開放給開發者;2025年8月,OpenAI推出首個正式版Gpt-Realtime,開始面向生產級語音Agent。

      今年2月,Gpt-Realtime-1.5成為上一代主力模型,用于語音Agent和客服場景。再到今天的2.0版本的三大模型矩陣,這更像Realtime產品線從體驗功能走向企業API的一次版本升級。



      01

      從對話走向執行

      先來看GPT-Realtime-2,按照OpenAI官方的說法,這是第一款具備“GPT-5級推理”的語音模型。這個模型被設計用于處理復雜請求、調用工具、處理中斷,并在更長的語音會話里保持上下文。

      這些能力對應的是語音Agent落地時最常見的問題。

      GPT-Realtime-2把上下文窗口從32K提升到128K。這個參數對長會話場景有直接意義。比如一個用戶想要針對某套房產做咨詢、或者想要改簽機票,這些場景都可能包含大量條件和多輪確認。

      上下文窗口擴大后,模型可以在更長的實時對話里保留前面出現過的限制、偏好和業務信息。

      工具調用也是這次更新里的關鍵詞。RealtimeAPI可以用于構建會調用工具的語音體驗。應用可以保持實時會話連接,連續發送音頻,接收模型事件,更新會話狀態,并把外部系統返回的結果再交給模型繼續回應。

      美國房地產信息查詢網站Zillow,成為了OpenAI官方的首批企業案例。

      OpenAI在官網中提到,Zillow正在用GPT-Realtime-2構建可以理解住房條件并安排看房的語音助手。Zillow方面表示,在最困難的對抗性測試中,經過prompt優化后,電話任務成功率從69%提升到95%,FairHousing相關合規表現也更穩定。

      Fair Housing指美國住房交易中的反歧視合規要求,房產平臺不能在買賣、租賃、貸款或經紀服務中,基于種族、宗教、性別、殘障、家庭狀況、國籍等因素區別對待用戶。

      從“能說”到“會說”,這可能是GPT-Realtime-2給予行業的最大震撼。

      Booking子公司、知名旅行優惠平臺Priceline,則代表另一類語音模型的落地場景。

      據了解,Priceline也在測試GPT-Realtime-2系列。旅游預訂的鏈條很長,用戶可能要查航班、訂酒店、調整日期、處理延誤、比較價格,還可能在境外需要翻譯。語音Agent如果能穩定接入后臺系統,就有機會把“問答”推進到“辦事”。

      OpenAI提到的另一個已知客戶是德國電信。電信行業有大規模坐席、復雜套餐、故障處理、多語言服務和賬單解釋,也是語音模型落地的天然場景。



      GPT-Realtime-2還有一個細節是可調推理強度。

      OpenAI開發者文檔提到,GPT-Realtime-2把推理能力帶入語音到語音工作流。多數生產場景可以先使用較低的推理強度,優先保證通話里的響應速度;遇到更復雜的客服、預訂、排障任務,再提高推理強度,用更多計算換取更完整的判斷。

      這個細節很重要。語音交互比文字聊天更怕停頓。用戶在電話里等待一兩秒,會明顯感到卡頓。推理越強,延遲壓力越大。在性能和響應的平衡上,不同的開發者在這個問題上會有一定取舍。。

      官方也給出了一些測試數據。OpenAI稱,GPT-Realtime-2在Big Bench Audio上比GPT-Realtime-1.5高15.2%,在Audio MultiChallenge上高13.8%。這兩個指標用于衡量模型在音頻輸入、多輪語音、復雜指令和上下文整合方面的能力。

      第二款模型是GPT-Realtime-Translate。

      按OpenAI面向開發者的示例說明,GPT-Realtime-Translate主打實時語音到語音翻譯,適合廣播、直播、電話和視頻對話。它會自動識別輸入語言,并輸出翻譯后的語音和文本。開發者只需要設定目標語言。

      這個模型支持70多種輸入語言到13種輸出語言。OpenAI稱,它可以在說話人講話時跟上節奏。開發者文檔還提到,傳統語音翻譯常常要求說話人停頓,系統等一句話結束后再翻譯;而GPT-Realtime-Translate更接近連續口譯的形態。

      OpenAI把它的場景分成兩類。

      一類是廣播式翻譯,比如直播、網絡研討會、講座、財報電話會和大型會議演講。另一類是對話式翻譯,比如呼叫中心、視頻通話和電話工作流。這兩個類別基本覆蓋了企業最愿意付費的跨語言場景:客服、教育、國際會議、內容平臺、跨境銷售和企業培訓。

      第三款模型是GPT-Realtime-Whisper。

      GPT-Realtime-Whisper強調實時流式轉寫。它可以在說話人講話時生成字幕、會議記錄和工作流更新。相比起前兩個模型,Whisper的商業門檻最低。它的價格僅為0.017美元/分鐘。

      三款模型放在一起看,OpenAI已經把實時音頻拆成了三個明確入口:GPT-Realtime-2處理語音Agent,GPT-Realtime-Translate處理跨語言溝通,GPT-Realtime-Whisper處理實時文本化。

      三者的價格、延遲要求和客戶場景都不同,奧特曼想要在差異化路線上“通吃”語音AI市場。

      02

      TTS市場卷完“聲音質量”卷“實時”

      這次發布還有一個很清楚的商業信號:OpenAI正在把語音AI能力,全面推向API市場和企業工作流。

      除了OpenAI官方提到的Zillow、Priceline和德國電信三大測試客戶,更多公司也在把這批語音模型接進自己的產品。

      比如視頻平臺Vimeo、企業知識管理工具Glean、客服軟件公司Intercom,以及面向企業語音Agent的BolnaAI,都出現在目前披露的相關案例中。

      換句話說,GPT-Realtime系列已經成為了OpenAI的一個成熟的商業化版圖,客戶覆蓋內容平臺、企業辦公、客服系統和語音Agent創業公司等多類開發者。

      OpenAI展示的是一組真實業務中的場景:AI在通話中理解需求、調用系統、翻譯語言,并把語音交互接進企業后臺。

      而這一切,正好發生在語音AI市場繼續升溫的周期里。

      過去兩年,語音AI賽道最受關注的公司之一是ElevenLabs。這家公司2022年成立,最早靠高度擬真的AI配音、聲音克隆、多語言配音和內容本地化出圈,后來又把產品往企業語音Agent延伸。今年2月,ElevenLabs宣布完成5億美元D輪融資,估值達到110億美元。

      這一估值較2025年1月的33億美元大幅上升。公司稱,這筆資金將用于全球擴張,并繼續投入情感化對話模型、配音、轉寫和AI語音Agent等方向。

      更近的動態是,ElevenLabs在近期披露,公司年化經常性收入已經超過5億美元,并公布了更多參與D輪融資的新投資方。

      其中既包括貝萊德、惠靈頓管理等大型機構,也包括英偉達、賽富時創投、德國電信等產業方。甚至演員Jamie Foxx、Eva Longoria以及《魷魚游戲》創作者黃東赫等個人投資者,也出現在這輪投資名單中。

      面對著日益增長的需求,語音AI已經不只是創作者的配音工具。影視、廣告、游戲、教育、企業培訓、無障礙服務、內容出海和電話Agent,都在消耗更自然、更便宜、更可控的機器聲音。

      Deepgram代表另一種路線。

      這家公司長期做語音識別基礎設施,客戶更多來自聯絡中心、會議、銷售、醫療、金融等高頻語音場景。近年,Deepgram開始補上文本轉語音和語音Agent接口,試圖打通語音模型的辦事場景。

      Deepgram披露的信息顯示,旗下Aura-2文本轉語音面向實時語音應用,流式延遲低于200毫秒,并支持對地址、電話號碼、字母數字組合等結構化內容做更自然的朗讀。

      它還把語音識別、語音合成、實時情緒分析、話題檢測和摘要能力,放進聯絡中心等企業場景。

      Cartesia則主打低延遲和實時交互。

      這家公司由前斯坦福AI實驗室成員創辦,技術標簽是狀態空間模型,主打更快、更低成本的實時多模態模型。

      它的語音產品Sonic系列,核心賣點是低延遲文本轉語音。Cartesia的Sonic 3文檔稱,它是一個流式文本轉語音模型,強調高自然度、準確跟隨文本和低延遲;Sonic 3支持42種語言,也支持音量、語速和情緒控制。

      在Cartesia官網上,可以看到這家公司把90毫秒低延遲作為實時對話體驗的賣點。

      這些公司共同推動了TTS市場的變化。

      早期TTS競爭主要看聲音像不像真人。之后,行業開始比多語言覆蓋、聲音克隆、情緒表達、版權授權和配音效率。

      現在,語音Agent把要求抬高了。企業不只要一個好聽的聲音,還要完整鏈路:語音識別要準,首字延遲要低,大模型要能理解上下文,工具調用要穩定,語音合成要自然,翻譯要連續,轉寫還要能進入后續工作流。

      一些行業材料也反映了這個趨勢。Deepgram在TTS對比文章中提到,面向語音Agent的文本轉語音,已經把“首段語音生成低于100毫秒”視為新的基線之一。

      在行業內都在競相卷“實時”的背景下,OpenAI最大的優勢來自模型棧。

      OpenAI可以把整個企業調用TTS的鏈路,放到同一個開發者平臺里。對開發者來說,少接幾個供應商,就少一些延遲、集成和運維成本。對企業來說,統一平臺也更容易做權限管理、日志留存、數據策略和安全審查。

      不過,OpenAI想要通吃企業語音市場,也沒那么容易。

      ElevenLabs已跑到110億美元估值、超過5億美元年化收入;Deepgram今年1月完成1.3億美元融資,估值13億美元,服務1300多家客戶;Cartesia也在2025年完成6400萬美元A輪融資,Sonic模型據稱已有1萬多客戶使用,并以90毫秒模型延遲、42種語言主打實時語音。

      OpenAI有模型棧優勢,但語音市場并不缺少強勢玩家。



      奧特曼對這次發布的公開表態很短。他在X上稱,GPT-Realtime-2進入API是“相當大的一步前進”,同時OpenAI還在繼續改進ChatGPT里的語音體驗。

      只是從各大企業用戶爭相測試的情況來看,OpenAI的新一代語音模型,足以讓人期待他在接下來這一年的市場表現。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      阿斯麥CEO慌了!ASML遭中方禁售,臺積電拒購2nm光刻機,反制猝不及防

      阿斯麥CEO慌了!ASML遭中方禁售,臺積電拒購2nm光刻機,反制猝不及防

      Thurman在昆明
      2026-05-09 01:00:31
      濃煙滾滾!上海一小區突發,車輛瞬間被火焰吞噬

      濃煙滾滾!上海一小區突發,車輛瞬間被火焰吞噬

      看看新聞Knews
      2026-05-08 16:52:59
      海參崴的街頭,誰在出賣我們的歷史尊嚴?

      海參崴的街頭,誰在出賣我們的歷史尊嚴?

      迷世書童H9527
      2026-05-07 14:55:09
      烏克蘭擊沉里海艦隊導彈艦!摧毀全俄最大的兩座煉油廠

      烏克蘭擊沉里海艦隊導彈艦!摧毀全俄最大的兩座煉油廠

      項鵬飛
      2026-05-08 19:30:06
      瀏陽煙花廠事故升級!26人死亡變成37人,網友:煙花爆竹該清除了

      瀏陽煙花廠事故升級!26人死亡變成37人,網友:煙花爆竹該清除了

      火山詩話
      2026-05-08 18:13:12
      外媒:“絕對不可能”!中方已可以制造出足以進行核聚變的超級鋼

      外媒:“絕對不可能”!中方已可以制造出足以進行核聚變的超級鋼

      混沌錄
      2026-05-08 22:29:16
      五一旅游收入排名,河南381億第二,北京跌出前五,第一實至名歸

      五一旅游收入排名,河南381億第二,北京跌出前五,第一實至名歸

      有范又有料
      2026-05-08 11:27:59
      打回身價!里夫斯31+6創新高解鎖500分里程碑 險被SGA夾傷胳膊

      打回身價!里夫斯31+6創新高解鎖500分里程碑 險被SGA夾傷胳膊

      醉臥浮生
      2026-05-08 12:23:05
      《百年孤獨》揭開的人性真相:陪你到老的從來不是血緣與愛情,而是內心深處的這兩種力量

      《百年孤獨》揭開的人性真相:陪你到老的從來不是血緣與愛情,而是內心深處的這兩種力量

      心理觀察局
      2026-05-08 08:49:13
      拉橫幅真管用!中超第二位下課主帥誕生,鄧卓翔再次復出救火

      拉橫幅真管用!中超第二位下課主帥誕生,鄧卓翔再次復出救火

      體壇鑒春秋
      2026-05-08 17:06:34
      難怪中方遲遲不表態,美媒道出扎心真相:原來中方早看不上我們了

      難怪中方遲遲不表態,美媒道出扎心真相:原來中方早看不上我們了

      十夏九漓
      2026-05-08 14:56:10
      “4只皮皮蝦1035元”店主事發次日病逝,年僅43歲;家人稱其有基礎病,事發前已腦出血,店鋪收到多起威脅電話,不打算繼續開業

      “4只皮皮蝦1035元”店主事發次日病逝,年僅43歲;家人稱其有基礎病,事發前已腦出血,店鋪收到多起威脅電話,不打算繼續開業

      揚子晚報
      2026-05-08 12:46:41
      馬來西亞與中國決裂,轉向日本,361億賠償引發熱議!

      馬來西亞與中國決裂,轉向日本,361億賠償引發熱議!

      橙色書卷
      2026-05-06 21:19:04
      80年代經典游戲機復活,預裝25款游戲

      80年代經典游戲機復活,預裝25款游戲

      熱搜摘要官
      2026-05-08 00:06:45
      現役球員季后賽總得分TOP6,只有哈登沒有總冠軍

      現役球員季后賽總得分TOP6,只有哈登沒有總冠軍

      懂球帝
      2026-05-08 11:07:06
      伊朗15枚導彈越海峽,阿聯酋被迫亮牌,中國激光炮守防線

      伊朗15枚導彈越海峽,阿聯酋被迫亮牌,中國激光炮守防線

      老做體育解說
      2026-05-07 21:15:59
      風向突變!巴拉圭總統竄臺惹大禍,島內慌了,大陸反擊超乎預想

      風向突變!巴拉圭總統竄臺惹大禍,島內慌了,大陸反擊超乎預想

      墜入二次元的海洋
      2026-05-08 14:38:41
      中國臺北3-2瑞典晉級:下輪戰日本,能否為“祖國母親”掃清阻力

      中國臺北3-2瑞典晉級:下輪戰日本,能否為“祖國母親”掃清阻力

      銜春信
      2026-05-09 00:25:58
      紫牛頭條 | 網購時發現所在街道被“拉黑”,商家稱該片地址惡意退貨的人太多

      紫牛頭條 | 網購時發現所在街道被“拉黑”,商家稱該片地址惡意退貨的人太多

      揚子晚報
      2026-05-08 09:48:44
      中國女子在挪威被捕被指控收集衛星數據 外交部:堅決反對任何對中方的無端指責和惡意抹黑

      中國女子在挪威被捕被指控收集衛星數據 外交部:堅決反對任何對中方的無端指責和惡意抹黑

      每日經濟新聞
      2026-05-08 22:49:23
      2026-05-09 01:47:00
      字母榜 incentive-icons
      字母榜
      讓未來不止于大。
      2443文章數 8062關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      外籍銀行高層在香港豪宅性虐及殺害兩女子 內幕解密

      頭條要聞

      外籍銀行高層在香港豪宅性虐及殺害兩女子 內幕解密

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      估值3000億 DeepSeek尋求500億元融資

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態度原創

      藝術
      健康
      數碼
      教育
      手機

      藝術要聞

      砸22億!OPPO在東莞建了一批“O字樓”

      干細胞能讓人“返老還童”嗎

      數碼要聞

      華碩京東重磅新品日,華碩天選7系列游戲本開啟預約

      教育要聞

      摒棄打壓式教育,皮格馬利翁效應

      手機要聞

      小米超大屏旗艦殺回來了!小米17 Max入網配置全曝光,價格很香

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 色一情一乱一伦一区二区三区| 午夜电影在线观看国产1区| 日韩a在线播放| 人妻夜夜爽天天爽一区| 欧美老肥妇性疯狂视频| 亚洲国产中文在线二区三区免 | 亚洲老汉色| 一区一区二级毛片免费| 加勒比久久AV| 亚洲AV日韩AV高潮潮喷无码| 欧美天天拍在线视频| 亚洲区综合中文字幕日日| 国产最新网址| 国产免费拔擦拔擦8x高清在线人| 色悠久久久久综合欧美99| 亚洲丁香婷婷久久一区二区| 美女色在线观看| 亚洲成色www久久网站夜月| 日韩a一级理论电影| 日韩精品亚洲不卡一区二区| 天堂a无码a无线孕交| 国内精品久久久久国产盗摄| 99精品日本二区留学生| av综合亚洲一区二区| 国产19p| 天天日天天爽| 无码精品人妻一区二区三区av | 亚洲精品国产摄像头| 欧美 亚洲 国产 视频 小说| 成人网站亚洲综合久久| 国产精品无遮挡一区二区| 亚洲丝袜精品在线视频| 精品无码视频| 国产女人18水真多毛片18精品 | 伊人天堂网| 92在线精品视频在线播放 | 免费A片在线视频网| 亚洲国产精品嫩草影院| 久久久久久综合网天天| 97超碰人人| 欧美熟妇|