<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      AI有嘴了!OpenAI連發三語音模型

      0
      分享至



      昨天凌晨,OpenAI發布了三款音頻模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。

      OpenAI官網的表述是,新模型可以讓開發者構建能在用戶說話時“推理、翻譯和轉寫”的實時語音產品。三款模型已經開放給開發者測試。



      這次更新的重點在于三款模型不同場景分工。

      GPT-Realtime-2面向實時語音Agent場景,它是OpenAI首個具備“GPT-5級推理”的語音模型,可以處理復雜請求,調用工具,處理中途打斷,并在更長語音會話中維持上下文。

      GPT-Realtime-Translate面向實時語音翻譯場景,支持70多種輸入語言到13種輸出語言。

      GPT-Realtime-Whisper面向實時語音轉寫,可以在人說話時生成文本,用于字幕、會議記錄和工作流更新。

      價格也同步公布。GPT-Realtime-2按token計費,音頻輸入起價為32美元/百萬token,音頻輸出為64美元/百萬token;GPT-Realtime-Translate按分鐘計費,價格為0.034美元/分鐘;GPT-Realtime-Whisper同樣按分鐘計費,價格為0.017美元/分鐘。

      相關報道顯示,一些企業用戶包括Zillow、Priceline和德國電信在內的知名廠商已經在測試這些模型。

      這是OpenAI過去一年語音路線的一次延伸。

      2024年,OpenAI先把ChatGPT高級語音模式背后的低延遲語音能力開放給開發者;2025年8月,OpenAI推出首個正式版Gpt-Realtime,開始面向生產級語音Agent。

      今年2月,Gpt-Realtime-1.5成為上一代主力模型,用于語音Agent和客服場景。再到今天的2.0版本的三大模型矩陣,這更像Realtime產品線從體驗功能走向企業API的一次版本升級。



      01

      從對話走向執行

      先來看GPT-Realtime-2,按照OpenAI官方的說法,這是第一款具備“GPT-5級推理”的語音模型。這個模型被設計用于處理復雜請求、調用工具、處理中斷,并在更長的語音會話里保持上下文。

      這些能力對應的是語音Agent落地時最常見的問題。

      GPT-Realtime-2把上下文窗口從32K提升到128K。這個參數對長會話場景有直接意義。比如一個用戶想要針對某套房產做咨詢、或者想要改簽機票,這些場景都可能包含大量條件和多輪確認。

      上下文窗口擴大后,模型可以在更長的實時對話里保留前面出現過的限制、偏好和業務信息。

      工具調用也是這次更新里的關鍵詞。RealtimeAPI可以用于構建會調用工具的語音體驗。應用可以保持實時會話連接,連續發送音頻,接收模型事件,更新會話狀態,并把外部系統返回的結果再交給模型繼續回應。

      美國房地產信息查詢網站Zillow,成為了OpenAI官方的首批企業案例。

      OpenAI在官網中提到,Zillow正在用GPT-Realtime-2構建可以理解住房條件并安排看房的語音助手。Zillow方面表示,在最困難的對抗性測試中,經過prompt優化后,電話任務成功率從69%提升到95%,FairHousing相關合規表現也更穩定。

      Fair Housing指美國住房交易中的反歧視合規要求,房產平臺不能在買賣、租賃、貸款或經紀服務中,基于種族、宗教、性別、殘障、家庭狀況、國籍等因素區別對待用戶。

      從“能說”到“會說”,這可能是GPT-Realtime-2給予行業的最大震撼。

      Booking子公司、知名旅行優惠平臺Priceline,則代表另一類語音模型的落地場景。

      據了解,Priceline也在測試GPT-Realtime-2系列。旅游預訂的鏈條很長,用戶可能要查航班、訂酒店、調整日期、處理延誤、比較價格,還可能在境外需要翻譯。語音Agent如果能穩定接入后臺系統,就有機會把“問答”推進到“辦事”。

      OpenAI提到的另一個已知客戶是德國電信。電信行業有大規模坐席、復雜套餐、故障處理、多語言服務和賬單解釋,也是語音模型落地的天然場景。



      GPT-Realtime-2還有一個細節是可調推理強度。

      OpenAI開發者文檔提到,GPT-Realtime-2把推理能力帶入語音到語音工作流。多數生產場景可以先使用較低的推理強度,優先保證通話里的響應速度;遇到更復雜的客服、預訂、排障任務,再提高推理強度,用更多計算換取更完整的判斷。

      這個細節很重要。語音交互比文字聊天更怕停頓。用戶在電話里等待一兩秒,會明顯感到卡頓。推理越強,延遲壓力越大。在性能和響應的平衡上,不同的開發者在這個問題上會有一定取舍。。

      官方也給出了一些測試數據。OpenAI稱,GPT-Realtime-2在Big Bench Audio上比GPT-Realtime-1.5高15.2%,在Audio MultiChallenge上高13.8%。這兩個指標用于衡量模型在音頻輸入、多輪語音、復雜指令和上下文整合方面的能力。

      第二款模型是GPT-Realtime-Translate。

      按OpenAI面向開發者的示例說明,GPT-Realtime-Translate主打實時語音到語音翻譯,適合廣播、直播、電話和視頻對話。它會自動識別輸入語言,并輸出翻譯后的語音和文本。開發者只需要設定目標語言。

      這個模型支持70多種輸入語言到13種輸出語言。OpenAI稱,它可以在說話人講話時跟上節奏。開發者文檔還提到,傳統語音翻譯常常要求說話人停頓,系統等一句話結束后再翻譯;而GPT-Realtime-Translate更接近連續口譯的形態。

      OpenAI把它的場景分成兩類。

      一類是廣播式翻譯,比如直播、網絡研討會、講座、財報電話會和大型會議演講。另一類是對話式翻譯,比如呼叫中心、視頻通話和電話工作流。這兩個類別基本覆蓋了企業最愿意付費的跨語言場景:客服、教育、國際會議、內容平臺、跨境銷售和企業培訓。

      第三款模型是GPT-Realtime-Whisper。

      GPT-Realtime-Whisper強調實時流式轉寫。它可以在說話人講話時生成字幕、會議記錄和工作流更新。相比起前兩個模型,Whisper的商業門檻最低。它的價格僅為0.017美元/分鐘。

      三款模型放在一起看,OpenAI已經把實時音頻拆成了三個明確入口:GPT-Realtime-2處理語音Agent,GPT-Realtime-Translate處理跨語言溝通,GPT-Realtime-Whisper處理實時文本化。

      三者的價格、延遲要求和客戶場景都不同,奧特曼想要在差異化路線上“通吃”語音AI市場。

      02

      TTS市場卷完“聲音質量”卷“實時”

      這次發布還有一個很清楚的商業信號:OpenAI正在把語音AI能力,全面推向API市場和企業工作流。

      除了OpenAI官方提到的Zillow、Priceline和德國電信三大測試客戶,更多公司也在把這批語音模型接進自己的產品。

      比如視頻平臺Vimeo、企業知識管理工具Glean、客服軟件公司Intercom,以及面向企業語音Agent的BolnaAI,都出現在目前披露的相關案例中。

      換句話說,GPT-Realtime系列已經成為了OpenAI的一個成熟的商業化版圖,客戶覆蓋內容平臺、企業辦公、客服系統和語音Agent創業公司等多類開發者。

      OpenAI展示的是一組真實業務中的場景:AI在通話中理解需求、調用系統、翻譯語言,并把語音交互接進企業后臺。

      而這一切,正好發生在語音AI市場繼續升溫的周期里。

      過去兩年,語音AI賽道最受關注的公司之一是ElevenLabs。這家公司2022年成立,最早靠高度擬真的AI配音、聲音克隆、多語言配音和內容本地化出圈,后來又把產品往企業語音Agent延伸。今年2月,ElevenLabs宣布完成5億美元D輪融資,估值達到110億美元。

      這一估值較2025年1月的33億美元大幅上升。公司稱,這筆資金將用于全球擴張,并繼續投入情感化對話模型、配音、轉寫和AI語音Agent等方向。

      更近的動態是,ElevenLabs在近期披露,公司年化經常性收入已經超過5億美元,并公布了更多參與D輪融資的新投資方。

      其中既包括貝萊德、惠靈頓管理等大型機構,也包括英偉達、賽富時創投、德國電信等產業方。甚至演員Jamie Foxx、Eva Longoria以及《魷魚游戲》創作者黃東赫等個人投資者,也出現在這輪投資名單中。

      面對著日益增長的需求,語音AI已經不只是創作者的配音工具。影視、廣告、游戲、教育、企業培訓、無障礙服務、內容出海和電話Agent,都在消耗更自然、更便宜、更可控的機器聲音。

      Deepgram代表另一種路線。

      這家公司長期做語音識別基礎設施,客戶更多來自聯絡中心、會議、銷售、醫療、金融等高頻語音場景。近年,Deepgram開始補上文本轉語音和語音Agent接口,試圖打通語音模型的辦事場景。

      Deepgram披露的信息顯示,旗下Aura-2文本轉語音面向實時語音應用,流式延遲低于200毫秒,并支持對地址、電話號碼、字母數字組合等結構化內容做更自然的朗讀。

      它還把語音識別、語音合成、實時情緒分析、話題檢測和摘要能力,放進聯絡中心等企業場景。

      Cartesia則主打低延遲和實時交互。

      這家公司由前斯坦福AI實驗室成員創辦,技術標簽是狀態空間模型,主打更快、更低成本的實時多模態模型。

      它的語音產品Sonic系列,核心賣點是低延遲文本轉語音。Cartesia的Sonic 3文檔稱,它是一個流式文本轉語音模型,強調高自然度、準確跟隨文本和低延遲;Sonic 3支持42種語言,也支持音量、語速和情緒控制。

      在Cartesia官網上,可以看到這家公司把90毫秒低延遲作為實時對話體驗的賣點。

      這些公司共同推動了TTS市場的變化。

      早期TTS競爭主要看聲音像不像真人。之后,行業開始比多語言覆蓋、聲音克隆、情緒表達、版權授權和配音效率。

      現在,語音Agent把要求抬高了。企業不只要一個好聽的聲音,還要完整鏈路:語音識別要準,首字延遲要低,大模型要能理解上下文,工具調用要穩定,語音合成要自然,翻譯要連續,轉寫還要能進入后續工作流。

      一些行業材料也反映了這個趨勢。Deepgram在TTS對比文章中提到,面向語音Agent的文本轉語音,已經把“首段語音生成低于100毫秒”視為新的基線之一。

      在行業內都在競相卷“實時”的背景下,OpenAI最大的優勢來自模型棧。

      OpenAI可以把整個企業調用TTS的鏈路,放到同一個開發者平臺里。對開發者來說,少接幾個供應商,就少一些延遲、集成和運維成本。對企業來說,統一平臺也更容易做權限管理、日志留存、數據策略和安全審查。

      不過,OpenAI想要通吃企業語音市場,也沒那么容易。

      ElevenLabs已跑到110億美元估值、超過5億美元年化收入;Deepgram今年1月完成1.3億美元融資,估值13億美元,服務1300多家客戶;Cartesia也在2025年完成6400萬美元A輪融資,Sonic模型據稱已有1萬多客戶使用,并以90毫秒模型延遲、42種語言主打實時語音。

      OpenAI有模型棧優勢,但語音市場并不缺少強勢玩家。



      奧特曼對這次發布的公開表態很短。他在X上稱,GPT-Realtime-2進入API是“相當大的一步前進”,同時OpenAI還在繼續改進ChatGPT里的語音體驗。

      只是從各大企業用戶爭相測試的情況來看,OpenAI的新一代語音模型,足以讓人期待他在接下來這一年的市場表現。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      再貴也要吃,立夏后大量上市!通便排毒,殺菌消炎,錯過了真可惜

      再貴也要吃,立夏后大量上市!通便排毒,殺菌消炎,錯過了真可惜

      江江食研社
      2026-05-08 17:30:11
      賀嬌龍去世4個月,丈夫首次公開露面,賀媽媽悲傷哭泣惹人淚目

      賀嬌龍去世4個月,丈夫首次公開露面,賀媽媽悲傷哭泣惹人淚目

      180視角
      2026-05-08 13:12:21
      西甲前五,馬競確定獲得下賽季歐冠正賽資格

      西甲前五,馬競確定獲得下賽季歐冠正賽資格

      懂球帝
      2026-05-08 05:26:58
      金螳螂:目前僅承接少量 商業航天發射場配套工程 及數據中心施工項目

      金螳螂:目前僅承接少量 商業航天發射場配套工程 及數據中心施工項目

      每日經濟新聞
      2026-05-07 22:52:55
      霹靂15迎來勁敵,印度引進300枚R37M,射程400公里專克霹靂15?

      霹靂15迎來勁敵,印度引進300枚R37M,射程400公里專克霹靂15?

      鋒芒點兵
      2026-05-08 18:04:15
      浙江油價定了:5月8日24時起,92號汽油每升8.68元,95號汽油每升9.23元,0號柴油每升8.39元

      浙江油價定了:5月8日24時起,92號汽油每升8.68元,95號汽油每升9.23元,0號柴油每升8.39元

      臺州交通廣播
      2026-05-08 16:54:11
      賴清德“跪了”

      賴清德“跪了”

      極目新聞
      2026-05-08 08:26:23
      沒想到,世乒賽尚未收官,孫穎莎的恩師邱貽可又迎來重磅喜訊

      沒想到,世乒賽尚未收官,孫穎莎的恩師邱貽可又迎來重磅喜訊

      生活新鮮市
      2026-05-08 18:14:06
      納瓦爾:不要去管別人,只管早睡、運動和讀書

      納瓦爾:不要去管別人,只管早睡、運動和讀書

      書窗小記
      2026-05-06 21:38:32
      一天了還沒笑夠?姆巴佩大笑著回到皇馬訓練基地

      一天了還沒笑夠?姆巴佩大笑著回到皇馬訓練基地

      懂球帝
      2026-05-08 16:29:07
      坐等官宣!《花少8》未播先火,雙數季魔咒、嘉賓陣容引全網熱議

      坐等官宣!《花少8》未播先火,雙數季魔咒、嘉賓陣容引全網熱議

      一禾的世界
      2026-05-07 13:15:29
      廣東男籃動態更新!徐杰深夜加練,杜峰調整陣容,朱芳雨提前部署引援動作

      廣東男籃動態更新!徐杰深夜加練,杜峰調整陣容,朱芳雨提前部署引援動作

      凱豐侃球
      2026-05-08 15:07:34
      特朗普態度180度轉變:連說中國三句好話!日本想截胡卻被晾一邊

      特朗普態度180度轉變:連說中國三句好話!日本想截胡卻被晾一邊

      小蔑談事
      2026-05-08 17:32:10
      給《低智商犯罪》演技最好的10位演員排個名:王傳君第3,王驍第2

      給《低智商犯罪》演技最好的10位演員排個名:王傳君第3,王驍第2

      八斗小先生
      2026-05-07 16:56:09
      被傳緋聞22年,楊紫和張一山終于公開回應,雙方家長都見過了

      被傳緋聞22年,楊紫和張一山終于公開回應,雙方家長都見過了

      科學發掘
      2026-05-08 13:23:20
      利率1.3%沒人存!銀行員工納悶:現在老百姓存錢,到底在琢磨啥?

      利率1.3%沒人存!銀行員工納悶:現在老百姓存錢,到底在琢磨啥?

      生活新鮮市
      2026-05-08 12:03:33
      伊朗外長來北京,開口向中方求助,不到24小時,特朗普叫停一件事

      伊朗外長來北京,開口向中方求助,不到24小時,特朗普叫停一件事

      阿尢說歷史
      2026-05-08 16:47:50
      中式軍工有多卷?當前路沒了參照物,一句“萬一呢”開始左右互搏

      中式軍工有多卷?當前路沒了參照物,一句“萬一呢”開始左右互搏

      無知君趣科普
      2026-05-08 17:32:10
      美媒:美政府正尋求重啟“自由計劃”行動

      美媒:美政府正尋求重啟“自由計劃”行動

      環球網資訊
      2026-05-08 07:59:46
      反轉!夜光劇本事件7年后再復盤:原來我們都被卓偉和輿論帶偏了

      反轉!夜光劇本事件7年后再復盤:原來我們都被卓偉和輿論帶偏了

      老吳教育課堂
      2026-05-06 01:45:59
      2026-05-08 19:28:49
      字母榜 incentive-icons
      字母榜
      讓未來不止于大。
      2443文章數 8062關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      伊朗成立新部門 所有想過霍爾木茲的船要先填40多道題

      頭條要聞

      伊朗成立新部門 所有想過霍爾木茲的船要先填40多道題

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經要聞

      輪到豆包收割了?

      汽車要聞

      智能雙艙大五座SUV 樂道L80將于5月15日正式上市

      態度原創

      時尚
      教育
      親子
      房產
      本地

      海魂衫搭配白色,更解暑!

      教育要聞

      南京江寧區2026年小學、初中招生入學工作實施細則

      親子要聞

      越來越多的80后開始拼三胎了!

      房產要聞

      豪擲6.8億拿地!何猷君大手筆投資三亞!

      本地新聞

      用蘇繡的方式,打開江西婺源

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99在线无码精品秘 人口| 欧美成人精品在线| 久久久久99精品成人片牛牛影视| 五月天天天综合精品无码| www.黄| 久久久久成人精品| 中文精品无码中文字幕无码专区| 成人网站亚洲综合久久| 久久99热精品免费观看| 欧美一区二区丝袜高跟鞋| 精品久久久久久无码不卡| 给我免费的视频在线观看| 久久先锋男人av资源网站| 在线综合亚洲中文精品| 国产成人综合在线观看| 国产美女精品一区二区| 成人影片在线观看18| 欧洲熟妇性色黄| 亚洲一级无码片一区二区三区| 久久做受www| 久久久久久九九| 亚洲色无码中文字幕| 亚洲人妻系列中文字幕| 波多野结衣无码视频一区二区三区| 97人妻天天爽夜夜爽二区| 亚洲第一视频在线观看| 天天躁日日操狠狠操欧美老妇| 日韩成人无码v清免费| 色欲麻豆国产福利精品| 亚洲国产精品久久久久婷婷图片| 99re这里只有国产中文精品国产精品| 可以直接免费观看的av网站| 午夜电影网va内射| 久久国产精品精品国产色婷婷| 亚洲国产成人久久综合碰碰| 一级毛片a女人刺激视频免费| 91丨九色丨人妻丨白浆| 最近最新中文字幕视频| 精品人妻无码专区在线无广告视频视频在线| 2021年国产精品每日更新| 男人亚洲天堂|