![]()
新眸原創(chuàng)·作者 | 李小東
最近這段時(shí)間,不管是硅谷的開發(fā)者郵件組,還是國內(nèi)的技術(shù)社群,話題幾乎都繞不開兩個(gè)消息。
一個(gè)是OpenAI正式確認(rèn),代號Spud的新一代大模型GPT-6即將全球發(fā)布;另一個(gè)是這家公司在發(fā)布前,親手關(guān)停了一年前引爆全網(wǎng)的視頻生成產(chǎn)品Sora,連API都定了全面下線的時(shí)間表。
不少做AI開發(fā)的朋友,這兩周都在調(diào)整手里的項(xiàng)目節(jié)奏,等著看GPT-6的發(fā)布文檔,也有人在聊,OpenAI這步棋走得太急,畢竟Sora上線的時(shí)候,幾乎重新定義了AI視頻生成的標(biāo)準(zhǔn),怎么說停就停了。
其實(shí)比起GPT-6到底能把參數(shù)堆到多少,推理能力提升了多少,更值得琢磨的,是OpenAI在這款模型發(fā)布前做的一系列選擇,以及整個(gè)AI行業(yè),在這場發(fā)布會到來之前,悄悄發(fā)生的那些變化。
01
GPT-6的底色
與OpenAI的轉(zhuǎn)身
前兩天OpenAI的官方公告里,關(guān)于GPT-6的信息并不算多,只明確了預(yù)訓(xùn)練工作已在德克薩斯州的Stargate數(shù)據(jù)中心全部完成,目前進(jìn)入最終的安全對齊與API調(diào)試階段。
更多的細(xì)節(jié),來自核心管理層對外的零星表述。
OpenAI總裁GregBrockman在近期的播客訪談中親口確認(rèn)了GPT-6的存在,他的表述里沒有常見的參數(shù)堆砌,只留下一句關(guān)鍵的判斷:這次不是增量改進(jìn),他們思考模型開發(fā)方式已經(jīng)發(fā)生重大改變。
SamAltman則在給全體員工的內(nèi)部信中,將這款模型定義為“一個(gè)非常強(qiáng)大的模型,可以真正加速經(jīng)濟(jì)發(fā)展”。
從行業(yè)渠道流出的測試信息來看,GPT-6的核心升級,確實(shí)跳出了過去幾代模型的慣性路徑。它采用全新的“Symphony”架構(gòu),首次實(shí)現(xiàn)了文本、圖像、音頻、視頻的原生統(tǒng)一處理,而非行業(yè)內(nèi)常見的多模態(tài)模塊拼接。
這意味著,用戶無需再通過插件跳轉(zhuǎn),就能用手繪草圖直接生成前端代碼,上傳一段視頻就能拆解動作細(xì)節(jié)并生成對應(yīng)腳本,甚至用語音指令完成從創(chuàng)意構(gòu)思到視頻成片的全流程操作。
開發(fā)者最關(guān)注的編碼、推理和AI智能體任務(wù)上,GPT-6較GPT-5.4實(shí)現(xiàn)了40%以上的性能提升,上下文窗口從100萬token直接擴(kuò)展至200萬,單次可處理約150萬字的文本,相當(dāng)于兩部中篇小說的體量。
公開的測試數(shù)據(jù)顯示,其數(shù)學(xué)推理準(zhǔn)確率達(dá)到92.5%,代碼生成通過率96.8%,在44類職業(yè)測試中,83%的任務(wù)表現(xiàn)達(dá)到或接近人類專家水平。
更值得關(guān)注的,是OpenAI為這場發(fā)布做的一系列前置動作,尤其是對Sora的全面關(guān)停。我記得Sora剛出現(xiàn)的時(shí)候,被行業(yè)稱為“重磅炸彈”,不少做視頻創(chuàng)作的朋友,當(dāng)初都為Sora的能力驚嘆過。
但文本生成視頻這件事,能成為真正意義上的商業(yè)項(xiàng)目的,確實(shí)少之又少。要么是生成的內(nèi)容版權(quán)說不清,要么是成本太高,遠(yuǎn)不如人工制作可控。
這也是Sora最終走向關(guān)停的核心原因。《福布斯》雜志的估算數(shù)據(jù)顯示,Sora項(xiàng)目每年的運(yùn)行成本高達(dá)50多億美元,而自上線以來,應(yīng)用程序內(nèi)總收入僅約210萬美元,完全無法覆蓋高昂的算力與運(yùn)營成本。
和文本生成不同,AI視頻生成對算力的消耗呈指數(shù)級增長,單段10秒的基礎(chǔ)視頻生成成本約1.3美元,復(fù)雜場景的成本甚至能達(dá)到33美元。
為了控制虧損,OpenAI不得不不斷削減用戶的免費(fèi)生成額度,從最初的每日30條降到每日6條,進(jìn)一步加劇了用戶的流失。Appfigures的監(jiān)測數(shù)據(jù)顯示,Sora的30天留存率僅為1%,60天留存更是趨近于零,用戶嘗鮮過后,幾乎沒有持續(xù)使用的動力。
壓垮Sora的還有版權(quán)與合規(guī)的重壓。上線初期,Sora憑借生成迪士尼IP、名人形象的視頻快速出圈,也隨之引發(fā)了大量的版權(quán)訴訟與行業(yè)抵制。
OpenAI被迫將內(nèi)容生成規(guī)則從“默認(rèn)可用”收緊為“需明確授權(quán)”,直接砍掉了產(chǎn)品最核心的吸引力,與迪士尼的10億美元合作也隨之終止。而深度偽造內(nèi)容的泛濫,更是讓OpenAI持續(xù)面臨監(jiān)管層面的壓力,美國非營利組織“捍衛(wèi)公眾利益組織”曾專門致信,要求其下架Sora。
當(dāng)然,也有人判斷,OpenAI沖刺IPO在即,這家公司在2026年2月底完成了新一輪1220億美元的私募融資,估值達(dá)到8520億美元,計(jì)劃在2026年第四季度正式登陸資本市場。對華爾街的投資者而言,一個(gè)持續(xù)燒錢、看不到盈利前景的視頻生成項(xiàng)目,遠(yuǎn)不如一個(gè)能帶來穩(wěn)定現(xiàn)金流的企業(yè)級生產(chǎn)力模型有吸引力。
而高盛則測算,2025年OpenAI全年收入超過200億美元,但虧損仍高達(dá)140億至150億美元。想要滿足上市的盈利預(yù)期,OpenAI必須把有限的資源投入到最具商業(yè)價(jià)值的業(yè)務(wù)上。
就現(xiàn)在來說,企業(yè)級服務(wù)正是當(dāng)下AI行業(yè)最確定的現(xiàn)金牛,Anthropic的年度收入超過190億美元,其中約80%來自企業(yè)客戶,這給OpenAI帶來了直接的競爭壓力。
關(guān)停Sora,全力押注GPT-6,本質(zhì)上是OpenAI在上市前夜,對自身商業(yè)敘事的一次重塑。
從過去用炫酷的生成能力吸引C端用戶,轉(zhuǎn)向用穩(wěn)定、高效的生產(chǎn)力能力服務(wù)B端企業(yè),從AI技術(shù)的探索者,轉(zhuǎn)向AI商業(yè)化的落地者。而GPT-6的登場,正是這場轉(zhuǎn)型的核心載體。
02
AI賽道,不是單線程的賽跑
就在OpenAI為GPT-6的發(fā)布緊鑼密鼓籌備的同時(shí),全球AI行業(yè)的其他玩家,并沒有跟著它的節(jié)奏起舞,反而提前開啟了新一輪的布局。
4月2日,谷歌DeepMind正式推出Gemma4系列大模型,以Apache2.0協(xié)議完全開源,四款模型覆蓋從手機(jī)端側(cè)到云端推理的全場景。
其中20億參數(shù)的E2B模型,內(nèi)存占用低至1.5GB,可在智能手機(jī)、樹莓派上離線運(yùn)行,性能卻追平了上代270億參數(shù)的模型;310億參數(shù)的稠密模型,在ArenaAI排行榜上位列開源模型第三,直接碾壓多個(gè)參數(shù)量是其20倍的競品。
開源社區(qū)的反應(yīng)很直接,發(fā)布當(dāng)天,HuggingFace上相關(guān)的衍生模型就破了千個(gè),很多做端側(cè)AI開發(fā)的團(tuán)隊(duì),直接把之前的模型方案換掉了。谷歌官方公布的數(shù)據(jù)顯示,Gemma4發(fā)布24小時(shí)內(nèi),總下載量就突破4億次,衍生模型超過10萬個(gè),在開源社區(qū)掀起了一場新的狂歡。
谷歌的這一步棋,恰好走在了OpenAI的反面,當(dāng)OpenAI用閉源的GPT-6向AGI發(fā)起沖刺時(shí),谷歌選擇用開源的方式,把AI能力下放給全球的開發(fā)者和設(shè)備廠商,搶占端側(cè)AI的入口。
Gemma4的核心突破,就是讓大模型徹底擺脫了云端算力的束縛,手機(jī)、IoT設(shè)備、汽車都能在本地實(shí)現(xiàn)全功能的AI推理,未來的AI競爭,不再只是云端大模型的參數(shù)競賽,更是端側(cè)設(shè)備上的生態(tài)爭奪戰(zhàn)。
國內(nèi)大廠的動作同樣密集。就在谷歌發(fā)布Gemma4的同一天,阿里正式推出通義千問Qwen3.6-plus,在全球權(quán)威編程榜單CodeArena中表現(xiàn)亮眼,在考察復(fù)雜web開發(fā)自主編碼能力的react專項(xiàng)榜單中位列全球第二,超越了OpenAI的GPT-5.0-high和谷歌的Gemini3.1pro,僅次于Anthropic的Claude-opus-4.6。
字節(jié)跳動則在今年推出豆包2.0,支持私有化部署,滿足企業(yè)數(shù)據(jù)安全和合規(guī)需求,同時(shí)公布豆包系列產(chǎn)品躋身全球AI助手第一梯隊(duì)。行業(yè)內(nèi)流出的數(shù)據(jù)顯示,豆包大模型的日均Token消耗已達(dá)120萬億,較初期增長了1000倍,三個(gè)月內(nèi)實(shí)現(xiàn)了翻倍。
騰訊則在3月下旬為微信全量推送了ClawBot插件,原生接入OpenClaw開源AI智能體框架,讓12億用戶的微信聊天框,直接變成了可自主拆解復(fù)雜任務(wù)的AI控制臺。
微軟的動作更值得玩味。前不久微軟正式推出MAI-Transcribe-1、MAI-Voice-1與MAI-Image-2三款自研商用模型,覆蓋語音轉(zhuǎn)寫、語音生成與圖像生成三大核心場景。這三款模型由微軟MAI超級智能團(tuán)隊(duì)開發(fā),意味著在與OpenAI的合作之外,微軟正在加速構(gòu)建自研的AI模型體系,減少對外部技術(shù)的依賴。
整個(gè)AI行業(yè),正在GPT-6即將掀起的浪潮前,形成了清晰的路線分化。
OpenAI沿著閉源的路線,全力向AGI的終點(diǎn)沖刺,試圖用下一代模型重新定義行業(yè)的天花板;谷歌、阿里等廠商則用開源的方式,構(gòu)建更廣泛的開發(fā)者生態(tài),搶占端側(cè)AI的未來;微軟、騰訊等巨頭,則依托自身的產(chǎn)品生態(tài),把AI能力深度融入現(xiàn)有的用戶場景,實(shí)現(xiàn)技術(shù)的快速落地。
這場持續(xù)了三年多的AI競賽,早已不是單線程的賽跑。
03
落地的修行
是比參數(shù)更重要的事
從2022年底ChatGPT發(fā)布至今,三年多的時(shí)間里,AI行業(yè)經(jīng)歷了一輪瘋狂的參數(shù)軍備競賽,各家廠商爭相發(fā)布更大參數(shù)、更高精度的模型,但事實(shí)上,卻很少真正沉下心來解決AI如何落地的核心問題。
多數(shù)大模型仍停留在聊天機(jī)器人的階段,除了少數(shù)科技企業(yè)和開發(fā)者,絕大多數(shù)普通用戶和傳統(tǒng)行業(yè),并沒有真正享受到AI技術(shù)帶來的效率提升。
GPT-6的到來,單從當(dāng)前的寥寥信息推斷,似乎能夠?yàn)檫@場競賽重新劃定賽點(diǎn)。整個(gè)行業(yè)的競爭焦點(diǎn),從“能不能做出來”,轉(zhuǎn)向“能不能用起來”。
無論是GPT-6對智能體能力的深度整合,還是Gemma4對端側(cè)部署的極致優(yōu)化,亦或是Qwen3.6-plus在編程場景的深度打磨,本質(zhì)上都是在讓AI技術(shù)走出實(shí)驗(yàn)室,真正融入到具體的工作場景中,變成能解決實(shí)際問題的工具。
對國內(nèi)的大模型廠商而言,GPT-6的發(fā)布既是挑戰(zhàn),也是全新的機(jī)會。過去幾年,國產(chǎn)大模型始終處在追趕者的位置,跟著海外廠商的節(jié)奏,在參數(shù)和精度上不斷追趕。但隨著AI行業(yè)的賽點(diǎn)轉(zhuǎn)向落地與生態(tài),國內(nèi)廠商依托本土的場景優(yōu)勢、用戶基礎(chǔ)和產(chǎn)業(yè)鏈資源,反而有了實(shí)現(xiàn)差異化突圍的可能。
從企業(yè)服務(wù)廠商從業(yè)者那里了解到,目前國內(nèi)制造業(yè)、金融、零售等傳統(tǒng)行業(yè),對AI的需求正在快速爆發(fā),但他們需要的不是一個(gè)無所不能的通用大模型,而是能解決行業(yè)具體痛點(diǎn)的垂直解決方案。
比如制造業(yè)的質(zhì)檢與生產(chǎn)流程優(yōu)化,金融業(yè)的風(fēng)險(xiǎn)管控與客戶服務(wù),零售業(yè)的用戶運(yùn)營與供應(yīng)鏈管理,這些場景都需要AI模型深度結(jié)合行業(yè)知識,而這正是國內(nèi)廠商的優(yōu)勢所在。
而對普通的開發(fā)者和用戶來說,的確不用過度焦慮GPT-6會不會帶來行業(yè)顛覆,也不用執(zhí)著于追逐最新的模型版本。
大家都能夠意識到,真正有價(jià)值的,是學(xué)會把這些AI工具,變成自己工作里的幫手。AI的出現(xiàn)不應(yīng)該是為了替代人,它能做的,是把人從重復(fù)繁瑣的工作里解放出來,去做更有價(jià)值的事。
GPT-6的發(fā)布會再過幾天就會到來,它也許真的會刷新我們對AI能力的認(rèn)知,也會給行業(yè)帶來新的變化。
但我們也認(rèn)識到,即使SamAltman曾經(jīng)說過,AGI會是人類文明史上最重要的事件之一,但在那個(gè)遙遠(yuǎn)的終點(diǎn)到來之前,整個(gè)行業(yè),還有我們每一個(gè)人,都要先完成一場更務(wù)實(shí)的修行。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.