正月十五剛過(guò),AI圈就有大事發(fā)生:2月12日,CNBC引述知情人士爆料稱,百度計(jì)劃在今年下半年發(fā)布下一代人工智能模型Ernie 5.0,將在模型多模態(tài)能力方面有重大增強(qiáng)。次日凌晨3點(diǎn),OpenAI首席執(zhí)行官Sam Altman就表示即將發(fā)布GPT-4.5和GPT- 5,重點(diǎn)是GPT- 5將免費(fèi)開(kāi)放。與此同時(shí),文心一言宣布:將于4月1日0時(shí)起全面免費(fèi),PC端和App端都可使用文心系列最新模型。
中美AI行業(yè)兩大領(lǐng)軍企業(yè)為何同時(shí)宣布免費(fèi)?全面開(kāi)放大模型有什么樣的深層次原因?全球兩大頭部AI產(chǎn)品免費(fèi)開(kāi)放,對(duì)AI產(chǎn)業(yè)有哪些影響?下面K哥談?wù)勛约旱挠^察與思考。
01
OpenAI與百度隔空對(duì)飆
OpenAI首席執(zhí)行官Sam Altman,于2月13日凌晨公布了GPT-4.5和GPT-5的最新消息。免費(fèi)版ChatGPT能在標(biāo)準(zhǔn)智能設(shè)置下無(wú)限制地使用GPT - 5進(jìn)行對(duì)話。在更早之前的2月6日,OpenAI宣布ChatGPT Search向所有人開(kāi)放,打開(kāi)OpenAI官網(wǎng)即可直接使用,甚至不需要注冊(cè)。
另?yè)?jù)CNBC報(bào)道,百度計(jì)劃在今年下半年發(fā)布下一代人工智能模型Ernie 5.0,將在模型多模態(tài)能力方面有重大增強(qiáng)。次日13日Open ai火速跟進(jìn),宣布即將發(fā)布GPT-5。
有意思的是,就在OpenAI公布ChatGPT Search全面開(kāi)放的前幾個(gè)小時(shí),谷歌宣布向所有人開(kāi)放最新Gemini 2.0模型,包括Flash、Pro Experimental和Flash-Lite三個(gè)版本。
2月13日,文心一言在官網(wǎng)宣布將于4月1日0時(shí)起全面免費(fèi),所有PC端和App 端用戶均可體驗(yàn)文心系列最新模型,以及超長(zhǎng)文檔處理、專業(yè)檢索增強(qiáng)、高級(jí)AI繪畫、多語(yǔ)種對(duì)話等功能。
![]()
從以上幾家AI領(lǐng)軍企業(yè)的最新動(dòng)向不難發(fā)現(xiàn),大模型開(kāi)放是大勢(shì)所趨,科技巨頭們都在主動(dòng)開(kāi)放各自的大模型產(chǎn)品,讓更多用戶體驗(yàn)和使用。
02
更強(qiáng)大模型改寫AI競(jìng)爭(zhēng)版圖
此次開(kāi)放的大模型,綜合能力非常強(qiáng)悍。以文心一言為例,K哥作為文心一言的深度用戶,對(duì)于此前開(kāi)放的文心大模型3.5版和這次全面開(kāi)放的4.0版,還是比較熟悉的。文心大模型4.0較之前的版本,綜合能力更強(qiáng)大,K哥做了個(gè)測(cè)評(píng)。
先讓文心大模型預(yù)測(cè)下《哪吒2》最終全球票房,以下是3.5版的預(yù)測(cè)結(jié)果。
對(duì)比一下4.0的效果,不但給出了更具可能性的結(jié)果,整個(gè)思考鏈路非常清晰。
再來(lái)看看文生圖表現(xiàn)如何,我輸入提示詞:幫我畫一個(gè)奧黛麗赫本吃湯圓。以下是3.5版本出的圖,還是不錯(cuò)的。
4.0版本基于iRAG技術(shù),生成了更準(zhǔn)確的人物臉部,而且一次可以生成多張供你選擇。
2月13日,文心一言還新上線了深度搜索功能,能針對(duì)專業(yè)咨詢類問(wèn)題的解決能力進(jìn)行全面加強(qiáng),以解決專業(yè)問(wèn)題查詢門檻高、查詢渠道專精、查詢結(jié)果分析難度大等使用挑戰(zhàn)。
在民生、創(chuàng)業(yè)、經(jīng)濟(jì)分析等方面問(wèn)題,能夠提供專家級(jí)的內(nèi)容回復(fù);除了搜索能力以外,具備更全面的思考、規(guī)劃、反思能力,針對(duì)工具規(guī)劃及調(diào)用能力上進(jìn)行全面加強(qiáng),能夠更加“聰明”的使用多個(gè)工具解決各類復(fù)雜任務(wù)問(wèn)題。
接著說(shuō)說(shuō)大家關(guān)心的幻覺(jué)問(wèn)題,RAG是主要的解決方案,百度在RAG技術(shù)上具備中文深度理解、多模態(tài)檢索、垂直領(lǐng)域定制化以及實(shí)時(shí)數(shù)據(jù)整合能力等優(yōu)勢(shì),在中文互聯(lián)網(wǎng)、企業(yè)服務(wù)、政務(wù)等場(chǎng)景中更具實(shí)用性和競(jìng)爭(zhēng)力。從RAG能力實(shí)測(cè)來(lái)看,國(guó)內(nèi)外主流大模型中,百度文心一言綜合表現(xiàn)最佳。
在解決圖片生成的幻覺(jué)問(wèn)題上,百度提出了iRAG(image based RAG)技術(shù)解決方案,將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,就可以生成各種超真實(shí)的圖片,去掉了AI味兒,而且成本很低。前文測(cè)評(píng)的案例中,大家已經(jīng)感受到iRAG的強(qiáng)大了,iRAG具備無(wú)幻覺(jué)、超真實(shí)、沒(méi)成本、立等可取等特點(diǎn),在影視作品、漫畫作品、連續(xù)畫本、海報(bào)制作等很多領(lǐng)域都有廣泛的應(yīng)用空間。
在K哥看來(lái),文心一言的全面開(kāi)放,保證了用戶享有最佳體驗(yàn),進(jìn)一步降低AI的使用門檻。在百度的頭部效應(yīng)之下,會(huì)有越來(lái)越多AI公司加入開(kāi)放的隊(duì)伍,這將有利于推動(dòng)中國(guó)AI行業(yè)的發(fā)展,促進(jìn)AI普惠。
03
大模型成本“三級(jí)跳”
杰弗里·摩爾在《跨越鴻溝》中指出,高科技產(chǎn)品在市場(chǎng)化過(guò)程中,會(huì)面臨一個(gè)難以逾越的“死亡之谷”,這是早期使用者到大眾用戶的過(guò)渡階段,能否“跨越裂谷”,是高科技產(chǎn)品發(fā)展的關(guān)鍵。2024年AI產(chǎn)品的用戶破圈增長(zhǎng),標(biāo)志著AI已經(jīng)“跨越裂谷”。
AI技術(shù)突破背后的成本降低,是這次大模型全面開(kāi)放的核心原因。
一方面,大模型訓(xùn)練成本大幅降低。以百度為例,文心大模型的訓(xùn)練成本不斷降低,工程技術(shù)上的突破創(chuàng)新主要有3點(diǎn):
1,昆侖芯性價(jià)比高,可降低單位算力成本。昆侖芯在性能上表現(xiàn)卓越,能夠在更少的計(jì)算資源下運(yùn)行大規(guī)模模型(如DeepSeek-V3/R1),這使得大模型的推理和訓(xùn)練所需的計(jì)算量減少,從而直接降低算力成本。
2,萬(wàn)卡集群規(guī)模效應(yīng),提高資源利用率。百度智能云已點(diǎn)亮萬(wàn)卡集群,并計(jì)劃擴(kuò)展至 3萬(wàn)卡。大規(guī)模集群可以通過(guò)任務(wù)并行調(diào)度、彈性算力管理等方式,提高計(jì)算資源利用率,避免算力閑置,提高單任務(wù)的計(jì)算效率,降低整體算力成本。
3,百舸平臺(tái)助力大規(guī)模集群實(shí)現(xiàn)高效的部署管理。如:超大規(guī)模HPN高性能網(wǎng)絡(luò),將帶寬有效性提升到90%以上;創(chuàng)新性散熱方案,有效降低能耗,進(jìn)一步優(yōu)化成本;高效并行化任務(wù)切分策略,將MFU(GPU有效利用率指標(biāo))提升至58%;故障恢復(fù)時(shí)間為分鐘級(jí),集群有效訓(xùn)練率達(dá)到98%。
另一方面,推理成本的顯著下降。在飛槳深度學(xué)習(xí)框架的支持下,文心大模型通過(guò)優(yōu)化實(shí)現(xiàn)推理性能提升,推理成本顯著降低。正如百度創(chuàng)始人李彥宏在阿聯(lián)酋迪拜出席“世界政府峰會(huì)”上所說(shuō)的:“在過(guò)去,當(dāng)我們談?wù)撃柖蓵r(shí),每18個(gè)月,性能水平或價(jià)格都會(huì)減半。但是今天,當(dāng)我們談?wù)摯笮驼Z(yǔ)言模型時(shí),增加的成本基本上降低了,可以在12個(gè)月內(nèi)降低90%以上。”
04
先進(jìn)生產(chǎn)力人人可用
這場(chǎng)AI開(kāi)放浪潮,預(yù)示著AI產(chǎn)業(yè)的全新范式:與其構(gòu)建封閉的技術(shù)護(hù)城河,不如孕育創(chuàng)新的生態(tài)雨林。當(dāng)大模型成為"水電煤"一樣的基礎(chǔ)設(shè)施,人類將會(huì)創(chuàng)造出遠(yuǎn)超我們想象的數(shù)字文明。
一場(chǎng)屬于普通人的生產(chǎn)力革命正在悄悄降臨,正如馬文·明斯基所說(shuō)的:"真正重要的不是機(jī)器能否思考,而是人類能否因之更好地思考。"此刻,屬于每個(gè)人的AI時(shí)代,才剛剛拉開(kāi)帷幕。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.