![]()
作者 | 李楠
郵箱 | linan@pingwest.com
當(dāng)AI能力以肉眼可見(jiàn)的速度變強(qiáng),使用它的代價(jià)也在同步攀升。以至于“AI太費(fèi)錢”從一句牢騷,變成了真實(shí)的商業(yè)困境。
但有問(wèn)題,就會(huì)有解決問(wèn)題的人。最近我們圍觀了一場(chǎng)名為“投海Tech Show”的活動(dòng)現(xiàn)場(chǎng)。其中就有幾位創(chuàng)業(yè)者,試圖把AI變成每個(gè)人更觸手可及的基礎(chǔ)設(shè)施。
這里面包括身在校園的年輕博士,也有再次出發(fā)的產(chǎn)業(yè)老兵。有人致力于當(dāng)下的“節(jié)流”,讓現(xiàn)有模型跑得更便宜;有人則著眼未來(lái)的“開(kāi)源”,去太空為AI尋找近乎無(wú)限的能源。
有意思的是,他們本身都與海淀這個(gè)科技創(chuàng)新高地聯(lián)系緊密。本場(chǎng)活動(dòng)的Tech Show項(xiàng)目均源自海淀區(qū)“五方六力”科技成果轉(zhuǎn)化機(jī)制挖掘推薦,技術(shù)成果來(lái)源于清華、北大、北航、北郵等高校。
而借用海淀“投資于人、投資于未來(lái)”的理念,從這場(chǎng)活動(dòng)看,一個(gè)不必焦慮于AI賬單的未來(lái),有點(diǎn)眉目了。
1
一、硬核的00后,要打破算力定價(jià)權(quán)
王冠博是這天最年輕的創(chuàng)始人之一,清華計(jì)算機(jī)博士在讀,00后。他走上臺(tái)的第一件事不是介紹公司,而是講了一個(gè)讓他想清楚方向的時(shí)刻。
那是2025年2月,DeepSeek剛剛爆火。彼時(shí)市面上還沒(méi)有Manus,也沒(méi)有Claude Code。他看著DeepSeek的測(cè)試數(shù)據(jù),注意到一個(gè)細(xì)節(jié):僅僅加入深度思考功能,Token消耗量就跳漲了數(shù)倍。
“那時(shí)候我就在想,未來(lái)一定不是單純的Chatbot的形式,”他在臺(tái)上說(shuō),“未來(lái)一定是multi pipeline復(fù)雜的任務(wù)流程。你只加一個(gè)深度思考,Token就有4倍,甚至多出10倍的提升,multi pipeline可能是千倍、甚至萬(wàn)倍的Token爆炸。”
![]()
幾個(gè)月后,龍蝦的出現(xiàn)證明了他的判斷。一個(gè)普通的AI任務(wù),調(diào)用的Token量可能是過(guò)去對(duì)話場(chǎng)景的數(shù)百倍。代價(jià)由誰(shuí)承擔(dān)?最終還是用戶和開(kāi)發(fā)者。
王冠博想解決這個(gè)問(wèn)題。他們把問(wèn)題的解法鎖定在“端側(cè)”。
在他們看來(lái),用戶并不在意模型跑在云端還是本地,他們只想要“又便宜又好用”。正是基于這一理念,他們要做的不是端側(cè)小模型,而是把云端大模型真正部署到端側(cè)。
但這里有個(gè)非常現(xiàn)實(shí)的障礙,那就是內(nèi)存。市面上一萬(wàn)元左右的消費(fèi)級(jí)設(shè)備最多24G內(nèi)存,刨去系統(tǒng)和應(yīng)用占用,留給模型推理的不過(guò)8G,只能跑2B參數(shù)的小模型,而2B模型根本解決不了像龍蝦這類復(fù)雜任務(wù)的需求。
“很多品牌廠商面臨一個(gè)困境,”王冠博說(shuō),“能不能既將模型本地化,也把‘龍蝦’本地化,而且模型本地化是能解決‘龍蝦’需求的模型,它就需要是一個(gè)大十幾B甚至百B的模型。”
萬(wàn)格智元的方案,是從算法、系統(tǒng)、芯片三個(gè)層次同時(shí)入手。他報(bào)出了幾個(gè)數(shù)字:以35B的模型為例,他們的系統(tǒng)只需要4.7GB內(nèi)存,內(nèi)存開(kāi)銷大幅下降,而推理速度則在極低內(nèi)存消耗下提升了約30倍。
臺(tái)下一位投資人追問(wèn):“怎么解決帶寬限制的問(wèn)題?”王冠博的回答展示了他研究的深度:不是硬堆內(nèi)存,而是改變數(shù)據(jù)加載方式,“以位寬的方式按比特去load,之后邊load邊算,是一個(gè)極致的流水線式的調(diào)度,以一個(gè)極低的激活參數(shù)量配合IO帶寬,讓算和取、存和算來(lái)實(shí)現(xiàn)高效并行。”
突破是具體的:純CPU就能運(yùn)行35B、80B、120B參數(shù)大模型;把本地部署成本從萬(wàn)元級(jí)降到千元級(jí)。
此前萬(wàn)格智元完成千萬(wàn)級(jí)融資時(shí),有投資方評(píng)價(jià),這支清華博士團(tuán)隊(duì)用普通CPU實(shí)現(xiàn)了主流模型在本地生成Token,“擺脫了行業(yè)對(duì)昂貴GPU資源的依賴”。
概括起來(lái),這個(gè)00后要做的,是AI時(shí)代的“自來(lái)水”。不是把算力鎖在云端機(jī)房里出售,而是把它帶回每一臺(tái)普通電腦。他這樣形容自己的00后團(tuán)隊(duì):“能干、能熬、能做”。
1
二、把AI裝進(jìn)口袋,還不用多花錢
同樣在臺(tái)上講端側(cè)的,還有另一位清華計(jì)算機(jī)系在讀博士——萬(wàn)象智維CEO王拓為。
王拓為本科、博士都在清華就讀,研究方向聚焦于移動(dòng)端設(shè)備上的大模型系統(tǒng)優(yōu)化。用他自己的話說(shuō),這是一件“比云端難得多”的事情。
云端有充沛的計(jì)算資源,但在端側(cè),算力、內(nèi)存、功耗、散熱,都是約束。而在給定的硬件條件下,把一個(gè)程序的性能跑到極致,是王拓為興趣所在。
![]()
眼下AI正在從“會(huì)說(shuō)”走向“會(huì)做”。大模型從內(nèi)容生成走向結(jié)果交付。智能體天然地從單輪對(duì)話走向7×24小時(shí)持續(xù)運(yùn)行,并且單次任務(wù)也需要更長(zhǎng)的上下文處理能力,都讓Token調(diào)用量呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。
而從實(shí)際需求出發(fā),人們不是任何時(shí)候都需要基于云側(cè)的超強(qiáng)智能,很多時(shí)候,反倒希望有一種夠用,但是“更快、更安全、更節(jié)省的本地化的算力。”再加上,隨著端側(cè)模型結(jié)構(gòu)創(chuàng)新和端側(cè)推理技術(shù)演進(jìn),王拓為判斷,端側(cè)智能的窗口期已經(jīng)到來(lái)。
不過(guò)這種機(jī)會(huì)未必屬于已有的硬件。在王拓為看來(lái),當(dāng)前幾類AI方案都有短板。
云側(cè)方案看起來(lái)能力最強(qiáng),但上下文并非天然存在于云上,每次調(diào)用都需要把數(shù)據(jù)重新上傳組織,引入巨大的傳輸開(kāi)銷和隱私風(fēng)險(xiǎn)。而“無(wú)論是手機(jī)還是電腦,本質(zhì)上都是以用戶的通用需求為導(dǎo)向所設(shè)計(jì)”,真正能穩(wěn)定分配給智能體的算力資源非常有限,并且數(shù)據(jù)封閉在各自的生態(tài)里,無(wú)法形成統(tǒng)一的個(gè)人上下文系統(tǒng)。
至于Agent主機(jī),雖然能在本地持續(xù)運(yùn)行模型,“但依然不夠便捷,依賴網(wǎng)絡(luò),使用鏈路也更長(zhǎng)”。
萬(wàn)象智維給出的解法,是一塊卡片大小的端側(cè)硬件——它以第三方的姿態(tài),貼在手機(jī)背面或揣進(jìn)口袋,連接手機(jī)、電腦、耳機(jī)等所有可穿戴設(shè)備,“在不同的設(shè)備和不同的生態(tài)之間建立起上下游匯總的渠道”。
簡(jiǎn)單來(lái)說(shuō),他們要在這塊硬件上部署本地大模型,實(shí)現(xiàn)敏感上下文在本地處理,讓云端與本地模型高效協(xié)同。而這一切都是免費(fèi)的。“因?yàn)槎藗?cè)的算力天然就被我們所擁有,用戶并不需要為每一次額外調(diào)用付出成本。”
支撐這套方案的,是兩套自研技術(shù)。
一個(gè)是端側(cè)模型推理引擎OmniInfer,集成了團(tuán)隊(duì)近五年的推理優(yōu)化能力。王拓為及其團(tuán)隊(duì)曾花兩個(gè)月時(shí)間反匯編底層硬件指令代碼,重新編寫高性能算子,最終實(shí)現(xiàn)了相比CPU方案接近20倍的性能提升,可部署模型參數(shù)量達(dá)到原來(lái)的2倍,甚至能在手機(jī)上支撐100K長(zhǎng)度的超長(zhǎng)上下文。
另外是OmniClaw,一個(gè)端側(cè)任務(wù)執(zhí)行系統(tǒng)。它通過(guò)云端和本地模型協(xié)同,“在任務(wù)效果不降級(jí)的情況下實(shí)現(xiàn)成本的大幅下降”。
臺(tái)下投資人提問(wèn),用戶從哪里切入。王拓為的答復(fù)是三步走:第一步面向海外極客用戶開(kāi)啟眾籌,讓他們?cè)诒镜乜ㄆ剿懔ζ脚_(tái)上發(fā)揮全部構(gòu)想;第二步靠口碑走向重度使用者,針對(duì)其辦公和使用場(chǎng)景做深度優(yōu)化;最終走向普通用戶。
“當(dāng)我們每個(gè)人把日常全部上下文都提供給模型的時(shí)候,每個(gè)人的Token都不會(huì)夠用。”顯然,萬(wàn)象智維不想讓大家有這種遺憾。
1
三、老兵再出發(fā),讓AI少消耗多出活
講完年輕人,再來(lái)看看產(chǎn)業(yè)老兵。
明日新程創(chuàng)始人李笛,是這次活動(dòng)最資深的創(chuàng)業(yè)者。他之前最被人熟悉的身份,是“微軟小冰之父”,但他想做的從來(lái)不止于打造一個(gè)“小冰”,而是堅(jiān)信,智能體才是未來(lái)人機(jī)共生網(wǎng)絡(luò)中屬于AI的節(jié)點(diǎn)。
2025年底,也是在中關(guān)村國(guó)際創(chuàng)新中心的路演日活動(dòng)上,明日新程首次公開(kāi)亮相。之后依托海淀區(qū)的人才與科研資源,形成專業(yè)化的AI技術(shù)布局。成立一個(gè)季度,已連續(xù)完成兩輪融資。
![]()
李笛講的核心問(wèn)題,在臺(tái)上說(shuō)來(lái)直接:今天的多智能體框架,有兩個(gè)根本性缺陷。
第一是協(xié)同失控。他舉了一個(gè)例子:晚上睡前給AI Agent安排了一個(gè)任務(wù),第二天早上起來(lái),“你會(huì)發(fā)現(xiàn)它們幾個(gè)討論的結(jié)果是,決定把你的郵箱全部清空,決定把一些代碼寫得非常亂”。他們還做過(guò)實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)多個(gè)智能體沒(méi)有良好協(xié)同機(jī)制時(shí),“往往是那個(gè)比較笨的會(huì)去說(shuō)服那幾個(gè)比較好的”——越好的模型越善于合理化對(duì)方的觀點(diǎn),最終拉低整體結(jié)果。
第二是成本爆炸。如果協(xié)同機(jī)制做得粗糙,沒(méi)有很好的基于控制的方法去處理真正的上下文,一句“你好”就可能消耗非常非常多的Token。
明日新程從人類智慧中破解這些難題。李笛認(rèn)為,研究群體智能的運(yùn)作規(guī)律,唯一藍(lán)本就是人類。因?yàn)槿祟愂谴蠹宜芙佑|到的唯一的高級(jí)認(rèn)知智能體,并且,在人類社會(huì)漫長(zhǎng)的歷史周期里,“絕大部分的時(shí)候都是良幣驅(qū)逐劣幣。”
為此,明日新程專門梳理過(guò)1800年到2020年人類文獻(xiàn),拆解“群體智慧”的演進(jìn)脈絡(luò),探索智能體之間的動(dòng)態(tài)協(xié)同,選出leader、通過(guò)辯論和反思形成決策的方法體系。最終,他們帶來(lái)了一套名為“團(tuán)子”的多智能體協(xié)同框架。
成效是顯著的。李笛介紹,團(tuán)子的智能深度穩(wěn)定超越任何單一大模型所產(chǎn)生的結(jié)果,可追溯決策形成的全部過(guò)程,并且推理成本還比Google Deep Research低50%以上。
還有投資人追問(wèn):這是不是另一種OpenClaw?而李笛表示,他們和OpenClaw有30%的相似、70%的不同——相似在都是reactive+proactive的場(chǎng)景,不同在于,OpenClaw完全沒(méi)有多智能體協(xié)同,也沒(méi)有多智能體進(jìn)化,而團(tuán)子有著使用強(qiáng)化學(xué)習(xí)的進(jìn)化機(jī)制。
這帶來(lái)充滿想象力的前景。“群體智能是一個(gè)全新的框架層,下面是大模型,上面是各種各樣的ToC、ToB應(yīng)用,無(wú)論你的應(yīng)用是基于難題還是基于24小時(shí)以上的長(zhǎng)程任務(wù),都能通過(guò)群體智能的方式規(guī)范和約束它。”
總的來(lái)看,明日新程既要讓AI更聰明能干,也要讓AI更便宜可用。
1
四、打造極致太空AI Token Machine,把Token變便宜
以上種種是為AI“節(jié)流”,有人則想為AI“開(kāi)源”。
一葦宇航同樣是扎根于海淀的一家公司。公司創(chuàng)始人邢若粼是北郵博士。在他眼中,“智能的上界,其實(shí)就是能源的邊界。”
要用好AI,必須掌握充分的能源。邢若粼判斷,地面能源和場(chǎng)地終將觸及天花板,有近乎無(wú)限場(chǎng)地和太陽(yáng)能資源的太空,才是未來(lái)AI的最佳容器。
這絕不是異想天開(kāi)。其實(shí)在2025年底,馬斯克便公開(kāi)表示:“3年內(nèi),太陽(yáng)能AI衛(wèi)星或?qū)⒊蔀槌杀咀畹偷腁I計(jì)算方式。”隨后,SpaceX被曝出基于Starlink V3衛(wèi)星改造太空算力的計(jì)劃,谷歌公布了“太陽(yáng)捕手”計(jì)劃,一場(chǎng)圍繞太空算力的全球競(jìng)賽,已經(jīng)鳴槍。
![]()
邢若粼用一個(gè)有趣的比喻來(lái)講項(xiàng)目愿景:“我們做的事情,其實(shí)就是打造一臺(tái)極致的AI Token Machine。”
想法很酷,當(dāng)然挑戰(zhàn)更不簡(jiǎn)單。宇宙射線會(huì)擊穿芯片、造成數(shù)據(jù)翻轉(zhuǎn)。傳統(tǒng)解法是花大價(jià)錢采購(gòu)抗輻射的航天級(jí)器件,但這意味著成本極高、商業(yè)化艱難。
一葦宇航走了另一條路——用軟件的冗余對(duì)抗硬件的脆弱性。在老股東麟閣創(chuàng)投的一篇文章中可以看到,一葦宇航自研了一套基于Rust的雙內(nèi)核操作系統(tǒng)RROS,而思路和SpaceX的Starlink一脈相承:接受單點(diǎn)失效的可能性,但通過(guò)架構(gòu)冗余確保系統(tǒng)整體可用。根據(jù)在軌實(shí)測(cè),RROS可在200毫秒內(nèi)完成故障切換,平均無(wú)故障時(shí)間超過(guò)1萬(wàn)小時(shí)。
這帶來(lái)了一種誘人的商業(yè)圖景:把芯片發(fā)射到太空,組成星座,用太陽(yáng)能驅(qū)動(dòng)算力,把能源轉(zhuǎn)化成Token,再用Token的收入繼續(xù)加強(qiáng)整個(gè)制造環(huán)節(jié)。“這是一場(chǎng)工業(yè)體系對(duì)地面?zhèn)鹘y(tǒng)的基建IDC模式徹底的顛覆,它是一個(gè)閉環(huán)的飛輪,這個(gè)效應(yīng)會(huì)不斷自我加強(qiáng)。”
長(zhǎng)遠(yuǎn)看,這甚至可以形成AI for AI的循環(huán),讓AI自己來(lái)迭代這套太空算力系統(tǒng)——基于Token的消耗產(chǎn)生更多Token,構(gòu)建新時(shí)代的商業(yè)飛輪。
有意思的是,這個(gè)看似最為硬核的創(chuàng)業(yè)故事,有個(gè)頗為詩(shī)意的名字。“一葦宇航”取自達(dá)摩“一葦渡江”的典故。達(dá)摩一葦渡江傳播自己的理念,邢若粼和他的團(tuán)隊(duì)想在茫茫宇宙中“擴(kuò)展人類意識(shí)的邊界”,并且要在五年內(nèi),追趕乃至超越SpaceX的10萬(wàn)瓦級(jí)衛(wèi)星算力。
概括而言,一葦宇航最終優(yōu)化的是端到端產(chǎn)生Token的成本。當(dāng)大量算力可以在太空軌道上運(yùn)轉(zhuǎn),地球上的我們,大概不必再為AI賬單焦慮了。
1
有必要再提一句這些項(xiàng)目的地理坐標(biāo):海淀。
一個(gè)好項(xiàng)目可以在一個(gè)季度內(nèi)完成兩輪融資,有野心改變未來(lái)的在校生不必猶豫就能大膽創(chuàng)業(yè)。這些事以前都是小概率,現(xiàn)在正變得越來(lái)越普遍。很難說(shuō)這跟海淀的土壤沒(méi)有關(guān)系。
跟這里的創(chuàng)業(yè)者聊天,很容易得到類似的反饋:在這兒做AI和硬科技,不用跨區(qū)就能對(duì)接研發(fā)、測(cè)試和場(chǎng)景。從種子期到成長(zhǎng)期,有人幫你把投融資、政策申報(bào)、孵化服務(wù)全鏈條跑通。這意味著你可以把絕大部分精力,留給技術(shù)攻堅(jiān)本身。
這其實(shí)是一種很稀缺的托底。在介紹中關(guān)村科學(xué)城創(chuàng)投生態(tài)時(shí),中關(guān)村科學(xué)城公司副總經(jīng)理聶麗霞說(shuō),海淀正在持續(xù)構(gòu)建“投資本+投資源+強(qiáng)服務(wù)”的創(chuàng)投 生 態(tài)體系。
從這個(gè)角度看,AI的賬單大概真的會(huì)變便宜。但這不只因?yàn)閯?chuàng)業(yè)者們?cè)诎l(fā)揮才智、技術(shù)在演化進(jìn)步,也因?yàn)橛腥嗽敢猓劝褎?chuàng)新本身的代價(jià)壓下來(lái)一截。比起解決某一個(gè)技術(shù)命題,這也許是更重要的事。
![]()
點(diǎn)個(gè)“愛(ài)心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.