![]()
讓中國所有能被用起來的芯片,都能以最高效率地產生Token。
文|《中國企業家》記者閆俊文
見習編輯|李原編輯|何伊凡
圖片來源|受訪者
對比前兩年的艱難摸索,最近一年,夏立雪創業進入到了“低阻力超音速”的狀態。
“前兩年,Token規模尚未真正起量,我們要面對方向選擇、節奏布局等沒有標準答案的難題。現在賽道和需求都比之前清晰了,雖然不確定性依然在,但不一樣的是,很多事情開始能落地、能衡量了。最初的判斷正一點一點被驗證,能朝著明確的目標全力跑起來,這已經是非常理想的創業節奏。”
5月7日,AGI基礎建設服務商無問芯穹宣布,公司獲得超7億元融資,聯合領投方為杭州高新金投集團和惠遠資本,跟投方包括國興資本、秦淮數據等,老股東君聯資本、上海國投孚騰和元智未來追加投資。
無問芯穹聯合創始人兼CEO夏立雪接受《中國企業家》獨家專訪時表示:“公司從2025年下半年就啟動了這輪融資。當時,我們認為模型能力突破了商業化的臨界點,大模型正從好技術到好產品,再到好產業轉化。我們當時就預判,應該要儲備更多彈藥。”
夏立雪判斷,AI產業已進入現金流閉環階段。企業賺取的收入可重新投入生產,制造并輸出高價值的Token,再通過商業化變現形成持續回款,實現可盈利、可循環、可擴張的成熟產業鏈。
而在整個AI產業鏈中,Infra層起著關鍵作用,它是整合芯片與能源的“Token工廠”,涵蓋數據中心、冷卻系統、網絡架構等硬件設施,也是英偉達CEO黃仁勛所提出的五層蛋糕——能源、芯片、基礎設施(Infrastructure)、模型、應用中的關鍵一層。
夏立雪認為,在供小于求的市場里,算力可能長時間供給不足。“不是最有錢的人就能占領最高的行業地位,而是最懂得做好優化的人。”
無問芯穹上一次融資是在6個月前,2025年11月,公司完成了5億元A+輪融資。再向前追溯,2024年8月宣布完成近5億元A輪融資,加上天使輪,無問芯穹公開披露的累計融資,已經超過22億元。
![]()
無問芯穹成立于2023年5月,發起人是清華大學電子工程系教授汪玉,夏立雪、聯合創始人兼首席科學家戴國浩、首席技術官李伯勛都曾是汪玉的學生。
汪玉在2025年9月的一次演講中提到,如何優化單位能耗下的Token效率,將是AI 2.0時代基礎設施與系統設計的核心命題。評價基礎設施效能的核心指標已經發生了變化——傳統的“每焦耳能量所能支持的計算次數(TOPS/J)”正被“每焦耳能量所能處理的有效Token數量(Tokens/J)”所取代。
無問芯穹將目標鎖定為打造“最高效的Token工廠”,以及成為Token經濟樞紐。這個定位比之前公司提出的“AI加速”和“送鏟人”更為清晰聚焦。
面對國產芯片與海外高端算力并存、性能與生態參差不齊的行業現實,無問芯穹走出了一條以多元異構、軟硬協同、自主化AI為核心的獨特路徑。目前,無問芯穹平臺已接入包括Kimi、智譜、DeepSeek、通義千問、MiniMax等在內的頭部大模型。
夏立雪坦言,國產芯片不必追求一步到位替代海外方案,而是要邊跑邊改、邊用邊優。真正的效率突破,是把不同算力放在最擅長的位置。
無問芯穹通過異構混訓混推,實現了英偉達與國產芯片的混合使用,把大模型的預填充與解碼、訓練與推理、復雜算子與常規計算合理拆分,讓每一分算力都實現了價值最大化。這得以讓大模型廠商在逐步提升國產芯片承載比例的同時,不必損失3~6個月的迭代周期。
以Token為中心的商業模式正在讓整個AI產業感到興奮。對此,夏立雪提供了幾個關鍵數據:第一,去年底至今年4月底,無問芯穹MaaS平臺模型推理的Token用量以20倍速增長,并且增長量主要來自大規模商業化以及智能水平最好的模型。
第二,未來6個月,Token的使用量將供不應求,并會保持這種增速。
第三,Token漲價潮即將到來。夏立雪說:“漲價和成本降低這兩件事情疊加起來,你就會發現這是一個盈虧平衡線的問題:Token價格上漲、同時成本降低,會使得原本某些領域虧本的生意變成賺錢。所以,AI最終的盈虧平衡線是能夠在更多場合內取得正向收益。一旦取得正向收益,供需的飛輪就會轉起來。”
DeepSeek-V4的發布,也讓這條路徑迎來關鍵拐點。V4發布的Pro與Flash雙版本,兼顧了極致性能與普惠成本,為國產芯片提供了規模落地的最佳載體。
夏立雪認為,DeepSeek真正的價值,不僅是對硬件友好的優化,更是用開源生態與分層產品策略,把國產芯片真正帶入商業化主航道。更多國產芯片有望被高效激活、規模化使用、持續迭代。
他預判,憑借電力、模型性價比等因素,中國未來會成為全世界的“Token生產工廠”。“過去Made in China是制造業,現在是AI Made in China。”
以下是夏立雪接受《中國企業家》獨家專訪的內容(有刪減):
行業仍在10倍速增長
《中國企業家》:作為產業上下游中間的Infra層,你預計今年的競爭是不是會格外激烈,會不會淘汰幾家?
夏立雪:我認為不是。一個產業如果要淘汰公司,核心原因是需求飽和,從而出現白熱化競爭。但目前AI產業需求非但沒有飽和,還在大量增長,對上下游都有帶動。既然整個產業都有更大的蛋糕可以切,中間任何一個階段、任何一個層次,都會有更大的市場可以分。
具體到Infra這個賽道,它的價值是把底層資源發揮出更大的產能。如果現在國內的芯片夠用了,才能談得上飽和。但現在和未來很長一段時間,都是極度緊缺的狀態。
黃仁勛在演講中描述的基礎設施,被他放入了“能源、芯片、基礎設施、模型、應用”五層蛋糕體系內。大家能感受到這是一個萬億級的市場,我們在里面做到千億、百億的收入,都是很不錯的狀態。
現在更多的關注點,應該是自己的技術能不能進一步做好、能不能提供產業價值、客戶認不認可我們的價值,以及能不能持續推出更好的產品迭代。這幾件事情遠比競爭關系重要得多。
《中國企業家》:所以AI Infra行業還是一個你追我趕的馬拉松式競爭?
夏立雪:現在可能還談不上競爭。蛋糕足夠大,隨便圈一塊地,都可以先蓋起一座自己的城市。大家都還在選擇做哪一塊市場,遠沒到需要拼刺刀的階段。
![]()
《中國企業家》:在整個Infra層,無問芯穹相比于競爭對手,核心價值點在哪里?
夏立雪:在今天這個時間點,占據最高行業地位的不是最有錢的人,而是最懂得做好優化的人。
Token工廠的底層邏輯,就是對每單位資源所生產的Token,以及每Token所帶來的生產力水平,進行優化。因此,我們一直是按照技術價值和產業價值打通的方式來做Infra。
在黃仁勛的AI產業五層結構中,基礎設施立足在中間層,向上需要把算法和應用的know-how、業務的流量、尺寸和分布,都納入到優化空間內;向下要把芯片結構,甚至能源建設都納入考慮。所以基礎設施是一個非常需要全棧技術能力的層次。
我們有很強的算法團隊,也有很強的偏硬件團隊,既能把算法中最好、最重要的計算保留下來,又讓這些計算能絲滑地跑在硬件最擅長的結構上。這兩者之間的打通,是Infrastructure最核心的競爭力,也是無問芯穹在行業里最獨特的一點。
我們從成立最開始就立足軟硬協同、多元異構的核心技術,做M種模型和N種芯片之間的聯合優化,這些都是在宣告我們的立場:要把每一塊芯片上的每一分算力、每一秒鐘都壓榨到極致,這就是我們為這個行業帶來的價值。
《中國企業家》:一家國產大模型廠商說,算法迭代如果要適配國產芯片,至少要損失3到6個月的時間。基于國產算力、異構芯片,你們怎么去盡量彌補這個時間差,做到性能先進或者效率先進?
夏立雪:最重要的是把任務做合理的分工和拆解。以DeepSeek-V4為例,它有Pro和Flash(專業和快速)兩個版本,參數量分別是1.6T和284B,面向不同的應用場景,有不同分工。
我們做多元異構,除了把A國產芯片和B國產芯片混在一起,更重要的是能夠把國產芯片和英偉達芯片也混在一起。它們之間也形成分工,從又大又重、對算子庫、性能、帶寬都要求拉滿的任務中,拆出國產芯片能夠承擔的子任務;而國產芯片暫時還不擅長、需要花一些時間才能應對的復雜任務,交給英偉達芯片處理。
我們之前還做過更難的事情:把訓練任務也拆開,讓兩種芯片配合起來完成訓練,混合下來的折損率在3%以下,達到97.6%的混合訓練效率。
現在,我們能把大模型的推理,比如Prefill(預填充)和Decode(解碼),拆在兩種不同的芯片上,去做異構PD分離。
這就是無問芯穹的價值:通過拆解任務,讓每份算力做最擅長的事情,不讓用戶“等”。對大模型來說,“等”是一個很可怕的機會成本,只要不讓它等,就能邊跑邊改。
《中國企業家》:邊跑邊改會不會影響客戶體驗?
夏立雪:首先要讓客戶從體感上,認知到國產芯片是能用的。邊跑邊改之后,才有改的方向,因為Token工廠本身有很重要的飛輪:運行的業務越多,越能發現里面的優化空間。
對我們來說,整個Token工廠的價值,就是積累了更好的優化之后,提供更具性價比的Token。讓更多的人來用,飛輪就轉起來了。
所以,國產芯片的生態閉環非常重要。無問芯穹提供的核心價值,是我們通過對任務進行拆分,打通芯片之間的通信庫,讓芯片的容錯、SLA(服務等級)能夠穩定達到可用,最后再統一交付。
《中國企業家》:你怎么評價DeepSeek-V4的發布?
夏立雪:首先,它是相當好用的開源模型,DeepSeek繼續把開源模型的生態體系推廣下去,未來一定能看到更多應用在開源生態中爆發。
其次,V4模型有相當多的優化技術,也兼顧了硬件友好。比如它對Cache(緩存)的一些優化做得很好,使得用當前的硬件也可以去支撐非常長的Token上下文。未來Token使用量還會進一步快速增長,對Infra層也帶來了更多的需求。
第三,同時發布Pro和Flash兩個模型,是健康的模型規劃。更大尺寸的Pro模型,追求AGI的實現;好用,但成本又沒那么高的Flash模型,可以更好地把國產芯片用起來。
用戶也是用腳投票的,DeepSeek之所以會花精力發布Flash模型,他們一定是發現了這個版本也能滿足很多行業的需求。這意味著整個AI賽道都在走向更健康的狀態,不再只有最尖端的模型大家才愿意用,200B量級的模型也有很多人愿意用。
讓國產芯片最高效率產生Token
《中國企業家》:無問芯穹正在打造最高效的“Token工廠”,你們之前是AI加速、所謂的“賣鏟子”,這是不是一個定位的升級?
夏立雪:我不知道“升級”這個詞算不算重,但我們核心技術的內核沒有變化,一直都在研究怎么把每一分算力的價值發揮到極致。
更多從業者在訓模型的時期,我們提供的是怎么把已有資源用得更好,更像是“遞鏟子”的工作。
現在,技術本身的目標沒有變,但業務發生了變化,產品形式和商業模式也會隨之自然轉化:大量需求來自Agent和各行各業的客戶。在這個時間點,只提供“發動機”,客戶不一定能組裝成最好的“流水線”,倒不如由我們把整條“流水線”搭起來。
既然Token已經是有量、能定價、有一定標準化趨勢的商品形態,那我們完全可以利用自己的技術優勢,向市場提供最高效的優質Token產能。
![]()
《中國企業家》:現在,你們最大的目標指引是不是Token?
夏立雪:是Token的生產效率和Token產生的價值,最典型的目標就是Token/秒。我們也在嘗試用各種各樣的方法,讓Token/秒這個指標變得更好,所有的優化最后都可以回到這里。
算子優化直接提升了芯片上每秒產生的Token;穩定性優化、運維工作最后也都是為了提升Token/秒。
我們之所以使用各類異構芯片,也是為了讓“Token/秒”的資源系數變得更大,讓更多的芯片貢獻到“Token/秒”中。一句話描述:讓中國所有能被用起來的芯片,都能以最高的效率去產生Token,這就是我們當前最重要的目標。
我們也在投入一部分精力,幫助那些對Token還用得沒有最高效,但有很好的創意和產品能力的中小創業者:他們可以用我們的工具把從Token到生產力的環節做好,讓他們把百分百的精力,花在釋放Token生產力,推出自己的產品上。
《中國企業家》:前段時間,你們還推出了一個龍蝦盒子,打造企業級的Token工廠。龍蝦盒子相較于市面上其他部署方案,在降低Token成本、提高產出效率方面解決了哪些痛點?
夏立雪:龍蝦盒子是一種產品形式,目前還在早期階段,我們更關注的是技術價值的內核。這個產品最重要的一點是,它反映了我們最終解決的是Token到生產力的轉化效率。這涉及不同模型之間的配合,以及在不同數據域之間的安全性問題。
龍蝦盒子最核心的賣點,聚焦于“每Token所釋放生產力”的優化目標上。因為Token可以分層,一部分任務用最強的模型,另一部分任務用更具性價比的模型。盒子可以用來跑小模型,重點解決的是數據傳輸時的安全問題。
這件事既能用在終端的龍蝦盒子上——它針對的痛點是數據不想上傳到云端。未來也可以用在另一種場景——云上跑大模型,同時配合小集群,所以它更多代表我們在技術路線上的新布局和突破。
我們之前提過“異構、異域和異屬”,一網三異。異構解決的是同一個集群中如果有兩種不同的芯片,怎么一起跑。異域解決的是跨越一定距離(最遠可達4000公里)的兩個集群,怎么一起跑。異屬解決的是兩種不同數據區內的資源,怎么一起跑。龍蝦盒子,也是這個技術路線的落地。
《中國企業家》:阿里、字節、騰訊都成立了Token的部門,你們內部團隊會有這種專門的Token團隊嗎?
夏立雪:我在很早期提過一個概念,叫“模力資源部”,參照“人力資源部”的思路,因為未來AI就是人的擴展。目前,公司內部用AI寫代碼這件事,基本上已經是100%覆蓋;我們也在用AI做運維;甚至內部還有幫大家用AI畫PPT的工具。
現在有不少公司存在專門負責AI應用的部門,考核指標可能是公司和員工每天的Token使用量。雖然有點矯枉過正,最終不一定就是這種形態,但在早期完全可以先按這種方式跑起來。
《中國企業家》:你提到,過去每兩周就會翻倍Token的使用量,那未來一年或者未來幾年都會保持這個增長趨勢嗎?
夏立雪:調用量現在還是被供給卡住了。以后Token調用量增長,代表了用戶對Token性價比的接受度,或者供給成本下降的速度。
未來3到6個月,大概率還會保持當前這樣的供需狀態;6個月后,可能會有一波新的Token用量爆發。這是因為供給能力有望大幅擴充:既包括新結構的國產芯片,也包括從模型到硬件的聯合優化。此時,Token性價比和技術優化空間,也都會同步變大,這既讓可用的資源增多,也讓更精尖的芯片,有更高性價比的Token產出率。
就像之前的流量時代,用戶從每個月花幾百兆流量到用上幾個G流量,但花的錢并沒有增加10倍。Token用量增長,也帶來了整個產業的繁榮,成本也會持續顯著下降。
《中國企業家》:你們內部怎么評價Token的指標?是看使用量、看數量規模,看它的增速,還是看它帶來的客戶付費?哪個才是AI Infra公司價值的第一指標?
夏立雪:不同階段指標肯定不一樣。在快速增長的階段,高價值Token用量的規模,是最重要的。同時,萬億參數模型大概率還是挺貴的,這代表Token和基礎設施產生了對行業有價值、有回報的輸出。
用量越大,能看到的優化空間越多;優化技術如果不錯,就能產生更好的性價比,用量就會進一步增加,從而產生飛輪效應。
作為CEO,我更關注公司運轉得好不好,看的是技術深度和客戶認可度:能不能在技術主導的賽道保持最先進的領先地位,客戶是不是認可我們的產品價值。外化的指標,是高價值模型的付費量或者調用量。
《中國企業家》:從你們平臺上Token使用量的增速來看,主要來自哪些行業客戶、哪些場景?智能體的貢獻大概占比多少?
夏立雪:95%以上都是智能體產生的。所屬行業也很豐富,其中寫代碼占大頭,還有內容創意生成等。
中國將成為Token世界工廠
《中國企業家》:現在大家都在說Token漲價這件事情,你覺得Token應該漲價嗎?或者你們覺得它應該怎么去定價?
夏立雪:多數國內模型的價格水平和漲幅都低于海外模型,但智能性已經不錯了,所以漲價空間是有的。
更重要的是,漲價背后的邏輯是用戶付費意愿——漲完之后還有人愿意買,這才是剛需。
漲價和成本降低這兩件事疊加起來,是盈虧平衡線的移動,原本某些領域虧本的生意變成賺錢,緊接著就會進入供需增長飛輪,最終給用戶帶來實惠。
![]()
《中國企業家》:你會覺得長期來看Token會不會產能過剩,或者Token太多市場上消化不了,導致新一輪的價格戰?會有這樣一個拐點嗎?
夏立雪:未來Token會分層。一層是更優質的、產生更大價值的Token,另一層可能是白熱化競爭、追求極致性價比的Token。這很像互聯網廣告流量,最終都按CPM(千人成本)計費,大家了解哪些渠道的曝光更值錢。Token經濟在這方面更明確,因為模型智能性水平,就體現在Token質量上。
我們作為Infra廠商看到的是,優質Token未來還是嚴重供不應求。全世界都這樣,在中國,稀缺度其實更高。
《中國企業家》:3月底的時候,昆侖萬維創始人周亞輝對我們說,移動互聯網的CPM在十年間是漲的,獲客成本越來越高,可能漲了10倍。在這個Token時代也可能是這樣——Token的成本看起來越來越低,但可能價格也會相對應地漲10倍。
夏立雪:CPM漲,核心是因為廣告投放平臺推出了以ROI為目標的優化模型,能“保轉化”。
Token也一樣。未來定價可能按照模型類型分層,也可能按照Token的輸入輸出,甚至按SLA分層定價。但本質上都是為Token所產生的轉化價值去分層。既然它轉化為生產力的價值更高了,Token本身價值就更高,價格也可以更高。
《中國企業家》:你曾提到過,中國未來會成為世界的Token工廠——過去Made in China是制造業,現在是AI Made in China。
夏立雪:中國擁有豐沛的能源結構優勢、完整的AI產業鏈和全球最大規模的AI應用市場,完全有能力復刻“Made in China”的成功路徑。
以終為始,既然價值存在,所需要解決的就是方式、方法和鏈路的問題。
《中國企業家》:有些人說,電力就是算力、電力即Token。你會怎么評價這個觀點?
夏立雪:未來在穩定的狀態下,確實如此。比如芯片選型中,至少幾家芯片廠商都有了可觀的市場份額。此時意味著建設“Token工廠”,主要成本是原材料,而不是“房子”。
英偉達還是太貴了,相當于“房子”是拿金磚蓋的,電的優化價值還沒有完全凸顯。但再過兩年左右,“房子”的成本會變得可控,那時評價Token工廠的生產效率,看的一定是“原材料”到“成品”的轉化效率。
因此,未來電的成本以及電到Token的轉化率會變得更關鍵。中國在能源方面的優勢,一定會在全球展現出巨大的行業價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.