<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      對話清程極智核心團隊:不是所有Token都是好Token

      0
      分享至



      智東西

      作者 | 陳駿達

      編輯 | 李水青

      智東西5月26日報道,今天,北京AI Infra創企清程極智舉辦了一場小范圍媒體溝通會,系統性地梳理了其成立以來的技術脈絡與產品版圖。

      清程極智成立于2023年底,核心團隊來自清華大學計算機系高性能所,在高性能計算等領域有豐富經驗。截至2026年3月,清程已完成3輪融資,投資方包括北京市人工智能產業基金、聯想、中科創星等知名產業基金。

      目前,清程極智已經推出了智能計算軟件棧八卦爐(Bagualu)、大模型推理引擎赤兔(Chitu)、大模型服務評測與API調用平臺AI Ping等多款產品,覆蓋AI訓練、推理與應用服務的完整體系。

      清程極智重點展示了AI Ping在Token服務環節的能力,包括通過7×24小時持續評測、異地分布式測試以及智能路由,對不同Token服務商的延遲、吞吐和穩定性進行動態觀測與調度。

      在推理層面,清程極智分享了赤兔推理引擎的技術路徑,包括底層自研架構、國產芯片適配,到支持FP8/FP4等量化技術的實現思路,以及其在昇騰、沐曦、海光、摩爾線程等國產算力生態中的實踐進展。

      清程極智核心團隊還向智東西等媒體分享了不少行業一線觀察,話題涵蓋Token服務成本、國產算力適配和模型技術路線等。

      清程極智首席科學家翟季冬提出了Token有好壞之分的觀點,即便是同一個模型、同樣數量的Token,不同服務商在首Token延遲、吞吐量、支持的上下文長度這些指標上,表現可能相差四五倍。

      清程極智聯合創始人、產品副總裁師天麾則進一步揭示了Token服務中的亂象,比如有些廠商Token單價看似不高,但緩存命中率低,反而拉高總體使用成本。

      一、Token經濟爆火,如何少花“冤枉錢”

      2026年,Token經濟成為新的熱詞。清程極智首席科學家翟季冬拋出了一組數據:從全球范圍看,Token每日調用量從2024年初的約0.5萬億,攀升至今年3月的300至600萬億,增長近300倍;而中國的增速更為驚人,同期從0.1萬億增長至140萬億,增幅高達1400倍。



      是什么在驅動這種增長?翟季冬說道:“現在Top 10的AI應用中,Agent能占到80%以上。Agent和單輪對話不一樣,它需要多步執行,每一步都可能調用大模型,Token消耗量是普通對話的好幾倍。另外像AI編程這類工具,Token調用量也非常大,未來可能真的會取代相當一部分普通程序員的日常工作。”

      中國具備獨特的Token經濟發展土壤。翟季冬稱,在供給側,政府在大力建智算中心、數算中心、超算中心,算力基礎設施在持續增長。

      模型層面,DeepSeek、GLM、Kimi等優秀模型在不斷開源,云廠商部署很方便,連電信、移動這樣的運營商都在朝著Token服務方向走。

      需求側,中國的企業級用戶、開發者、科研人員、普通消費者,都對Token有著真實的需求。



      然而,市場爆發并不等于用戶獲得了良好體驗。如今,業界常常將Token比喻為“水電煤”,但翟季冬認為,Token與電力還有些細微的區別:當我們使用電力的時候,并不關心是風電、水電、火電,但Token本身,是有好有壞的。



      國內目前已經涌現出數十家Token供應商,但服務質量參差不齊,流通環節問題凸顯。用戶面對眾多模型和供應商,往往難以判斷Token的好壞與差異,選擇變得異常困難。

      清程極智團隊在日常業務中,接觸了大量“花冤枉錢”的案例。清程極智聯合創始人、產品副總裁師天麾說道:“買Token里頭有很多的坑。”

      第一個坑是不同服務商模型效果不一致。以DeepSeek模型為例,即便是同一個版本、同樣的機器、同樣的價格,不同服務商提供的模型效果也是不一樣的。

      第二個坑是不同服務商Token服務的實際成本不一致。有些情況下,就算標價相同、生成Token數相同,但不同服務商最終成本可能差好幾倍。

      這與緩存命中率有關。有的服務商緩存機制做得好,實際重復的請求不用重新計算,成本就低;有的服務商技術不行,每次都要重新跑,用戶花同樣的錢,買到的有效計算可能少很多。

      第三個坑是服務質量。迅速興起的Token廠商服務質量參差不齊,有的順暢,有的卡頓,甚至會出現服務變笨的情況。清程極智觀察到,目前“慢響應”的問題愈發突出,拿到請求后Token服務廠商原本應該3-5秒返回結果,但實際情況是,30秒、50秒甚至300秒都可能出現。

      從用戶實際體驗的角度來說,這種相應速度已經基本不可用,然而在廠商的服務質量保證中,只要返回了結果就算可用。

      翟季冬說道:“不同服務商在首Token延遲、吞吐量、支持的上下文長度這些指標上,表現可能相差四五倍。”

      二、給大模型API做個“大眾點評”,7×24小時持續評測、智能調度模型

      今年一月,清程極智推出了AI Ping,就是為了解決上述問題。開發者將AI Ping形象地稱為“大模型API服務的大眾點評”。

      AI Ping面向開發者的兩大核心需求提供支持:一是通過7×24小時的持續評測,呈現全面、客觀、真實的大模型服務性能指標,提供客觀、可驗證的性能榜單;二是借助統一API接口、智能路由調度等功能,幫助需通過云端調用大模型的開發者縮短決策周期、提升開發效率、降低接入成本。

      師天麾詳細介紹了AI Ping背后的關鍵技術。

      在測評方面,AI Ping主打的是從真實用戶的視角出發,做端到端的匿名評測。為確保公平性,他們會使用同樣的模型、同樣的輸入、在同一個時間段進行測試,并通過動態輸入機制改變評測內容,避免服務商針對評測進行“作弊”。

      同時,這一評測不是一次性的,而是24小時不間斷的進行,還會同時在北京、深圳、上海、成都等地進行分布式的異地評測。

      師天麾稱,他們將部分評測結果與國內云廠商的性能監測進行過交叉驗證,誤差基本控制在1%以內。AI Ping目前可以將Token服務的成本降低超37%,吞吐提升超90%,延遲降低超20%,可用率達到99.99%以上,對標服務質量最高的云大廠。



      這些評測成為AI Ping提供智能路由服務的基礎。清程極智觀察到,同一家服務商的延遲、吞吐在一天內大幅度波動是十分正常的現象,對于用戶而言,如果選擇單一的服務商,資深的服務穩定性就會受到影響。

      AI Ping的智能路由就像是一套導航系統,針對模型調用過程中的卡頓、成本失控等問題,智能調用最優鏈路,實時規劃高效調用路徑。

      同時,有些模型適合處理快速問答、有些模型適合復雜推理,AI Ping智能路由還可以實現不同模型的搭配。

      用戶還可在AI Ping上根據自己的需求選擇模型策略,比如默認模式、成本優先、性能優先等等。

      師天麾認為,AI Ping提供的服務隊中小企業而言尤其具有價值。對大廠而言,采購幾十個服務商提供的Token服務,然后進行評測并不是件難事,但中小企業因為成本、技術等原因很難做到這點。

      三、自研國產大模型推理引擎,不簡單挪用現成技術

      清程極智的另一大關鍵產品,是其生產級大模型推理引擎“赤兔”。清程極智聯合創始人唐適之詳細介紹了推理引擎的技術原理和赤兔的技術特點。

      推理引擎是運行在AI算力上的計算機程序,它接收用戶輸入,依據大模型定義進行計算并產生輸出,其輸入輸出以Token為單位進行計量。之所以需要專門開發推理引擎,是因為開源模型本身只是數學表示,要實現接收輸入并產生回答的完整過程,就必須設計相應的推理引擎程序。



      一個高效的推理引擎需要滿足多方面的要求:其精度要能如實反映模型的回答能力;吞吐量要大,每秒鐘處理的請求和Token數量要足夠多;延遲要低,每個請求的處理時間要盡可能短;同時還要占用盡可能少的硬件資源,并且運行穩定,避免因頻繁報錯導致服務中斷。

      赤兔推理引擎正是為應對這些挑戰而自主研發的。赤兔由清程極智聯合清華大學團隊推出并開源,同時也提供商用版本。開源版服務國產算力生態并持續迭代,企業版則服務企業級高端需求。

      赤兔推理引擎從第一行代碼就均為自研,面向國產芯片開發,既能在昇騰、沐曦、海光、摩爾線程等廠商的國產芯片上運行,也能在進口芯片上運行,具備較強的兼容性,為行業節約了大量重復工作的成本。



      在適應國產算力方面,赤兔引擎沒有像很多現有方案那樣簡單挪用vLLM、SGLang等現成技術,而是真正考慮國產芯片與英偉達芯片在計算能力、數據表達能力、硬件調度和通信方式等方面的差異,在技術上做了針對性突破。

      例如,他們通過軟件實現對FP8/FP4等浮點數量化類型的支持,在有硬件支持的GPU上可以節省顯卡并提升速度,在沒有硬件支持的國產卡上則可以有效降低成本并達到可用的使用價值。

      總體而言,赤兔這樣的國產推理引擎在國產算力和國產模型之間搭建起重要的橋梁,完善了整個生態,助力國產AI推理鏈條實現自主可控。



      四、談模型架構演進與國產算力生態

      會后,翟季冬、師天麾、唐適之與智東西等媒體進行了深入溝通。

      唐適之向我們介紹了赤兔推理引擎的技術積累。大模型興起之前,流體力學模擬、藥物設計相關的計算需求也很高,如今AI Infra層的許多技術都源自于高性能計算。清程極智核心團隊所來自的清華大學計算機系高性能所,已經在這方面有幾十年的技術積累。

      談及國產算力生態的建設,唐適之回憶起了英偉達的往事。唐適之稱,之前他還在清華學習時,英偉達會主動向他們贈送免費GPU,為的就是打造生態,如今英偉達的生態已經較為成熟,其芯片也成為緊俏的商品。

      目前,各大國產芯片廠商都在自建生態,但這些生態都相對獨立。不同國產廠商的所需要的技術很多都是共通的,清程極智想做的就是站在更宏觀的視角,服務整個國產算力的發展。

      智東西向唐適之詢問了國產芯片適配過程中的具體細節。唐適之解釋稱,芯片能力的發揮不僅依賴硬件本身,更依賴系統軟件的深度優化。當前國產算力適配涉及算子庫、編譯器、并行方案等多個技術層面,它們解決的是同一問題:如何讓芯片將更多時間投入真實有效計算,而不是消耗在無效的數據搬運和通信開銷上。

      他舉例稱,算子庫更偏向手工優化,能夠精細調用芯片計算單元;編譯器則偏向自動優化,但自動生成的效果未必始終最優。因此,在實際部署中,需要綜合不同技術手段,根據芯片架構特點選擇最適合的方案,有時甚至需要多種方式協同使用。

      對于市場關注的“Token越來越便宜”趨勢,師天麾則從供需關系與調度效率角度給出了觀察。他認為,大模型推理成本下降并不意味著Token不再緊缺。當前國內推理需求仍在快速增長,尤其長上下文、多輪交互等應用興起后,Token消耗速度遠超以往,而算力供給卻難以同步擴張。

      師天麾透露,清程極智正在嘗試通過評測和智能調度提升算力利用率。“全中國總會有一些服務繁忙,也會有一些服務空閑,但過去業界并不知道誰繁忙誰空閑。”有了AI Ping之后,清程極智可以用更便宜的價格獲得Token、并以更便宜的價格對外提供服務,提高算力的利用率,然后同時也給用戶來降低成本。

      翟季冬則分享了他對大模型技術路線演進的看法。他認為:“如果朝著AGI方向看,上層模型其實遠遠沒有收斂,還有很多探索空間。”

      未來模型架構并不一定局限于傳統自回歸(Auto-regressive)路線。例如,去年螞蟻曾探索基于擴散機制的語言模型方向,其技術路徑與傳統自回歸架構有所不同,目前包括螞蟻在內的一些企業仍在持續推進類似嘗試,谷歌此前也進行過相關探索。

      與此同時,多模態統一模型也成為行業關注的重要方向。目前文本問答、圖片生成、視頻生成等能力大多仍由不同模型分別承擔,但越來越多企業正在嘗試將文本、圖片和視頻整合到統一模型之中,實現多模態能力的一體化。

      盡管翟季冬并非直接從事大模型研究,但結合與相關企業的交流和觀察,他感受到,整個行業仍在積極探索模型架構,未來仍有望出現新的模型架構與技術路線。

      結語:AI Infra效率成競爭焦點

      隨著大模型逐漸普及,模型背后的基礎設施效率愈發成為AI行業的競爭焦點。誰能更低成本、更穩定、更高質量地提供Token服務,誰就更有機會占據下一階段優勢。

      與此同時,國產算力生態也在加速發展,行業對于新型架構、互聯效率和系統級優化的探索明顯加速,轉向“芯片+軟件棧+推理引擎+應用生態”的整體協同。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      蘇芒徹底翻車!代言的汽車遭到抵制,接受魯豫采訪的評論區也炸鍋

      蘇芒徹底翻車!代言的汽車遭到抵制,接受魯豫采訪的評論區也炸鍋

      火山詩話
      2026-05-26 11:15:20
      王岳倫上海高調戀新歡!審美始終不變,氣場卻難超前妻李湘

      王岳倫上海高調戀新歡!審美始終不變,氣場卻難超前妻李湘

      情感大頭說說
      2026-05-27 15:08:08
      “我想殺他的心都有”,小兒子的出生記錄上,都是堂哥簽字的

      “我想殺他的心都有”,小兒子的出生記錄上,都是堂哥簽字的

      漢史趣聞
      2026-05-27 10:34:53
      五市黨委主要領導調整

      五市黨委主要領導調整

      上觀新聞
      2026-05-26 11:51:19
      這個發達的小國家,快被中國人“買”下了!中國移民占比高達九成

      這個發達的小國家,快被中國人“買”下了!中國移民占比高達九成

      瀟湘煙雨水
      2026-05-26 06:09:18
      夏天,三個豆子一起煮,濕氣跑了、脾胃棒了,睡得香了,正當時

      夏天,三個豆子一起煮,濕氣跑了、脾胃棒了,睡得香了,正當時

      阿龍美食記
      2026-05-26 14:15:09
      驚爆!張雨綺直播賣內褲引熱議,是她穿過的內褲?網友:真不尷尬嗎?

      驚爆!張雨綺直播賣內褲引熱議,是她穿過的內褲?網友:真不尷尬嗎?

      八卦王者
      2026-05-26 14:58:51
      特斯拉中國官網新增自動換擋,要來了!

      特斯拉中國官網新增自動換擋,要來了!

      花果科技
      2026-05-26 22:41:36
      湖南明確:一律先免職再徹查

      湖南明確:一律先免職再徹查

      第一財經資訊
      2026-05-27 11:08:08
      爸媽被嫂子趕出門來我家,老公要我只管吃穿不給錢,照做躲過一劫

      爸媽被嫂子趕出門來我家,老公要我只管吃穿不給錢,照做躲過一劫

      麥子情感故事
      2026-05-27 17:49:09
      法國學者點破中美博弈:中國將重返世界巔峰,美國開始讓渡地位!

      法國學者點破中美博弈:中國將重返世界巔峰,美國開始讓渡地位!

      錦年衍生煩愁
      2026-05-26 15:12:14
      地下助孕實驗室藏身杭州別墅區 記者暗訪遭工作人員暴力拖拽致骨折

      地下助孕實驗室藏身杭州別墅區 記者暗訪遭工作人員暴力拖拽致骨折

      大象新聞
      2026-05-27 18:28:16
      比賴清德還狂!若2028年她當臺灣地區領導人,解放軍出手武力統臺

      比賴清德還狂!若2028年她當臺灣地區領導人,解放軍出手武力統臺

      阿訊說天下
      2026-05-26 13:40:22
      社保局內部人員坦言:辦理退休簽字一刻,務必親口問清三句話

      社保局內部人員坦言:辦理退休簽字一刻,務必親口問清三句話

      椰青美食分享
      2026-05-25 19:15:50
      網吧老板當場趕人:這臺機器以后別想打這游戲了

      網吧老板當場趕人:這臺機器以后別想打這游戲了

      峽谷一級保護廢物
      2026-05-27 10:20:52
      被商業衛星發現!中國航母“遼寧”艦最新位置曝光,真到戰時如何隱蔽?

      被商業衛星發現!中國航母“遼寧”艦最新位置曝光,真到戰時如何隱蔽?

      軍武速遞
      2026-05-26 19:40:41
      才過了1個周,樊思睿事件就徹底沒熱度了

      才過了1個周,樊思睿事件就徹底沒熱度了

      金牌娛樂
      2026-05-27 11:52:58
      美女飛行員突破“12G”的瓜

      美女飛行員突破“12G”的瓜

      吃瓜體
      2026-05-25 16:16:43
      太突然!北京一39年公立幼兒園要關了!

      太突然!北京一39年公立幼兒園要關了!

      大北京早知道
      2026-05-27 16:07:06
      越鬧越大!庾澄慶公開內涵《歌手》節目組,淘汰真相徹底藏不住了

      越鬧越大!庾澄慶公開內涵《歌手》節目組,淘汰真相徹底藏不住了

      胡一舸南游y
      2026-05-27 13:43:47
      2026-05-27 21:08:49
      智東西 incentive-icons
      智東西
      智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
      11911文章數 117085關注度
      往期回顧 全部

      科技要聞

      韜定律:全球在卷納米數 華為換了一把尺子

      頭條要聞

      重慶兩個村被山洪毀了:十余人被沖走 一家五口失聯

      頭條要聞

      重慶兩個村被山洪毀了:十余人被沖走 一家五口失聯

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂要聞

      王鶴棣風波連累父親炸串店遭差評?

      財經要聞

      中國半導體的陽謀

      汽車要聞

      限時補貼價9.28-10.98萬 MG 4X正式上市

      態度原創

      家居
      旅游
      藝術
      公開課
      軍事航空

      家居要聞

      古老而持久 石影扶手椅

      旅游要聞

      美麗中國行|“超長待機”!五龍潭月牙泉持續噴涌263天 刷新紀錄

      藝術要聞

      這個夏天去蘇州過幾天清閑安逸的日子

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      以軍稱已打死哈馬斯新任軍事領導人

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩一区二区三区射精-百度| 国产精品亚洲色婷婷99久久精品| 国产一区二区| 色吊丝2277sds中文字幕| 久久精品国产亚洲αv忘忧草| 日韩av手机免费观看| 免费a片网址| 国产成人av大片在线观看| 日韩av在线一区二区三区| 乌克兰少妇videos高潮| 国产色婷婷视频在线观看| 亚洲成人av| 久久精品国产99久久3d动漫| 亚洲日韩久久综合中文字幕| 毛片自拍| 欧洲亚洲第一区久久久| 99久热re在线精品视频| 一本大道久久久久精| 亚洲の无码国产の无码步美| 中文字幕 亚洲 无码 在线| 久久一日本道色综合久久| 精品无码三级在线观看视频| 国产呦精品一区二区三区网站| 久久精品国产亚洲av天海翼| 午夜美女裸体福利视频| A级毛片免费高清视频不卡| 亚洲综合色婷婷| 骚老师av在线| 欧美午夜一区| 日韩精品人妻系列无码专区| 亚洲精品亚洲人成人网| 大桥未久亚洲无av码在线| 太仆寺旗| 精品国产一区二区三区四区vr| 把插八插露脸对白内射| 亚洲av黄片一区二区| 97久久久亚洲综合久久| 又粗又大又黄又硬又爽免费看| 精品亚洲AⅤ无码午夜在线| 人妻丰满熟妇AV无码区APP| 国产中文字幕精品免费 |