![]()
面向所有熱愛硬核技術(shù)的你:這一次,用代碼說話,用性能封神。
責(zé)編 | 夢依丹
出品丨AI 科技大本營(ID:rgznai100)
在 DeepSeek-R1 和 Kimi K2.5 等頂級開源模型確立了萬億參數(shù)的工業(yè)基準(zhǔn)后,真正的極限性能壓榨才剛剛開始。誰能在極高并發(fā)下打破內(nèi)存墻?誰能用最優(yōu)雅的代碼實(shí)現(xiàn)最高效的算子重構(gòu)?在當(dāng)下的 AI 戰(zhàn)場,速度即是正義,吞吐量決定生死。
由 AMD 與 GPU MODE 聯(lián)合發(fā)起的極客巔峰對決,正式向全球發(fā)榜:
2026 線上黑客松:AMD E2E Model Speedrun 正式吹響集結(jié)號!
在這里,你將直接操控 AMD 專為大模型打造的頂配云端 GPU 陣列
在這里,沒有紙上談兵的 PPT,只有硬核的絕對速度與吞吐量。
在這里,你的極限優(yōu)化不僅能贏取巨額美金,更將直接合入主流開源框架,定義下一代 AI 推理的工業(yè)標(biāo)準(zhǔn)!
你,敢來迎戰(zhàn)嗎?
![]()
注:CST 為中國標(biāo)準(zhǔn)時(shí)間
![]()
百萬美金獎池,憑實(shí)力“拿錢”
本次挑戰(zhàn)賽設(shè)立了高達(dá) 110 萬美元的總獎金池!只要你的技術(shù)夠硬,名與利雙豐收。
決賽入圍獎:只要從預(yù)選賽殺出重圍,躋身 Top 10,每支隊(duì)伍保底斬獲 10,000 美金!
Track 1 賽道桂冠 (DeepSeek-R1-0528):$350,000 獨(dú)攬!
Track 2 賽道桂冠 (Kimi K2.5 1T FP4):$650,000 獨(dú)攬!
注:兩大賽道完全獨(dú)立,有實(shí)力的團(tuán)隊(duì)完全可以雙線作戰(zhàn),包攬百萬美金!
![]()
賽制硬核,分秒必爭的“大逃殺”
比賽絕非易事,本次大賽將采用“底層算子突圍 + 端到端決賽大考”的雙階段賽制。能留到最后的,注定是地表最強(qiáng)的性能架構(gòu)師。
預(yù)選賽 —— 底層內(nèi)核的絕對廝殺
所有參賽者需對三大核心 GPU 算子進(jìn)行極限打磨:
1?? MXFP4 MoE (最高 1500 分)
2?? MLA Decode (最高 1250 分)
3?? MXFP4 GEMM (最高 1000 分)
每個(gè)內(nèi)核問題的得分= 最大分值 × [1 -(排名分值/20)]。
排名按順序所對應(yīng)分值= 0,1,2,…18,19。
總分為三項(xiàng)內(nèi)核問題得分之和,采用上述方法。
只有排名前 20 的算子才能獲得積分,總分排名前 10 的戰(zhàn)隊(duì)/個(gè)人,方可拿到通往決賽的門票。
總決賽 —— 真實(shí)世界的端到端狂飆
Top 10 選手將獲得 AMD 提供的單節(jié)點(diǎn) 8 卡云端 Instinct? GPU 集群。你們需要在極致并發(fā)下,挑戰(zhàn)兩大明星模型:
賽道 1:DeepSeek-R1-0528 FP4 + MTP
賽道 1 評判標(biāo)準(zhǔn)
在 4、32、128 三種并發(fā)度下,你不僅要保證極高的吞吐量 (Token Throughput),還要死守低延遲的交互性 (Interactivity),更要確保模型精度不能掉(本賽道要求 GSM8K ≥ 0.93)。
性能門檻(三個(gè)并發(fā)級別必須同時(shí)達(dá)標(biāo)):
![]()
賽道 2: Kimi K2.5 1T FP4
賽道 2 評判標(biāo)準(zhǔn)
在4、32、128三種并發(fā)度下,你不僅要保證極高的吞吐量 (Token Throughput),還要死守低延遲的交互性 (Interactivity),更要確保模型精度不能掉(如 Track 1 要求 GSM8K ≥ 0.93)
性能門檻(三個(gè)并發(fā)級別必須同時(shí)達(dá)標(biāo)):
![]()
評分:Token Throughput per GPU(最高 600 分)+ Interactivity(最高 400 分),三個(gè)并發(fā)級別滿分 3000 分。
![]()
跑分不是終點(diǎn)
我們尋找的不是為了跑分的“特供版代碼”,而是能真正造福全人類 AI 社區(qū)的工業(yè)級優(yōu)化。
終極必殺規(guī)則:代碼必須可 Merge!
所有具備獲獎資格的團(tuán)隊(duì),其提交的代碼必須在賽后 2-4 周內(nèi),在 AMD 工程師的指導(dǎo)下,成功向 AMD 官方倉庫(AMD ATOM / vLLM / SGLang)發(fā)起 Pull Request 并完成合并。
讓你的名字,永遠(yuǎn)鐫刻在推動大模型時(shí)代前行的開源主分支上!
![]()
決戰(zhàn)時(shí)刻表 (北京標(biāo)準(zhǔn)時(shí)間)
報(bào)名& 預(yù)選賽截止時(shí)間 : 4 月 7 日 2:59 PM(TOP 10 誕生)
決賽排位戰(zhàn):4 月 8 日 0:00 AM —— 5 月 16 日 2:59 PM
全球頒獎典禮: 5 月 19 日
![]()
如何加入這場算力狂歡?
無論你是 AI 底層優(yōu)化老兵、CUDA/Triton 極客,還是系統(tǒng)架構(gòu)師、開源社區(qū)貢獻(xiàn)者,只要你對 AI 系統(tǒng)性能工程充滿狂熱,這里就是你的主場!(支持個(gè)人或至多 3 人組隊(duì)參賽)
第一步:加入 AMD AI Developer Program,獲取官方彈藥庫。
第二步:查閱預(yù)選賽參考 kernels,使用 Popcorn CLI 準(zhǔn)備你的提交。
預(yù)選賽入口及工具庫:https://github.com/gpu-mode/reference-kernels
別一個(gè)人戰(zhàn)斗!立刻加入 GPU MODE Discord 社區(qū) 及 微信比賽專屬群,與全球頂尖開發(fā)者同頻共振,獲取實(shí)時(shí)賽事更新與官方技術(shù)支持!
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.