![]()
過去幾年,模型越來越強(qiáng),但模型使用的賬單也越來越嚇人——阻礙企業(yè)級(jí)場(chǎng)景下 AI 深度使用的,不是模型不夠好,而是推理成本高、速度跑不起來。
你現(xiàn)在為每一個(gè) Token 付的錢,還有多少空間可以壓縮?
同樣跑一個(gè)大模型,有人花 1 塊錢,有人只花 1 毛,差距在哪?
當(dāng)硬件紅利持續(xù)釋放,推理成本的下限在哪?
這不是玄學(xué),背后靠的是工程優(yōu)化!
今年,“模型推理“——是 AI 領(lǐng)域當(dāng)之無愧的關(guān)鍵詞,基于算力的“推理加速”已成為行業(yè)共識(shí)。有一群人,正在改寫這道問題的答案。
4 月 13 日 19:00,InfoQ 聯(lián)合阿里云共同打造的【AI Token 說】首播,邀請(qǐng)“推理加速大拿”+“芯片產(chǎn)品專家”+“資深媒體人”圍繞“推理加速,如何實(shí)現(xiàn)底層破局?”開啟硬核對(duì)話:
Token 背后不為人知的算力博弈,國(guó)內(nèi)推理加速真正卡點(diǎn)在哪里?
阿里云飛天企業(yè)版 x 平頭哥“真武”芯片,如何實(shí)現(xiàn) 13 倍推理性能“硅基躍遷”?
軟硬協(xié)同如何把 Token 成本砍掉 90%,讓大模型推理更具性價(jià)比?
從科技從業(yè)者視角,把基于國(guó)內(nèi)算力生態(tài)的推理加速實(shí)踐拆解給你聽,也一起聊聊“模型推理”的未來趨勢(shì)!
Every Token Tells a Story。每一枚 Token,皆是算力的敘事!長(zhǎng)按識(shí)別海報(bào)二維碼,鎖定席位。 4 月 13 日晚 7 點(diǎn),不見不散。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.