![]()
朋友們,最近AI圈出了個事兒。
就在4月30號,那個被稱為“大模型界奧林匹克”的LMArena競技場更新了最新排名。
![]()
![]()
6%的成本干翻頂流
這個平臺不像有些評測那樣對著固定題庫刷分,它玩的是盲測——用戶同時看兩個匿名模型的回答,純粹憑質量投票。所以這分數里頭的“水分”,基本擰不出來。
![]()
![]()
這名字聽著挺拗口,說人話就是:以前訓練不同尺寸的模型,得分別練好幾次,相當于做一桌子菜每道都得單獨燒。現在這個技術實現了一次訓練就能生出多種規格的模型,堪稱“一魚多吃”的典范。
![]()
百分之六什么概念?別人花100塊才能干成的事,它6塊錢搞定,效果還領先。這性價比,搞得我都有點心疼那些燒了幾億美金訓練的同行了。
![]()
這次5.1要是再往上拱一步,那可不只是版本號跳個數字那么簡單。
![]()
說白了,這不叫簡單的軟件升級,這是國產大模型在全球牌桌上的一次關鍵搶位。以前咱們總覺得這方面差口氣,現在人家用實打實的榜單排名告訴你:別老覺得外國的月亮比較圓,咱自己的技術也開始有模有樣了。
![]()
而且你細品,6%的成本跑出領先效果,這意味著什么?意味著不靠堆顯卡、不靠燒錢,也能走出一條自己的路。這個路子要是走通了,對整個行業的影響,可能比拿個榜單第一更大。
當然,預覽版到正式版還有一段路,到底能進化成啥樣,咱們5月中旬見分曉。
反正看完這個成績單,我反正先給國產大模型鼓個掌——卷得好,繼續卷,光明正大地卷。
![]()
![]()
這波國產大模型在LMArena上的表現,說白了就一句話:用更少的資源,打出了更漂亮的數據。6%的成本撬動全球前十五,這事兒放在兩年前恐怕沒幾個人敢想。技術路線一旦走通了,后續的想象空間遠比一個榜單排名大得多。
當然,預覽版到正式版還有變數,咱們不急著下定論。但有一點是清楚的——國產大模型,已經不再是跟在后面跑的選手了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.