![]()
公司情報專家《財經涂鴉》獲悉,4月28日,商湯正式發布并開源日日新SenseNova U1 系列原生理解生成統一模型。
該模型基于商湯今年三月自主研發的NEO-unify架構,在單一模型架構上統一了多模態理解、推理與生成。
據悉,本次開源發布的是SenseNova U1的輕量版系列SenseNova U1 Lite,包含SenseNova-U1-8B-MoT(基于稠密骨干網絡)與SenseNova-U1-A3B-MoT(基于混合專家(MoE)骨干網絡)兩個不同規格的模型。
與傳統多模態模型經常出現的等待、誤解和信息損耗相比,SenseNova U1基于統一表征空間構建,可以將不同模態的信息以更緊湊、更高密度的方式組織起來。
該模型下,圖像和語言不再是兩套系統之間的接力,而是在同一個大腦中自然融合,令信息流轉更快捷、理解更直接、生成更高效。
在涵蓋圖像理解、圖像生成與編輯、空間智能和視覺推理的多項基準測試中,SenseNova U1 Lite均達到同量級開源模型SOTA水平,為統一多模態理解與生成樹立了新的標桿,甚至僅憑8B-MoT的較小規格,就能達到甚至超越部分大型商業閉源模型,展現出全維度多領域的統治力。
![]()
(SenseNova U1 Lite的商業級復雜信息圖生能力)
商湯表示,正在沿著當前的技術路徑繼續Scale,計劃在未來推出體量更大的模型,“我們相信,基于高效的原生架構,可以以低得多的計算成本達到國際頂尖模型的水平。”
因此同時,憑借NEO-Unify架構的優勢,SenseNova U1亦在業內首次實現連續性的圖文創作輸出,且只需單次單模型調用,就能輸出更高質量的作品,較傳統范式實現了效率的大幅提升。
SenseNova U1 所具備的原生圖文理解生成能力,能天然將圖像和文本底層融合信號完整的保留上下文中,區別于過去只能利用多模型串聯勉強實現,它的圖像間風格具備明顯的高一致性,能在統一表征空間進行高效連貫思考。
例如,繪制一個鋼鐵俠圖案時,它可以從掃描草稿出發,逐步進行連續創作,最終做出一個完成度很高的圖像。每一步創作的過程對于前一步的結構和細節都做了精準的保持,一個統一表征的共享上下文在其中發揮了關鍵作用。
據悉,該模型即將上線辦公小浣熊。未來,該模型還能為機器人提供具身大腦,實現在單一模型閉環內完成從復雜環境感知、邏輯推演到精準任務執行的全過程,為推動技術與產業發展提供重要基礎與關鍵引擎。
“我們相信,原生統一的多模態智能是通往 AGI 的必經之路”。商湯表示,未來還將持續推動開源生態建設,并發布更大參數規模的 U1 系列模型,與廣大用戶和開發者共同定義智能交互的未來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.