我們正在共同構建能夠解鎖全新水平智能的強化學習基礎設施。
強化學習智能體 —— 即通過不斷試錯來學習的 AI 系統,能夠將算力轉化為全新的知識。
這正是 NVIDIA 與 Ineffable Intelligence 之間全新工程級合作的核心內容。Ineffable Intelligence 是一家總部位于倫敦的 AI 實驗室,由 AlphaGo 架構師 David Silver 創立,該公司在上周剛結束隱身模式,正式對外亮相。
這種學習需要一條強大且高度優化的管線來支撐。與預訓練不同,預訓練是把固定的人類數據輸入系統,而強化學習工作負載會實時生成數據。
該系統必須在緊密循環中持續執行操作、觀察、評分和更新,這給互連技術、顯存帶寬和服務帶來了預訓練所沒有的壓力。此外,該系統將基于與人類語言和其他人類數據截然不同的豐富經驗進行訓練,可能需要全新的模型架構和訓練算法。
這正是 NVIDIA 和 Ineffable 技術協作的重點所在:構建一個能夠大規模為強化學習系統提供數據的管線。兩家公司的工程師團隊正通力合作,探索創建此訓練管線的理想方式。
以上為摘要內容,請點擊鏈接閱讀完整內容:NVIDIA 與 Ineffable Intelligence 共同推進構建強化學習基礎設施的未來 | NVIDIA 英偉達博客
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.