![]()
前Tesla AI總監、OpenAI創始團隊成員Andrej Karpathy最近在X上分享了他對當前AI認知分歧的觀察。他認為,人們對AI能力的理解正在形成越來越大的鴻溝,而這種分歧背后有兩個關鍵原因。
![]()
第一個問題在于使用的時效性和層級。很多人去年嘗試過ChatGPT的免費版本,然后就形成了對AI能力的固定印象。他們看到的可能是模型的一些奇怪表現、幻覺問題,或者是OpenAI高級語音模式在一些簡單問題上出錯的 viral 視頻。但這些免費或老舊的模型,并不能代表今年最先進的智能體模型(如OpenAI Codex和Claude Code)的真實能力。
第二個問題更加微妙。即使有人愿意每月支付200美元使用最先進的模型,很多能力也只在高度技術化的領域表現得特別突出。日常的搜索、寫作、咨詢等任務,并不是能力提升最明顯的領域。這背后有兩個原因:一是強化學習的技術特性決定了它更適合有明確驗證標準的任務;二是這些應用場景在商業上的價值相對較低,公司不會把主要資源投入到這些方向的優化上。
Karpathy把用戶分成了兩類。第一類是只用免費或舊版本模型的人,他們看到的是AI的各種局限和笑話。第二類是既付費使用最先進的智能體模型,又在編程、數學、研究等技術領域專業使用的人。這第二類人正在經歷最嚴重的"AI精神病"——因為今年這些領域的能力提升簡直是驚人的。當你把終端交給這些模型時,你會看到它們在幾分鐘內解決原本需要幾天甚至幾周才能完成的編程問題。
這兩群人在各說各話。一方面,OpenAI的免費高級語音模式確實會在Instagram短視頻里搞砸最基礎的問題;另一方面,OpenAI最高端的付費Codex模型卻可以花一個小時有條理地重構整個代碼庫,或者找出計算機系統中的漏洞。
這種能力差異之所以存在,Karpathy認為有兩個關鍵因素:一是這些技術領域有明確的獎勵函數可以驗證(比如單元測試通過與否),非常適合強化學習訓練;二是這些應用在B2B場景中的價值巨大,公司會把最大比例的團隊資源投入到這些方向的改進上。
Karpathy是深度學習領域的知名研究者,曾任Tesla人工智能總監,也是OpenAI的創始團隊成員,在斯坦福大學獲得博士學位。他的觀察提醒我們,在評估AI能力時,需要考慮使用的模型版本、應用場景以及個人的使用深度,否則很容易形成片面的認知。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.