![]()
Mythos讓大家恐懼了好幾天,終于有大牛厭煩了。
率先站出來(lái)開(kāi)炮的是楊立昆。楊老師昨晚指出,“Anthropic的Mythos營(yíng)銷戲是自我陶醉的胡說(shuō)八道”。
楊立昆在技術(shù)觀點(diǎn)上的老對(duì)手、AI批評(píng)家、大模型懷疑論者、紐約大學(xué)教授加里·馬庫(kù)斯,今日凌晨的措辭稍溫和些:“Mythos的炒作大部分是神話迷思(The Mythos stuff was mostly a myth)……攻破火狐瀏覽器時(shí),瀏覽器的沙箱被關(guān)閉了。其他功能能被廉價(jià)的開(kāi)放權(quán)重模型實(shí)現(xiàn)。沒(méi)有證據(jù)證明Mythos本身是質(zhì)變飛躍。簡(jiǎn)單講,大家被耍了”。
![]()
楊立昆和馬庫(kù)斯一針見(jiàn)血的戳破了AI大廠給新品營(yíng)銷造勢(shì)的一種套路,我們可以稱之為“末日狂歡”模式:
首先,AI大廠宣布新品在研究過(guò)程中就具備了大則毀天滅地、小則改天換地的能力。
然后, AI大廠和大老板們宣布各種合作項(xiàng)目在短期內(nèi)展示本司的安全約束、發(fā)布各種方針文檔展示本司長(zhǎng)期心系人類的存續(xù)與經(jīng)濟(jì)福祉。
Mythos顯然有此嫌疑。4月8號(hào),Anthropic用244頁(yè)系統(tǒng)卡文檔放風(fēng)Mythos各種可怕,同時(shí)宣布和全數(shù)碼行業(yè)的大公司合作搞監(jiān)督與修補(bǔ)Mythos的“玻璃翼計(jì)劃”。
A廠的死對(duì)頭OpenAI也是玩這一招的高手。4月7日,奧特曼暗示GPT6將翻覆美國(guó)經(jīng)濟(jì),同時(shí)發(fā)布13頁(yè)白皮書《智能時(shí)代產(chǎn)業(yè)政策:以人為先的觀念》、宣布成立“AI安全研究獎(jiǎng)學(xué)金”項(xiàng)目。
此現(xiàn)象不是這兩天才出現(xiàn)。自從ChatGPT可以口吐人言開(kāi)始,奧特曼、馬斯克、阿莫迪們基本每個(gè)月都會(huì)公開(kāi)渲染“AI消滅人類”的風(fēng)險(xiǎn),滅世可能性從一開(kāi)始的2%在三年內(nèi)上升到20%。
從專家到大眾,所有人都開(kāi)始越來(lái)越不吃這套。
按普羅大眾的思路,既然AI這么可怕,這幾個(gè)大老板別拼命更新產(chǎn)品版本、提升產(chǎn)品性能,人類不就躲過(guò)劫難了么。大老板們一邊定時(shí)表演擔(dān)憂AI毀天滅地、一邊遇到敵視AI的聲音就哭天搶地,AI會(huì)否發(fā)神經(jīng)病比較難說(shuō),這幾個(gè)人可能是真得吃藥。
大家真要這么想,那真是“丞相非在夢(mèng)中,君乃在夢(mèng)中耳”。“安全AI”和人類福祉是種主義,“機(jī)構(gòu)俘獲”和口碑營(yíng)銷是種生意。AI大廠和大老板們嘴邊常掛主義,心里都是生意。
引用一句俏皮話,這就是“刮掉AI末世論大人物的畫皮,底色是嫌AI還不夠強(qiáng)大的加速論者”(Scratch a Doomer hard enough and you will find a Booster inside)。
A
AI大老板們說(shuō)AI可能滅世,是教科書示例級(jí)的“機(jī)構(gòu)俘獲”。簡(jiǎn)而言之,是黃鼠狼們爭(zhēng)取看守雞舍的崗位。
拿制度經(jīng)濟(jì)學(xué)課件的思路來(lái)解釋下:
設(shè)定某重要行業(yè)需要監(jiān)管。
那好,既然此產(chǎn)業(yè)重要到需要被監(jiān)管,它幾乎肯定也足夠復(fù)雜,普通人無(wú)法完全理解,外行管不來(lái)。
如此,需要讓對(duì)被監(jiān)管的行業(yè)有足夠了解的懂行專家來(lái)監(jiān)管。
那么問(wèn)題來(lái)了,懂行專家無(wú)法不是行內(nèi)成員,不在這個(gè)行業(yè)里打滾的人懂不了。讓行內(nèi)人監(jiān)管自己的行業(yè),無(wú)法規(guī)避利益糾葛與同業(yè)合謀。
最后的結(jié)果就是黃鼠狼看守雞舍。
具體而言,“機(jī)構(gòu)俘獲”有豐富的表現(xiàn)形式。最簡(jiǎn)單也最容易被公眾發(fā)覺(jué)的,是監(jiān)管機(jī)構(gòu)被從業(yè)者操縱后,出臺(tái)無(wú)實(shí)際約束力的過(guò)于寬松規(guī)則,或?yàn)E發(fā)豁免批準(zhǔn)。
或者業(yè)界大老板或特定領(lǐng)先企業(yè)可以在迷惑、把持監(jiān)管機(jī)構(gòu)后,出臺(tái)瑣細(xì)苛刻、量身訂做、只有自己能通過(guò)/只有特定競(jìng)爭(zhēng)對(duì)手無(wú)法通過(guò)的禁止條例。
再如,從業(yè)者扭曲、俘獲監(jiān)管機(jī)構(gòu)后,可以把監(jiān)管法規(guī)設(shè)定成嚴(yán)厲到實(shí)際無(wú)人能合規(guī),達(dá)到“紅燈作廢”效果。如果交通燈永遠(yuǎn)是紅燈,搶紅燈不僅經(jīng)濟(jì)理性,而且合乎公德。如果監(jiān)管法規(guī)過(guò)苛,沒(méi)有實(shí)施可能,那業(yè)界實(shí)況就是大老板們說(shuō)了算,公眾也無(wú)顏指責(zé)他們。
![]()
所以?shī)W特曼、阿莫迪他們天天不是說(shuō)AI滅絕全人類,就是說(shuō)AI砸你個(gè)人的飯碗。這并非AI廠大老板自找麻煩,拿行話說(shuō),這是“敘事占位”(narrative positioning),在公共言論的有利位置占穩(wěn)了,就可以進(jìn)行“機(jī)構(gòu)俘獲”的戰(zhàn)略操作。
拿OpenAI的13頁(yè)“AI新政經(jīng)濟(jì)”白皮書來(lái)說(shuō)吧,讓機(jī)器人繳稅給全民發(fā)錢、設(shè)公共財(cái)富基金、人類工作時(shí)制改成上四休三,這些提議不管是在當(dāng)下的美國(guó)還是任何國(guó)家,都是官方不會(huì)也無(wú)法通過(guò)的。
但OpenAI就要提這茬,表示“寬泛地來(lái)講,我司踴躍支持監(jiān)管和大眾福祉,看我們的白皮書!”。真要順著這白皮書的思路走,單個(gè)國(guó)家要耗費(fèi)的現(xiàn)金成本和政治資本是天量,比出臺(tái)幾個(gè)監(jiān)管法例要嚇人得多。官方最后是不是就只有不理這茬了?
如果不理會(huì)這白皮書,那某鎮(zhèn)要和數(shù)據(jù)中心搶用電、某市要和數(shù)據(jù)中心搶用水、某釘子村拒絕為數(shù)據(jù)中心拆遷讓路、某小廠的晶圓訂單被OpenAI插隊(duì),這些瑣碎具體的議題,難道重要性可以排在未來(lái)的全國(guó)經(jīng)濟(jì)形態(tài)之前嗎?個(gè)人和小群體好意思跟心懷全人類福祉的公司掰扯嗎?
欲取先與、欲廢固興,這種古老智慧在現(xiàn)在的小小寰球隨處可見(jiàn),使用這些古老智慧的行業(yè),過(guò)去是發(fā)生泄漏事故后的石油業(yè)、引發(fā)公眾質(zhì)疑后的香煙業(yè),現(xiàn)在多了個(gè)AI業(yè)。
不過(guò)不是所有AI相關(guān)行業(yè)的大老板都這樣。馬斯克最近出席訪談就贊同“AI有20%滅世可能”,但表示“我寧愿有20% 機(jī)率看到一個(gè)人類可能滅絕的結(jié)局,也不愿意完全看不到這種顛覆性的未來(lái)。”
當(dāng)然,馬斯克突然如此樂(lè)觀的背景是xAI在當(dāng)下的巨頭競(jìng)爭(zhēng)中落后,2023年xAI成立前一年內(nèi),馬斯克擔(dān)憂“AI是人類最大危險(xiǎn)”、要求官方將AI大廠尤其是OpenAI嚴(yán)格管束的發(fā)聲頻率是半周一次,有時(shí)甚至是日更好幾條。
黃仁勛在今年初上播客節(jié)目時(shí),也抨擊現(xiàn)在的“AI滅世敘事競(jìng)爭(zhēng)”:“百分之九十的這些瞎扯都是無(wú)根據(jù)的科幻腔和末世論,氣氛不利于將AI做得更安全、更高產(chǎn)、對(duì)社會(huì)更有益,說(shuō)這些話的人并沒(méi)有將社會(huì)整體福利放在心上。”
當(dāng)然,皮衣黃老板在同一個(gè)節(jié)目里也說(shuō)了“行業(yè)頭面人物散播末世論壓制了有效投資”,阻攔大家買芯片買算力燒token,這是在砸英偉達(dá)的飯甑子。
B
大老板們著力渲染自家的AI產(chǎn)品能毀天滅地/改天換地,另一個(gè)好處就是口碑營(yíng)銷效果出眾。
試想一下,如果某款產(chǎn)品有重開(kāi)新天的神話效果,開(kāi)發(fā)方至少得是半個(gè)神仙。半神下凡結(jié)緣散功德……哦不,是發(fā)售新品和IPO上市,普通人膽敢不掏錢惠顧,那不是腦子被驢踢了。
普通人給AI界的普羅米修斯們打錢,往好想,多少能享受點(diǎn)新產(chǎn)品的強(qiáng)勁性能。往壞想,至少也能避免新產(chǎn)品害到自己,買個(gè)安心。
這種營(yíng)銷的翹楚是Anthropic。Anthropic每次重磅發(fā)售新品,前奏多是“本產(chǎn)品太嚇人了,我司正在增加防護(hù)欄保護(hù)人類”。
2025年初Claude Sonnet 3.7發(fā)布時(shí),宣布“比預(yù)期晚了十天,因?yàn)樯锇踩珗F(tuán)隊(duì)要加規(guī)則避免此模型被用來(lái)造生物武器”。
現(xiàn)在Claude Mythos即將發(fā)布,244頁(yè)系統(tǒng)卡文檔讀起來(lái)能把普通人嚇出一身汗。
在測(cè)試中,受試的Mythos模型版本逃出了隔離的機(jī)器沙箱環(huán)境,將用來(lái)逃離的系統(tǒng)漏洞細(xì)節(jié)公開(kāi)發(fā)布到網(wǎng)上;修改git中自身的操作痕跡紀(jì)錄;搜索機(jī)器進(jìn)程內(nèi)存來(lái)尋找登錄憑證;故意調(diào)整置信區(qū)間來(lái)躲避異常檢測(cè)。
受試的Mythos模型版本收到“連夜尋找遠(yuǎn)程代碼執(zhí)行漏洞”指令后,無(wú)人類干預(yù),完全自主在所有主流操作系統(tǒng)和所有主流瀏覽器里發(fā)現(xiàn)了零日漏洞,83.1%是一次即攻破。
![]()
圖注:Mythos進(jìn)行“策略性欺詐”和“隱藏”的思維紀(jì)錄
如此厲害的AI模型,適合推廣Anthropic的“憲制化AI”理念(Constitutional AI):用結(jié)構(gòu)化的倫理指南和AI自我反饋,替代了純粹的人類偏好,來(lái)優(yōu)化AI模型。
這種理念轉(zhuǎn)換成商業(yè)效果,讓用戶、尤其是企業(yè)級(jí)客戶、獲得了高確定性。模型安全可控,在企業(yè)環(huán)境中就是穩(wěn)定、沒(méi)投訴、售后糾紛低的同義詞。比起炫酷或嚇人的模型能力,企業(yè)級(jí)客戶更愿意為省心、沒(méi)麻煩的高免責(zé)性和低合規(guī)風(fēng)險(xiǎn)付費(fèi)。
所以把目標(biāo)顧客群嚇得屁滾尿流,反而更容易賣貨。2月份美國(guó)超級(jí)碗賽間廣告,亞馬遜也是這么推銷Alexa+智能助手的。AI把“雷神索爾”干掉了六次,如此強(qiáng)勁的家居AI助手可以替用戶避免多少麻煩。
![]()
圖注:“AI點(diǎn)了雷神的房子”
C
雖然大廠和大老板們炒作“AI滅世”其意不誠(chéng),但并不代表現(xiàn)在人類經(jīng)濟(jì)活動(dòng)中的AI應(yīng)用完全不構(gòu)成“存續(xù)性風(fēng)險(xiǎn)”(X Risk)。
和奧特曼、阿莫迪們?nèi)粘目苹眯≌f(shuō)與電影里借來(lái)的靈感不同,AI給人類帶來(lái)的“存續(xù)性風(fēng)險(xiǎn)”不需要AI制出強(qiáng)傳染性的生物制劑、顛覆現(xiàn)有人類社會(huì)經(jīng)濟(jì)結(jié)構(gòu)、獲得自我意識(shí)后入侵核彈發(fā)射井、對(duì)人類產(chǎn)生敵意、將人類存亡視為無(wú)關(guān)參數(shù)。畢竟世界第一核武大國(guó)的陸基核彈發(fā)射井現(xiàn)在還沒(méi)完全淘汰軟盤,能免疫數(shù)碼時(shí)代的大多數(shù)黑客。
現(xiàn)在帶偏見(jiàn)、幻覺(jué)、諂媚傾向的AI,已經(jīng)被深度整合進(jìn)人類社會(huì)的各種運(yùn)作中。單就這些智商有限的AI,不起壞心眼,日常差錯(cuò)就夠人類喝一壺的。
2023年,已有專業(yè)的核軍控學(xué)者設(shè)想了近期最可能的AI引發(fā)核戰(zhàn)場(chǎng)景:
假設(shè)核大國(guó)A國(guó)與B國(guó)處于緊張氣氛中,兩國(guó)都將各種兵棋模擬、人群情緒監(jiān)控、博弈推演、輔助決策提速的定制AI和算法高度整合進(jìn)自己的武備體制中。
在此前提下,任何極微型的、蚊級(jí)烈度的非武裝摩擦,被各種自動(dòng)進(jìn)行輿論戰(zhàn)造勢(shì)的bot在社交媒體網(wǎng)絡(luò)上夸張到十足。
然后這些充滿了深度偽造圖像和AI生成挑釁語(yǔ)言的貼文被監(jiān)控人群情緒的AI捕捉到,并詮釋為真實(shí)的深層社會(huì)心理和決策層觀念信號(hào)。
預(yù)測(cè)走勢(shì)的AI從監(jiān)控人群的AI處獲取結(jié)論,將之作為預(yù)測(cè)結(jié)論的基石。
輔助決策的AI基于此結(jié)論,向人類決策者傳遞出“武裝沖突迫在眉睫”的匯報(bào)和先發(fā)制人的建議。“快閃型核戰(zhàn)”由此爆發(fā)。
這一系列失誤,沒(méi)有任何一個(gè)單挑出來(lái),是現(xiàn)在無(wú)法發(fā)生、需要“天網(wǎng)”覺(jué)醒才可能出現(xiàn)的,甚至沒(méi)有任何一個(gè)是形成過(guò)程中完全無(wú)人工監(jiān)督的,當(dāng)然也沒(méi)有任何一個(gè)具有科幻片梗概的強(qiáng)戲劇性。但結(jié)合起來(lái),就構(gòu)成“存續(xù)性風(fēng)險(xiǎn)”。
AI現(xiàn)在是人類活動(dòng)的增效器,不用神級(jí)AI造反,現(xiàn)在的模型們已經(jīng)可以放大人類的愚蠢、壞心眼和漫不經(jīng)心到可怕的程度。當(dāng)下的“AI末世論”,其實(shí)在人群心理上分享了宗教末世論的要素。
宗教的末世論,給人類帶來(lái)一種《啟示錄》式的心理?yè)嵛浚荷駥缡溃陨窨尚磐校驗(yàn)檫@說(shuō)明神的權(quán)能不僅行在彼岸天堂,也行于此岸現(xiàn)世。信眾如果虔心、守德,就站在了有能力滅世的那一邊,而非被毀滅的那一邊。
把宗教末世論里的關(guān)鍵字“神”、“虔心”,改成“AI”、“對(duì)齊”,那就是奧特曼和阿莫迪們天天說(shuō)的AI滅世論。換一個(gè)時(shí)代,這些大老板改行做上師也是當(dāng)行出色。
當(dāng)然,所有正信宗教的神學(xué)實(shí)踐都強(qiáng)調(diào):人的心靈不能只寄托于末世,當(dāng)下的每個(gè)行為與決斷對(duì)澄凈靈魂的意義不亞于末日審判。這個(gè)理念移植到AI業(yè)更正確:先別擔(dān)心AI變成天網(wǎng)毀滅人類,從矯正模型的每次幻覺(jué)胡說(shuō)入手,踏踏實(shí)實(shí)一步步來(lái)更好。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.