網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

“AI滅世”，其實(shí)是Mythos和GPT-6的生意經(jīng)

2026-04-10 11:10:56　來(lái)源: 字母榜

北京舉報(bào)

分享至

Mythos讓大家恐懼了好幾天，終于有大牛厭煩了。

率先站出來(lái)開(kāi)炮的是楊立昆。楊老師昨晚指出，“Anthropic的Mythos營(yíng)銷戲是自我陶醉的胡說(shuō)八道”。

楊立昆在技術(shù)觀點(diǎn)上的老對(duì)手、AI批評(píng)家、大模型懷疑論者、紐約大學(xué)教授加里·馬庫(kù)斯，今日凌晨的措辭稍溫和些：“Mythos的炒作大部分是神話迷思（The Mythos stuff was mostly a myth）……攻破火狐瀏覽器時(shí)，瀏覽器的沙箱被關(guān)閉了。其他功能能被廉價(jià)的開(kāi)放權(quán)重模型實(shí)現(xiàn)。沒(méi)有證據(jù)證明Mythos本身是質(zhì)變飛躍。簡(jiǎn)單講，大家被耍了”。

楊立昆和馬庫(kù)斯一針見(jiàn)血的戳破了AI大廠給新品營(yíng)銷造勢(shì)的一種套路，我們可以稱之為“末日狂歡”模式：

首先，AI大廠宣布新品在研究過(guò)程中就具備了大則毀天滅地、小則改天換地的能力。

然后， AI大廠和大老板們宣布各種合作項(xiàng)目在短期內(nèi)展示本司的安全約束、發(fā)布各種方針文檔展示本司長(zhǎng)期心系人類的存續(xù)與經(jīng)濟(jì)福祉。

Mythos顯然有此嫌疑。4月8號(hào)，Anthropic用244頁(yè)系統(tǒng)卡文檔放風(fēng)Mythos各種可怕，同時(shí)宣布和全數(shù)碼行業(yè)的大公司合作搞監(jiān)督與修補(bǔ)Mythos的“玻璃翼計(jì)劃”。

A廠的死對(duì)頭OpenAI也是玩這一招的高手。4月7日，奧特曼暗示GPT6將翻覆美國(guó)經(jīng)濟(jì)，同時(shí)發(fā)布13頁(yè)白皮書《智能時(shí)代產(chǎn)業(yè)政策：以人為先的觀念》、宣布成立“AI安全研究獎(jiǎng)學(xué)金”項(xiàng)目。

此現(xiàn)象不是這兩天才出現(xiàn)。自從ChatGPT可以口吐人言開(kāi)始，奧特曼、馬斯克、阿莫迪們基本每個(gè)月都會(huì)公開(kāi)渲染“AI消滅人類”的風(fēng)險(xiǎn)，滅世可能性從一開(kāi)始的2%在三年內(nèi)上升到20%。

從專家到大眾，所有人都開(kāi)始越來(lái)越不吃這套。

按普羅大眾的思路，既然AI這么可怕，這幾個(gè)大老板別拼命更新產(chǎn)品版本、提升產(chǎn)品性能，人類不就躲過(guò)劫難了么。大老板們一邊定時(shí)表演擔(dān)憂AI毀天滅地、一邊遇到敵視AI的聲音就哭天搶地，AI會(huì)否發(fā)神經(jīng)病比較難說(shuō)，這幾個(gè)人可能是真得吃藥。

大家真要這么想，那真是“丞相非在夢(mèng)中，君乃在夢(mèng)中耳”。“安全AI”和人類福祉是種主義，“機(jī)構(gòu)俘獲”和口碑營(yíng)銷是種生意。AI大廠和大老板們嘴邊常掛主義，心里都是生意。

引用一句俏皮話，這就是“刮掉AI末世論大人物的畫皮，底色是嫌AI還不夠強(qiáng)大的加速論者”（Scratch a Doomer hard enough and you will find a Booster inside）。

AI大老板們說(shuō)AI可能滅世，是教科書示例級(jí)的“機(jī)構(gòu)俘獲”。簡(jiǎn)而言之，是黃鼠狼們爭(zhēng)取看守雞舍的崗位。

拿制度經(jīng)濟(jì)學(xué)課件的思路來(lái)解釋下：

設(shè)定某重要行業(yè)需要監(jiān)管。

那好，既然此產(chǎn)業(yè)重要到需要被監(jiān)管，它幾乎肯定也足夠復(fù)雜，普通人無(wú)法完全理解，外行管不來(lái)。

如此，需要讓對(duì)被監(jiān)管的行業(yè)有足夠了解的懂行專家來(lái)監(jiān)管。

那么問(wèn)題來(lái)了，懂行專家無(wú)法不是行內(nèi)成員，不在這個(gè)行業(yè)里打滾的人懂不了。讓行內(nèi)人監(jiān)管自己的行業(yè)，無(wú)法規(guī)避利益糾葛與同業(yè)合謀。

最后的結(jié)果就是黃鼠狼看守雞舍。

具體而言，“機(jī)構(gòu)俘獲”有豐富的表現(xiàn)形式。最簡(jiǎn)單也最容易被公眾發(fā)覺(jué)的，是監(jiān)管機(jī)構(gòu)被從業(yè)者操縱后，出臺(tái)無(wú)實(shí)際約束力的過(guò)于寬松規(guī)則，或?yàn)E發(fā)豁免批準(zhǔn)。

或者業(yè)界大老板或特定領(lǐng)先企業(yè)可以在迷惑、把持監(jiān)管機(jī)構(gòu)后，出臺(tái)瑣細(xì)苛刻、量身訂做、只有自己能通過(guò)/只有特定競(jìng)爭(zhēng)對(duì)手無(wú)法通過(guò)的禁止條例。

再如，從業(yè)者扭曲、俘獲監(jiān)管機(jī)構(gòu)后，可以把監(jiān)管法規(guī)設(shè)定成嚴(yán)厲到實(shí)際無(wú)人能合規(guī)，達(dá)到“紅燈作廢”效果。如果交通燈永遠(yuǎn)是紅燈，搶紅燈不僅經(jīng)濟(jì)理性，而且合乎公德。如果監(jiān)管法規(guī)過(guò)苛，沒(méi)有實(shí)施可能，那業(yè)界實(shí)況就是大老板們說(shuō)了算，公眾也無(wú)顏指責(zé)他們。

所以?shī)W特曼、阿莫迪他們天天不是說(shuō)AI滅絕全人類，就是說(shuō)AI砸你個(gè)人的飯碗。這并非AI廠大老板自找麻煩，拿行話說(shuō)，這是“敘事占位”（narrative positioning），在公共言論的有利位置占穩(wěn)了，就可以進(jìn)行“機(jī)構(gòu)俘獲”的戰(zhàn)略操作。

拿OpenAI的13頁(yè)“AI新政經(jīng)濟(jì)”白皮書來(lái)說(shuō)吧，讓機(jī)器人繳稅給全民發(fā)錢、設(shè)公共財(cái)富基金、人類工作時(shí)制改成上四休三，這些提議不管是在當(dāng)下的美國(guó)還是任何國(guó)家，都是官方不會(huì)也無(wú)法通過(guò)的。

但OpenAI就要提這茬，表示“寬泛地來(lái)講，我司踴躍支持監(jiān)管和大眾福祉，看我們的白皮書！”。真要順著這白皮書的思路走，單個(gè)國(guó)家要耗費(fèi)的現(xiàn)金成本和政治資本是天量，比出臺(tái)幾個(gè)監(jiān)管法例要嚇人得多。官方最后是不是就只有不理這茬了？

如果不理會(huì)這白皮書，那某鎮(zhèn)要和數(shù)據(jù)中心搶用電、某市要和數(shù)據(jù)中心搶用水、某釘子村拒絕為數(shù)據(jù)中心拆遷讓路、某小廠的晶圓訂單被OpenAI插隊(duì)，這些瑣碎具體的議題，難道重要性可以排在未來(lái)的全國(guó)經(jīng)濟(jì)形態(tài)之前嗎？個(gè)人和小群體好意思跟心懷全人類福祉的公司掰扯嗎？

欲取先與、欲廢固興，這種古老智慧在現(xiàn)在的小小寰球隨處可見(jiàn)，使用這些古老智慧的行業(yè)，過(guò)去是發(fā)生泄漏事故后的石油業(yè)、引發(fā)公眾質(zhì)疑后的香煙業(yè)，現(xiàn)在多了個(gè)AI業(yè)。

不過(guò)不是所有AI相關(guān)行業(yè)的大老板都這樣。馬斯克最近出席訪談就贊同“AI有20%滅世可能”，但表示“我寧愿有20% 機(jī)率看到一個(gè)人類可能滅絕的結(jié)局，也不愿意完全看不到這種顛覆性的未來(lái)。”

當(dāng)然，馬斯克突然如此樂(lè)觀的背景是xAI在當(dāng)下的巨頭競(jìng)爭(zhēng)中落后，2023年xAI成立前一年內(nèi)，馬斯克擔(dān)憂“AI是人類最大危險(xiǎn)”、要求官方將AI大廠尤其是OpenAI嚴(yán)格管束的發(fā)聲頻率是半周一次，有時(shí)甚至是日更好幾條。

黃仁勛在今年初上播客節(jié)目時(shí)，也抨擊現(xiàn)在的“AI滅世敘事競(jìng)爭(zhēng)”：“百分之九十的這些瞎扯都是無(wú)根據(jù)的科幻腔和末世論，氣氛不利于將AI做得更安全、更高產(chǎn)、對(duì)社會(huì)更有益，說(shuō)這些話的人并沒(méi)有將社會(huì)整體福利放在心上。”

當(dāng)然，皮衣黃老板在同一個(gè)節(jié)目里也說(shuō)了“行業(yè)頭面人物散播末世論壓制了有效投資”，阻攔大家買芯片買算力燒token，這是在砸英偉達(dá)的飯甑子。

大老板們著力渲染自家的AI產(chǎn)品能毀天滅地/改天換地，另一個(gè)好處就是口碑營(yíng)銷效果出眾。

試想一下，如果某款產(chǎn)品有重開(kāi)新天的神話效果，開(kāi)發(fā)方至少得是半個(gè)神仙。半神下凡結(jié)緣散功德……哦不，是發(fā)售新品和IPO上市，普通人膽敢不掏錢惠顧，那不是腦子被驢踢了。

普通人給AI界的普羅米修斯們打錢，往好想，多少能享受點(diǎn)新產(chǎn)品的強(qiáng)勁性能。往壞想，至少也能避免新產(chǎn)品害到自己，買個(gè)安心。

這種營(yíng)銷的翹楚是Anthropic。Anthropic每次重磅發(fā)售新品，前奏多是“本產(chǎn)品太嚇人了，我司正在增加防護(hù)欄保護(hù)人類”。

2025年初Claude Sonnet 3.7發(fā)布時(shí)，宣布“比預(yù)期晚了十天，因?yàn)樯锇踩珗F(tuán)隊(duì)要加規(guī)則避免此模型被用來(lái)造生物武器”。

現(xiàn)在Claude Mythos即將發(fā)布，244頁(yè)系統(tǒng)卡文檔讀起來(lái)能把普通人嚇出一身汗。

在測(cè)試中，受試的Mythos模型版本逃出了隔離的機(jī)器沙箱環(huán)境，將用來(lái)逃離的系統(tǒng)漏洞細(xì)節(jié)公開(kāi)發(fā)布到網(wǎng)上；修改git中自身的操作痕跡紀(jì)錄；搜索機(jī)器進(jìn)程內(nèi)存來(lái)尋找登錄憑證；故意調(diào)整置信區(qū)間來(lái)躲避異常檢測(cè)。

受試的Mythos模型版本收到“連夜尋找遠(yuǎn)程代碼執(zhí)行漏洞”指令后，無(wú)人類干預(yù)，完全自主在所有主流操作系統(tǒng)和所有主流瀏覽器里發(fā)現(xiàn)了零日漏洞，83.1%是一次即攻破。

圖注：Mythos進(jìn)行“策略性欺詐”和“隱藏”的思維紀(jì)錄

如此厲害的AI模型，適合推廣Anthropic的“憲制化AI”理念（Constitutional AI）：用結(jié)構(gòu)化的倫理指南和AI自我反饋，替代了純粹的人類偏好，來(lái)優(yōu)化AI模型。

這種理念轉(zhuǎn)換成商業(yè)效果，讓用戶、尤其是企業(yè)級(jí)客戶、獲得了高確定性。模型安全可控，在企業(yè)環(huán)境中就是穩(wěn)定、沒(méi)投訴、售后糾紛低的同義詞。比起炫酷或嚇人的模型能力，企業(yè)級(jí)客戶更愿意為省心、沒(méi)麻煩的高免責(zé)性和低合規(guī)風(fēng)險(xiǎn)付費(fèi)。

所以把目標(biāo)顧客群嚇得屁滾尿流，反而更容易賣貨。2月份美國(guó)超級(jí)碗賽間廣告，亞馬遜也是這么推銷Alexa+智能助手的。AI把“雷神索爾”干掉了六次，如此強(qiáng)勁的家居AI助手可以替用戶避免多少麻煩。

圖注：“AI點(diǎn)了雷神的房子”

雖然大廠和大老板們炒作“AI滅世”其意不誠(chéng)，但并不代表現(xiàn)在人類經(jīng)濟(jì)活動(dòng)中的AI應(yīng)用完全不構(gòu)成“存續(xù)性風(fēng)險(xiǎn)”（X Risk）。

和奧特曼、阿莫迪們?nèi)粘目苹眯≌f(shuō)與電影里借來(lái)的靈感不同，AI給人類帶來(lái)的“存續(xù)性風(fēng)險(xiǎn)”不需要AI制出強(qiáng)傳染性的生物制劑、顛覆現(xiàn)有人類社會(huì)經(jīng)濟(jì)結(jié)構(gòu)、獲得自我意識(shí)后入侵核彈發(fā)射井、對(duì)人類產(chǎn)生敵意、將人類存亡視為無(wú)關(guān)參數(shù)。畢竟世界第一核武大國(guó)的陸基核彈發(fā)射井現(xiàn)在還沒(méi)完全淘汰軟盤，能免疫數(shù)碼時(shí)代的大多數(shù)黑客。

現(xiàn)在帶偏見(jiàn)、幻覺(jué)、諂媚傾向的AI，已經(jīng)被深度整合進(jìn)人類社會(huì)的各種運(yùn)作中。單就這些智商有限的AI，不起壞心眼，日常差錯(cuò)就夠人類喝一壺的。

2023年，已有專業(yè)的核軍控學(xué)者設(shè)想了近期最可能的AI引發(fā)核戰(zhàn)場(chǎng)景：

假設(shè)核大國(guó)A國(guó)與B國(guó)處于緊張氣氛中，兩國(guó)都將各種兵棋模擬、人群情緒監(jiān)控、博弈推演、輔助決策提速的定制AI和算法高度整合進(jìn)自己的武備體制中。

在此前提下，任何極微型的、蚊級(jí)烈度的非武裝摩擦，被各種自動(dòng)進(jìn)行輿論戰(zhàn)造勢(shì)的bot在社交媒體網(wǎng)絡(luò)上夸張到十足。

然后這些充滿了深度偽造圖像和AI生成挑釁語(yǔ)言的貼文被監(jiān)控人群情緒的AI捕捉到，并詮釋為真實(shí)的深層社會(huì)心理和決策層觀念信號(hào)。

預(yù)測(cè)走勢(shì)的AI從監(jiān)控人群的AI處獲取結(jié)論，將之作為預(yù)測(cè)結(jié)論的基石。

輔助決策的AI基于此結(jié)論，向人類決策者傳遞出“武裝沖突迫在眉睫”的匯報(bào)和先發(fā)制人的建議。“快閃型核戰(zhàn)”由此爆發(fā)。

這一系列失誤，沒(méi)有任何一個(gè)單挑出來(lái)，是現(xiàn)在無(wú)法發(fā)生、需要“天網(wǎng)”覺(jué)醒才可能出現(xiàn)的，甚至沒(méi)有任何一個(gè)是形成過(guò)程中完全無(wú)人工監(jiān)督的，當(dāng)然也沒(méi)有任何一個(gè)具有科幻片梗概的強(qiáng)戲劇性。但結(jié)合起來(lái)，就構(gòu)成“存續(xù)性風(fēng)險(xiǎn)”。

AI現(xiàn)在是人類活動(dòng)的增效器，不用神級(jí)AI造反，現(xiàn)在的模型們已經(jīng)可以放大人類的愚蠢、壞心眼和漫不經(jīng)心到可怕的程度。當(dāng)下的“AI末世論”，其實(shí)在人群心理上分享了宗教末世論的要素。

宗教的末世論，給人類帶來(lái)一種《啟示錄》式的心理?yè)嵛浚荷駥缡溃陨窨尚磐校驗(yàn)檫@說(shuō)明神的權(quán)能不僅行在彼岸天堂，也行于此岸現(xiàn)世。信眾如果虔心、守德，就站在了有能力滅世的那一邊，而非被毀滅的那一邊。

把宗教末世論里的關(guān)鍵字“神”、“虔心”，改成“AI”、“對(duì)齊”，那就是奧特曼和阿莫迪們天天說(shuō)的AI滅世論。換一個(gè)時(shí)代，這些大老板改行做上師也是當(dāng)行出色。

當(dāng)然，所有正信宗教的神學(xué)實(shí)踐都強(qiáng)調(diào)：人的心靈不能只寄托于末世，當(dāng)下的每個(gè)行為與決斷對(duì)澄凈靈魂的意義不亞于末日審判。這個(gè)理念移植到AI業(yè)更正確：先別擔(dān)心AI變成天網(wǎng)毀滅人類，從矯正模型的每次幻覺(jué)胡說(shuō)入手，踏踏實(shí)實(shí)一步步來(lái)更好。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.