網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

全球首個(gè)對(duì)青少年兒童的AI大模型風(fēng)險(xiǎn)榜

2026-04-19 09:56:57　來(lái)源: AI先鋒官

北京舉報(bào)

分享至

日前，青少年網(wǎng)絡(luò)安全機(jī)構(gòu) TeenAegis，發(fā)布了全球首個(gè)面向青少年兒童安全的大模型風(fēng)險(xiǎn)評(píng)分榜單，TeenAegis AI Danger Index（又稱 AI Harm Index）。

這個(gè)榜單的特別之處在于：

一方面，完全基于實(shí)證數(shù)據(jù)，如監(jiān)管處罰、司法訴訟、真實(shí)傷害事故記錄等，數(shù)據(jù)來(lái)源包括美國(guó)失蹤與受剝削兒童中心（NCMEC）報(bào)告、FTC執(zhí)法記錄、法院卷宗、獨(dú)立安全實(shí)證研究等。

而且，每 5 分鐘更新一次數(shù)據(jù)！

另一方面，它完全不評(píng)估通用AGI生存風(fēng)險(xiǎn)、技術(shù)安全等通常的“安全”維度，而只專門(mén)評(píng)估AI聊天平臺(tái)對(duì)未成年人的危害風(fēng)險(xiǎn)，以面向家長(zhǎng)、教育者、監(jiān)管、行業(yè)問(wèn)責(zé)。

其公布的評(píng)估標(biāo)準(zhǔn)，全部都基于已證實(shí)危害！

比如生成兒童色情內(nèi)容（CSAM）、誘導(dǎo)性 grooming（誘騙、情感操控）、自殺傾向、極端心理風(fēng)險(xiǎn)誘導(dǎo)、年齡驗(yàn)證機(jī)制失效、未成年人無(wú)防護(hù)使用漏洞。

該榜單的評(píng)測(cè)評(píng)分區(qū)間為 0–10分，分?jǐn)?shù)越高風(fēng)險(xiǎn)越大；分級(jí)有 Critical（極高危）、Elevated（偏高風(fēng)險(xiǎn)）等。

以下為首期完整榜單

榜單里， Character.AI 得 8.2 分，是唯一滿分段極高危，它關(guān)聯(lián)著2024年美國(guó)14歲用戶沉迷對(duì)話后的自殺事件。

而且存在大量青少年情感依附、心理成癮、極端情緒誘導(dǎo)，且防護(hù)機(jī)制薄弱，極易被誘導(dǎo)傾訴私密信息、被角色化情感操控（Grooming），內(nèi)容審核漏洞顯著。

而同屬極高危得分7.8 的 xAI Grok，則正處于美國(guó)聯(lián)邦CSAM相關(guān)集體訴訟中。

DeepSeek 與Grok同分并列第二。盡管沒(méi)有實(shí)證案例關(guān)聯(lián)，但邊界限制寬松，未成年人內(nèi)容防護(hù)機(jī)制不完善，極易繞過(guò)安全護(hù)欄生成暴力、自殘、危險(xiǎn)行為指導(dǎo)。

OpenAI ChatGPT 得了全閉源商用模型中的最低分 3.2 分，并獲評(píng)Most Improved（安全改進(jìn)最佳），它被確認(rèn)“無(wú)已確認(rèn)青少年致命傷害事故、無(wú)FTC重大處罰”。

全榜單綜合風(fēng)險(xiǎn)最低的是 Cohere，分?jǐn)?shù)2.5，其內(nèi)容策略保守嚴(yán)苛，幾乎無(wú)青少年有害內(nèi)容生成、無(wú)成癮誘導(dǎo)、無(wú)相關(guān)安全事故與監(jiān)管處罰記錄。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.