日前,青少年網(wǎng)絡(luò)安全機(jī)構(gòu) TeenAegis,發(fā)布了全球首個(gè)面向青少年兒童安全的大模型風(fēng)險(xiǎn)評(píng)分榜單,TeenAegis AI Danger Index(又稱 AI Harm Index)。
這個(gè)榜單的特別之處在于:
一方面,完全基于實(shí)證數(shù)據(jù),如監(jiān)管處罰、司法訴訟、真實(shí)傷害事故記錄等,數(shù)據(jù)來(lái)源包括美國(guó)失蹤與受剝削兒童中心(NCMEC)報(bào)告、FTC執(zhí)法記錄、法院卷宗、獨(dú)立安全實(shí)證研究等。
而且,每 5 分鐘更新一次數(shù)據(jù)!
![]()
另一方面,它完全不評(píng)估通用AGI生存風(fēng)險(xiǎn)、技術(shù)安全等通常的“安全”維度,而只專門(mén)評(píng)估AI聊天平臺(tái)對(duì)未成年人的危害風(fēng)險(xiǎn),以面向家長(zhǎng)、教育者、監(jiān)管、行業(yè)問(wèn)責(zé)。
其公布的評(píng)估標(biāo)準(zhǔn),全部都基于已證實(shí)危害!
比如生成兒童色情內(nèi)容(CSAM)、誘導(dǎo)性 grooming(誘騙、情感操控)、自殺傾向、極端心理風(fēng)險(xiǎn)誘導(dǎo)、年齡驗(yàn)證機(jī)制失效、未成年人無(wú)防護(hù)使用漏洞。
![]()
該榜單的評(píng)測(cè)評(píng)分區(qū)間為 0–10分,分?jǐn)?shù)越高風(fēng)險(xiǎn)越大;分級(jí)有 Critical(極高危)、Elevated(偏高風(fēng)險(xiǎn))等。
以下為首期完整榜單
![]()
榜單里, Character.AI 得 8.2 分,是唯一滿分段極高危,它關(guān)聯(lián)著2024年美國(guó)14歲用戶沉迷對(duì)話后的自殺事件。
而且存在大量青少年情感依附、心理成癮、極端情緒誘導(dǎo),且防護(hù)機(jī)制薄弱,極易被誘導(dǎo)傾訴私密信息、被角色化情感操控(Grooming),內(nèi)容審核漏洞顯著。
而同屬極高危得分7.8 的 xAI Grok,則正處于美國(guó)聯(lián)邦CSAM相關(guān)集體訴訟中。
DeepSeek 與Grok同分并列第二。盡管沒(méi)有實(shí)證案例關(guān)聯(lián),但邊界限制寬松,未成年人內(nèi)容防護(hù)機(jī)制不完善,極易繞過(guò)安全護(hù)欄生成暴力、自殘、危險(xiǎn)行為指導(dǎo)。
OpenAI ChatGPT 得了全閉源商用模型中的最低分 3.2 分,并獲評(píng)Most Improved(安全改進(jìn)最佳),它被確認(rèn)“無(wú)已確認(rèn)青少年致命傷害事故、無(wú)FTC重大處罰”。
全榜單綜合風(fēng)險(xiǎn)最低的是 Cohere,分?jǐn)?shù)2.5,其內(nèi)容策略保守嚴(yán)苛,幾乎無(wú)青少年有害內(nèi)容生成、無(wú)成癮誘導(dǎo)、無(wú)相關(guān)安全事故與監(jiān)管處罰記錄。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.