AI傳訛:“數(shù)據(jù)投毒”的生成邏輯與轉(zhuǎn)化
?文/郭小平、李誠婧
-
框架+邏輯(?)
數(shù)據(jù)投毒引發(fā)隱私信息泄露、虛假信息擴散與公共認知偏差等傳播風險,暴露出當前AI大模型在數(shù)據(jù)根基與事實核查機制方面的雙重疏漏。它不僅表征著數(shù)智時代人機關(guān)系失衡與技術(shù)治理滯后的現(xiàn)實癥候,還警醒人機協(xié)同關(guān)系與技術(shù)向善的建構(gòu)。
-
觀點(????)
【數(shù)據(jù)投毒】
“數(shù)據(jù)投毒”是通過定向干預AI大模型及其訓練數(shù)據(jù),擾亂機器學習進程、扭曲模型輸出結(jié)果的技術(shù)行為。其操作手段分為直接攻擊與間接攻擊,前者篡改訓練集數(shù)據(jù)、植入后門以攻擊模型性能;后者則間接誘導模型在開源數(shù)據(jù)庫抓取虛假信息。早期的數(shù)據(jù)投毒源于非主動的數(shù)據(jù)污染,近年來,隨著生成式人工智能的技術(shù)演進,針對模型進行的主動投毒,如標簽反轉(zhuǎn)、虛假樣本注入、重復樣本放大、語義后門、后門投毒、特征投毒、干凈標簽投毒等攻擊方式,嚴重影響AI信息生成與傳播,也暴露了AI大模型在事實核查方面的脆弱性。
-
答題語料積累(????)
?? 同時,平臺縱容博主上傳缺乏“顯式與隱式標識”的AIGC內(nèi)容,消解了新聞事實與AI創(chuàng)作的邊界。機器人水軍、AI洗稿、AI虛構(gòu)性創(chuàng)作等產(chǎn)生的虛假信息“數(shù)量龐大、隱匿性、擬人化”,能有效誘導AI大模型在數(shù)據(jù)采集階段將其抓取并納入訓練集。在遞歸污染機制的催化下,模型持續(xù)向用戶二次傳播這些不實信息,進而影響公眾對特定輿論與社會議題的認知。
?? 斯蒂格勒為此警示道,數(shù)據(jù)投毒將是AI大模型催生的系統(tǒng)性愚蠢,使公眾“對自動社會的經(jīng)驗,正在形成一種新的心理環(huán)境(麻木)……表現(xiàn)為功能性恍惚,一種基于驅(qū)力 的資本主義和工業(yè)民粹”。在此狀態(tài)下,公眾的認知與判斷“不再是經(jīng)驗生成的核心,而被重新定義為流 程中的附屬變量”。當公共決策日益依賴AI大模型時,人類的主體性或?qū)⒅鸩酵嘶鐣⑾萑胗葾I邏輯主導的認知困境。
??在此基礎(chǔ)上,貝爾納·斯蒂格勒指出,人與技術(shù)的關(guān)系存在“技術(shù)藥性”,在數(shù)智時代,數(shù)據(jù)投毒正是這種“技術(shù)藥性”的當代顯影。它既可作為“毒”,破壞AI大模型性能、污染公共認知;亦可通過暴露技術(shù)脆弱性,轉(zhuǎn)化為維護模型正常運作的防御機制,發(fā)揮“藥”的修復與免疫功能。
#新傳考研
#論文帶讀
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.