快科技5月8日消息,美國加州北區聯邦地區法院作出最新司法裁定,正式駁回英偉達公司要求駁回集體版權訴訟的動議,這起案件被業內稱作AI訓練數據版權第一案。
本次訴訟由多名作者聯合發起,核心指控英偉達使用19.7萬本盜版電子書,通過旗下NeMo Megatron AI框架訓練大語言模型,侵犯了其合法著作權。
![]()
原告方在訴訟文書中明確,英偉達用于模型訓練的數據,來自包含19.7萬本未經授權電子書的Books3數據集,該數據集被整合進超800GB的開源文本數據集The Pile中,最終被接入NeMo框架用于相關大模型訓練。
英偉達在案件審理過程中,援引美國版權法中互聯網服務提供商的"安全港"保護條款及相關司法判例,主張NeMo Megatron是通用AI訓練工具,具備大量合法非侵權用途,要求法院駁回該起訴訟。
審理該案的法官在裁定中駁回了英偉達的全部抗辯主張,明確本案爭議焦點并非NeMo框架整體,而是框架內的特定數據處理腳本,這些腳本被指控的唯一目的就是加速侵權過程,與通用開發工具存在本質區別。
另外,NVIDIA還被指控向Writer、Persimmon AI Labs、亞馬遜等客戶分發自動下載The Pile的腳本和工具,直接為第三方侵權提供基礎設施。
本次裁定生效后,該起集體版權訴訟將正式進入證據開示環節,后續可進入庭審階段,目前法院尚未公布下次聽證會的具體日期。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.