<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      用GitHub上的開源代碼訓(xùn)練人工智能違法嗎?

      0
      分享至



      近日,人工智能公司OpenAI在開發(fā)者大會上宣布[i]:如果用戶因人工智能生成內(nèi)容造成版權(quán)侵權(quán)被起訴索賠,其將向用戶提供版權(quán)保護盾:為客戶辯護并報銷過程中產(chǎn)生的費用。其實OpenAI這招是從微軟學(xué)來的。而微軟,則是因為用了開源軟件代碼訓(xùn)練人工智能被起訴,迫不得已才想出版權(quán)保護盾的辦法。今天就來聊聊微軟被起訴這個的訴訟,以及用開源代碼訓(xùn)練人工智能到底有哪些法律風險。

      筆者在網(wǎng)上找到了案件的起訴書、微軟的答辯意見和美國加利福尼亞北區(qū)法院的初步裁定[ii],今天就根據(jù)相關(guān)內(nèi)容介紹一下該案。美國是普通法系國家,法院的審判模式和我國有很大區(qū)別,所以我對判決書中的判例引用和制度也都不甚了解,只能挑自己看得懂的案件事實和部分說理做摘要。美國法律上的分析可以參考美國律師這篇文章[iii]。

      OpenAI公司開發(fā)出一款名為Codex的人工智能生成工具。GitHub 推出了基于生成式人工智能的代碼自動完成工具 Copilot。Copilot是一款面向 GitHub用戶的訂閱工具,月費 10 美元,年費100美元。根據(jù)訴狀,Copilot需要Codex才能運行。2022年11月,兩名軟件開發(fā)者使用化名(為什么用化名起訴,因為有人通過原告律師對原告發(fā)出過死亡威脅)提起了假定的集體訴訟,被告為GitHub、微軟(作為GitHub的母公司)、OpenAI。原告聲稱Copilot和Codex作為人工智能工具,其訓(xùn)練中使用了原告受版權(quán)保護的計算機代碼。

      開源代碼的特點是都在開源許可證下發(fā)布的,既然是開放的,所以用開源代碼訓(xùn)練人工智能也不能說必然侵權(quán),但在GitHub上有11種開源許可證,每一種許可證都對使用開源代碼者有不同的要求,要求任何衍生作品或許可作品的副本都包含貢獻源代碼者的信息、版權(quán)聲明以及其他要求,比如GPL許可證下的代碼要求使用者開放其軟件中的全部源代碼。

      但原告認為,當他們的代碼被用作訓(xùn)練數(shù)據(jù)時,代碼附帶的開源許可證的版權(quán)管理信息(“CMI”Copyright ManagementInformation)被刪除了。他們還認定Codex和Copilot生成的作品部分包含了他們受版權(quán)保護的代碼。原告的訴求包括一系列索賠,違反《數(shù)字千年版權(quán)法》(DMCA);違反 GitHub用戶協(xié)議;不公平競爭;隱私權(quán)侵權(quán)等。

      但原告的起訴有一個證據(jù)瑕疵:無法證明Codex和Copilot生成的作品完全復(fù)制了原告的代碼。法院初步調(diào)查的結(jié)果是:發(fā)現(xiàn)了幾處Copilot的輸出與 Github用戶編寫的授權(quán)代碼相匹配(matched)的情況,但這些情況都不涉及原告發(fā)布的代碼。也就是說,有初步證據(jù)證明人工智能輸出的內(nèi)容用了Github上的代碼,但本案的原告不是代碼的作者,所以無權(quán)主張此行為侵權(quán)。

      這些匹配的代碼證明原告訴訟事項并非沒有依據(jù),故法院在初步裁定書中認定:原告有理由聲稱,被告的計劃至少存在以下重大風險:將復(fù)制原告的許可代碼并進行輸出。首先,Codex和Copilot的數(shù)據(jù)訓(xùn)練數(shù)據(jù)中包括所有公開的GitHub存儲庫。其次,程序會根據(jù)相關(guān)提示重現(xiàn)眾所周知的代碼,并提供幾個具體的此類復(fù)制的例子。最后,原告聲稱GitHub自己的內(nèi)部研究顯示,Copilot"大約有1%的時間"從訓(xùn)練數(shù)據(jù)中復(fù)制代碼。因此,原告聲稱的,“如果沒有禁令救濟,就會存在以下現(xiàn)實危險,Codex或Copilot將復(fù)制原告的許可代碼作為輸出”有一定道理。

      原告還聲稱被告修改了 Copilot,以確保它不再復(fù)制許可證文本、署名和版權(quán)聲明。法院認為,如果原告的代碼是被復(fù)制用于輸出,其復(fù)制方式將違反開源許可證的規(guī)定。雖然原告未能證明事實損害足以使其獲得部分訴訟資格,但法院還是認可他們有資格以財產(chǎn)權(quán)受到損害為由提出損害賠償,同時要求起訴8項禁令救濟。

      雖然法院的初步裁定駁回了原告的很多訴請,比如隱私權(quán),民事共謀和宣告性救濟(civil conspiracy and declaratory relief),但這個訴訟如果繼續(xù)推進,對被告方而言,其人工智能產(chǎn)品會始終處于被法院認定停止侵權(quán)的威脅之下,所以目前案件對誰更有利還不好說。

      要厘清用開源代碼訓(xùn)練人工智能是否侵權(quán)的問題,可以看訴狀里提到的下面幾個問題:

      一、人工智能是怎么用開源代碼訓(xùn)練及輸出的?

      根據(jù)訴狀,原告認為人工智能的訓(xùn)練是算法推演,而不是理解代碼后生成結(jié)果,至少在訴訟的答辯狀里,被告方對訓(xùn)練過程、方法都沒有進行回應(yīng),只是說認為訓(xùn)練屬于合理使用。

      原告認為:Codex和Copilot不能理解代碼,與人工智能有關(guān)的 "研究"、 "培訓(xùn)"和"學(xué)習"等詞描述的是與人類推理不同的算法過程。也不能像人類那樣"理解"語義和上下文,人工智能模型無法像人類一樣"學(xué)習",它能檢測其訓(xùn)練數(shù)據(jù)中具有統(tǒng)計意義的模式,并提供從其訓(xùn)練數(shù)據(jù)中得出的輸出結(jié)果,在統(tǒng)計適當?shù)那闆r下,對數(shù)據(jù)進行分析。這樣的"蠻力"方法既不高效,也不可靠。所以Codex和Copilot不能自己生成代碼,他們只是用算法推導(dǎo)出用戶想要什么,他們生成的結(jié)果是多個來源拼湊的。

      可能Codex和Copilot這個產(chǎn)品是為了給程序員編程時服務(wù),這個訓(xùn)練的智能跟人類學(xué)習區(qū)別還是很大的,甚至和ChatGPT生成代碼的方式也是不同的。如果訴狀所稱屬實,因為輸出的內(nèi)容都是現(xiàn)成的結(jié)果的拼湊,其侵權(quán)的可能性確實會比較大。

      二、GitHub的用戶協(xié)議有沒有限制或禁止訓(xùn)練行為?

      所有上傳到GitHub的代碼均受GitHub用戶協(xié)議的約束,該協(xié)議條款規(guī)定用戶保留其上傳至GitHub的任何內(nèi)容的所有權(quán),但授予GitHub存儲權(quán),對[內(nèi)容]進行存檔、解析和顯示,并制作必要的附帶副本,以提供服務(wù),包括不斷改進服務(wù)。

      根據(jù)Github的用戶協(xié)議:這包括將代碼復(fù)制到我們的數(shù)據(jù)庫并進行備份等操作的權(quán)利;向您和其他用戶提供,將其解析為搜索索引或在我們的服務(wù)器上進行其他分析;與其他用戶共享。用戶協(xié)議還規(guī)定,用戶如果設(shè)置了GitHub將授予每位GitHub用戶非獨占的、全球范圍內(nèi)的許可通過GitHub服務(wù)使用、展示和執(zhí)行。在GitHub功能允許的情況下,內(nèi)容只能在GitHub上發(fā)布。

      鑒于用戶協(xié)議中有代碼要“與其他用戶共享”的規(guī)定,所以,如果代碼是開源的,那拿來訓(xùn)練應(yīng)當也是共享的一種方式,符合用戶協(xié)議規(guī)定。

      三、人工智能輸出的涉及開源代碼的內(nèi)容是不是符合開源協(xié)議?

      訴狀稱:盡管GitHub公共存儲庫中的大部分代碼都受到限制其使用的開源許可證的約束,但Codex和Copilot“并未進行編程設(shè)計,以將版權(quán)歸屬、版權(quán)聲明和許可條款視為法律上必需的”,Copilot訓(xùn)練數(shù)據(jù)并復(fù)制作為輸出,但沒有復(fù)制版權(quán)歸屬信息、版權(quán)聲明和許可條款。這違反了“數(shù)萬(可能是數(shù)百萬)軟件開發(fā)人員”的開源許可證。

      這里面有三個法律問題,首先是違法問題,根據(jù)美國的版權(quán)法律[iv],未經(jīng)版權(quán)所有者或法律授權(quán),任何人不得刪除或更改版權(quán)管理信息。而本案中,代碼附帶的開源許可證的版權(quán)管理信息(“CMI”Copyright ManagementInformation),在訓(xùn)練時被刪除了。這里的版權(quán)管理信息的范圍要比我國《著作權(quán)法》規(guī)定的署名權(quán)要大,因為除了顯示作者或項目的名稱,開源協(xié)議可能還有其他要求,比如公開衍生代碼甚至項目的全部代碼。

      其次是違約問題,GitHub上有十一種開源協(xié)議[v]。每一種都對使用代碼,產(chǎn)生衍生代碼有明確的條件,并且復(fù)制或者以原有代碼衍生新的代碼都至少應(yīng)當載明代碼來源,所屬的開源許可證,如果版權(quán)管理信息被刪除,人工智能的開發(fā)者就會違反開源協(xié)議。

      還有人工智能使用者侵權(quán)的問題。由于版權(quán)管理信息被刪除,Codex和Copilot的使用者無法判斷人工智能生成的代碼是否屬于開源許可證項下的代碼,如果其使用了這些代碼,但沒有按照開源許可證的要求標明開源代碼來源以及其他要求,就會對開源代碼的作者構(gòu)成侵權(quán)。可能這也是微軟和OpenAi會向其人工智能服務(wù)用戶提供版權(quán)保護盾的原因。

      最后,本案可以看出人工智能目前處于野蠻生長的狀態(tài),創(chuàng)業(yè)者只故產(chǎn)品快速推出,但產(chǎn)品設(shè)計中忽視法律風險和更重要的產(chǎn)業(yè)生態(tài)保護。開源軟件作為一個有幾十年歷史的龐大的產(chǎn)業(yè),標注版權(quán)管理信息和遵守開源許可證的規(guī)定是產(chǎn)業(yè)能夠正常運轉(zhuǎn)的核心,而新興的人工智能產(chǎn)業(yè)卻只是把開源社區(qū)的成果——開源代碼全部拿走,但完全不愿遵守法律和開源社區(qū)的規(guī)則。所以,我的判斷是,這種破壞生態(tài)式的創(chuàng)新應(yīng)該不會得到法院的支持。

      本文作者:游云庭,上海大邦律師事務(wù)所高級合伙人,知識產(chǎn)權(quán)律師。本文僅代表作者觀點。

      [i] https://baijiahao.baidu.com/s?id=1781864329601644857&wfr=spider&for=pc

      [ii] https://www.skadden.com/-/media/files/publications/2023/05/ruling-on-motion-to-dismiss-sheds-light/govuscourtscand403220950.pdf?rev=4e26e0aee78a4ff49aa30cabfcb265f6&hash=8D62FF3579B6D474BCA1E9E495233E76

      [iii] https://www.jdsupra.com/legalnews/ruling-on-motion-to-dismiss-sheds-light-6984451/

      [iv] https://www.law.cornell.edu/uscode/text/17/1202

      [v] 這十一種開源許可證為:(1)Apache License 2.0;(2) GNU General PublicLicense version;(3) MIT; (4)BSD 2;(5) BSD 3;(6) Boost Software License("BSL-1.0") (7) Eclipse Public License 2.0; (8) GNU Affero GeneralPublic License version 3 ("AGPL-3.0") ;(9)General Public License version 2 ("GPL 2") ;(10) GNULesser General Public License version 2.1("LGPL-2.1") ;(11) Mozilla PublicLicense 2.0("GPL-3.0")。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      慘敗!4月燃油SUV銷量:僅5款車型破萬,CR-V第12,哈弗H6第22

      慘敗!4月燃油SUV銷量:僅5款車型破萬,CR-V第12,哈弗H6第22

      三農(nóng)老歷
      2026-05-12 03:23:47
      實戰(zhàn)出真知!烏克蘭靠真實戰(zhàn)場數(shù)據(jù),在中東賺麻了

      實戰(zhàn)出真知!烏克蘭靠真實戰(zhàn)場數(shù)據(jù),在中東賺麻了

      寰球經(jīng)緯所
      2026-05-10 10:10:20
      特朗普臨行放話:訪問中國主要談3件事!“對臺軍售”是重中之重

      特朗普臨行放話:訪問中國主要談3件事!“對臺軍售”是重中之重

      咣當?shù)厍?/span>
      2026-05-12 15:26:57
      以色列全票通過重磅法案:10月7日襲擊者或被判死刑

      以色列全票通過重磅法案:10月7日襲擊者或被判死刑

      桂系007
      2026-05-12 05:59:35
      不僅華為要謝,中國更要感謝梁孟松!為中國芯片竟放棄千萬年薪!

      不僅華為要謝,中國更要感謝梁孟松!為中國芯片竟放棄千萬年薪!

      優(yōu)趣紀史記
      2026-05-10 21:41:28
      越扒越后怕!全球生育率暴跌,居然是美國半個世紀前布的局?

      越扒越后怕!全球生育率暴跌,居然是美國半個世紀前布的局?

      混沌錄
      2026-05-11 18:07:32
      失業(yè)后我才明白,只有愚蠢的人,才會花幾十萬在農(nóng)村建房子

      失業(yè)后我才明白,只有愚蠢的人,才會花幾十萬在農(nóng)村建房子

      三農(nóng)雷哥
      2026-05-12 11:36:27
      四太奚夢瑤砸1.68億買豪宅,結(jié)婚7年首置業(yè),婆媳狂買3套刷新房價

      四太奚夢瑤砸1.68億買豪宅,結(jié)婚7年首置業(yè),婆媳狂買3套刷新房價

      開開森森
      2026-05-12 14:59:27
      汽車4月國內(nèi)銷量下跌21%油車跌37% 出口暴漲80%

      汽車4月國內(nèi)銷量下跌21%油車跌37% 出口暴漲80%

      網(wǎng)上車市
      2026-05-11 21:44:30
      不斷挑撥離間!小玥兒忍無可忍,一個動作揭開了與馬筱梅的關(guān)系

      不斷挑撥離間!小玥兒忍無可忍,一個動作揭開了與馬筱梅的關(guān)系

      觀察鑒娛
      2026-05-12 09:28:50
      太平軍攻南京有多慘烈?將軍祥厚及五千旗兵全部被殺,滿人被屠盡

      太平軍攻南京有多慘烈?將軍祥厚及五千旗兵全部被殺,滿人被屠盡

      老范談史
      2026-05-11 19:45:11
      雷霆主帥:我對詹姆斯?jié)M懷敬意,他在這個年齡的表現(xiàn)讓人難以置信

      雷霆主帥:我對詹姆斯?jié)M懷敬意,他在這個年齡的表現(xiàn)讓人難以置信

      懂球帝
      2026-05-12 15:21:08
      利雅得勝利vs利雅得新月前瞻:勝利贏球就奪冠 C羅PK本澤馬

      利雅得勝利vs利雅得新月前瞻:勝利贏球就奪冠 C羅PK本澤馬

      智道足球
      2026-05-12 14:57:30
      火爆!對手未定,上海隊CBA半決賽主場G1門票就已全部售罄

      火爆!對手未定,上海隊CBA半決賽主場G1門票就已全部售罄

      懂球帝
      2026-05-12 11:07:09
      中國4月銷量最高車型出爐:特斯拉Model Y屈居第二

      中國4月銷量最高車型出爐:特斯拉Model Y屈居第二

      快科技
      2026-05-11 18:30:32
      賴清德遭當頭一棒,中方向191國通告,對岸不準參會,鄭麗文表態(tài)

      賴清德遭當頭一棒,中方向191國通告,對岸不準參會,鄭麗文表態(tài)

      芳芳歷史燴
      2026-05-12 16:28:46
      76人更衣室徹底亂了!恩比德帶頭,球員集體倒戈,毒瘤早該離隊

      76人更衣室徹底亂了!恩比德帶頭,球員集體倒戈,毒瘤早該離隊

      你的籃球頻道
      2026-05-12 07:31:00
      穆帥:再說一遍我沒和皇馬談過;進不進歐冠不會影響我的未來

      穆帥:再說一遍我沒和皇馬談過;進不進歐冠不會影響我的未來

      懂球帝
      2026-05-12 07:05:06
      “到底是哪個天才想出的在北京種月季?”

      “到底是哪個天才想出的在北京種月季?”

      新浪財經(jīng)
      2026-05-11 17:55:50
      開了十年麻將館我算看透了!天天泡牌桌上的人,沒一個命好的

      開了十年麻將館我算看透了!天天泡牌桌上的人,沒一個命好的

      欣悅廣場舞
      2026-04-17 16:25:41
      2026-05-12 17:40:49
      游云庭律師 incentive-icons
      游云庭律師
      互聯(lián)網(wǎng)法律評論
      163文章數(shù) 189關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹發(fā)布載人變形機甲,定價390萬元起

      頭條要聞

      老人游泳館溺水6分鐘無人施救 家屬:救生員在玩手機

      頭條要聞

      老人游泳館溺水6分鐘無人施救 家屬:救生員在玩手機

      體育要聞

      總是掉鏈子的“倒霉蛋”,闖進了歐戰(zhàn)決賽

      娛樂要聞

      劉濤曬媽祖誕辰活動照 評論區(qū)變許愿池

      財經(jīng)要聞

      黃仁勛真是被白宮徹底封殺了

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態(tài)度原創(chuàng)

      健康
      親子
      家居
      本地
      公開課

      干細胞能讓人“返老還童”嗎

      親子要聞

      37歲卵巢功能下降還能懷孕嗎?促排期間注意哪些事項吃什么?

      家居要聞

      極簡主義下的居住場域與空間

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲中文无码线在线观看| 日韩aⅴ一区二区三区| 久久亚洲人成电影网| 99久久无码国产精品性出奶水| av亚洲一区| 邻居少妇张开腿让我爽了在线观看 | A级毛片18以上观看视频免费| 97人妻精品无码| 国产av一区二区亚洲| 色综合中文综合网| 色成年激情久久综合国产| 久久躁狠狠躁夜夜av麻豆| 国产五区| 亚洲中文字幕手机在线第一页| 国产在线视欧美亚综合| 久久亚洲男人第一AV网站| 揉捏奶头高潮呻吟视频试看| 国产女人在线视频| 日韩国产亚洲一区二区在线观看| 日本伊人一区二区三区| 国产亚洲色欲色一色www| 精品无人区无码乱码毛片国产| 亚洲日韩一区| 成人免费看片又大又黄| 国产精品一区二区韩国AV| 精品香蕉久久久午夜福利| 91福利导航大全| 色欲国产一区二区日韩欧美| 国外av片免费看一区二区三区| 久久久久久一区国产精品| 亚洲国产av无码综合原创国产 | 日本丰满老妇bbb| 亚洲AV成人无码久久精品| 一本一道av无码中文字幕麻豆| 淫射网| 成年人免费国产视频| 福利无遮挡喷水高潮| 国产精品国产三级国产专区53| 久久SE精品一区精品二区| 尤物在线观看精品国产福利片| 美女把尿囗扒开让男人添|