版權倡導者炮轟GitHub Copilot AI編程輔助工具

6 月下旬,微軟旗下代碼託管平台 GitHub 推出了能夠對整行或全部代碼給出 AI 分析建議的 Copilot 編程輔助工具。然而這個支持多種語言和框架、能夠直接以擴展程序的形式在 Visual Studio Code 中調用的功能,也遭到了一些版權倡導者的猛烈批評。據悉,GitHub Copilot 由 OpenAI Codex 項目提供支撐,並接受了數十億行的開源代碼訓練。

1.png

(來自:GitHub Blog)

以 Brian P. Hogan 為例,他認為 GitHub Copilot 會“剽竊”你的代碼。而且在幫助 AI 完成了訓練之後,它甚至會反過來向你收費。對於那些為此感到歡呼的人,@bphogan 感到很是失望。

2.png

至於 GitHub Copilot 是否直接從訓練數據集中默背代碼,Mark O.Riedl 的觀點是 —— Copilot 使用了某個版本的 GPT3,並在基於 GPL 授權的代碼上展開了訓練。

3.png

但在某些情況下,@mark_riedl 指出 GitHub Copilot 會有直接從記憶中復誦代碼片段的情況。

4.png

Armin Ronacher 則對 GitHub 持更加鮮明的反對態度,理由是平台拿竟然他的開源代碼來訓練這麼個鬼東西。更讓人無力吐槽的是,美國法律竟然允許任何人這麼胡搞,儘管他非常確定不該進一步增強版權法。

5.jpg

對此,外媒 MSPU 的 @Pradeepviswav 表示,自己不理解 GitHub Copilot 怎麼就侵犯了 GPL 代碼版權的整個論點。

首先,機器生成的代碼,不該被視作衍生作品。否則我們就無法用 AI 來創建音樂識別應用,因為您的 AI 模型將基於受版權保護的音樂內容。

6.png

(Copilot 傳送門)

其次,即使 Copilot 從訓練數據集中生成了準確的短代碼片段,也不應被視為侵犯版權。比如下面這段:

if(i<=0)

i=i+1;

你不該就此聲明版權,因為該片段構不成所謂的原始代碼。而且 GitHub Copilot 應該能夠在不違反任何版權的情況下,向開發者推薦此類短代碼片段。

至於微軟和 GitHub 將在未來幾天內給出怎樣的回應,還請拭目以待。

相關文章:

GitHub Copilot可對整行或全部代碼給出AI分析建議

(0)
上一篇 2021-07-06 10:06
下一篇 2021-07-06 10:27

相关推荐