生成式AI爆火背後:數據確權、隱私與版權爭議

文|硅谷101,採訪|泓君,文字|何源清,編輯|泓君
來源:鈦媒體

生成式AI爆火背後:數據確權、隱私與版權爭議

圖片來源:由無界版圖AI工具生成

老牌雜誌《經濟學人》的封面一向以辛辣和構思獨特取勝,而今年年中,《經濟學人》的雜誌封面《Ai’s New Frontier》竟是一張Midjourney人工智能生成的圖片。美國科羅拉多州博覽會美術大賽的冠軍作品——《太空歌劇院(Théâtre D'opéra Spatial)》,也是由AI所生成。

普通人可以用AI生成媲美藝術家的作品,這讓“一句話生成圖片”在網絡上爆紅。硅谷知名投資機構紅杉也寫了一篇文章,叫做《Generative AI: A Creative New World》,一時間,也成為投資人競相追逐的賽道,業內人士將生成式AI的賽道稱之為AIGC(Artificial IntelligenceGenarated Content)。

本期節目,《硅谷101》邀請到了美國西北大學工業工程及管理科學系和計算機科學系助理教授汪昭然大廠數據科學家鍾凱祺來聊聊我們的使用體驗,並嘗試回答“一句話生成圖片”到底是什麼,以及AI生成圖片的數據與版權問題。

以下是部分訪談精選。

01 誤解獲獎作品《太空歌劇院》:並不完全是機器生成

《硅谷101》:您覺得在使用AIGC生成圖片的過程中,有什麼有意思的地方,跟大家介紹一下你的使用經驗?

鍾凱祺:你之前提到看過一幅照片,後面全是圖書館里的書,前面是幾個機器人,那張圖就是我畫的。製圖過程當中感覺比較重要的事是,後面一定要去學很多描述風格的裝飾詞,甚至是你需要的藝術家風格要明確的告訴它。比如在那一幅圖裡面,我就很明確地說是一個比較中古的油畫風,一個人和一些機器人一起合作,在一個巨大的古老的圖書館當中一起工作。需要把這種感覺描述出來,越精確越好。接下來就是去試結果,可能試了大概20次左右,已經得到一個不錯的結果。再去看看別人有沒有一些更好的方案。還挺好玩的,像拆盲盒一樣。

《硅谷101》:讓我想起來在片頭提到了這幅獲獎作品,叫做《太空歌劇院》,我其實看了那幅作品,覺得他絕對不是一個“一句話生成圖片”的初級玩家,一定是個高級玩家。

鍾凱祺:那幅圖是精修過的。

《硅谷101》:怎麼精修?

鍾凱祺:要參賽的圖片,一般是先用 Midjourney 畫一個底稿,專業的畫家會在這基礎上再去對它用電腦做一些精修。

原畫師現在用兩種方法精修:

一是直接打出底稿之後用它來做精修;

二是直接做局部:我在某一個局部想要什麼,把這個做出來,然後再把幾個局部的圖片“捏”起來,做自己想要的構圖。

這幾類的方法現在都有,不完全直接用 AI 製圖。就像攝影技術,照片生成的時候攝影也不太好直接出,因為有可能過度曝光等等的原因,必須要在弄完之後加很多的操作,這種邏輯也是一樣的。等於現在還處在我們和AI作畫技術不斷磨合、進步的這麼一個過程當中。

《硅谷101》:Midjourney的美學風格是什麼決定的?

鍾凱祺決定美學風格的,

第一是數據集,看看本身有什麼風格?

第二是整個訓練和推理的過程,會在過程當中不斷地進行調試:設置一定的函數,來保證達到的效果是它們想要的。它們會對某一既定的、一致的美學風格去給一些征照的打分,等等的方式來調優每一個模型自己的美學風格。

當然這一塊我不是特別專業,但我看到過有一些專業的畫師在用了各大產品后,非常詳盡的評測,對它們的美學風格是有一定的差異性評價的。

02‍‍ 數據確權、隱私與版權爭議

《硅谷101》:我片頭開始講到了那幅獲獎的作品《太空歌劇院》,說它引來了版權爭議。這個作品它算不算你創作的?它的版權歸誰?我用DALL·E·2生成的我們播客封面圖的這兩張照片,它的版權又是歸誰,其他人能不能用這兩幅圖?它目前其實是沒有任何的法律保護,在一個真空地帶的。您怎麼看?

汪昭然:這裡面包含一個非常嚴重的問題,就是數據確權的問題。數據生成出來的模型到底歸誰,包括一直到下游,你的 Prompt 生成出來的特定的圖片,這個圖片的版權歸誰?其實現在有很大的爭議。

這也是另外一個值得研究的熱點,就是數據怎麼定價、數據怎麼確權、你怎麼保護你自己的隱私。包括GBP-3做代碼生成,還有微軟現在的產品集成到Visual Studio Code里,它從把Github上的代碼給讀了一遍,生成出來代碼到底算誰的。有些代碼它的許可證可能不允許你去直接抄。如果我的模型生成代碼出來的是一模一樣的,比如生成了3行一樣的,你很有可能就被告了。像谷歌被Oracle告Java的專利侵權,這其實是類似的。就算是人完全看一遍,自己記住再寫一遍,其實也不能保證完全不一樣。所以這其實是一個很大的問題。

那具體到數據集裡面,如果出現特定人的臉,就算不是一模一樣,但是大同小異,到底算不算侵犯隱私,或者我乾脆就願意把我的數據賣給 Open AI 或者是 Stability 做訓練,它應該給我付多少錢,下游的分成應該分多少。這是一個很大的問題,在廣義的經濟學上,信息是怎麼定價的?也是有很多值得研究的課題。

但是另外一方面,這也是好事。我們可以這樣想:如果出現了一個非常嚴格的、可執行的數據確權、數據定價的規則,那麼它馬上就能形成一個非常大的數據的市場。不僅僅是大模型的,包括現在的推薦系統用到的這些數據,本質上也是從用戶手裡面給“騙”來的。你推薦的這些利潤是不是應該給用戶分一部分,現在還是非常模糊的階段。

但是現在數據隱私的立法已經很完善了,我們可能馬上也能看到數據的交易。不論是在美國、歐洲或者中國,可能也會有一些政策層面的改變,在這些政策下會發掘出來什麼機會。很有意思,同時也有很多新的挑戰需要解決。

《硅谷101》我稍微補充一點,剛剛我們提到的在AI圖片生成平台生成的作品,它們採用的版權協議叫做 CC0機制:它是一個開放版權協議,它的版權並不完全是屬於我的。比如我雖然可以被認為是跟機器共同創作作品的作者,但是這個作品同時也可以被其他的人去使用或者修改。所以現在應該來說在法律上它是最寬泛的一種,但未來會不會收緊我們不知道。

我們剛剛提到的是數據的隱私的問題,但另外還有一個是昨天我看見有人轉發了一條即刻,是一期Joe Rogan(美國一個非常著名的播客主持人),跟Steve Jobs(喬布斯)的採訪對話。聽到這裡大家肯定會非常奇怪,因為大家知道喬布斯已經去世了,是不可能接受採訪的。所以第一反應是不是生前的採訪?它其實是一段假的,也是就AI生成的。根據比如 Joe Rogan 的數據,和喬布斯生前的採訪的東西,把它整理成的一個AI的採訪對話。我沒有全部聽,大概點進去稍微聽了一下,感覺還挺順暢的,它相當於是一個假的播客作品。因為GPT3也能寫, 那以後是不是AI可以生成這種大量的假新聞。我記得AI生成圖片火之前,有一段時間 Deepfake(深度偽造技術)也很火。未來這種技術要怎麼樣去做好安全性,完全靠這些企業的道德標準嗎?

汪昭然:對,這就是一個非常大的挑戰。其實大家可能也沒有什麼好的解決方法,因為從原理來看,以前我們說有知識產權的保護,是因為可以很嚴格的比對,你到底有沒有侵犯專利,有沒有抄襲文章。但是現在很多東西,你說它是抄了,它也沒有完全抄,但卻有一些神似。就像在連續空間上不可能有兩個點完全重合,概率是非常非常小的。

所以我覺得這些都是一些需要研究的問題,特別像生成模型,其實很多時候它會帶來一些想不到的技術難點,就像您說的 Deepfake(深度偽造技術),或者是生成得一些很有冒犯性的內容,這些在某種意義上也回到了“可控生成”的問題上:什麼是冒犯性的內容?其實我們可能也都沒有一個共識。怎麼嚴格定義、立法定義,因為確立規則是在這個東西出來之後,本質上都會有一些滯后性。甚至在這個時代已經不太好定義什麼叫做“不好的內容”,這是非常有挑戰性的。我其實就非常感興趣在這方面有沒有一些簡單的解決方案,這些都是一些研究性的前沿理論。

03‍ 生成式AI:未來的搜索引擎?

《硅谷101》:您覺得生成式AI的最終目標可能是什麼?

鍾凱祺:其實我覺得這一塊未來會碰到的邊界越來越多,也不斷會有法規完善,可能法規和業界的發展磨合會是不斷發生的,有一個碰撞的過程。Stability 的CEO Emad Mostaque 在Twitter上就說過,包括Open AI 的 CEO Sam Altman也在Twitte上說過,生成式AI的最終目標是做一個類似於像新時代的搜索引擎。

當你想要一幅畫或者一句話、一段語音等等的時候,輸入你想要的內容,直接得到一個根據歷史拼接出來的結果。這個過程當中一定會有越來越多的,可能是版權、可能是安全性所帶來的問題。但是我認為這個過程確實是一個未來的趨勢以及不可逆的。在這個過程當中肯定也就會有數據定價。

前面所討論到的問題,我理解目前技術可能還暫時不支持,但肯定會有發展的空間,因為目前學界在做的很多,包括深度學習的可解釋性等等的探索,如果未來真的可以定位到一些圖片或者是音頻當中所用到的語料、或者是素材庫的一個可解釋性,比如根據Transformer當中的Attention(注意力機制)來定位到一些真正的圖片當中的對象,到底哪一個在圖片當中的佔比最大?可能是來自於哪個藝術家等等。運用這樣的深度學習的邏輯,或者是用Prompt當中的一些歸因的邏輯,去確定一些數據源頭的定價,這應該會成為一個新的搜索引擎以及數據定價的一個模型。感覺會有很大一段發展和思潮的路要去走。

04‍ 藝術家的機會與挑戰:從賣畫到賣風格

《硅谷101》:您覺得未來藝術家們的機會與挑戰會有哪些?

汪昭然:我覺得很有意思的是,從藝術家的角度,現在的商業模式是不是會有改變?現在大家把一個特定的畫去拍賣,比如畫家成名之後拍賣得更貴、轉賣、收藏,像NFT這種風格的。但是另外一方面,如果在未來,作為一個畫家,我有沒有可能去賣我的風格?因為我的風格可以生成無限多的類似風格的圖片。其實已經出現了一些例子,比如有人就在他的Prompt裡面加入一個畫家的名字,這個畫家是專門畫龍的,畫得特別逼真。那是不是加入畫家的名字,生成出來的就有他的風格,這個畫家好像現在就遇到了這樣一些法律上的麻煩,到底算不算侵犯我的知識產權,反過來想,這對於畫家是不是也算是一種新的機會?我來賣我的名字,賣我的風格,其實是超越了一幅特定的畫、特定的作品,更廣義上的一種知識產權,或者是一種藝術升華,我覺得其實也是一個很有意思的方向,可以思考。

【名詞解釋】

OpenAI
 一個人工智能實驗室,由營利組織OpenAI LP與母公司非營利組織OpenAI Inc組成,是特斯拉創始人Elon Musk與前YC總裁Sam Altman共同創建。 

DALL·E·2
 一個通過文本描述生成圖像的人工智能工具,是OpenAI旗下的模型。 

Midjourney
 一款AI繪畫工具,只要輸入你想到的文字,就能通過人工智能產出相對應的圖片,耗時只有大約一分鐘。

【相關閱讀】

《Generative AI: A Creative New World》——Sequoia www.sequoiacap.com 

中文版《生成式AI:一個創造性的新世界》 www.woshipm.com

本文鏈接:https://www.8btc.com/article/6793354

轉載請註明文章出處

(0)
上一篇 2023-03-22 10:22
下一篇 2023-03-22 10:23

相关推荐