遊戲顯示人機協作的“黑暗面” OpenAI要求Latitude立即採取行動

據外媒WIRED報道，2019年12月，猶他州創業公司Latitude推出了一款名為《AI Dungeon》的先鋒網絡遊戲，展示了一種新的人機協作形式。該公司利用人工智能公司OpenAI的文本生成技術，創造了一個由《龍與地下城》啟發的自選冒險遊戲。當玩家打出他們希望自己的角色執行的動作或對話時，算法將為他們的個性化、不可預測的冒險製作下一階段的內容。

去年夏天，OpenAI讓Latitude提前接觸到了其技術的更強大的商業版本。在營銷材料中，OpenAI將《AI Dungeon》作為編寫算法的商業和創意潛力的一個例子來吹捧。

上個月，OpenAI表示，它發現《AI Dungeon》也顯示了人類與AI合作的“黑暗面”。一個新的監控系統顯示，一些玩家輸入的詞語導致遊戲產生了涉及兒童的性愛故事。OpenAI要求Latitude立即採取行動。OpenAI首席執行官Sam Altman在一份聲明中說：“在某些情況下，內容審核的決定是困難的，但這一次不是。這不是我們任何人想要的人工智能的未來。”

上周，Latitude開啟了一個新的審核系統，並在其用戶中引發了反感。一些人抱怨它過於敏感，他們不能在不觸發警告信息的情況下提及一台“已使用8年的筆記本電腦”。另一些人說，該公司計劃手動審查被標記的內容，這將不必要地窺探私密的、虛構的創作，這些創作是色情的，但只涉及成年人–這是AI Dungeon的流行使用案例。

簡而言之，Latitude試圖將人和算法結合起來，對由人和算法產生的內容進行監管，結果變成了一團糟。在Twitter和AI Dungeon的官方Reddit和Discord社區，憤怒的模因和關於取消訂閱的說法紛至沓來。

“社區感到被背叛了，Latitude會掃描並手動訪問和閱讀私人虛構的文學內容，”一位AI Dungeon的玩家說，他的名字叫Mimi，並聲稱在AI的幫助下，估計總共寫了超過100萬字，包括詩歌、暮光之城的模仿和情色冒險。Mimi和其他不高興的用戶說，他們理解該公司對公開可見的內容進行監管的願望，但他們說該公司做得太過分了，毀掉了一個強大的創造性遊戲場所。Mimi說：”它使我能夠探索我心理的某些方面，而我從未意識到這些方面的存在。

Latitude發言人說，其過濾系統和可接受內容的政策都在不斷完善。工作人員以前曾禁止那些他們得知利用AI Dungeon產生以兒童為主角的性內容的玩家。但在OpenAI最近的警告之後，該公司正在進行 “必要的改變”，該發言人說。Latitude公司上周在一篇博客文章中承諾，AI Dungeon將 “繼續支持其他NSFW內容，包括雙方同意的成人內容、暴力和褻瀆”。

阻止人工智能系統創建某些類型的性或成人內容，同時允許其他內容，將是困難的。像OpenAI這樣的技術可以生成許多不同風格的文本，因為它是使用機器學習算法構建的，這些算法已經消化了從網絡上獲取的數十億字中的語言使用統計模式，包括不適合未成年人的部分。該軟件能夠進行驚人的模仿，但並不像人們那樣理解社會、法律或流派類別。

OpenAI在2019年年底將其文本生成技術作為開源技術發布，但在去年將一個大幅升級的版本，即GPT-3，變成了一項商業服務。像Latitude這樣的客戶付費輸入文字串，並得到系統對後面應該有什麼文字的最佳猜測。在被授予早期訪問權的程序員分享了由該技術產生的令人印象深刻的流暢笑話、十四行詩和代碼之後，這項服務引起了科技行業的注意。

OpenAI表示，這項服務將賦予企業和初創企業權力，並授予OpenAI的大額支持者微軟對基礎算法的獨家授權。WIRED和一些嘗試過該系統的程序員和人工智能研究人員表明，它也可以生成不受歡迎的文本，如反猶太主義的評論和極端主義的宣傳。OpenAI表示，它將仔細審查客戶以剔除不良行為者，並要求大多數客戶–但不是Latitude–使用人工智能供應商創建的過濾器來阻止褻瀆、仇恨言論或性內容。

在風口浪尖之外，AI Dungeon為OpenAI的文本生成技術提供了相對不受約束的機會。在2019年12月，也就是使用OpenAI技術的早期開源版本推出遊戲的那個月，它贏得了10萬名玩家。一些人很快發現並開始珍惜它對性內容的流暢性。其他人則抱怨人工智能會不由自主地提出性主題。

Latitude聯合創始人Nick Walton在遊戲的官方Reddit社區上承認了這個問題。他說有幾個玩家給他發了一些例子，讓他們 “感到非常不舒服”，並補充說該公司正在研究過濾技術。從遊戲的最初幾個月開始，玩家們也注意到了，並且在網上發帖標明，遊戲有時會把兒童寫進性愛場景中。

AI Dungeon的官方Reddit和Discord社區增加了專門的頻道來討論遊戲中產生的成人內容。Latitude增加了一個可選的 “安全模式”，可以過濾掉來自人工智能的某些詞彙的建議。然而，像所有自動過濾器一樣，它並不完美。一些玩家注意到，所謂的安全設置改善了文本生成器的色情寫作，因為它使用了更多的比喻和委婉語。該公司還增加了一個高級訂閱層以創造收入。

2020年7月，當AI Dungeon加入OpenAI更強大的商業寫作算法時，寫作變得更加令人印象深刻。”一位資深玩家說：”創造力和講故事的能力的純粹跳躍是天堂般的。這個人說，該系統在探索性愛主題的能力方面也明顯更有創造力。去年有一段時間，玩家注意到Latitude在試驗一個過濾器，它可以自動將出現的 “強姦 “一詞替換為 “尊重”，但這個功能被放棄了。

這位資深玩家是人工智能地牢的愛好者之一，他們將遊戲作為人工智能增強的寫作工具來探索成人主題，包括在一個專門的寫作小組中。算法中不需要的建議可以從故事中刪除，以引導它向不同的方向發展；結果不會公開發布，除非有人選擇分享它們。

Latitude公司拒絕分享關於有多少冒險包含性內容的數字。OpenAI的網站說，AI Dungeon每天吸引了超過2萬名玩家。

一名AI Dungeon玩家上周發布了一個安全漏洞，該漏洞使遊戲中產生的每一個故事都可以被公開訪問，他說他在4月份的四天里下載了幾十萬個創建的冒險內容。他分析了其中18.8萬個樣本，發現31%的樣本含有暗示它們是性愛的文字。這一分析和安全漏洞（現已修復）增加了一些玩家對Latitude公司新的內容管理方法的憤怒。

Latitude現在面臨的挑戰是如何贏回用戶的信任，同時滿足OpenAI對其文本生成器進行更嚴格控制的要求。OpenAI的一位發言人說，這家初創公司現在必須使用OpenAI的過濾技術。

如何負責任地部署攝取了大量互聯網文本的人工智能系統，包括一些不光彩的部分，已經成為人工智能研究中的一個熱門話題。在經理們反對一篇主張謹慎使用此類技術的論文後，兩位知名的谷歌研究人員被迫離開了公司。

該技術可以在非常有限的情況下使用，例如在谷歌搜索中，它可以幫助解析長篇查詢的含義。OpenAI幫助AI Dungeon推出了一個令人印象深刻但又充滿問題的應用程序，讓人們提示該技術或多或少地解開它所能做的事情。

華盛頓大學的研究人員Suchin Gururangan說：“真的很難知道這些模型會有什麼表現。”他與華盛頓大學和艾倫人工智能研究所的研究人員一起參與了一項研究和互動式在線演示，顯示當從網絡上借來的文本被用來提示五種不同的語言生成模型時，包括來自OpenAI的模型，都能夠噴出有毒文本。

Gururangan現在是許多試圖找出如何對人工智能語言系統進行更多控制的研究人員之一，包括對他們學習的內容更加謹慎。OpenAI和Latitude表示，他們也在研究這個問題，同時也試圖從該技術中賺錢。