AI字幕在兒童頻道里吐“髒話”？中招比例高達40% 亞馬遜谷歌都很祖安

2022-02-27 17:50 • 熱點資訊

AI自動生成的字幕，能離譜到什麼程度？不僅把“螃蟹”（crab）誤聽成“廢話”（crap），當場爆粗，甚至還能把“玉米”（corn）給翻譯成p*rn……

關鍵在於，這些是AI給兒童節目自動生成的字幕。

被AAAI 2022收錄的一篇新研究發現，在7013個兒童視頻中，接近40%的節目出現了少兒不宜或髒話等詞彙。

甚至在一個113集的兒童機器人學習欄目中，AI就“爆粗”了103次，平均接近一集一次！

對此，油管（YouTube）在接受《連線》採訪時回應：

我們為13歲以下的兒童開發了YouTube Kids，這個APP會關閉字幕生成功能。

但如果真有字幕需求的話，如何才能想辦法減少這種AI生成錯誤？

一起來看看。

亞馬遜Google都很“祖安”

先來看看這篇論文的調查結果。

研究人員一共從油管上選出了24個兒童頻道，分別記錄了這些頻道的播放量和訂閱量。

可以看出，這些篩選出來的視頻播放量基本都達到了百萬級，訂閱人數也同樣不少。

然後，研究人員分別試了一下Google和AWS（亞馬遜網頁服務）的字幕生成效果。

結果顯示，AI字幕的“少兒不宜”率可謂離譜：

在7013個視頻中，GoogleAI出現錯誤字幕的次數達到2768次，接近40%。

亞馬遜的AI字幕錯誤率還要更高，達到了3672次，超過52%。

具體來說，兩個AI分別容易在這些“不太恰當”的字詞上出錯：

圖左亞馬遜，圖右Google

在這些數據集中，有一些詞語又尤為“少兒不宜”，例如一些罵人的髒詞：

經過作者們人工檢查（例如確認原視頻是否真的說了髒話），發現AI主要容易在以下幾種情況中出錯：

背景音樂嘈雜

說話者為嬰兒

說話者為兒童

說話者以英語為第二語言

說話者在唱歌

包括但不限於這些情況

那麼，有沒有什麼辦法減少這種情況發生呢？

語序連貫的錯誤更容易修復

研究人員提出了一個新的數據集，利用近音字詞來構建禁忌詞的“替換”備選。

例如，對於crap這一可能出現的“粗口”，研究人員就給它設置了crab、craft等讀音相似的字詞，便於AI在搞錯時進行替換。

具體來說，他們在BERT、XLM、XLNet等NLP模型上，針對“完形填空”任務進行了重新訓練，也就是用[MASK]遮住部分單詞，讓AI來填寫對應的內容。

結果顯示，在語序正常、前後文案有邏輯的視頻中，AI替換的準確率更高（藍色為正確替換詞）：

然而在一些邏輯不強的文案中，成功替換的效果就沒有那麼好了：

最終，Megatron和Levenshtein等模型展現出了最好的修復效果，分別給亞馬遜AI帶來了超過25%的正確修復率，給GoogleAI帶來了超過28%的修復率。

看來AI在字幕生成能力上還是任重道遠啊。

ai 兒童字幕

赞 (0)

西安三星半導體佔全世界閃存芯片產能超過10%

上一篇 2022-02-27 17:50

定位純電小型SUV 全新大眾ID.2 X效果圖曝光

下一篇 2022-02-27 17:50

熱點資訊

繼通過Zoom解僱900名員工后 Better.com又宣布解僱3000名員工

在線抵押貸款公司Better.com於當地時間周二表示，在該公司CEO因在一個Zoom電話中解僱900名員工而受到批評后僅三個月後，該公司又將對其員工隊伍展開更大規模的裁員。根據提…

2022-03-09
熱點資訊

FF收到退市警告法拉第未來發文澄清：相關報道系誤讀

近日，“賈躍亭收到美國退市警告”的話題引起網友熱議，具體內容為賈躍亭創立的法拉第未來被指控造車騙局，並收到了一份來自美國證券交易委員會發出的退市警示函，FF存在被退市的可能。今日午…

2021-11-29
熱點資訊

日英混血流行歌手Rina加盟《疾速追殺4》電影

據Deadline消息，日英混血歌手Rina Sawayama將加盟基努里維斯主演的動作片《疾速追殺4》，影片將於2022年5月上映。《疾速追殺4》也是Rina Sawayama第…

2021-05-31
熱點資訊

特斯拉大股東稱Twitter買得太便宜了馬斯克將獲得3倍回報

據報道，巴倫資本公司（Baron Capital）CEO、特斯拉最大股東之一羅恩·巴倫（Ron Baron）今日表示，特斯拉CEO埃隆·馬斯克（Elon Musk）以“令人難以置信…

2022-05-05
熱點資訊

Patriot推出Supersonic Rage Prime 3.2 Gen 2高速閃存盤

Patriot內存公司今天發布了其最快的存儲設備，它被歸類為USB閃存驅動器（而不是便攜式SSD）。Supersonic Rage Prime3.2 Gen 2尺寸為1厘米x 2….

2021-06-29
熱點資訊

無人出租貴過網約車 2000多萬網約車司機會被搶生意？

科幻電影中的場景已經照進現實，目前，我國多地已展開“無人出租”試商用，當地用戶可以像平時坐網約車那樣，在手機App上召喚一輛無人駕駛網約車。8月8日，百度宣布已獲得在重慶和武漢兩個…

2022-08-23
熱點資訊

Google發布Pixel Buds Pro ANC真無線耳塞產品

今年的GoogleI/O2022大會的下半場，Google專註於為我們帶來全新的硬件。今年活動的一個引人關注的產品是Google耳機陣容的新成員，Pixel BudsPro。在過去…

2022-05-12
熱點資訊

NASA團隊更換SLS登月火箭的密封圈準備進行燃料箱測試

在首先斷開液態氫燃料供給管線的地面和火箭側接口板（稱為快速斷開）之後，NASA團隊已經更換了太空發射系統（SLS）火箭核心級上與9月3日阿特米斯一號發射嘗試中檢測到的液態氫泄漏有關…

2022-09-10
熱點資訊

馬斯克暗示特斯拉可能出售比特幣幣價周日聞訊大跌10%

特斯拉CEO埃隆·馬斯克(ElonMusk)周日在Twitter交流中暗示，特斯拉可能或已經出售了所持有的比特幣，導致比特幣價格大跌。一個賬號名為@CryptoWhale的Twit…

2021-05-17
熱點資訊

維珍銀河發布視頻推廣太空旅行服務

據外媒8月15日消息，維珍銀河官方發布一則4分鐘左右的視頻，推介其運營的太空旅行服務。視頻中，維珍銀河詳細介紹了太空飛行器Unity的整個飛行過程，並着重介紹了乘客在太空中的感受。…

2021-08-16