谷歌AI看不懂網友評論會錯意高達30%

2022-07-18 14:46 • 熱點資訊

給你兩句話，來品一下它們所蘊含的情感：“我真的會謝。”“聽我說謝謝你，因為有你，溫暖了四季……”或許你會說，這很簡單啊，不就是最近經常被玩的梗嗎？但如果問問長輩，他們可能就是一副“地鐵老人看手機”的模樣了。

不過與流行文化之間有代溝這事，可不僅限於長輩們，還有 AI。這不，一位博主最近就 po 出了一篇分析Google數據集的文章，發現它對 Reddit 評論的情緒判別中，錯誤率竟高達 30%。

就比如這個例子：

我要向朋友怒表達對他的愛意。

Google數據集把它判斷為“生氣”。

還有下面這條評論：

你 TM 差點嚇壞我了。

Google數據集將其判別為“困惑”。

網友直呼：你不懂我的梗。

人工智能秒變人工智障，這麼離譜的錯誤它是怎麼犯的？

斷章取義它最“拿手”

這就得從他判別的方式入手了。Google數據集在給評論貼標籤時，是把文字單拎出來判斷的。我們可以看看下面這張圖，Google數據集都把文字中的情緒錯誤地判斷為憤怒。

不如我們由此來推測一下Google數據集判別錯誤的原因，就拿上面的例子來說，這四條評論中均有一些“髒話”。

Google數據集把這些“髒話”拿來作為判斷的依據，但如果仔細讀完整個評論，就會發現這個所謂的“依據”只是用來增強整個句子的語氣，並沒有實際的意義。

網友們的發表的評論往往都不是孤立存在的，它所跟的帖子、發布的平台等因素都可能導致整個語義發生變化。

比如單看這條評論：

his traps hide the fucking sun.

單單依靠這個很難判斷其中的情緒元素。但如果知道他是來自一個肌肉網站的評論，或許就不難猜出了，（他只是想稱讚一下這個人的肌肉）。

忽略評論的帖子本身，或者將其中某個情感色彩強烈的詞語單拎出來判斷其情緒元素都是不合理的。一個句子並不是孤立存在的，它有其特定的語境，其含義也會隨着語境的變化而變化。

將評論放入完整的語境中去判斷其情緒色彩，或許會大大提升判別的準確率。但造成 30% 這麼高的失誤率可不僅僅只是“斷章取義”，其中還有更深層次的原因。

“我們的梗 AI 不懂”

除了語境會幹擾數據集判別之外，文化背景也是一個非常重要的因素。

大到國家地區，小到網站社群都會有其內部專屬的文化符號，這種文化符號圈層之外的人很難解讀，這就造成了一個棘手的問題：若想更準確地判斷某一社區評論的情緒，就得針對性地對其社區進行一些數據訓練，深入了解整個社區的文化基因。

在 Reddit 網站上，網友評論指出“所有的評分者都是以英語為母語的印度人”。

這就導致會對一些很常見的習語、語氣詞及一些特定的“梗”造成誤解。說了這麼多，數據集判別失誤率這麼高的原因也就顯而易見了。

但與此同時，提高 AI 判別情緒的精確度也有了清晰的方向。例如博主也在這篇文章中就給出了幾條建議：

首先，在對評論貼標籤時，得對他所處的文化背景有深刻地理解。以 Reddit 為例，要判斷其評論的情緒色彩，要對美國的一些文化、政治理解透徹，並且還要能夠迅速 get 到專屬網站的“梗”；

其次，要測試標籤對一些諷刺、習語、梗的判別是否正確，確保模型能夠整整理解文本的意思；

最後，核查模型判斷與我們真實判別，以做出反饋，更好地訓練模型。

One More Thing

AI 大牛吳恩達曾發起過一項以數據為中心的人工智能運動。

將人工智能從業者的重點從模型 / 算法開發轉移到他們用於訓練模型的數據質量上。吳恩達曾說：

數據是人工智能的食物。

用於訓練數據的好壞對於一個模型也至關重要，在新興的以數據為中心的 AI 方法中，數據的一致性至關重要。為了獲得正確的結果，需要固定模型或代碼并迭代地提高數據質量。

……

最後，你覺得在提高語言 AI 判別情緒這件事上，還有什麼方法呢？

歡迎在留言區討論~

參考鏈接：

[1]https://www.reddit.com/r/MachineLearning/comments/vye69k/30_of_googles_reddit_emotions_dataset_is/
[2]https://www.surgehq.ai/blog/30-percent-of-googles-reddit-emotions-dataset-is-mislabeled
[3]https://mitsloan.mit.edu/ideas-made-to-matter/why-its-time-data-centric-artificial-intelligence

google 數據評論

赞 (0)

米哈游虛擬偶像鹿鳴開啟首次直播，大偉哥吹的牛實現了？

上一篇 2022-07-18 14:15

SpaceX成功向近地軌道發射53顆星鏈互聯網衛星

下一篇 2022-07-18 14:47

熱點資訊

追蹤馬斯克、扎克伯格私人飛機的Facebook賬號被封

9月24日消息，追蹤特斯拉首席執行官埃隆·馬斯克（Elon Musk）和Meta首席執行官馬克·扎克伯格（Mark Zuckerberg）私人飛機軌跡的美國小伙傑克·斯威尼（Jac…

2022-09-24
熱點資訊

美版特斯拉Model Y開始安裝“生化武器防禦模式”標準Hepa過濾器

據外媒報道，特斯拉在弗里蒙特工廠生產其新Model Y電動SUV上採用了“生化武器防禦模式”標準的Hepa過濾器。隨着Model X和更新款Model S的推出，特斯拉開始在車內安…

2021-08-11
熱點資訊

[圖]高通推出驍龍8cx/7c+ Gen 3：性能更強續航更持久

在 CES 2022 大展上，高通宣布了適用於高端 Windows 設備的全新驍龍 8cx Gen 3 計算平台。高通公司稱，這款新的 SoC 在 CPU 性能上最多提升 85%，…

2022-01-05
熱點資訊

提倡理智追星：微博官方宣布“明星勢力榜”正式下線

8月6日，微博宣布“明星勢力榜”正式下線，聲明中表示：由於最近一年來部分明星粉絲群體非理性應援、刷榜等問題愈演愈烈，對明星勢力榜評分機制形成挑戰，榜單不能全面客觀地反映明星的社會影…

2021-08-06
熱點資訊

新款14/16吋MacBook Pro升級1080P攝像頭滿足在線視頻需求

疫情的全球肆虐，讓不少人不得不適應在家遠程辦公的新常態。為此在今天凌晨發布的新款 14/16 英寸 MacBook Pro 中，蘋果對前置攝像頭進行了升級，分辨率從 720P 升級…

2021-10-19
熱點資訊

Android用戶獲得另一個基於App的Google電視遙控器選項

Google已經更新了其Google HomeAndroid應用，為Android電視、Google電視和其他設備（如NVIDIAShield）增加了一個內置遙控器。如果你把實體遙…

2021-11-10
熱點資訊

問界M5智能座艙搭載華為66W快充、40W無線快充

2021年12月，華為與賽力斯合作的品牌AITO，發布了智能SUV問界M5，問界M5搭載“HUAWEI DriveONE純電驅增程平台”和 “HarmonyOS智能座艙”，將智能帶…

2022-03-17
熱點資訊

2022年諾貝爾文學獎揭曉：82歲法國作家安妮·埃爾諾

央視新聞消息，當地時間10月6日，瑞典文學院宣布，將2022年諾貝爾文學獎授予法國作家安妮·埃爾諾（Annie Ernaux）。據澎湃新聞，獲獎評語是“因她的勇氣和臨床的敏銳性揭示…

2022-10-06
熱點資訊

因芯片短缺和零部件採購困難豐田汽車宣布將9月全球汽車產量削減40%

由於芯片短缺及東南亞新冠疫情擾亂了供應鏈，豐田汽車計劃將9月全球汽車產量削減40%，從原計劃的接近90萬輛降至約50萬輛。此次減產意味着從下個月初開始，包括愛知縣的高岡工廠在內的多…

2021-08-19
熱點資訊

麥當勞在俄850家門店今起暫停營業本土餐企取而代之呼聲在俄升高

隨着西方對俄羅斯展開全面經濟制裁，西方跨國企業和品牌開始啟動了撤出俄羅斯市場的進程。在一系列“外商大撤離”行動中，作為第一家衝破“鐵幕”入駐蘇聯、見證了俄羅斯30多年社會變遷的美國…

2022-03-14