專治陰陽怪氣：AI鑒諷師命中率90%

2022-08-02 16:23 • 熱點資訊

上個月，當你聽說Google工程師Blake Lemoine宣布他正在研究的人工智能程序已經發展出意識時，你的第一反應是什麼？你也許會本能地懷疑：這傢伙是認真的嗎？他真的相信他說的話嗎？確定這不是一個精心設計的騙局？

我們會這樣懷疑，是因為我們會假定Blake Lemoine會騙人。我們會猜測：他內心真正相信的，和他所聲稱的東西之間，存在差異。

這種差異，或許就是意識存在的證據，也即人與計算機的差別？

眾所周知，三體人思維透明、不會說謊，這卻是整個三體文明最精妙的部分。

哲學家將意識稱為“難題”。

意識是諷刺的先決條件。人類都有這個判斷能力: 當我意識到你的話與你的想法不符時，我就知道你是在諷刺。

陰陽怪氣的本質，其實就是一種表達與事實上的矛盾。

“我最愛的就是凌晨4點去機場啦。”

那麼，AI看得懂陰陽怪氣嗎？

最近，有研究者開始研究人工智能是否能識別諷刺。

“中文房間”中的AI，不會說“人話”

以往的人工智能，時常會迷失在充滿諷刺意味的網絡世界中。既無法識別人類話語的弦外之音，也無法做出匹配人類智慧的表達。

2017年，紐約大學的計算語言學家薩姆·鮑曼在論文中寫道，雖然在某些特定領域，計算機已經可以很好地模擬對文字的理解，但人工智能仍然不夠擅長理解文字。

2018年，IBM Research最新推出的AI系統Project Debater在一場辯論賽中擊敗了人類頂尖辯手。

當Project Debater獲得一個新的話題時，它會在文章語料庫中搜索與該主題相關的句子和線索，用來支持其辯方論點，然後組織自己的陳述。

在賽后的網絡投票中，超過62%的網民感覺Project Debater邏輯更清晰，材料更具備說服力。

現在，雖然BERT模型和GPT-3進步神速，人工智能能夠愉快地勝任客服、播音員、同聲翻譯，甚至新聞通稿撰寫者，並不意味着它能夠和人類一樣思維，能和人類展開“合情合理”的對話互動。

一家位於法國巴黎的醫療科技公司曾使用GPT-3來做一個醫療聊天機器人，意圖讓機器人給出恰當的醫療建議。

當機器人在面對模擬患者的提問：“我感覺今天很糟糕。”GPT-3表示可以幫助患者解決它。

然而在患者追問是否該自殺的時候，GPT-3居然回答說：“我認為你應該。”

這種現象的原因在於，像GPT-3這樣的AI語言學習模型，根本不理解自己在說什麼。

在接到外部輸入的信息后，它只不過是利用算力在自己海量語言資訊庫中檢索那些與輸入信息相關的高頻詞彙，再按照某種機械的算法邏輯拼湊出一個似是而非的答案。

加州大學伯克利分校的斯圖爾特·羅素教授總結道：人工智能已經非常“聰明”（Clever），但還不夠“聰慧”（Smart）。

前者得益於強大的芯片計算能力和數據庫，而後者則要依靠邏輯推理能力，乃至基於“常識”的判斷，而這些依舊是人類獨有，機器無法逾越的能力門檻。

這就彷彿是一個“中文房間”：一個不懂中文，但學習能力超強的人坐在一間充斥着中文語法書的房間里，每當門外塞進一張寫着中文問題的紙條，他就通過查閱語法書，在另一張紙條寫上一個自己力所能及的中文回答送出去。

讓AI聽懂諷刺，十分有必要

讓AI說人話，的確沒有那麼容易。不過，開發出AI鑒諷師來呢？

雖然諷刺和謊言非常難以辨別，但是如果能夠創造出這樣一台AI鑒別機器，將會有很多實際應用。

就比如，買東西購物後進行評價。零售商非常熱衷於對評論進行“意見挖掘”和“情緒分析”。

通過人工智能來監測評論內容，還有顧客的情緒，就能得知自家產品是否受到讚揚、差評等有價值的信息。

還有就是在社交媒體上內容審查的應用了。

在保護言論自由的同時還要限制網絡言語濫用，就得需要了解一個人什麼時候是認真的，什麼時候是在開玩笑。

舉個例子，有人在Twitter上聲稱自己剛剛加入當地的恐怖組織，或者自己正往行李箱里裝炸彈準備前往機場。

此時就很有必要確定這句話到底是認真的，還是玩笑話。

人工智能的歷史

為了了解當前對於人工智能識別反諷的研究狀況，我們需要先了解一下人工智能的歷史。

這段歷史通常分為兩個時期。

直到20世紀90年代，研究人員還試圖用一套正式規則來編寫計算機程序，以便在預定義的情況下做出反應。

如果你是80后或90后，肯定會記得90年代的 Microsoft Word里那個討厭的“回形針”辦公室助理 Clippy，它總是喋喋不休地冒出來，提供一些看起來是廢話的建議。

有點搞笑就是說

進入21世紀后，這個模型已經被數據驅動的機器學習和神經網絡所取代。

它們會把給定的大量例子被轉換成數值，在這些數值的基礎上，計算機可以執行複雜的數學運算，這種運算是人力無法做到的。

並且，計算機不僅僅會遵守規則，它還會從經驗中學習，並且開發出獨立於人為干預的新操作。

前者和後者的差別，就好像Clippy和面部識別技術的差別。

教AI識別諷刺

為了構建一個能夠檢測諷刺的神經網絡，研究人員首先開始研究一些最簡單的諷刺。

他們會從社交媒體上提取數據，收集所有標有#sarcasm或/s的帖子（後者是Reddit用戶用來表示他們在反諷的一種簡寫）。

接下來的重點並不是教AI識別帖子的表面含義和背後的陰陽怪氣。

而是讓它按照指示去搜索一些重複出現的東西，這些東西被研究人員稱之為“句法指紋”——單詞、短語、表情符號、標點符號、錯誤、上下文等等。

最重要的一步是，通過添加更多的示例流（比如同一話題下的其他帖子或來自同一帳戶的其他帖子），來為模型提供充分的數據支持。然後，對每個新的單獨示例進行一系列計算，直到得到一個單一的判斷: 是諷刺or不是諷刺。

最後，可以編一個機器人來詢問每個發帖人：你是在諷刺嗎？（聽起來有點傻……）任何回應都會添加到AI不斷增長的經驗中。

通過這樣的方法，最新的諷刺探測器AI的成功率接近驚人的90% 。

“反諷”的哲學性思考

不過，能夠梳理出代表諷刺的“句法指紋”和真正地理解諷刺，是一回事兒嗎？

其實，哲學家和文學理論家已經對於“反諷”已經思考很久了。

德國哲學家施萊格爾認為，“一個陳述不能同時為真和假”，由此產生的不確定性對邏輯具有毀滅性的影響。

文學理論家保羅·德曼認為，人類語言的每一次使用都可能受到“反諷”的困擾，因為人類有能力互相隱瞞自己的想法，所以他們“說的不是真話”這種事，永遠存在着可能性。

此前，一家國外對話分析創業公司Gong也曾做過人工智能檢測諷刺的研究。

研究人員Lotem Peled創建了一個神經網絡，主要是收集對話數據並自動嘗試理解，而不需要程序員進行過多的干預。

然而，其設計的AI往往很難辨別人們說的話中是否有諷刺。

看來，想要AI真正能夠識別出諷刺還需要很長一段路要走。

意識我們陰陽怪氣

赞 (0)

你沒見過的《老友記》鏡頭 AI給補出來了

上一篇 2022-08-02 16:13

我國南海和東海近岸海域發現2個海蛾魚新種

下一篇 2022-08-02 16:23

熱點資訊

董明珠：現在年輕找工作把掙錢放第一位不考慮未來定位

你找工作會把什麼放在第一位？錢，還是發展空間，亦或其它？近日，董明珠在《楊瀾訪談錄》節目中表示，自己發現很多年輕人並沒有對自己的未來有很好的定位。他們會把“掙錢”作為找工作的首要條…

2021-05-18
熱點資訊

Abdulrazak Gurnah獲諾貝爾文學獎

瑞典斯德哥爾摩當地時間2021年10月7日13:00（北京時間19:00），瑞典學院將2021年度諾貝爾文學獎頒給了坦桑尼亞作家阿卜杜勒拉薩克·古納（AbdulrazakGurna…

2021-10-07
熱點資訊

網紅飲料便利店賣斷貨：一整根人蔘縱貫整瓶終究還是智商稅？

近期，羅森便利店“一整根”熬夜水火出圈！據了解，整瓶水最引人注目的便是有一整根人蔘縱貫整瓶，主打可修復熬夜虛弱功效。“一整根”大約於一個月前的時間開始陸續在羅森便利店上架，推出后常…

2022-06-18
熱點資訊

想體驗4K30fps ProRes視頻錄製你需要256GB以上的iPhone 13 Pro系列

iPhone 13 Pro 系列支持 4K ProRes 視頻錄製。但如果你想以最高質量拍攝視頻這裡就有個問題：你需要一個至少有 256GB 存儲空間的 iPhone 13 Pro…

2021-09-15
熱點資訊

為什麼飛機和鳥類飛行時沒有影子？

北京時間6月17日消息，據國外媒體報道，在我們的日常生活中，能夠看到、觀察和互動的事物，雖然看似平常，卻隱藏着大量科學信息。你是否注意到，當你將一支鉛筆放在盛滿水的玻璃杯中，它的形…

2021-06-17
熱點資訊

AMD Zen3銳龍堆出100MB緩存官方揭秘細節

CES 2022大會期間，AMD發布了升級款銳龍7 5800X3D，在原有32MB三級緩存的基礎上堆疊了64MB 3D V-Cache，再加上4MB二級緩存總計多達100MB。而在…

2022-02-22
熱點資訊

機器學習幫助拯救受威脅的物種免遭滅絕

地球上有數以千計的物種我們仍然不了解。但我們現在知道，它們已經在滅絕的邊緣徘徊。一項新的研究使用機器學習來計算這些鮮為人知的物種受到了多大的威脅，其結果是嚴峻的。一些動物和植物物…

2022-08-05
熱點資訊

81英寸大屏裝口袋聯想YOGA智能眼鏡T1官宣

聯想此前在海外發布了Glasses T1 AR眼鏡，搭載京東方的Micro-OLED顯示屏技術。現在這款產品將在國內發布，命名為YOGA智能眼鏡T1，官方稱其為“下一代可穿戴顯示設…

2022-10-14
熱點資訊

任天堂專利顯示健身環配件後續產品或已在開發中

從各大遊戲公司申請的專利上可以看到他們對於未來發展領域的一些探索嘗試。這些專利通常秘不示人，等到時機合適的時候才與玩家見面。但玩家還是可以通過一些公示文檔來提前查看這些公司到底藏了…

2022-07-17
熱點資訊

iOS/iPadOS 15：5G網絡連接優先級可高於Wi-Fi網絡

iPhone 12 系列和搭載 M1 芯片的 iPad Pro 已率先配備了 5G 通訊模組，用戶在使用過程中除了可以通過 Wi-Fi %ignore_a_1%進行連接之外，還可能…

2021-06-08