MIT科學家發現計算機可以理解複雜的詞彙和概念

研究人員正在研究具有AI的機器是否能夠模仿人類的思維過程並以類似的方式理解詞語。來自美國加州大學洛杉磯分校、麻省理工學院(MIT)和美國國立衛生研究院(NIH)的研究人員剛剛發表了一項回答該問題的研究。

這項發表在《Nature Human Behaviour》上的研究表明，人工智能系統可能真的能夠理解高度複雜的詞義。研究人員還發現了一種獲得這種複雜信息的簡單方法。他們發現，他們所研究的人工智能系統以一種跟人類判斷非常相似的方式來表示詞義。

研究人員們所探索的AI系統在過去十年中被廣泛用於分析單詞的含義。它通過“閱讀”互聯網上的大量材料來獲取詞義，這些材料包含數百億個單詞。

當單詞經常出現在一起時–如“桌子”和“椅子”–系統就會了解到它們的含義是相關的。而如果成對的詞很少出現在一起–比如“桌子”和“星球”–它就會了解到它們有非常不同的含義。

這種方法似乎是一個合乎邏輯的起點，但考慮一下，如果理解意義的唯一方法是計算單詞之間出現的頻率而沒有任何跟其他人和我們的環境互動的能力，那麼人類將如何理解這個世界。

加州大學洛杉磯分校心理學和語言學助理教授Idan Blank是這項研究的共同牽頭人，他稱研究人員着手了解該系統對所學單詞的了解及它有什麼樣的常識。

Blank表示，在研究開始之前，該系統似乎有一個主要限制：“就系統而言，每兩個單詞只有一個數值，代表它們的相似程度。”

相比之下，人類的知識要詳細和複雜得多。

“考慮一下我們對海豚和短吻鱷的知識，”Blank說道，“當我們在大小的尺度上比較兩者時，從‘小’到“大”，它們是相對相似的。就它們的智力而言，它們有些不同。就它們對我們構成的危險而言，在從‘安全’到‘危險’的範圍內，它們差別很大。所以一個詞的意義取決於上下文。我們想問這個系統是否真的知道這些微妙的差異–它對相似性的想法是否與人類的想法一樣靈活。”

為了找出答案，研究人員們開發了一種他們稱之為“語義投射”的技術。如人們可以在模型對 “大”和“小”這兩個詞的表述之間畫一條線看看不同動物的表述在這條線上的位置。

通過利用這種方法，科學家們研究了52個詞組，以看看該系統是否能學會對意義進行分類–比如根據動物的大小或對人類的危險程度判斷動物，或根據天氣或總體財富對美國各州進行分類。

在其他詞彙分組中，有跟服裝、職業、體育、神話生物和名字有關的術語。每個類別都被賦予了多種背景或維度–如尺寸、危險、智力、年齡和速度。

研究人員發現，在這些許多對象和背景中，他們的方法被證明跟人類的直覺非常相似。為了進行這種比較，研究人員還要求每組25人對52個詞中的每一個做出類似的評估。

值得注意的是，該系統學會了感知“Betty”和“George”這兩個名字在相對“老”方面是相似的，但它們代表不同的性別。還有，“weightlifting（舉重）”和“fencing（擊劍）”在通常都在室內進行方面是相似的，但在它們需要多少智力方面則不同。

“這是一個如此漂亮的簡單方法，而且完全是直觀的，”Blank說道，“‘大’和‘小’之間的界限就像一個心理尺度，而我們把動物放在這個尺度上。”

Blank表示，他實際上並不指望這項技術能起作用，但當它起作用時他很高興。“事實證明，這個機器學習系統比我們想象的要聰明得多；它包含了非常複雜的知識形式，而且這些知識是以一種非常直觀的結構組織起來的。僅僅通過記錄哪些詞在語言中相互共現你就可以了解到很多關於這個世界的信息。”