索尼研究團隊《自然》雜誌上發文解釋如何訓練《GT賽車》遊戲AI

過去兩年時間裡，索尼一直在通過由 1000 台 PlayStation 4 遊戲機組建的虛擬訓練場，對名為“GT Sophy”的人工智能開展培訓。在去年 7 月的一場單車比賽中，其已能夠超越真人玩家。然後 10 月份的時候，它甚至在虛擬賽車比賽中將人類挑落馬下。

遊戲截圖

測試項目選擇了 Polyphony Digital 開發的《GT 賽車》（Gran Turismo Sport），這是一款畫面真實、熱度相當之高的主機遊戲。

而在最新實驗中，索尼希望證明人工 AI 可在國際象棋 / 圍棋之外的賽事中也碾壓真人選手，即使這些遊戲被長期認為是由人類主導的。

有趣的是，AI 還曾在經典的雅達利視頻遊戲和《星際爭霸》即時戰略（RTS）遊戲中擊敗了人類選手。

當今的人工智能，通常特指基於神經網絡技術的計算機編程過程。該技術旨在模仿人腦的工作方式，而索尼的最新研究成果，已發表在周三出版的《自然》雜誌上。

對於《GT 賽車》之類的視頻遊戲來說，其最大的特色，就是提供了開放式的戰術選擇、以及模擬的物理規則。然而一位真人挑戰者表示，GT Sophy 選擇了新穎的路線來追趕他們。

Sony AI x Polyphony Digital Race Together – K.Yoshida Message（via）

在 SONY AI 油管頻道分享的一段視頻中，曾於 FIA《Gran Turismo 2020》世界總決賽中贏得三項挑戰的 Takuma Miyazono 指出：

“人工智能在以一種我們永遠想不到的方式去駕駛，但在回看的時候，它又顯得相當合理”。

The Making of Gran Turismo Sophy – SONY AI（via）

據悉，GT Sophy 使用了一套被稱作“深度強化學習”（deep reinforcement learning）的技術路線。

起初這套完全未經訓練的系統並不知道它該幹什麼，但通過遵循人工設計的獎勵機制，它最終掌握了比賽規則、然後一遍又一遍地掌控了比賽。

期間的難點，在於如何弄清賽車比賽中中的不成文規則，包括如何避免碰撞、以及適時地切斷競爭對手的路線。

索尼 AI 總監 Peter Wurman 補充道：

我們普遍低估了彰顯正確體育精神的難度，要做到這一點，我們必須不在競爭壓力下面露難色、過於膽怯或咄咄逼人。

最後，為了運行這套模擬，索尼使用了 1000 台 PlayStation 4 遊戲主機，並將之連接到了一台採用傳統處理器的計算機上。