索尼研究團隊《自然》雜誌上發文解釋如何訓練《GT賽車》遊戲AI

過去兩年時間裡,索尼一直在通過由 1000 台 PlayStation 4 遊戲機組建的虛擬訓練場,對名為“GT Sophy”的人工智能開展培訓。在去年 7 月的一場單車比賽中,其已能夠超越真人玩家。然後 10 月份的時候,它甚至在虛擬賽車比賽中將人類挑落馬下。

1.jpg

遊戲截圖

測試項目選擇了 Polyphony Digital 開發的《GT 賽車》(Gran Turismo Sport),這是一款畫面真實、熱度相當之高的主機遊戲。

而在最新實驗中,索尼希望證明人工 AI 可在國際象棋 / 圍棋之外的賽事中也碾壓真人選手,即使這些遊戲被長期認為是由人類主導的。

有趣的是,AI 還曾在經典的雅達利視頻遊戲和《星際爭霸》即時戰略(RTS)遊戲中擊敗了人類選手。

索尼研究團隊《自然》雜誌上發文解釋如何訓練《GT賽車》遊戲AI

當今的人工智能,通常特指基於神經網絡技術的計算機編程過程。該技術旨在模仿人腦的工作方式,而索尼的最新研究成果,已發表在周三出版的《自然》雜誌上。

對於《GT 賽車》之類的視頻遊戲來說,其最大的特色,就是提供了開放式的戰術選擇、以及模擬的物理規則。然而一位真人挑戰者表示,GT Sophy 選擇了新穎的路線來追趕他們。

Sony AI x Polyphony Digital Race Together – K.Yoshida Message(via)

在 SONY AI 油管頻道分享的一段視頻中,曾於 FIA《Gran Turismo 2020》世界總決賽中贏得三項挑戰的 Takuma Miyazono 指出:

“人工智能在以一種我們永遠想不到的方式去駕駛,但在回看的時候,它又顯得相當合理”。

The Making of Gran Turismo Sophy – SONY AI(via)

據悉,GT Sophy 使用了一套被稱作“深度強化學習”(deep reinforcement learning)的技術路線。

起初這套完全未經訓練的系統並不知道它該幹什麼,但通過遵循人工設計的獎勵機制,它最終掌握了比賽規則、然後一遍又一遍地掌控了比賽。

期間的難點,在於如何弄清賽車比賽中中的不成文規則,包括如何避免碰撞、以及適時地切斷競爭對手的路線。

索尼 AI 總監 Peter Wurman 補充道:

我們普遍低估了彰顯正確體育精神的難度,要做到這一點,我們必須不在競爭壓力下面露難色、過於膽怯或咄咄逼人。

最後,為了運行這套模擬,索尼使用了 1000 台 PlayStation 4 遊戲主機,並將之連接到了一台採用傳統處理器的計算機上。

(0)
上一篇 2022-02-10 12:11
下一篇 2022-02-10 12:11

相关推荐