MIT研究團隊讓四足迷你獵豹機器人學會了如何快速奔跑

麻省理工學院（MIT）的四足迷你獵豹機器人，剛剛打破了之前創下的最佳速度記錄 —— 達到了 8.72 mph（14.04 km/h）。這項成績主要歸功於一套新穎的無模型強化學習系統，允許機器人自己找出最佳的跑步方式、以及適應不同的地形，而不再依賴於前置的人工分析。

（來自：MIT / CSAIL）

雖然迷你獵豹算不上是當今最快的四足機器人，但麻省理工學院的 Improbable AI 實驗室和美國國家科學基金會（NSF）旗下的人工智能與基礎交互研究所（IAIFI），還是賦予了其更強的靈活性。

Mini Cheetah robot runs faster than ever – MIT CSAIL（via）

在近日分享的一段新視頻中，可見到這台機器人在撞到障礙物后迅速繞過，以及自主學習適應濕滑結冰路面、以及鬆散的礫石山丘等地形。在一套簡單的神經網絡的加持下，它能夠對錯綜複雜的新環境展開相應的評估。

通常情況下，機器人都是在一套系統的指引下移動的。該系統會參考機械肢體是如何移動的，來分析並製作指導用的模型數據。但在實際應用中，這些模型往往效率低下、且在應對意外狀況時不夠全能。

尤其當機器人已最高速度運行時，系統硬件更是面臨極限壓力，使得環境建模變得更加困難。為了克服這方面的短板，MIT 研究團隊選擇了一套獨特的“經驗學習”系統。

相比之下，類似波士頓動力公司的 Spot 之類的機器人，依賴於人工去分析運動的物理特性、並手動配置機器人的軟硬件和分析設計參數。

基於此，MIT 的迷你獵豹機器人可以通過反覆試驗來自主學習，而無需人工介入。在積攢了對不同地形的足夠經驗后，它便可在後續工作中自動改進其行為，甚至無需在現實生活中積累這方面的經驗。

研究人員稱，通過模擬，迷你獵豹機器人可在靜止不動的三個小時內，迅速積累 100 天的經驗。MIT博士生 Gabriel Margolis 與 IAIFI 博士后研究員 Ge Yang 補充道：

我們開發的這種方法，可通過模擬經驗來改進機器人的行為，同時適用於在現實世界中成功落實這種學習行為。

背後原理是機器人能夠在模擬器中看到所有環境信息，且系統會教授它們在可現實世界中分辨並識別的實用技能。

有了這樣一套系統，研究人員還希望繼續擴大技術的規模，且這是傳統方法難以輕易做到的。

最後，Margolis 和 Yang 補充道：

想要構建具備多種不同技能的機器人，一種更加實用的犯法，就是告訴機器人該做什麼、以及學會如何去做。我們的系統，就是一個很好的例子。

在實驗室中，我們已開始將相關範例應用於其它機器人系統，包括可以拾取並操縱不同物體的機械臂。