麻省理工學院(MIT)的四足迷你獵豹機器人,剛剛打破了之前創下的最佳速度記錄 —— 達到了 8.72 mph(14.04 km/h)。這項成績主要歸功於一套新穎的無模型強化學習系統,允許機器人自己找出最佳的跑步方式、以及適應不同的地形,而不再依賴於前置的人工分析。
(來自:MIT / CSAIL)
雖然迷你獵豹算不上是當今最快的四足機器人,但麻省理工學院的 Improbable AI 實驗室和美國國家科學基金會(NSF)旗下的人工智能與基礎交互研究所(IAIFI),還是賦予了其更強的靈活性。
Mini Cheetah robot runs faster than ever – MIT CSAIL(via)
在近日分享的一段新視頻中,可見到這台機器人在撞到障礙物后迅速繞過,以及自主學習適應濕滑結冰路面、以及鬆散的礫石山丘等地形。在一套簡單的神經網絡的加持下,它能夠對錯綜複雜的新環境展開相應的評估。
通常情況下,機器人都是在一套系統的指引下移動的。該系統會參考機械肢體是如何移動的,來分析並製作指導用的模型數據。但在實際應用中,這些模型往往效率低下、且在應對意外狀況時不夠全能。
尤其當機器人已最高速度運行時,系統硬件更是面臨極限壓力,使得環境建模變得更加困難。為了克服這方面的短板,MIT 研究團隊選擇了一套獨特的“經驗學習”系統。
相比之下,類似波士頓動力公司的 Spot 之類的機器人,依賴於人工去分析運動的物理特性、並手動配置機器人的軟硬件和分析設計參數。
基於此,MIT 的迷你獵豹機器人可以通過反覆試驗來自主學習,而無需人工介入。在積攢了對不同地形的足夠經驗后,它便可在後續工作中自動改進其行為,甚至無需在現實生活中積累這方面的經驗。
研究人員稱,通過模擬,迷你獵豹機器人可在靜止不動的三個小時內,迅速積累 100 天的經驗。MIT博士生 Gabriel Margolis 與 IAIFI 博士后研究員 Ge Yang 補充道:
我們開發的這種方法,可通過模擬經驗來改進機器人的行為,同時適用於在現實世界中成功落實這種學習行為。
背後原理是機器人能夠在模擬器中看到所有環境信息,且系統會教授它們在可現實世界中分辨並識別的實用技能。
有了這樣一套系統,研究人員還希望繼續擴大技術的規模,且這是傳統方法難以輕易做到的。
最後,Margolis 和 Yang 補充道:
想要構建具備多種不同技能的機器人,一種更加實用的犯法,就是告訴機器人該做什麼、以及學會如何去做。我們的系統,就是一個很好的例子。
在實驗室中,我們已開始將相關範例應用於其它機器人系統,包括可以拾取並操縱不同物體的機械臂。