UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

隨着四足機器人的應用越來越成功,它們面對的場景也會越來越多:今天爬樓梯,明天過草地,後天又去坑坑窪窪的石子地……這麼複雜多變的地形它們可hold不住,分分鐘給你表演個人仰馬翻。不過現在,來自UC伯克利、卡內基梅隆大學以及Facebook AI的研究人員發明了一種新算法:

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

不需要任何參考軌跡無需微調直接部署在機器人身上——

就能讓它們在瞬間適應各種複雜的新地形,一步都不帶“走神”地穿過亂石、沙灘、樓梯、長植被、人為搭建的活動板等環境。

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

滴了油的墊子上也是健步如飛、突然被負重5公斤也沒事!

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

這個對於人類來說非常簡單的技能,機器人現在也擁有了……

就問你厲不厲害(怕不怕)?

ps.眼尖的朋友應該能看出來,這個項目用的機器人就是咱國產的A1,來自杭州的Unitree。

如何做到的?

這個算法被命名為RMA(Rapid Motor Adaptation,快速電機自適應)。

由兩部分組成:基本策略模塊 (base policy, π)和自適應模塊 (adaptation module, ϕ)。

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

算法完全在仿真環境中訓練,然後直接部署於現實世界

訓練分為兩個階段。

第一階段,將機器人當前狀態、先前的動作、環境因素作為輸入,使用model-free的強化學習進行基本策略訓練。

第二階段,採用on-policy數據的監督學習,訓練自適應模塊通過歷史狀態和動作來預測外部參數(extrinsics),也就是該怎麼下腳。

部署階段,自適應模塊生成外部參數,基本策略模塊生成所需的關節位置,並使用A1機器人的PD控制器轉換為扭矩。

總的來說,基本策略模塊探測環境,並實際控制機器人的步態

自適應模塊負責分析基本策略給的數據,並加以分析,然後告訴基本模塊如何調整步態。

兩者協同工作以便在多樣化的環境中實現實時適應。

需要注意的是,該算法沒有視覺輸入!環境因素由機器人運動部件“感覺到”的力收集而來。

室內和室外測試

又到了評估性能的時刻,室內測試中,將三者:RMA、A1機器人本身的控制器、沒有自適應模塊的RMA進行了比較。

結果發現,RMA以100%的成功率走下15cm高度的台階,並以80%的成功率走過可變形表面(記憶泡沫床墊和微微不平整的泡沫墊)。

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

它也能夠成功爬上斜坡和台階。

在油性表面上行走的成功為90%。

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

而A1的控制器在不平整的泡沫上就只有20%的成功率。

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

沒有自適應模塊的RMA就基本啥也不行了。

最下面的三張圖表還說明了三種方法的有效載荷限制

A1控制器的性能在8Kg載荷下開始下降。

沒有自適應模塊的RMA承載超過8Kg后就沒法移動,不過倒是不會跌倒。

而RMA則在負重、保持平衡與行走距離上碾壓前兩者。

A1機器人的本身重量為12Kg。

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

而在室外:RMA在沙子、泥堆、高大植被上行走或穿越灌木的成功率為100%(不會被草纏腳)。

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

UC伯克利給四足機器人加Buff:瞬間適應各種地形 抹油也能hold住

而在亂石堆上行走時成功率為80%。

在鋪滿了枯枝敗葉的自然階梯上的成功率為70%。

最後,研究人員表示,要開發出真正可靠的地形自適應機器人,現在的這個“盲人”機器人的裝備還遠遠不夠,還需配上視覺傳感器等工具。這也是他們未來工作的一個重要方向。

(0)
上一篇 2021-07-11 16:13
下一篇 2021-07-11 16:14

相关推荐