擅長爬山的機器狗登Science 比人類徒步速度快4分鐘

1月19日，瑞士蘇黎世聯邦理工學院的一項新成果登上國際學術頂刊Science（《科學》）的子刊Science
Robotics（《科學·機器人學》）。研究人員推出一個類似機器狗的四足機器人，這個機器人能夠結合外部感知和本體感知，爬上120米高的山僅需要31分鐘，比人類徒步花費的時間還要快4分鐘。

山上往往都由濕滑地面上的陡峭路段、高高的台階、碎石和布滿樹根的森林小徑組成，能在偏遠和危險環境中自主操作的腿式機器人，將幫助人類探索海拔較高的未知領域。

外部感知對於快速和節能的運動至關重要，機器人在接觸地形之前感知地形可以提前規劃和適應步態，以保持速度和穩定性。

瑞士蘇黎世聯邦理工學院機器人系統實驗室機器人學教授馬可·赫特（Marco Hutter）領導的研究小組，聯合學校的衍生公司ANYbotics，推出了商業化的腿式四足機器人ANYmal，這個機器人能夠穿越多種類型的複雜地形。

▲ANYmal與其他四足機器人跨越障礙物對比

論文鏈接：https://www.science.org/doi/10.1126/scirobotics.abk2822

一、不依賴傳感器，自主判斷速度快慢

為了在困難的地形上前進，人類和動物會自動將其環境的視覺感知與他們的腿和手的本體感覺結合起來。這使他們能夠輕鬆應對濕滑或鬆軟的地面，並較容易地四處走動。不過，到目前為止，腿式機器人只能在有限的範圍內做到這一點。

“原因是激光傳感器和攝像頭記錄的有關直接環境的信息通常不完整且模稜兩可。”赫特研究小組的博士生、該研究的主要作者三木隆弘（Takahiro Miki）解釋說。

機器人能夠利用外部感知來行動，是該項技術中的一項重大挑戰。首先，山上的雪、植被和水表面的反射率高，機器人會將它們視為無法踩到或完全消失的障礙物；其次，由於山上有灰塵、霧氣，能見度低，或者由於光線反射、植被遮擋機器人身上的傳感器，這些都可能會導致傳感器的感知度降低。

受這些因素影響，機器人腿部運動比較通用的解決方案是靠本體感覺，這也嚴重限制了其運動速度，因為機器人需要先親身感受地形，然後再調整步態。

“這就是為什麼像ANYmal這樣的機器人必須能夠自己決定，何時信任對環境的視覺感知並快速前進，何時最好謹慎行事，小步前進。”三木隆弘說。

▲ANYmal爬樓梯

二、控制器快速避障，10秒前進4米多

赫特領導的研究小組提出的這種更加通用的解決方案，他們整合了機器人腿部運動的外部感受和本體感受。研究人員開發的具有高魯棒性和速度的腿式運動控制器，採用了基於注意力的循環編碼器。該編碼器可以集成本體感受和外部感受輸入，並經過端到端的訓練，讓機器人學習無縫組合不同的感知模式。

“機器人已經學會將其環境的視覺感知與本體感覺，也就是基於直接的腿部接觸的觸覺結合起來。這使它能夠更快、更有效地應對崎嶇地形，最重要的是，更穩健。”赫特說，未來，ANYmal可以用於任何對人類來說太危險，或對其他機器人來說也難以通過的地方。

機器人在現實世界中實際行動之前，科學家們在虛擬訓練營中為這個四足機器人設置了眾多障礙，以便於它能找到克服多種障礙的理想方式，以及它何時可以依賴環境數據、何時可以忽略這些數據。

赫特說：“在實驗中評估機器人外部感知很重要。”研究人員在模擬的附加實驗中，他們還比較了各種階梯和樓梯地形中，機器人行動的成功率，以進一步定量評估其性能。

▲ANYmal上樓梯

在評估過程中，研究人員向機器人發出0.7m/s的固定前進速度指令，持續10秒，並收集了300個實驗數據來計算成功率。實驗成功的標準是機器人的行動距離是否超過4米。研究結果顯示，這個四足機器人的控制器性能明顯優於基線，可以穿越更多類型的地形範圍。

▲ANYmal於其他機器人行動對比

三、教師+學生模型訓練，訓練迭代1000個環境

研究小組還採用了教師-學生模式來對機器人進行訓練。在訓練過程中，赫特將信息策略的控制頻率設置為50 Hz，每個環境收集250個時間段的軌跡數據，形成一次訓練迭代。隨後他們將模擬環境并行化，以同時執行1000個環境的訓練。

對於教師模型，研究人員採用深度增強學習PPO算法，這個算法模型可以有效衡量機器人的步長。在將觀察結果匯總觀察之前，他們會使用運行平均值和標準偏差對其進行標準化，不同的實驗會在每一次訓練中以指數形式更新。

對於學生模型，赫特說：“我們在300個環境中進行了推廣，並為一次訓練迭代收集了400個時間段的軌跡。”並且在訓練學生模型時，實驗過程沒有高度樣本噪音干擾。

“通過這種訓練，機器人能夠在以前從未見過的情況下掌握最困難的自然地形。”赫特說，“即使直接環境中的傳感器數據模稜兩可或含糊不清，這也有效。”

▲ANYmal與其他四足機器人避障對比

根據赫特的說法，ANYmal會依靠其本體感覺安全行事，這樣的話機器人行動就做到了兩全其美，能夠結合外部感知的速度和效率以及本體感知的安全性。

結語：機器人或能幫助人類探索未知領域

在實際應用場景中，ANYmal在自主探索狹窄隧道、洞穴和城市基礎設施的地下系統的同時，還能自動快速地克服許多障礙物和困難地形。

機器人的快速避障和感知能力進一步提升，在未來，各種極端條件下，比如地震之後、核災難之後或是森林火災期間，對人類來說太危險以及其他機器人無法應對困難地形的地方，像ANYmal這樣的機器人都可以派上大用場。

近年來，機器人研究的應用在不斷擴展，機器人行動結合本體感受和外部感受等技術，都在解決很多機器人運動的難題，該領域未來在人類未知領域的探索應用場景可能會進一步擴大。

智東西（公眾號：zhidxcom）

編譯 | 程茜

編輯 | Panken