MIT機械手新研究：玩轉2000多個物體球體成功率近100%

本周一，麻省理工學院計算機科學與人工智能實驗室（MIT
CSAIL）公布了一項新成果——一個能夠靈活控制機械手的程序框架。在很長一段時間裡，機械手的操縱物體能力還不如剛滿一歲的嬰兒靈活。即使現在機械手可以做的不僅僅是撿起和放下物體，但在發力和複雜手部動作方面，它還沒有完全模仿到位。

目前，在該領域已經有多個AI實驗室致力於機械手訓練，例如OpenAI的Dactyl機器手、DeepMind的RGB堆疊技術（RGB-Stacking）等，都在一定程度上促進了機器人行業的發展。

MIT CSAIL研究人員提出的程序框架可以讓機械手操縱超過2000個不同物體的方向，利用簡單的“師生”訓練方法，在模擬環境中訓練”教師“網絡，再應用到現實世界的“學生”中，解決機械手技術的複雜問題。

該論文將在2021年機器人學習會議（Conference on Robot Learning，CORL）上發表。

一、從魔方到2000多種不同物體，任意玩轉

OpenAI 2019年10月15日在官網博客發布了Dactyl機械手的視頻，視頻內容是Dactyl機械手在約4分鐘的時間裡成功還原了一個三階魔方，這是在機械手控制領域，從定向任務編程邁向更通用AI技術的重要一步。

▲Dactyl機械手還原魔方視頻（GIF來源為YouTube）

2021年10月12日DeepMind發布RGB堆疊技術（RGB-Stacking）對機械手進行強化學習訓練，這是一個基於視覺的學習系統，評估多個研究對象的行為和動作來提高機械手能力。

▲RGB堆疊技術機械手訓練過程（圖片來源為VentureBeat）

MIT CSAIL的科學家們也一直致力於讓機器提高模仿人類的能力，他們創建了一個更大的程序框架：無論機械手朝上還是朝下，都可以重置2000多個物體的方向。從杯子到金槍魚罐頭、奶酪盒子等，甚至可以延伸到生活中不常見的物體，這個程序框架都可以幫助機械手以特定的方式，在合適的位置快速拾取和放置物體。

此前機械手通常只能完成單一任務或者只能在垂直位置上移動，而現在機械手可以具備靈巧的“手部動作”，有助於滿足物流和製造行業一些常見的需求。例如將物品裝入插槽中進行裝配，或靈活操縱距離更遠的工具。MIT CSAIL的團隊使用了具有24個自由度的擬人機械手，證明了該程序框架可以在未來轉移到真正的機器人系統上。

▲MIT CSAIL研究團隊的機械手演示動畫（GIF來源為GitHub）

二、從零重力到正常條件，機械手性能提高

MIT CSAIL博士生、Improbable AI Lab研究小組首席研究員陳濤（Tao Chen）說：“在工業中，由於控制簡單，最常用的是平行爪夾持器，如下圖所示。但實際上它無法處理我們在日常生活中看到的許多工具。即使用該夾持器控制鉗子也很困難，因為它不能靈活地只移動其中一個手柄。我們的程序框架將允許多指機械手靈巧地操縱此類工具，這為機械手應用開闢了一個新領域。”