MIT機械手新研究:玩轉2000多個物體 球體成功率近100%

本周一,麻省理工學院計算機科學與人工智能實驗室(MIT
CSAIL)公布了一項新成果——一個能夠靈活控制機械手的程序框架。在很長一段時間裡,機械手的操縱物體能力還不如剛滿一歲的嬰兒靈活。即使現在機械手可以做的不僅僅是撿起和放下物體,但在發力和複雜手部動作方面,它還沒有完全模仿到位。

MIT機械手新研究:玩轉2000多個物體 球體成功率近100%

目前,在該領域已經有多個AI實驗室致力於機械手訓練,例如OpenAI的Dactyl機器手、DeepMind的RGB堆疊技術(RGB-Stacking)等,都在一定程度上促進了機器人行業的發展。

MIT CSAIL研究人員提出的程序框架可以讓機械手操縱超過2000個不同物體的方向,利用簡單的“師生”訓練方法,在模擬環境中訓練”教師“網絡,再應用到現實世界的“學生”中,解決機械手技術的複雜問題。

該論文將在2021年機器人學習會議(Conference on Robot Learning,CORL)上發表。

一、從魔方到2000多種不同物體,任意玩轉

OpenAI 2019年10月15日在官網博客發布了Dactyl機械手的視頻,視頻內容是Dactyl機械手在約4分鐘的時間裡成功還原了一個三階魔方,這是在機械手控制領域,從定向任務編程邁向更通用AI技術的重要一步。

MIT機械手新研究:玩轉2000多個物體 球體成功率近100%

▲Dactyl機械手還原魔方視頻(GIF來源為YouTube)

2021年10月12日DeepMind發布RGB堆疊技術(RGB-Stacking)對機械手進行強化學習訓練,這是一個基於視覺的學習系統,評估多個研究對象的行為和動作來提高機械手能力。

MIT機械手新研究:玩轉2000多個物體 球體成功率近100%

▲RGB堆疊技術機械手訓練過程(圖片來源為VentureBeat)

MIT CSAIL的科學家們也一直致力於讓機器提高模仿人類的能力,他們創建了一個更大的程序框架:無論機械手朝上還是朝下,都可以重置2000多個物體的方向。從杯子到金槍魚罐頭、奶酪盒子等,甚至可以延伸到生活中不常見的物體,這個程序框架都可以幫助機械手以特定的方式,在合適的位置快速拾取和放置物體。

此前機械手通常只能完成單一任務或者只能在垂直位置上移動,而現在機械手可以具備靈巧的“手部動作”,有助於滿足物流和製造行業一些常見的需求。例如將物品裝入插槽中進行裝配,或靈活操縱距離更遠的工具。MIT CSAIL的團隊使用了具有24個自由度的擬人機械手,證明了該程序框架可以在未來轉移到真正的機器人系統上。

MIT機械手新研究:玩轉2000多個物體 球體成功率近100%

▲MIT CSAIL研究團隊的機械手演示動畫(GIF來源為GitHub)

二、從零重力到正常條件,機械手性能提高

MIT CSAIL博士生、Improbable AI Lab研究小組首席研究員陳濤(Tao Chen)說:“在工業中,由於控制簡單,最常用的是平行爪夾持器,如下圖所示。但實際上它無法處理我們在日常生活中看到的許多工具。即使用該夾持器控制鉗子也很困難,因為它不能靈活地只移動其中一個手柄。我們的程序框架將允許多指機械手靈巧地操縱此類工具,這為機械手應用開闢了一個新領域。”

MIT機械手新研究:玩轉2000多個物體 球體成功率近100%

▲平行爪夾持器(圖片來源為YouTube)

機械手操縱物體時需要控制大量電機,並且手指與物體之間的接觸狀態也在頻繁變化,因此,機械手重置物體方向一直是一個具有挑戰性的技術難題。該程序框架需要通過2000多個對象進行學習。

當機械手朝下時,問題就變得更加棘手。機械手不僅需要操縱物體,還需要克服重力使其不會掉落。

MIT機械手新研究:玩轉2000多個物體 球體成功率近100%

▲機械手朝下時操縱物體(GIF來源為GitHub)

該團隊發現一種簡單的方法可以解決複雜的問題。他們使用了深度學習的無模型強化學習算法,意味着該程序框架必須從與環境的交互中找出價值函數,以及所謂的“師生”訓練方法。

為此,研究人員利用物體和機械手的信息對“教師”網絡進行訓練,這些信息無法在現實世界中獲得,只能在模擬環境中獲得,例如指尖的位置或物體移動速度。

為了確保機械手可以在模擬環境之外工作,“教師”網絡學習到的內容將被提煉為現實世界中可以獲取的觀察結果,並提供給“學生”網絡,例如攝像機捕獲的深度圖像、物體姿態和機械手的關節位置。

他們還使用了“重力課程”的學習方法,機械手首先在零重力環境中學習技能,然後慢慢地讓控制器適應正常的重力條件,以這種形式訓練機械手確實提高了其整體性能。

看似不是正常的學習過程,但被稱為機械手“大腦”的單個控制器可以通過這種訓練方法重新放置大量物體,即使這些物體它以前從未見過並且不知道形狀。

三、機械手成功率受物體形狀制約

麻省理工學院教授、該研究論文作者Pulkit Agrawal說:“我們最初認為,在機械手操縱物體時推斷形狀的視覺感知算法將是主要挑戰。相反,我們的結果表明,機械手可以學習與形狀無關的強大控制策略。這表明視覺感知對於操縱的重要性可能遠不如我們習慣的思維方式重要,而更簡單的感知處理策略可能就足夠了。”

例如蘋果、網球、彈珠等小的球形物體在用機械手重新放置時,其成功率接近100%。而對於勺子、螺絲刀和剪刀等更複雜的物體放置的成功率較低,只有約30%。

MIT機械手新研究:玩轉2000多個物體 球體成功率近100%

▲機械手操縱球形物體(GIF來源為GitHub)

由於其成功率因對象形狀而有所偏差,該團隊指出,在未來基於物體形狀訓練模型可以進一步提高機械手性能。

結語:簡單方法解決機械手複雜難題

此次麻省理工學院研究小組推出的程序框架,可以幫助機械手重新定位不同物體,操縱機械手多指機械手使用多種複雜工具,並滿足生產過程中的多種需求,開闢機械手應用的新領域。

該研究小組表示,由於高維驅動空間和手指與物體之間接觸狀態的頻繁變化,手持物體重新放置方向一直是機器人技術中的一個具有挑戰性的問題。用簡單的“師生”方法訓練機械手,巧妙的解決了這一複雜問題。

智東西(公眾號:zhidxcom)

編譯 |  程茜

編輯 |  李水青

(0)
上一篇 2021-11-11 07:29
下一篇 2021-11-11 07:29

相关推荐