“跨次元”目標檢測模型hold住各種畫風還能識別漫畫中物品

2022-01-16 16:04 • 熱點資訊

目標檢測種類多達20000+種的AI，你見過嗎？不僅準確“揪出”每個物體所在的位置，分類效果非常準確：

插畫版賽博恐龍也沒問題：

甚至還能檢測雜誌封面甚至漫畫中的物體！

這也是把目標檢測給玩出花來了，據作者表示模型在長尾問題等細節上的處理非常好，像獅子和狐狸這種少樣本也能準確識別：

這項研究來自Meta AI和德克薩斯大學奧斯汀分校，一作是著名目標檢測框架CenterNet的作者、復旦校友Xingyi Zhou。

一起來看看。

可識別“跨次元”物體

這篇論文提出了一種新的名為Detic的方法，用來解決目標檢測無法用到圖像級標籤（給一整張圖打標籤，標註裡面有什麼物體）的問題。

此前的目標檢測方法，通常是一個檢測框里一個物體：

這種方法有一個問題，就是沒辦法利用整個圖像級標籤，只能用單個物體的圖片進行訓練。

也有一些研究想出了一種新方法，搞個弱監督學習，試圖讓AI自己學會將圖像級的標籤，去對應錨定框裡面有什麼物體，但實際上這種方法的效果也不太好。

Detic的方法是採用目標檢測數據（a）和圖像標籤數據（b）對Detic進行混合訓練。

其中，在用目標檢測數據訓練Detic時，同時對圖像分類模塊W和目標檢測模塊B進行訓練，但只用標籤數據對圖像分類模塊W進行訓練。

訓練的數據集採用的是ImageNet，事實證明模型在訓練后無需微調，就能很好地適應到LVIS等數據集，相對之前的一些模型都達到了不錯的效果：

論文表示，Detic能分類的圖片類型也是多種多樣，從真實照片到賽博恐龍插畫這樣的“跨次元”作品都能識別：

這立刻吸引了不少網友來玩。

在線Demo可玩

有網友用梵高的世界名畫試了試。

放大一點來看，藝術加工后的椅子、人和桌子也能被識別：

還有用二次元的龍貓進行識別的，除了龍貓本身被錯認成貓頭鷹以外，其他的雨傘和靴子都認得不錯：

我們也隨便用一個鐘錶櫃的照片試了試，在線Demo的檢測時間稍微有點久，大約需要6分鐘左右，但效果還不錯：

細看的話還是能發現一些瑕疵，例如把部分手錶誤認成轉速計、以及懷錶和時鐘，以及也有一兩塊手錶沒有被檢測出來。

不過，即使在二次元和插畫中，這個AI能識別的物體，至少也需要在真實世界出現過。

例如，超出20000個分類的物體，如噴火龍和皮卡丘，就不在AI的監測範圍內了，全部被認成了猴子（狗頭）：

將這些二次元角色也加入AI訓練數據集中，不知能否取得同樣的檢測效果。

檢測物體目標

赞 (0)

奧密克戎全國多地散發張文宏最新解讀上海疫情

上一篇 2022-01-16 16:04

德國經濟部態度不明環球晶圓收購世創案遇阻

下一篇 2022-01-16 16:04

熱點資訊

新開發的COVID疫苗對迄今已知的所有SARS-CoV-2變體都有效

維也納醫科大學開發的用於預防SARS-CoV-2的疫苗的臨床前數據表明，它對迄今已知的所有SARS-CoV-2變體都有效，包括奧密克戎（Omicron）–甚至對那些因接…

2022-04-09
熱點資訊

網售處方葯細則呼之欲出

9月9日，中國證券報記者從權威人士處獲悉，國家葯監局日前就《藥品網絡銷售監督管理辦法》（送審稿）徵求意見已結束，涵蓋藥品網絡銷售管理、平台管理、監督管理、法律責任等。如該政策審議通…

2021-09-10
熱點資訊

新的低重力模擬器設計有望為未來的太空研究和居住環境提供條件

隨着人類對宇宙的不斷探索，太空的低重力環境給科學家和工程師帶來了不同尋常的挑戰。FAMU-FSU工程學院和總部設在佛羅里達州立大學的國家高磁場實驗室的研究人員已經開發出一種新的工具…

2021-10-29
熱點資訊

古菌新種“吃掉”石油“吐出”甲烷枯竭油藏有望重獲“生機”

油田中，枯竭的油藏真的“沒油”了嗎？一種能夠直接“吃掉”石油“吐出”甲烷氣體的古菌Ca. Methanoliparum近日被中國科學家發現，有望讓枯竭油藏重獲“生機”。北京時間12…

2021-12-23
熱點資訊

虛假網貸App調查：號稱“低息貸款” 仿冒金融平台

近日，山東李先生接到一通陌生來電，詢問他是否需要低息貸款。正為資金短缺發愁的李先生，按照對方指引下載了一款網貸App。一番操作后，對方以驗資、認證為由4次騙取李先生共計10餘萬元。…

2022-07-06
熱點資訊

科學家利用量子點讓過氧化物太陽能電池更穩定更高效

雖然過氧化物太陽能電池在近階段取得了長足的進步，但是依然有很多改進的空間。工程師們現在已經在配方中加入了一層量子點，從而產生了一種更穩定的太陽能電池，其效率接近歷史記錄。過氧化物…

2022-01-21
熱點資訊

Monkey’s Audio 7.0發布 APE音頻製作工具

Monkey’s Audio 是一套可將WAV轉成*.APE(Monkey’s Audio格式)的音樂文件，他不像一般的MP3或OGG音樂格式，為了節省空間…

2021-09-12
熱點資訊

離職半個月特斯拉前總裁已拋售2.74億美元股票

北京時間6月19日消息，美國證券交易委員會(SEC)的文件顯示，特斯拉資深高管、前汽車業務總裁傑羅姆·吉蘭(Jerome Guillen)已行使股票期權，自6月10日以來拋售了預計…

2021-06-19
熱點資訊

Duolingo想教你更多來自《權力的遊戲》中的高等瓦雷利亞語

HBO的《龍之家族》將在一個多月後首播，你很難在首播前及時掌握高等瓦雷利亞語。當然，有些人會嘗試，但對於那些尋找一種不那麼費時的方式來學習虛構的語言或刷新他們的技能的人，Duoli…

2022-07-20
熱點資訊

《長津湖》耗資約13億人民幣成中國影史最貴電影

據外媒TheHollywoodReporter報道，抗美援朝電影《長津湖》投資成本約13億元人民幣，成為中國電影歷史上花費最為昂貴的電影。抗美援朝戰爭題材電影《長津湖》將亮相本屆戛…

2021-06-24