機器學習與生成對抗網絡 - Meta AI：讓手繪小人動起來－鑽石舞台

來源：公眾號新智元授權

【導讀】想讓畫中的「紙片人」有生命，Meta AI來搞定！昨日，Meta AI宣布了一種獨創性方法，只需幾分鐘，就能動畫化兒童手繪的角色，效果拔群。

快看，「紙片人」居然自己跳出來了！

小貓學會了hiphop。

小蜜蜂還會做wave。

火柴人竟然會打跆拳道。

糖果人還能空中飛踢。

這些卡通動畫都是用孩子們的簡筆畫生成的，不過，作者可是一個AI！

AI動畫工具在兒童繪畫上翻車？

孩子們富有想象力和創造性的簡筆畫，有的時候能帶給人一些不一樣的思考。

不過，雖然家長或老師很容易就能看出孩子的畫想展示什麼，但人工智能卻很難完成這項任務。

為什麼呢？

這是因為孩子們的繪畫通常比較超脫常規，比如，人物的腳並不能支撐身子，或者人物的雙臂位於身體的同一側。

這樣一來，AI系統有時候就無法識別出圖像和繪畫中的人物。

不過，研究人員已經有了一些眉目。

昨日，Meta AI宣布了一種獨創性方法，只需幾分鐘，就能自動生成兒童手繪人物或類人角色（即具有雙臂、兩條腿等的角色）的動畫，而且生成的動畫還能做到栩栩如生。

只需將孩子的手繪上傳給Meta AI，就可以看到它們變成會跳舞的角色，十分逼真。

手繪變動畫四步走

許多AI工具和技術都是為了處理真實的人類圖像而設計的，但兒童繪畫增加了人物特徵的多樣性和不可預測性，這使得識別手繪人物變得更加複雜。

兒童繪畫中的「人」有許多不同的形式、顏色、大小和比例，在身體對稱性、形態等方面幾乎沒有相似之處。

於是，Meta AI通過四個步驟來應對這一挑戰。

通過物體檢測識別人形

製作兒童人物動畫的第一步是將人物與背景和圖片中的其他類型的角色區分開來。

Meta AI採用基於卷積神經網絡的目標檢測模型Mask R-CNN來提取兒童繪畫中的人物。

雖然Mask R-CNN已經在最大的分割數據集上進行過預訓練，但是這些數據集都是由真實世界物體的照片組成的，不包含手繪圖。

因此，研究人員又將模型在大約1000張手繪圖上進行了微調。

經過微調過程後，模型就能夠很好地檢測出測試數據集中的人物。

不過，雖然現有的目標檢測技術在區分兒童繪圖上的人物時非常有效，但是產生的分割mask不夠精確，無法用於動畫。

為了解決這個問題，我們改為使用從目標檢測器獲得的邊界框，並應用一系列形態學操作和圖像處理步驟來獲得mask。

使用角色mask從場景中提升人形

從繪圖中識別並提取人形後，下一步就是通過mask將主體與背景分開。

理論上，該步驟完成後，mask掉的部分應該只含有人形的部分，沒有任何背景。

但是，如果手繪圖中的人物的手、腳、身體等部位在外觀上過於不符合常規時，Mask R-CNN預測的mask往往無法準確地捕捉整個圖形。

比如下圖那個倒三角的小人，其中，黃色三角形代表身體，一條橫槓代表手臂。

Mask R-CNN的結果顯然非常粗糙，不是「砍掉」了手臂，就是加粗了大腿。

為此，Meta的研究人員開發了一種經典的基於圖像處理的方法，對這些形狀各異的身體部件更加穩健。

研究人員先用預測的人形邊界框來裁剪圖像，然後，應用自適應閾值處理和形態學操作，從框的邊緣進行泛填充，並假設mask是未被泛填充觸及的最大多邊形。

雖然這種方法可以精確提取提取適合於動畫的mask，但是當背景雜亂無章或者紙張上有褶皺、破損或陰影時，就不好使了。

通過「裝配」為動畫做準備

孩子們畫的人物有各種各樣的身體形狀，這些都遠遠超出了AI所見過的傳統人的頭部、手臂、腿部和軀幹的形狀。

舉個例子，孩子畫的「火柴人」沒有軀幹，胳膊和腿直接連在頭上。

因此，研究人員需要一種能夠處理這類形態「變異」的全新方法。

Meta使用專為人體姿勢檢測而訓練的模型AlphaPose來識別人物上的關鍵點，這些關鍵點可以用作臀部、肩膀、肘部、膝蓋、手腕和腳踝的識別。

由於AlphaPose是在真人的圖像上訓練的，所以要想讓它能檢測兒童繪畫中的姿勢，必須對它進行重新訓練，以處理兒童繪畫中千奇百怪的姿勢。

為此，Meta的研究人員先內部收集了一波兒童繪畫的數據。

然後，研究人員利用在這個初始數據集上訓練的姿勢檢測器創建了一個內部工具，並允許父母上傳他們孩子的畫作，而研究人員則可以利用上傳的畫進行額外的訓練。

隨着數據越來越多，模型也得到反覆地訓練，最終達到了一個較高的準確度。

三維運動捕捉製作2D人物動畫

一旦有了mask和聯合預測，也就有了製作動畫所需的一切。

Meta首先使用提取的mask生成一個網格，用原始圖形對其進行紋理化。

使用預測的關節位置，研究人員為角色創建一個骨架，通過旋轉骨骼和使用新的關節位置來生成各種姿勢。

在製作動畫之前，先從繪圖中創建一個需要操作的角色。

然後，通過將一幀運動捕捉數據投影到2D平面上並更改角色姿態。從前面（頂行）、側面（中間行）和扭曲的視角（底部）投射運動捕捉數據都可以。

最後，再讓角色產生一系列連續的姿勢，就可以創建一個動畫了。

Meta AI可以根據關節預測的可信度來選擇不同的運動：在手臂和腿都被正確預測的情況下，動畫可以無縫地產生。

但是如果軀幹沒有出現在繪圖中，它的關節置信度值將會很低，這時，這隻AI將不得不放棄任務，要求用戶糾正預測，或者宣布動畫「做不了」。

用AI製作更複雜的動畫

AI已經成為富有「創造力」的強大工具，能夠賦予藝術家力量，激發新的表達形式。Meta的動畫工具能鼓勵人們去嘗試繪畫，並把他們帶向更多的方向。

也許有一天，AI可以繪製出一幅複雜的圖畫，然後利用多個的角色相互作用以及背景中的元素，立即製作出一部詳細的動畫。

有了增強現實眼鏡，這些動畫人物甚至可以在現實世界中變得栩栩如生，與孩子們一起跳舞或交談。

可能，AI的想象力就像人類的想象力一樣，是無限的。

參考資料：

https://ai.facebook.com/blog/using-ai-to-bring-childrens-drawings-to-life/

猜您喜歡：

超110篇！CVPR 2021最全GAN論文匯總梳理！

超100篇！CVPR 2020最全GAN論文梳理匯總！

拆解組新的GAN：解耦表徵MixNMatch

StarGAN第2版：多域多樣性圖像生成

附下載 |《可解釋的機器學習》中文版

附下載 |《TensorFlow 2.0 深度學習算法實戰》

附下載 |《計算機視覺中的數學方法》分享

《基於深度學習的表面缺陷檢測方法綜述》

《零樣本圖像分類綜述: 十年進展》

《基於深度神經網絡的少樣本學習綜述》

鑽石舞台

鑽石舞台發表在痞客邦留言(0) 人氣()

鑽石舞台

鑽石鑽石亮晶晶

機器學習與生成對抗網絡 - Meta AI：讓手繪小人動起來

歷史上的今天

留言列表

文章搜尋

最新文章

熱門文章

誰來我家

參觀人氣

鑽石舞台

鑽石鑽石亮晶晶

機器學習與生成對抗網絡 - Meta AI：讓手繪小人動起來

歷史上的今天

留言列表

文章搜尋

最新文章

熱門文章

誰來我家

參觀人氣

贊助商連結