國產AI作畫神器：更懂中文，竟然還能做周邊！

2022-08-22 15:44 • 熱點資訊

最近在“ 一句話生成畫作”這個圈子裡，又一個AI工具悄然火起來了。不是你以為的Disco Diffusion、DALL·E，再或者Imagen……而是全圈子都在講中國話的那種。瞧，已經入圈的小夥伴們，都開始紛紛曬自己搞出來的傑作了：

國產AI作畫神器：更懂中文，竟然還能做周邊！

從網友們上傳的諸多畫作來看，這個AI可以cover的風格還真不少。

腦洞大開的《熊貓騎摩托》，中國山水畫里的春天小雨，絢麗的概念插畫《亞特蘭蒂斯》，甚至一隻黑白色調的戴帽子抽煙的狗……

國產AI作畫神器：更懂中文，竟然還能做周邊！

那這個既能支持中文，又能hold住眾多畫風的AI工具，到底是什麼來頭？

不賣關子。

它的廬山真面目，正是百度最新對外發布的一款中文作畫AI—— 文心·一格。

類似這種“你說我畫”的AI，聽說在國外已經火了很長一段時間。

現在終於等到了個 國產版的，那麼它到底好不好用呢？

“文心·一格”的初體驗

既然在這個圈子流行講中文，那咱就先從“中國風”開始上手。

例如輸進去極具古典韻味的“江南水鄉”，然後在方向和風格上選擇“傳統”、“中國風”。

國產AI作畫神器：更懂中文，竟然還能做周邊！

僅需等待片刻時間，“啪的一下”，一幅符合語義和風格的畫作就誕生了：

國產AI作畫神器：更懂中文，竟然還能做周邊！

嘿~還別說，這畫還真有一股子“小橋流水人家”的味道。

既然是國風，那就更傳統一點，直接輸入一句古詩詞，看文心·一格會作何反應：

雲深不知處。

雲深不知處。

‍

國產AI作畫神器：更懂中文，竟然還能做周邊！

‍

整體來說，這幅畫作確實是把“雲之深”韻味展現得到位了。

據了解，文心·一格還可以繼續加大難度。針對AI圖像生成技術的資深用戶，一格即將開放 高級自定義功能，支持文本描述結合參數設置的方式探索更多創意。

當然，也可以在”藝術家精品畫廊”里先瀏覽下內測用戶已經生成的圖片，像下面這張：

國產AI作畫神器：更懂中文，竟然還能做周邊！

講真，若非知道這是AI創作的，第一眼還以為是哪個動漫中的場景，是有夠絢爛的了。

還有下面這一張，也同樣稱得上是驚艷絕倫。

國產AI作畫神器：更懂中文，竟然還能做周邊！

但正所謂“貨比三家”，那麼文心·一格作為AI作畫這條賽道的“後起之秀”，和國外的產品相比又如何呢？

下一個挑戰環節，就是國內AI vs. 國外AI——惡犬咆哮。

國產AI作畫神器：更懂中文，竟然還能做周邊！

較為明顯的是，Disco Diffusion的風格更趨向於狂野；而文心·一格則是更偏向現實主義一些。

再拿文心·一格和DALL·E 2做個比較——畢加索風格的貓：

國產AI作畫神器：更懂中文，竟然還能做周邊！

在看完這兩者的創作對比，你覺得誰家的更畢加索一些呢？

不過在這般效果背後，對應的問題也隨之而來：

要生成風格更全面的圖片，文心·一格的用法會更複雜嗎？

懂中文，也懂“懶人”

用起來，並不複雜。

我們從操作界面、提示詞要求和性能要求幾方面，對Disco Diffusion和文心·一格等AI畫畫產品進行了簡單對比。

操作界面上，Disco Diffusion開放的接口不能說很複雜，但確實有點門檻。

它直接在GoogleColab上運行，需要申請賬號后使用（圖片生成后保存在雲盤），圖像分辨率、尺寸需要手動輸入，此外還有一些模型上的設置。

好處是可更改的參數更多，對於高端玩家來說可操作性更強，只是比較適合專門研究AI算法的人群：

國產AI作畫神器：更懂中文，竟然還能做周邊！

相比之下，文心·一格的操作只需三個步驟：輸入文字，鼠標選擇風格&尺寸，點擊生成。

國產AI作畫神器：更懂中文，竟然還能做周邊！

前文已經提到，文心·一格同樣也具備Disco Diffusion的“高級自定義”功能，隨後便會開放，對於想擁有更多“參數自由”的小夥伴們來說，同樣是個不錯的選擇。

至於 提示詞，Disco Diffusion的設置還要更麻煩一些。

除了描述畫面的內容以外，包括畫作類別和參考的藝術家風格也都得用提示詞來設置，通常大伙兒會在其他文檔中編輯好，再直接粘過來。

關鍵一旦提示詞設置得不好，生成的效果就不盡如人意，需要反覆嘗試、不斷細化，AI最終才能生成合適的畫面效果。

相比之下文心·一格倒是沒有格式要求，輸入150字的句子或詞組都可以：

當然，輸入畫家名字如莫奈，也能輸出對應風格：

國產AI作畫神器：更懂中文，竟然還能做周邊！

最後是 性能要求上，Disco Diffusion是有GPU使用限制的，每天只能免費跑3小時。抱抱臉（HuggingFace）上部分AI文生圖算法的Demo雖然操作簡單些，但一旦網速不行，就容易加載不出來：

△測試mini DALL·E時加載就失敗過

相比之下，文心·一格除了使用高峰期以外，基本上都是2分鐘就能生成，對使用設備也沒有要求。

總體來看，同樣是文字生成圖片AI，實際相比文心·一格的“真·一句話生成圖片”，DALL·E和Disco Diffusion的生成過程都不太輕鬆。

所以在這背後，文心·一格生成圖像，究竟是基於一個怎樣的邏輯？

我們以輸入“雲深不知處”為例，希望能輸出一幅中國風的畫作。當接收到這幾個字詞（query）后，AI的腦細胞就開始“運作”了起來，從語法、詞法、語義等角度對文本進行分析。

如果將生成過程可視化，這個階段還看不出什麼效果，處於AI理解文本的階段：

國產AI作畫神器：更懂中文，竟然還能做周邊！

很快，AI“拆解”文本后，理解要怎麼畫這幅畫了，於是在特定尺寸（用戶可選）的畫紙上，構思出整體的輪廓，兼具雲的元素和中國畫的風格：

國產AI作畫神器：更懂中文，竟然還能做周邊！

隨後，基於擴散生成模型的原理，迭代地完善並修正畫面細節，不斷提高清晰度、反覆檢查圖文描述一致性，用更精確的配色替代噪聲：

國產AI作畫神器：更懂中文，竟然還能做周邊！

最後，生成名為《雲深不知處》的完整畫作：

國產AI作畫神器：更懂中文，竟然還能做周邊！

看似“一句話生成圖片”不難，其實對 AI語義理解和 圖像生成能力提出了進一步要求。

為了能更好地理解文本、提升輸出效果，文心·一格還在百度文心的圖文生成跨模態模型 ERNIE-VilG的基礎上，進行了更詳細的優化。

為了提升圖文理解能力，在知識增強的基礎上，引入 跨模態多視角對比學習；

為了降低輸入要求同時提升效果，採用 基於知識的文本聯想能力，讓模型學會自己擴展提示詞的細節和風格；

為了提升圖像生成能力，採用 漸進式擴散模型訓練算法，讓模型來選擇效果最好的生成網絡。

國產AI作畫神器：更懂中文，竟然還能做周邊！

此外，在訓練和數據上，文心大模型的產業級能力也進一步給文心·一格提供了幫助，例如AI訓練數據和平時在產業實踐中積累的經驗，都能應用到文心·一格的模型中去；至於百度知識圖譜的算法能力，則進一步提升了模型通用性。

值得一提的是，如果開發者想將文心·一格的能力用到產品中，直接調用ERNIE-VilG的API接口就行，可以說是非常方便了。

One More Thing

我們在試玩文心·一格的時候，還發現了左下角這些有意思的應用場景，一鍵就能生成預覽：

國產AI作畫神器：更懂中文，竟然還能做周邊！

例如，頗有自如風格的裝飾畫：

國產AI作畫神器：更懂中文，竟然還能做周邊！

老闆批量發年貨時印的編織袋（手動狗頭）：

國產AI作畫神器：更懂中文，竟然還能做周邊！

其實，這也是文心·一格區別於Disco Diffusion、OpenAI的DALL·E 2的另一個特點——更強的實用性。

不僅普通玩家可以用來生成自己想畫但畫不出來的內容， 絕不會有兩幅相同的畫作，腦洞再放大點，就連媒體作者等文字內容創作者，也能用它高質量高效率配圖。

（嗯，以後你看量子位的文章，說不定有些配圖就是用AI生成的）

專業畫師、或是設計師和藝術家，更可以用它來啟發靈感、輔助創作。

當然，從官網看來，這個產品還在更新迭代、進一步優化中。

至於未來是否會在更多數字藏品、插畫、海報和電影動漫中，看見文心·一格的畫作？

我們拭目以待。

ai 中文這個

赞 (0)

終於熬出頭了：全國高溫退場日曆鄭州合肥等地先“退群”

上一篇 2022-08-22 15:42

馬斯克公布2022年兩個目標需要眾多“超級天才”

下一篇 2022-08-22 16:02

熱點資訊

TCL華星開發出全新半透半反屏幕：功耗直降90%

近年來，國產顯示屏廠商不僅產能佔據了全球過半份額，同時也在技術上突飛猛進，國產旗艦機也開始採用國產LCD/OLED屏，現在TCL華星又開發出了全新的半透半反屏幕，可將戶外顯示功耗降…

2022-08-19
熱點資訊

支持PCIe 4.0和176層NAND閃存的群聯E18新主控現已出貨

作為全球領先的 NAND 閃存控制器集成電路與存儲解決方案提供商之一，群聯電子股份有限公司今日宣布旗下 PS5018-E18 PCIe Gen4 主控已開始向製造商合作夥伴出貨。結…

2021-05-26
熱點資訊

監督機構回應藍色起源投訴 NASA解釋SpaceX登月方案更具靈活性

總部位於華盛頓州肯特的航空航天發射服務提供商藍色起源（Blue Origin），一直想要從 SpaceX 那裡搶到 NASA 的登月合同。今年 4 月，美國宇航局選擇了 Space…

2021-08-05
熱點資訊

福奇：美國仍有7000萬人未接種新冠疫苗新增病例或仍將激增

當地時間10月3日，美國國家過敏症和傳染病研究所所長安東尼·福奇在接受美國廣播公司的採訪時表示，雖然美國在三個月內的新冠肺炎新增病例指標呈顯著下降，與新冠相關的住院人數和平均每日新…

2021-10-04
熱點資訊

河北一大學畢業生作品入圍戛納：6人團隊打造、成本只有5000元

戛納國際電影節是當今世界上最具影響力、最頂尖的國際電影節，而今年河北一位24歲的大學生的畢業作品《地兒》就入圍了戛納電影節。據@錢江晚報報道，4月23日，第75屆戛納電影節公布了…

2022-04-29
熱點資訊

微軟發布視頻感謝Windows Insiders幫助完善Windows 11系統

Windows Insider計劃啟動7周年，這個日期與Windows 11的發布時間非常吻合。超過100萬Windows Insiders參與了操作系統的測試，今天微軟發布了一段…

2021-10-06
熱點資訊

玩家將電腦扔進湖裡以戒掉玩《守望先鋒》上癮症

《守望先鋒2》Beta測試已結束，許多玩家又回到《守望先鋒》繼續開打。雖然不是每個人都樂於回到6V6，但有玩家發現暴雪的這款遊戲容易讓人上癮。最近Twitter網友Fl4k_Dri…

2022-05-24
熱點資訊

谷歌將讓用戶更少看到他們不喜歡的廣告

谷歌正在擴大其敏感廣告類別選項，讓用戶降低他們看到的關於約會、懷孕、育兒和減肥的廣告數量，並使這些設置適用於更多地方。該功能的推出是為了讓人們在YouTube上看到更少的關於可能…

2022-04-29
熱點資訊

美國宇航局SLS火箭目標明年2月首次發射但仍然面臨諸多挑戰

美國宇航局的下一代火箭 – 空間發射系統（Space Launch System，SLS）目標在 2022 年 2 月發射，這是美國宇航局將人送回月球的旅程中的一次關鍵…

2021-10-23
熱點資訊

新電致變色材料可幫助建築物升溫和降溫

你可能聽說過電致變色窗或太陽鏡，它們可以通過電子方式在透明和有色狀態之間切換。那麼，同樣的技術已被應用於一種新材料，如果安裝在建築物的外牆上，它既可以加熱也可以冷卻。儘管它們的工…

2021-10-28