阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

2023-03-28 03:38 • 數字貨幣

來源：互聯網白話

作者：童蔚

這波AIGC（利用人工智能技術來生成內容）的熱潮，已經開卷視頻了。

上個月初，白話君說過，阿里達摩院正在研發類ChatGPT的對話機器人，當時已開放給公司內員工測試。

沒想到，一個多月後，先露面的是文本生成視頻。

就在3月30日，阿里達摩院低調地在魔搭社區（ModelScope）放出了“文本生成視頻大模型”。魔搭，是達摩院在去年11月推出的開源模型平台。

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

根據官方介紹，目前這個模型，由文本特徵提取、文本特徵到視頻隱空間擴散模型、視頻隱空間到視頻視覺空間這3個子網絡組成，整體模型參數約17億。支持英文輸入。擴散模型採用Unet3D結構，通過從純高斯噪聲視頻中，迭代去噪的過程，實現視頻生成的功能。

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

看不太懂？沒關係。會玩就行。

白話君剛才試了一把。輸入提示詞：A panda eating bamboo on a rock，等了差不多77秒，收到一段2秒鐘的視頻。感受一下~

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

如果換成中文：一隻大熊貓坐在岩石上吃竹子，出來的結果就是一隻類似於貓咪的小動物。果然，目前還不支持中文。

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

再來幾個~

A goldendoodle playing in a park by a lake.（一隻金貴犬在湖邊的公園玩耍）

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

A dog wearing a Superhero outfit with red cape flying through the sky.（一隻身着超級英雄裝和紅斗篷的狗正在天上飛）

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

Monkey learning to play the piano.（猴子正在學習彈鋼琴）

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

從試玩的結果來看，目前能生成的視頻長度多在2-4秒，生成等候時間從20多秒到1分多鐘不等。

感興趣的，不妨自己去體驗一下（試玩地址：https://modelscope.cn/studios/damo/text-to-video-synthesis/summary）

達摩院的這個發布，也在國內外的社交平台上吸引了一波嘗鮮的網友。因為玩的人太多，有微博網友說，連刷20次都沒擠進去。

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

另外，昨日凌晨，總部位於紐約的人工智能初創公司Runway也發布了一種從文本到視頻轉化的AI模型Gen-2。

上個月，這家曾參與創建Stable Diffusion的公司推出過模型Gen-1，能通過文本提示或參考圖像指定的風格，將現有視頻轉化為新視頻。

比如將“街道上的人”變成“粘土木偶”，只需要一行提示詞。

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

從命名上就能看出，Gen-2是Gen-1的升級版，能從零開始產出視頻。目前，我們只能看到Runway分享出來的一些演示片段。根據該公司的說法，未來幾周會提供廣泛訪問試用。

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

早在去年，谷歌和Meta都展示了各自在文本轉視頻上的嘗試，利用AI生成泰迪熊洗碗和在湖上泛舟等視頻。但這兩家公司都沒有宣布將相關技術推進到研究階段以外的計劃。

阿里達摩院低調上線文本生成視頻大模型，可以試玩！AI開始卷視頻了！

文本生成視頻，最理想的效果就是用戶給出提示詞，系統自動生成任何風格的對應視頻。

不過，從目前此類模型生成視頻的等待時間，畫面的真實度、清晰度以及長度等各方面來看，距離產出令人滿意的視頻還有很大距離。

事實上，與圖像編輯相比，視頻編輯是一個更有挑戰性的領域。扎克伯格此前就在推特上說過，AI模型能從生成靜態像素，發展到預測每個像素隨着時間推移發生的變化，這在技術上已經是一個突破。

當然了，也許用不了多久，AI就會解決現存的這些缺陷。將來，哪怕完全不懂視頻製作的人，也能上手做視頻，且可能是批量產出。

本文鏈接：https://www.8btc.com/article/6810506

轉載請註明文章出處

模型視頻達摩院

赞 (0)

ChatGPT“變現”在即，哪些法律風險不容忽視？

上一篇 2023-03-28 03:37

GPT-4 挑戰當老闆，目標：用 100 美元生成 100000 美元！

下一篇 2023-03-28 03:38

數字貨幣

解讀DeFi的經濟模型，為什麼加密銀行的利息是銀行的十倍？

本文作者凱文·韋巴赫，是賓夕法尼亞大學沃頓商學院的法律研究和商業道德教授。作為世界知名的新興技術專家，他研究了人工智能、寬帶、遊戲化和區塊鏈等發展對商業和政策的影響。韋巴赫曾在奧巴…

2021-08-30
數字貨幣

DeFi發展現狀報告：你認為DeFi發展到哪個階段了？

在短短8個月內，DeFi已將超過1000億美元的金額吸引到智能合約中。這些合約既實現了傳統金融能夠做的事情，又帶來了全新的金融原語。這些創新為個人提供了新的機會，使他們能夠真正…

2021-05-14
數字貨幣

CoinList賬號灰產調查：做號、養號與轉售

作者 | Richard Lee 編輯 | 龔荃宇作為加密世界最具影響力的代幣公募平台，CoinList今年在各大社區引發的「打新」潮儼然成為國內加密行業的現象級事件，幾乎每上線…

2021-07-23
數字貨幣

《福布斯》進軍元宇宙，推出虛擬億萬富豪NFT收藏品

文：Forbes Press Releases 近日，《福布斯》公布了其虛擬億萬富豪NFT系列的預覽，該系列包括一組虛擬投資者，他們擁有巨大的虛擬投資組合和基於紐交所實時定價的虛擬…

2022-04-13
意大利“封殺”ChatGPT？意副總理髮聲：監管過度，趕緊恢復服務！

來源：財聯社編輯劉蕊幾天前，意大利國家數據機構——意大利個人數據保護局（DPA）宣布禁止使用聊天機器人ChatGPT，並限制開發這一平台的OpenAI公司處理意大利用戶信息。…

數字貨幣 2023-04-07
數字貨幣

以太坊「生成藝術」熱潮來襲，一文教你如何應對

註：原文來自bankless，作者是William M. Peaster。幾個小時前，下面這件藝術品以超過40萬美元的價格成功售出。🤯 Ringer #666 那下面這個呢？ C…

2021-08-11
數字貨幣

幣圈雷曼風暴：幣安放棄收購，FTX 據稱遭監管調查、警告可能破產

媒體稱，幣安發現 FTX 的債務和資產相差可能超過 60 億美元；FTX 面臨最高 80 億美元流動性缺口；幣安發言人稱，FTX 的問題超出了幣安的控制範圍；美國證監會和大宗商品最…

2022-11-10
數字貨幣

速讀摩根大通元宇宙報告：大機會在哪裡？打工人與企業生存模式巨變

2 月 15 日，摩根大通發布了一篇名為「Opportunities in the metaverse」的研究報告（本文是速讀翻譯版本，譯者有刪減），探討企業如何在元宇宙中尋找機會…

2022-02-18
數字貨幣

淺談央行數字貨幣未來之路：整合數字創新勢在必行，在必要時迅速引入CBDC

來源：人大金融科技研究所原標題：《未來之路：央行數字貨幣與創新支付》稿源 | Banque de France 作者 | François Villeroy de Galhau…

2021-07-14
沉默6年後，狗狗幣基金會將正式重建，V神被列為顧問

經過幾年幾乎完全的媒體沉默之後，狗狗幣（DOGE）基金會即將回歸，以支持惠及這種基於模因的加密貨幣的核心開發者和項目。在周二的一份聲明中，狗狗幣基金會表示，為了支持狗狗幣社區，並…

數字貨幣 2021-08-18