微軟發布AI聲音生成工具VALL-E 只需3秒音頻即可模仿人說話

2023-01-10 14:15 • 科技資訊

訪問原網址

IT之家 1 月 10 日消息，微軟最近發布了一款名為 VALL-E 的人工智能工具，只需 3 秒音頻即可模仿人說話。

該工具經過 60000 小時英語語音數據的訓練，並使用特定語音的 3 秒剪輯來生成內容。與目前的許多人工智能工具不同，VALL-E 可以複製說話者的情緒和語氣，即使說話者本人從未說過的單詞也可以模仿。

微軟發布AI聲音生成工具VALL-E 只需3秒音頻即可模仿人說話

IT之家了解到，康奈爾大學的一篇論文使用 VALL-E 合成了幾種聲音，大家可以在 GitHub 上聆聽這些 AI 合成的音頻。

研究人員指出，在許多情況下，Vall-E 的性能優於當前的文本到語音轉換模型。然而，該研究還寫道，人工智能模型目前存在幾個問題。例如，文本提示中的某些單詞可能會發音不清晰、完全遺漏或在輸出中出現兩次。此外，該模型目前難以模仿某些聲音，尤其是帶有口音的聲音。

像其他 AI 新技術一樣，VALL-E 在安全、倫理等方面也引發了擔憂。微軟發布了關於使用 VALL-E 的道德聲明，但未來的使用用途方面沒有明確說明。

目前，微軟 Vall-E 尚未開源。微軟已經在 GitHub 上創建了一個 Vall-E 存儲庫，但目前只包含一個描述文件。

媒體報道

IT 之家

搜狐科技

鳳凰科技

vall 說話音頻

赞 (0)

視頻號總用戶使用時長超朋友圈80%，直播帶貨銷售額同比增長超8倍

上一篇 2023-01-10 14:15

天牧光能獲數千萬元種子輪融資

下一篇 2023-01-10 17:06

銀保監會：推動解決金融產品“數字鴻溝”問題

中國銀保監會辦公廳印發了《關於銀行業保險業數字化轉型的指導意見》(以下簡稱《指導意見》)，其中強調，構建面向互聯網客群的經營管理體系，對老年等客戶群體，加強大字版、語音版等應用軟件…

科技資訊 2022-01-27
外媒：轉轉計劃在IPO前進行一輪4億美元融資

今年3月份，轉轉發布《2020年度二手交易服務白皮書》顯示，2020年轉轉集團所有服務GMV同比增長111% … 去年5月，轉轉與找靚機的戰略合併后，除C2C全品類發展…

科技資訊 2021-07-05
科技資訊

歡聚時代去年營收同比增36.5%，全球移動端月活下滑20.4%

訪問原網址圖片來源：VCG 記者 | 徐詩琪美國當地時間3月15日，歡聚時代（NASDAQ:YY）發布2021年第四季度及全年未經審計的業績報告。財報顯示，2021年第四季度…

2022-03-16
騰訊再投500億元資金，助力共同富裕

這意味着四個月內，騰訊已連續規劃投入1000億元資金，充分發揮企業在“三次分配”中的主觀能動性，在增進社會福祉、助力共同富裕方面進行持續探索 … 8月17日召開的中央財…

科技資訊 2021-08-19
阿里升級家庭服務內測“蝸窩醬”平台

據Tech星球，阿里在近日內測了新的家庭服務平台“蝸窩醬” … 從支付寶頁面可以發現，“蝸窩醬”的服務主要由阿里此前推出的家庭服務平台勤鴿提供 … IT之家…

科技資訊 2021-07-19
瑞為技術完成數億元D輪融資

訪問原網址創業邦從媒體獲悉，近日，瑞為技術宣布完成數億元人民幣D輪融資，此次融資由招商局資本和上海機場旗下泓宇資本聯合領投，高略資本、景泰投資跟投，原股東賽富資本繼續加碼，湖濱資…

科技資訊 2022-08-18
華為公布評估女性情緒方法專利：通過獲取生理周期數據實現

華為技術有限公司公布“一種評估女性情緒的方法及相關裝置、設備”專利 … 此前，10月13日，華為針對女性用戶，公開了一項輔助化妝方法、終端設備、存儲介質及程序產品的專利…

科技資訊 2021-12-10
科技資訊

抖音回應世界盃4K直播涉嫌侵權：服務符合實際情況，有明確的合同依據

訪問原網址　　12月9日，卡塔爾世界盃巴西與克羅地亞之間對決即將開啟，而作為國內世界盃轉播的量大平台，咪咕將一紙非訴保全審查裁定書遞至抖音。　　當天，上海市浦東新區人民法院向北…

2022-12-09
淘寶上線訂單號碼保護功能

訪問原網址品玩8月24日訊，手機淘寶正式上線訂單號碼保護功能。用戶開通虛擬號碼保護功能后，訂單全流程不會再出現收貨人的真實手機號碼，而是以自動生成的虛擬號碼代替。據介紹，手機淘…

科技資訊 2022-08-24
科技資訊

微軟承認Win11 22H2存在遠程桌面問題，目前正在調查

訪問原網址　　IT之家 10 月 6 日消息，自從去年 Windows 11 發布以來，微軟就開始了對於 22H2 版本的開發和測試，經過近一年時間的完善，22H2 版本似乎仍存…

2022-10-06