攜手英偉達：Mozilla發布新版Common Voice Dataset

2021-07-31 11:44 • 熱點資訊

Common Voice 是一項旨在通過眾包的方式，來教授機器人如何像真人般講話的項目。Mozilla 基金會在幾年前發起的該項目，現已迎來與芯片巨頭英偉達的最新合作。其旨在允許志願者為世界上最大的開放式通用語音數據集貢獻一份力，從而推動語音合成與識別技術的發展。

（來自：Mozilla）

隨着新版公共語音數據集的發布，可知 Common Voice 語料庫已擁有超過 13000 小時的眾包語音數據。

與上一版相比，其新增了 4622 小時的內容，並且迎來了對 16 種語言的支持，包括：

巴薩語、斯洛伐克語、北庫爾德語、保加利亞語、哈薩克語、巴什基爾語、加利西亞語、維吾爾語、亞美尼亞語、白俄羅斯語、烏爾都語、瓜拉尼語、塞爾維亞語、烏茲別克語、阿塞拜疆語、以及豪薩語。

目前 Common Voice 已經收集了 76 種語言的公共語音數據庫，以及超過 18.2 萬份獨特的聲音，貢獻者社區在過去六個月內迎來了 25% 的增長。

（傳送門：NVIDIA）

語音時長 13905 小時，較上一版本增加了 4622 小時。排名前五的語言分別為英語（2630 小時）、基尼亞盧旺達語（2260 小時）、德語（1040 小時）、加泰羅尼亞語（920 小時）、以及世界語（840 小時）。

增長百分比最高的是泰語（從 12 小時到 250 小時、增長近 20 倍），盧干達語（從 8 小時到 80 小時、增長 9 倍），世界語（從 100 小時到 840 小時、增長超 7 倍），泰米爾語（從 24 小時到 220 小時、增長超 8 倍）。

感興趣的朋友，可移步至 Common Voice 官網（傳送門），為這個公共語音數據集貢獻自己的一份力量。或者前往 GitHub 存儲庫，獲取特定的元數據集和使用說明。

最後，作為 Mozilla 與 NVIDIA 的一個合作項目，相關訓練模型也可通過 Nvidia NeMo 免費獲得，後者是該公司打造的用於構建語音識別和對話模型的工具包。

common mozilla 語音

赞 (0)

洛杉磯一家醫院的兒童患者通過機器人在道奇體育場“跑壘”

上一篇 2021-07-31 11:44

高通侯明娟：驍龍終端已成為手遊玩家口袋裡的“遊戲機”

下一篇 2021-07-31 11:44

熱點資訊

拜登政府推動COVID-19疫苗激勵措施以使接種率超過70%

據外媒CNET報道，為了推動在7月4日前讓美國至少70%的成年人接種疫苗，美國總統喬·拜登周三宣布了6月為“全國行動月”（ National Month of Action）。作為…

2021-06-03
熱點資訊

NASA“航海民謠”唱響太陽物理學和太陽風

據外媒報道，日前，NASA戈達德太空飛行中心研究實驗室在經典歌曲《The Wellerman》的伴奏下展示了一段關於太陽物理學和太陽風的航海民謠。視頻中，一群保持社交距離的科學歌手…

2021-05-11
熱點資訊

Uber和Lyft將為受俄克拉荷馬州反墮胎法影響的司機支付罰金

據CNBC報道，Uber和Lyft將為根據俄克拉荷馬州反墮胎法因運送婦女到墮胎診所而被罰款的司機承擔法律費用。這兩家公司已經在之前通過類似法律的德克薩斯州宣布了類似計劃。根據俄克拉…

2022-05-01
熱點資訊

在線學習熱潮不減 Duolingo美國IPO估值超30億美元

北京時間7月20日早間消息，據報道，多鄰國公司（Duolingo Inc）周一表示，計劃在美國進行首次公開募股（IPO），其估值最高為34.1億美元。在疫情期間，這家語言學習應用程…

2021-07-20
熱點資訊

招聘啟事暗示英偉達正在為任天堂新一代Switch遊戲機設計芯片

有關任天堂新一代 Switch 遊戲機的傳聞，已經流傳相當長一段時間。而最近的英偉達泄密事件，可能證實了一款基於 Ampere GPU 架構、且支持 DLSS 深度學習超級採樣技術…

2022-05-14
熱點資訊

奇趣發現網友晒圖京都街道草坪酷似《馬里奧64》材質

任天堂旗下經典遊戲《馬里奧64》相信不少玩家都玩過，近日有玩家發推曬出京都街道謎之裝飾草坪引發熱議，網友驚呼酷似《馬里奧64》中的草坪材質，究竟為什麼會做成那個樣子，一起來了解下。…

2021-10-20
熱點資訊

英特爾再從AMD挖角資深圖形技術人員將領導Xe架構GPU的開發

英特爾高級副總裁、首席架構師兼架構、圖形與軟件部門總經理RajaKoduri是在2017年加入到英特爾團隊，肩負起打造高性能GPU的任務，這是過去很長一段時間裡英特爾的野心所在。隨…

2021-10-13
熱點資訊

美國中期選舉將近民主黨借TikTok拉票

8月10日消息，距離美國中期選舉還有不到100天的時間，民主黨正在為頗有影響的TikTok創作者配備數字工具，以通過互聯網向選民提供黨派贊助的內容。臨近選舉季，民主黨全國委員會 (…

2022-08-10
熱點資訊

24年未遇之奇景再等等 Intel旗艦級顯卡預計5-6月發布

按照官方說法，Intel Arc銳炫顯卡筆記本移動版一季度內上市，桌面版二季度，工作站則是三季度，但看起來，跳票又發生了！據權威媒體Igor’s LAB從多個消息源獲悉…

2022-03-08
熱點資訊

收費199元！《英雄聯盟》轉區系統開放：今晚6點開始每日限量

今天上午，《英雄聯盟》官方發布轉區系統重新開放公告，表示將於今日18：00開始恢復除教育網大區外的全部大區轉入轉出服務（點擊進入）。試運行階段轉區人數將限制在500人/日，並逐步擴…

2022-04-09