日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Mozilla基金會發(fā)起的Common Voice項目,發(fā)布新版語音識別數(shù)據(jù)集

電子工程師 ? 來源:lp ? 2019-03-02 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3 月 1 日,由 Mozilla 基金會發(fā)起的 Common Voice 項目,發(fā)布新版語音識別數(shù)據(jù)集,包括來自 42000 名貢獻者,超過 1400 小時的語音樣本數(shù)據(jù),涵蓋包括英語、法語、德語、荷蘭語、漢語在內的 18 種語言。

(數(shù)據(jù)集鏈接:https://voice.mozilla.org/zh-CN/datasets)

Common Voice 項目可以集成到由 DeepSpeech,也就是基于 DeepSpeech 語音識別框架的一套語音轉文本的開源語音識別引擎。它不僅包括語音片段,還包括對訓練語音引擎有用的元數(shù)據(jù),如說話者的年齡、性別和口音,收集這些語音片段需要做大量的工作。目前 DeepSpeech 項目已在GitHub上獲得了 9418 個 Star,1674 個 fork。

(GitHub 傳送門:https://github.com/mozilla/DeepSpeech)

它目前是同類項目中最大的多語言數(shù)據(jù)集之一,Mozilla 聲稱,此次發(fā)布的數(shù)據(jù)集比八個月前公開發(fā)布的 Common Voice 語料庫要更加龐大,其中包含來自 20,000 名英語志愿者的 500 小時語音數(shù)據(jù)(400,000 條錄音),而且語料庫還將進一步擴充。該基金會表示,通過 Common Voice網(wǎng)站和移動應用,他們正在積極開展 70 種語言的數(shù)據(jù)收集工作。

2017 年 6 月,Mozilla 宣布推出 Project Common Voice 眾包計劃,旨在為語音識別應用構建開源數(shù)據(jù)集。他們邀請來自世界各地的志愿者通過網(wǎng)絡和移動應用貢獻語音記錄的文本片段,當然,他們會非常嚴格地保護項目貢獻者的隱私。

2017 年 11 月,Mozilla 基金會發(fā)布了第一批 Common Voice 英語數(shù)據(jù)集成果,該數(shù)據(jù)集包括大約 500 個小時的語音數(shù)據(jù),以及來自 20,000 個志愿者貢獻的 400,000 條錄音。2018 年 6 月,Mozilla開始收集法語、德語和威爾士語等 40 多種語種的眾包語音數(shù)據(jù)。

為了簡化流程,Mozilla 本周還推出了一款改進的 Common Voice web 工具,其可以對不同的語音剪輯進行更改,還增加了用于查看、重新錄制和跳過剪輯的新控件,一個可以快速切換儀表板的“說話”和“收聽”模式的開關,以及選擇退出語音會話的選項。此外,它正在推出新的配置文件功能,允許用戶跨語言跟蹤他們的語言進度和指標,并添加人口統(tǒng)計信息。

未來幾個月里,Mozilla 表示將嘗試不同的方法來增加數(shù)據(jù)收集的數(shù)量,提升數(shù)據(jù)質量,并且最終計劃使用部分錄音數(shù)據(jù)來開發(fā)語音產品。

語音技術將是一大科技技術革新,但可惜的是,目前操縱這場革新游戲的只有大型科技公司。

首先,科技巨頭一般都來自科技強國,而用于訓練機器的語音數(shù)據(jù)目前更偏向于英語、中文等一些特定的語言,在多樣性方面,顯然這并不適合全人類。

其次,像亞馬遜、谷歌、蘋果這樣的科技巨頭正在大力投資他們的智能助手,但由此產生的數(shù)據(jù)集并不對外開放,而像學生、創(chuàng)業(yè)公司和對構建語音設備感興趣的人只能訪問非常有限的數(shù)據(jù)集,而且可能還需要付費購買。

基于此,Mozilla 基金會認為,沒有足夠的數(shù)據(jù)開放給公眾使用,將會扼殺科技創(chuàng)新,開放語音數(shù)據(jù)集則可以讓更多人參與進來,讓任何人都可以自由地使用該數(shù)據(jù)集,將語音技術嵌入到各種應用和服務中。這類似于 OpenStreetMap這樣的開放眾包項目,該項目為開發(fā)人員提供開放且可自由使用的世界地圖。

在新的數(shù)據(jù)集發(fā)布后,外國網(wǎng)友們也對此進行了評價:

看到開放數(shù)據(jù)領域的創(chuàng)新真是太好了。最近有許多斷言認為,質量更高的 ML 數(shù)據(jù)將要比 ML 算法更重要,這么說是對的,特別是在語音識別等領域。然而,要趕上科技巨頭還有很長的路要走。因為在 15 年前,就有公司每年會處理 100 萬分鐘的標簽語音數(shù)據(jù)。

除非我們在這方面進行投資,否則老牌企業(yè)和新進入這個市場的企業(yè)之間的數(shù)據(jù)差距將繼續(xù)擴大。

另有網(wǎng)友花了時間驗證了一些語音,他在評論中表達了質疑稱:

至少在我能聽出來的范圍內,我沒有聽到任何句子說錯了。不過,我確實遇到了大量非常糟糕的樣本,以至于有些難以理解。比如口音重、有背景噪音或者非常安靜,而且他覺得一些“機械的”樣本是通過文本轉語音軟件生成的。所以 Common Voice 能提供優(yōu)質數(shù)據(jù)嗎?

還有網(wǎng)友拿開源數(shù)據(jù)集 LibriSpeech 做了對比:

ASR 訓練的有聲讀物是絕對不錯的。事實上,在 Common Voice 之前,最大的 ASR 公開訓練數(shù)據(jù)集是 LibriSpeech (http://www.openslr.org/12/)。同樣值得注意的是,Mozilla 的 DeepSpeech 模型的第一個版本使用 LibriSpeech 進行了訓練和測試。但是正如其他人提到的由于一些數(shù)據(jù)集不夠好,由 Common Voice 的數(shù)據(jù)集訓練的有聲讀物存在一些瑕疵。

但是 Common Voice 的目標不是取代 LibreSpeech 或其他開放數(shù)據(jù)集(如 TED 演講)作為訓練數(shù)據(jù)集,而是它們的有益補充。

總之,相較于目前已開源的其他語音數(shù)據(jù)集類型單一,數(shù)據(jù)量不足,數(shù)據(jù)雜亂的情況,雖然而 Common Voice 的數(shù)據(jù)集有不足,但在綜合多樣性、豐富性和質量方面都遙遙領先。它有望被全世界更大范圍內的開發(fā)者們所關注并受益,也將為語音技術的發(fā)展帶來不可估量的價值。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    39

    文章

    1825

    瀏覽量

    116255
  • 語音技術
    +關注

    關注

    2

    文章

    227

    瀏覽量

    21814
  • 數(shù)據(jù)集

    關注

    4

    文章

    1240

    瀏覽量

    26264

原文標題:1400小時開源語音數(shù)據(jù)集,你想要都在這兒

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    樹莓派基金會發(fā)布桌面操作系統(tǒng) PIXEL OS

    “YES”,樹莓派基金會發(fā)布了該操作系統(tǒng)的 x86 體驗版。這個操作系統(tǒng)對硬件的需求很低,Upton 說 PIXEL “將運行在像我的 ThinkPad X40 這樣的老機器上,它只要 512MB
    發(fā)表于 12-31 10:58

    國內唯一開源基金會“開放原子開源基金會“正式成立!

    日。 開放原子開源基金會是一個致力于開源產業(yè)的全球性非營利公益機構,業(yè)務范圍包括開源軟件、開源硬件、開源芯片與開源內容等,為各類開源項目提供中立的知識產權托管服務,以及戰(zhàn)略咨詢、法務咨詢、項目運營
    發(fā)表于 09-10 17:24

    開放原子開源基金會聯(lián)合發(fā)起“openDACS開源電路與系統(tǒng)設計自動化”開源項目

    10 月 16 日,由中國計算機學會集成電路設計專業(yè)組、中國計算機學會開源發(fā)展委員會、開放原子開源基金會聯(lián)合發(fā)起,開放原子開源基金會、中科院計算所、中科院微電子所、北京大學、復旦大學、武漢理工大學等
    發(fā)表于 06-24 15:17

    Mozilla使用開源Common Voice語音識別數(shù)據(jù)進行多語言操作

    Mozilla 宣布它正在使其眾包項目 Common Voice 支持更多語言。Common Voice
    的頭像 發(fā)表于 06-12 11:18 ?5528次閱讀

    OpenInfra發(fā)起“定向基金”計劃,為開源項目建立可持續(xù)社區(qū)

    OpenInfra基金會正式宣布發(fā)起“定向基金”計劃,為特定項目提供定向資助,采用“開放型商業(yè)模式”支持組織/機構圍繞特定開源基礎設施項目
    的頭像 發(fā)表于 06-07 16:37 ?1740次閱讀

    高質量手勢識別數(shù)據(jù)讓手勢識別算法更準確

    手勢識別數(shù)據(jù)是指用于測試、訓練和開發(fā)手勢識別算法的數(shù)據(jù)。隨著手勢識別技術的不斷發(fā)展,越來越多
    的頭像 發(fā)表于 04-14 17:31 ?2144次閱讀

    人臉識別數(shù)據(jù)應用和研究

    人臉識別數(shù)據(jù)是指包含大量人臉圖像和相應的文本描述的數(shù)據(jù)。這些數(shù)據(jù)可以用于訓練和測試人臉
    的頭像 發(fā)表于 04-21 16:19 ?1998次閱讀

    車內語音識別數(shù)據(jù)是驅動智能出行的新動力

    隨著人們對智能化出行的需求不斷增長,車內語音識別技術成為了汽車領域的重要創(chuàng)新。而這項技術的發(fā)展離不開車內語音識別數(shù)據(jù)的支持,它為智能車輛提供了更加便捷、智能的人機交互體驗。 車內
    的頭像 發(fā)表于 07-09 00:46 ?1166次閱讀

    車內語音識別數(shù)據(jù):駕駛體驗升級與智能出行的未來

    車內語音識別數(shù)據(jù)是指在汽車內部通過語音識別技術對駕駛員和乘客的語音指令進行處理和響應的數(shù)據(jù)。隨著
    的頭像 發(fā)表于 11-08 17:01 ?1173次閱讀

    車載語音識別數(shù)據(jù)的應用與挑戰(zhàn)

    隨著人工智能技術的迅猛發(fā)展,車載語音識別數(shù)據(jù)成為汽車科技領域的一項重要資源。車載語音識別技術將語音信號轉化為可操作的指令,使駕駛員能夠在駕駛
    的頭像 發(fā)表于 08-28 23:00 ?1295次閱讀

    車載語音識別數(shù)據(jù)的技術進展與前景

    近年來,隨著人工智能和語音識別技術的飛速發(fā)展,車載語音識別數(shù)據(jù)的應用前景愈加廣闊。車載語音識別
    的頭像 發(fā)表于 08-28 17:15 ?1341次閱讀

    車載語音識別數(shù)據(jù)的社會影響與未來展望

    隨著車載語音識別數(shù)據(jù)的技術不斷進步,其社會影響也變得愈發(fā)顯著。車載語音識別技術的普及不僅將改變駕駛員與車輛之間的互動方式,還將深刻影響交通安全、用戶體驗以及出行方式。
    的頭像 發(fā)表于 08-28 16:55 ?1153次閱讀

    車內語音識別數(shù)據(jù)在智能駕駛中的應用與挑戰(zhàn)

    一、引言 隨著智能駕駛技術的不斷發(fā)展,車內語音識別數(shù)據(jù)在智能駕駛中的應用越來越廣泛。車內語音識別技術為駕駛員提供了更加便捷和安全的駕駛體驗,同時也為智能駕駛系統(tǒng)的智能化和個性化提供了有
    的頭像 發(fā)表于 01-26 18:14 ?2156次閱讀

    車內語音識別數(shù)據(jù)在智能駕駛中的價值與應用

    車內語音識別數(shù)據(jù)在智能駕駛中的價值與應用 一、引言 隨著智能駕駛技術的不斷發(fā)展,車內語音識別數(shù)據(jù)在智能駕駛中的應用越來越廣泛。車內語音
    的頭像 發(fā)表于 02-19 11:47 ?1455次閱讀

    開放原子開源基金會發(fā)布150余個開源項目應用案例

    近日,在2025開放原子開源生態(tài)大會開幕式上,開放原子開源基金會發(fā)布了150余個開源項目應用案例,涵蓋中國南方電網(wǎng)、中國移動、京東集團、安貞醫(yī)院、南京郵電大學、螞蟻密算等100余家單位的實踐成果
    的頭像 發(fā)表于 07-28 17:10 ?1309次閱讀
    苍梧县| 武定县| 邢台县| 五家渠市| 开封市| 鄄城县| 汝南县| 嘉祥县| 昌平区| 永靖县| 九寨沟县| 贵港市| 象山县| 嘉黎县| 汶川县| 微博| 靖安县| 富民县| 崇文区| 平潭县| 武胜县| 莎车县| 探索| 满城县| 桦南县| 浪卡子县| 沙河市| 辽中县| 桦甸市| 福安市| 文山县| 钦州市| 虞城县| 蓬溪县| 麻城市| 如皋市| 新化县| 玉屏| 安达市| 沙洋县| 鄯善县|