中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

Meta先下手為強推出AI大模型MMS

2023-06-05 11:58
來源:澎湃新聞·澎湃號·湃客
字號

你懂幾國語言?據(jù)相關(guān)資料顯示,世界上一共有7000多種語言。但是,我們懂的可能就只有幾種或者幾十種。而目前的計算機語音識別技術(shù)所能覆蓋的則有100多種。這對于很多人來說,已經(jīng)是天文級的數(shù)字了。但Meta新開源的語言模型卻有著更大的突破。

自從和OpenAI、Google分道揚鑣之后,Meta便在開源大模型方向上越走越深。日前,Meta在GitHub上新開源的AI語言模型——Massively Multilingual Speech ( MMS,大規(guī)模多語種語音)可以識別4000多種口頭語言,是目前已知技術(shù)的40倍之多;還擴展了文本與語音之間的轉(zhuǎn)化技術(shù)的涵蓋范圍,從大約100種語言到1100多種。不僅如此,Meta開源的MMS最突出的特點是不僅支持ASR,還支持TTS,也就是說不僅可以語音轉(zhuǎn)文字,還可以文字轉(zhuǎn)語音。

Meta的官網(wǎng)blog上特別提到的Tatuyo語,一種只有幾百人在使用的小語種。雖然對于日常來說沒什么用,但是對于研究來說卻是一個很好的助手。那么,對于這種只有幾百人使用的小語種,如何才能找到并有效的提煉數(shù)據(jù)集呢?

Meta介紹說,他們在數(shù)千種語言的音頻數(shù)據(jù)收集過程中,使用了一種非常規(guī)的方法——宗教文本錄音。“我們轉(zhuǎn)向已被翻譯成許多不同語言的宗教文本(例如《圣經(jīng)》),并且其翻譯已被廣泛研究用于基于文本的語言翻譯研究。而且,這些譯本都有公開錄音,記錄了人們采用不同語言進行閱讀的情景?!?/p>

同時,Meta 在 MMS 模型的訓練中結(jié)合使用了公司的 “自監(jiān)督語音表示學習”模型 wav2vec 2.0,使機器能夠在不依賴標記訓練數(shù)據(jù)的情況下進行學習;有了它,就可以在更少的數(shù)據(jù)上訓練語音識別模型。

而對于此種方式可能導致的模型偏向性,Meta聲稱,“雖然這些數(shù)據(jù)來自特定領(lǐng)域,并且通常由男性閱讀;但我們的分析表明,我們的模型在男性和女性聲音方面表現(xiàn)同樣出色。雖然錄音的內(nèi)容是宗教的,但我們的分析表明,這并不會使模型偏向于產(chǎn)生更多的宗教語言?!?/p>

在使用1B參數(shù)的wav2vec 2.0模型對1100多種語言進行多語言語音識別模型的訓練的時候,研發(fā)人員發(fā)現(xiàn),隨著語言數(shù)量的增加,性能會有所下降,但非常輕微:從61種語言到1107種語言,字符錯誤率只增加約0.4%,但語言覆蓋率卻增加了17倍以上?!?/p>

就此問題,Meta還與OpenAI的Whisper做了詳細的對比,在數(shù)據(jù)上訓練的模型實現(xiàn)了一半的單詞錯誤率,并且訓練數(shù)據(jù)更少:Meta的訓練數(shù)據(jù)只有45k小時的標注數(shù)據(jù),要比Whisper少10倍,而語言支持卻多了10倍,這是一個大的提高。不過,Meta亦表示它的新模型并不完美,“例如,語音轉(zhuǎn)文本模型可能會錯誤轉(zhuǎn)錄選定的單詞或短語,這存在一定風險。但是,我們?nèi)匀幌嘈?,整個 AI 社區(qū)的協(xié)作對于負責任地開發(fā) AI 技術(shù)至關(guān)重要。”而目前,Meta 已經(jīng)開源了相關(guān)的模型和代碼,以便研究社區(qū)中的其他人可以在此工作基礎(chǔ)上進行構(gòu)建。

對于語音大模型的未來,Meta并沒有完全做好設(shè)想,但他們希望可以通過稱也做了設(shè)想,希望可以通過一個模型解決所有語言的多個語音任務(wù)?!拔覀?yōu)檎Z音識別、語音合成和語言識別訓練了不同的模型,但我們有理由相信在未來,一個模型將能夠完成所有這些任務(wù)以及更多任務(wù),從而帶來更好的整體性能”,Meta 說道。

放眼未來,Meta希望擴大MMS的覆蓋范圍以支持更多語言,并改進其對方言的處理。進一步打破世界各地人群之間的語言障礙,讓來自全球每個角落的人們都可以通過聲音正常交流。這是一個美好的愿景,但我們相信這一天的遲早是要到來的。

    本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋