【Inno Portal】收集廣東話錄音 訓練AI語音辨識

語音辨識是AI訓練的重要一環,但一直以來,廣東話都被忽視,很多智能語音助理都不支援廣東話,即使支援,辨識能力亦較低,不及英文或國語。採用開放方式運作的 Mozilla多年前推出 Mozilla 語音計畫「Common Voice」,機械人學會真人說話方式,去年開始收集廣東話,但反應不太踴躍。
「Common Voice」正在收集全球各地的真人發聲錄音,當中包括廣東話,用來製作各國語言的語音辨識系統,並會公開讓人免費下載,自行開發語音辨識、機器對話等人工智能系統。Mozilla又會創造一套稱為 Deep Speech 的開放原始碼語音辨識引擎。
不過,Mozilla Hong Kong日前在社交平台發文指,需要大量廣東話句子,多樣化的口音,但暫時只有4個多小時(截至5月29日)已經檢驗的錄音,數量遠遠未達到製作人工智能系統的要求,呼籲大家幫手。
大家只需到「Common Voice」網站點擊「語言」,選擇香港後,點擊「貢獻」,即可按照示以平常說話的方式講出屏幕上的句子,並錄下來,同時可以聆聽檢驗其他人錄制的句子是否正確。
筆者發現有不少有心人在錄制時不時出現讀錯字、讀漏字的情況,部分則因為句子太繞口發音有異。不過,聽不同人讀同一句子或類似句子,語氣、音調、速度都不一樣,其實都相當有趣,大家不妨試試。
錄製廣東話:https://voice.mozilla.org/zh-HK/speak
聆聽廣東話:https://voice.mozilla.org/zh-HK/listen
作者:小飛俠
[email protected]

要讓機器聽懂人說的話,先要做好語音辨識支援。(Alex Knight/unsplash)

「Common Voice」正在收集廣東話真人發聲錄音。