语言维基:語音合成開發項目
出自 语言维基
為了滿足語言和音韻愛好者們關於合成方言和古漢語語音的需要,語言維基籌劃開發開源的語音合成項目。最終目標是開發出使用IPA輸入,能夠合成漢語各方言和古漢語語音的開源產品和服務。有鑒於常見語音合成軟件的局限性,我們將開發分為以下幾個階段,歡迎大家在Discussion欄提供反饋,或直接參與這個項目。
第一階段:掌握基本語音合成技術並掌握語言定製技術 [編輯 | 編輯原始碼]
軟件工具:開源eSpeak-ng多語言語音合成器
目標:修復漢語普通話合成功能,並用於基於漢語拼音的語音合成(合成音不局限於當前漢字讀音)
產品:增強的語言維基版 eSpeak-ng
第二階段:定製新語言和方言發音方案 [編輯 | 編輯原始碼]
軟件工具:語言維基版 eSpeak-ng
目標:通過eSpeak-ng的定製功能,增加所需語言發音(主要為中國境內語言)
產品:語音線上合成器和在線服務API
第三階段:與人工智能/深度學習專家共同將系統升級為深度語音合成 [編輯 | 編輯原始碼]
軟件工具:語言維基版 eSpeak-ng, TensorFlow
目標:實現和接近於人聲的高端語音合成
產品:人聲級在線語音合成界面和API