语言维基:语音合成开发项目

来自语言维基
跳转至: 导航搜索

为了满足语言和音韵爱好者们关于合成方言和古汉语语音的需要,语言维基筹划开发开源的语音合成项目。最终目标是开发出使用IPA输入,能够合成汉语各方言和古汉语语音的开源产品和服务。有鉴于常见语音合成软件的局限性,我们将开发分为以下几个阶段,欢迎大家在Discussion栏提供反馈,或直接参与这个项目。

第一阶段:掌握基本语音合成技术并掌握语言定制技术 [编辑 | 编辑源代码]

软件工具:开源eSpeak-ng多语言语音合成器

目标:修复汉语普通话合成功能,并用于基于汉语拼音的语音合成(合成音不局限于当前汉字读音)

产品:增强的语言维基版 eSpeak-ng

第二阶段:定制新语言和方言发音方案 [编辑 | 编辑源代码]

软件工具:语言维基版 eSpeak-ng

目标:通过eSpeak-ng的定制功能,增加所需语言发音(主要为中国境内语言)

产品:语音线上合成器和在线服务API

第三阶段:与人工智能/深度学习专家共同将系统升级为深度语音合成 [编辑 | 编辑源代码]

软件工具:语言维基版 eSpeak-ng, TensorFlow

目标:实现和接近于人声的高端语音合成

产品:人声级在线语音合成界面和API

详细信息 [编辑 | 编辑源代码]

软件源码:https://github.com/nlpguyz/espeak-ng