“语言维基:语音合成开发项目”的版本间的差异
来自语言维基
第21行: | 第21行: | ||
产品:人声级在线语音合成界面和API | 产品:人声级在线语音合成界面和API | ||
+ | |||
+ | === 详细信息 === | ||
+ | 软件源码:https://github.com/nlpguyz/espeak-ng |
2018年7月17日 (二) 11:48的最新版本
为了满足语言和音韵爱好者们关于合成方言和古汉语语音的需要,语言维基筹划开发开源的语音合成项目。最终目标是开发出使用IPA输入,能够合成汉语各方言和古汉语语音的开源产品和服务。有鉴于常见语音合成软件的局限性,我们将开发分为以下几个阶段,欢迎大家在Discussion栏提供反馈,或直接参与这个项目。
第一阶段:掌握基本语音合成技术并掌握语言定制技术 [编辑 | 编辑源代码]
软件工具:开源eSpeak-ng多语言语音合成器
目标:修复汉语普通话合成功能,并用于基于汉语拼音的语音合成(合成音不局限于当前汉字读音)
产品:增强的语言维基版 eSpeak-ng
第二阶段:定制新语言和方言发音方案 [编辑 | 编辑源代码]
软件工具:语言维基版 eSpeak-ng
目标:通过eSpeak-ng的定制功能,增加所需语言发音(主要为中国境内语言)
产品:语音线上合成器和在线服务API
第三阶段:与人工智能/深度学习专家共同将系统升级为深度语音合成 [编辑 | 编辑源代码]
软件工具:语言维基版 eSpeak-ng, TensorFlow
目标:实现和接近于人声的高端语音合成
产品:人声级在线语音合成界面和API