“语言维基:NLP和语料库”的版本间的差异
来自语言维基
第33行: | 第33行: | ||
[[espeakedit音素编辑程序]] 中文使用方法 | [[espeakedit音素编辑程序]] 中文使用方法 | ||
+ | |||
+ | == 甲骨文资料 == | ||
+ | 先秦史研究所 https://www.xianqin.org/ | ||
== 理论研究 == | == 理论研究 == |
2022年11月22日 (二) 15:49的最新版本
目录
中文分词和新词发现 [编辑 | 编辑源代码]
- 分词
- 新词发现
中文词性标注 [编辑 | 编辑源代码]
句法分析 [编辑 | 编辑源代码]
Universal Dependencies [编辑 | 编辑源代码]
语音识别 [编辑 | 编辑源代码]
- 多语言语音识别
- 多语言 IPA 识别前端
- 语言无关音素识别(输入语音、输出 IPA 近似 token)
- 多语言 IPA 转词汇语言模型
- IPA 近似 token 序列转各种语言词语
- 内置语言模型
- 多语言 IPA 识别前端
语音合成 [编辑 | 编辑源代码]
相关教程 [编辑 | 编辑源代码]
Spoken Language Processing: A Guide to Theory, Algorithm and System Development Chapter 16 (PDF)
软件介绍 [编辑 | 编辑源代码]
espeakedit音素编辑程序 中文使用方法
甲骨文资料 [编辑 | 编辑源代码]
先秦史研究所 https://www.xianqin.org/
理论研究 [编辑 | 编辑源代码]
开放数据集下载 [编辑 | 编辑源代码]
简单汉字语音数据集 下载 (43MB)
语言维基NLP技术和算法研发公布 [编辑 | 编辑源代码]
本站研发团队在人工智能、深度学习、自然语言处理等领域,进行广泛的前沿创新研究。部分研究处于世界领先水平,您可以在此了解部分项目的研发进展。您也可以与我们联系,咨询部分技术详细资料、合作和授权。
- 语言处理方面的基础算法研发
- RNN和LSTM的升级和优化。我们掌握的深度学习模型与技术,优于现有biLSTM、注意力机制LSTM、Transformer等。语音识别、机器翻译应用潜能,优于百度、谷歌、讯飞的现有系统。
- 研发下一代可解释AI核心技术
- 世界首创顶尖语义学习算法研究
- 优于目前计算语言学领域的语法分析、语义嵌入(word embedding)、GPT-3等前沿方法。研发出下一代的语义学习算法,可以更高效、稳定的处理自然语言语义。可以赋能机器人对话、自动翻译、自动问题回答、商业咨询等领域。
- NLP技术开发和应用
- 小语种语音、文字识别。运用最前沿技术,填补小语种处理的空白。正在研发满文文字识别(OCR)、满语和维吾尔语机器翻译、语音合成与识别等。
- 汉字识别新算法
- 正在研发优于CNN的汉字识别算法,取代第一代深度学习技术。
技术估值
- 创新技术组合估值目标价:1亿-100亿美金(对标百度、谷歌)。跨代技术可以取代现有语言处理类技术领航者,搜索引擎、对话系统等。