“语言维基:NLP和语料库”的版本间的差异
来自语言维基
(增加中文分词、新词发现、词性标注内容) |
|||
第1行: | 第1行: | ||
+ | == 中文分词和新词发现 == | ||
+ | * 分词 | ||
+ | ** [https://cloud.tencent.com/developer/article/1373073 入门科普:一文看懂NLP和中文分词算法(附代码举例)] | ||
+ | ** [https://blog.csdn.net/gdkyxy2013/article/details/84873428 中文分词的算法与实现(结巴分词)] | ||
+ | * 新词发现 | ||
+ | ** [https://zhuanlan.zhihu.com/p/80385615 “新词发现”算法探讨与优化-SmoothNLP] | ||
+ | ** [http://history.programmer.com.cn/12276 基于大规模语料的新词发现算法] | ||
+ | |||
+ | == 中文词性标注 == | ||
+ | * https://chinesenlp.xyz/zh/docs/pos_tagging.html | ||
+ | |||
== 语法分析 == | == 语法分析 == | ||
2021年3月24日 (三) 02:38的版本
中文分词和新词发现
中文词性标注
语法分析
Universal Dependencies
网站 http://universaldependencies.org
语音合成
相关教程
Spoken Language Processing: A Guide to Theory, Algorithm and System Development Chapter 16 (PDF)
软件介绍
espeakedit音素编辑程序 中文使用方法
理论研究
开放数据集下载
简单汉字语音数据集 下载 (43MB)