小语种OCR程序开发

From 语言维基
Revision as of 07:18, 25 February 2021 by Wunshans (talk | contribs) (小语种OCR项目简介)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

语言维基(Langwiki)致力于计算机自然语言处理技术的开发。出于对于语言处理技术的执着追求,我们不仅努力掌握主流NLP算法,还针对NLP领域难以处理的小语种问题,进行人工智能算法的优化和研发。此项目提出一个新的OCR算法,使OCR系统的训练时间和所需的数据量大为减少,使计算机OCR技术可以有效的应用于小语种手写体以及古籍的识别和数字化。小语种OCR应用的领域包括满文识别、蒙古文识别、基于阿拉伯字母的老维文识别等。

研发计划

  • 数据获取
  • 算法研发
  • 模型训练
  • 应用整合