语言维基:人工智能技术研发公告

From 语言维基
Jump to: navigation, search

本站研发团队在人工智能、深度学习、自然语言处理等领域,进行广泛的前沿创新研究。部分研究处于世界领先水平,您可以在此了解部分项目的研发进展。您也可以与我们联系,咨询部分技术详细资料、合作和授权。

  • 语言处理方面的基础算法研发
    • RNN和LSTM的升级和优化。我们掌握的深度学习模型与技术,优于现有biLSTM、注意力机制LSTM、Transformer等。语音识别、机器翻译应用潜能,优于百度、谷歌、讯飞的现有系统。
    • 研发下一代可解释AI核心技术
  • 世界首创顶尖语义学习算法研究
    • 优于目前计算语言学领域的语法分析、语义嵌入(word embedding)、GPT-3等前沿方法。研发出下一代的语义学习算法,可以更高效、稳定的处理自然语言语义。可以赋能机器人对话、自动翻译、自动问题回答、商业咨询等领域。
    • 包含丰富的模糊语义逻辑能力,可进行自然语言和世界知识级别的逻辑推理
  • NLP技术开发和应用
    • 小语种语音、文字识别。运用最前沿技术,填补小语种处理的空白。正在研发满文文字识别(OCR)、满语和维吾尔语机器翻译、语音合成与识别等。
    • 汉字识别新算法
      • 正在研发优于CNN的汉字识别算法,取代第一代深度学习技术。
  • 超越深度学习的计算机视觉技术
    • 语言是对于外在世界和自身思想表达,我们提供与先进的语言技术匹配的计算机视觉技术。2012年兴起的深度学习的计算机视觉能力,并未与自然语言完美的连接,以至于很多视觉语言任务(例如图像转标题)都不能达到满意的准确率和实用性。但是,我们在视觉领域,极大的超越了深度学习的局限性,不但性能上要超越ResNet, EfficientDet, YoloV5和ViT,而且提供了视觉场景的丰富的语义分割和语义关系识别。

技术估值

  • 目前处于初创阶段。预期5年内估值目标价:1亿-100亿美金(对标百度、谷歌)。跨代技术可以取代现有语言处理类技术领航者,搜索引擎、对话系统等。

2021年语言维基人工智能/机器学习基础算法 [edit | edit source]

技术项目 基础研究 应用研究 研究阶段 性能 性能预期 公布日期 对外授权
TrueNorm 可行性已验证 专家组评审通过 独家创新的深度神经网络归一化(normalization)算法,可以超越和取代 LayerNorm 和 BatchNorm 3/1/2021 基础研究不授权,应用可授权
TrueNB 可行性已验证 专家组评审通过 独家基于神经科学基础研究创新的CNN改进架构,可大幅提升各种计算机视觉、自然语言任务性能 5/1/2021 基础研究不授权,应用可授权
TrueNTM 研发中 V0.2 专家组评审通过 自研技术对标、超越谷歌 Neural Turing Machine、 Facebook 的 Memory Networks等神经图灵机模型。优化的神经图灵机可用于各类seq2seq任务、计算机数据结构操作、问题回答(QA)、语义判断等任务。 6/1/2021 基础研究不授权,应用可授权
TrueRNN: G2P 研发完成 高难度数据超过Transformer 在复杂G2P任务中,超越 SOTA, Transformer 9/14/2021 基础研究不授权,应用可授权
TrueRNN: OCR 可行性通过 基准数据性能优异 超越 SOTA 9/25/2021 基础研究不授权,应用可授权
TrueRNN: ASR 可行性通过 SOTA 超越 SOTA 10/3/2021 基础研究不授权,应用可授权
TrueRNN: seq2seq 研发中 超越SOTA。一种新的、性能更好的代替 Transformer 的 seq2seq 底层技术。 3/15/2022 基础研究不授权,应用可授权
CuteNLU 研发中 SOTA 实现 SOTA。一种基于现有 NLU 算法的易用语言理解框架。 可商业非商业授权
TrueSemantics 研发中 语义相关任务(机器翻译、意图理解、问题回答)超越 LSA, BERT, GPT-3,实现通用人工智能的语义基础
NeoConvNet 研发中 远超所有CNN变体SOTA,展示计算机视觉的最佳实践和精度 11/28/2021 基础研究不授权,应用可授权
NeuroArchV 研发阶段 II Layer I 研发完成 设计基于新型神经网络模型的第五代计算机架构、基本操作和基本运算和存储单元 12/20/2021 基础研究暂不授权,应用可授权
多模态语义推理机 研发中 以正确的途径实现通用人工智能,超越 OpenCOG, OpenNARS 等框架
神经计算机ASIC设计 研发中 保护人工智能算法产权、加速边缘计算、减少神经计算机能耗
NeoVisionArch 研发中 一种不同于 ConvNet 的深度神经视觉模型,采用新的 kernel 和基本运算,减少特征密度和提升学习性能。

TrueRNN: 以 RNN, LSTM, GRU 为基础的新一代序列学习、预测、转换模型,在语音识别、语音合成、语言文本处理(陌生词发音、机器翻译、语言理解)等领域,通过对于特定领域数学模型的研发和创新,进一步提升当前 SOTA 性能。

NeoConvNet: 修正 ConvNet 自1980年 Fukushima 的原型以及 LeCun 的CNN一直存在的瓶颈,成为下一代深度学习视觉的主干。自动驾驶的下一代视觉技术,自动驾驶行业的拯救者。

多模态语义推理机:具有符号运算模态和神经运算模态的计算机,同时处理多个信息输入模态(视觉、语音、语义)等,同时具有传统计算机优势、神经计算机的学习和通用智能推理能力。