语言维基:人工智能技术研发公告
From 语言维基
本站研发团队在人工智能、深度学习、自然语言处理等领域,进行广泛的前沿创新研究。部分研究处于世界领先水平,您可以在此了解部分项目的研发进展。您也可以与我们联系,咨询部分技术详细资料、合作和授权。
- 语言处理方面的基础算法研发
- RNN和LSTM的升级和优化。我们掌握的深度学习模型与技术,优于现有biLSTM、注意力机制LSTM、Transformer等。语音识别、机器翻译应用潜能,优于百度、谷歌、讯飞的现有系统。
- 研发下一代可解释AI核心技术
- 世界首创顶尖语义学习算法研究
- 优于目前计算语言学领域的语法分析、语义嵌入(word embedding)、GPT-3等前沿方法。研发出下一代的语义学习算法,可以更高效、稳定的处理自然语言语义。可以赋能机器人对话、自动翻译、自动问题回答、商业咨询等领域。
- 包含丰富的模糊语义逻辑能力,可进行自然语言和世界知识级别的逻辑推理
- NLP技术开发和应用
- 小语种语音、文字识别。运用最前沿技术,填补小语种处理的空白。正在研发满文文字识别(OCR)、满语和维吾尔语机器翻译、语音合成与识别等。
- 汉字识别新算法
- 正在研发优于CNN的汉字识别算法,取代第一代深度学习技术。
- 超越深度学习的计算机视觉技术
- 语言是对于外在世界和自身思想表达,我们提供与先进的语言技术匹配的计算机视觉技术。2012年兴起的深度学习的计算机视觉能力,并未与自然语言完美的连接,以至于很多视觉语言任务(例如图像转标题)都不能达到满意的准确率和实用性。但是,我们在视觉领域,极大的超越了深度学习的局限性,不但性能上要超越ResNet, EfficientDet, YoloV5和ViT,而且提供了视觉场景的丰富的语义分割和语义关系识别。
技术估值
- 目前处于初创阶段。预期5年内估值目标价:1亿-100亿美金(对标百度、谷歌)。跨代技术可以取代现有语言处理类技术领航者,搜索引擎、对话系统等。
2021年语言维基人工智能/机器学习基础算法 [edit | edit source]
技术项目 | 基础研究 | 应用研究 | 研究阶段 | 性能 | 性能预期 | 公布日期 | 对外授权 |
---|---|---|---|---|---|---|---|
TrueNorm | 是 | 可行性已验证 | 专家组评审通过 | 独家创新的深度神经网络归一化(normalization)算法,可以超越和取代 LayerNorm 和 BatchNorm | 3/1/2021 | 基础研究不授权,应用可授权 | |
TrueNB | 是 | 可行性已验证 | 专家组评审通过 | 独家基于神经科学基础研究创新的CNN改进架构,可大幅提升各种计算机视觉、自然语言任务性能 | 5/1/2021 | 基础研究不授权,应用可授权 | |
TrueNTM | 是 | 研发中 V0.2 | 专家组评审通过 | 自研技术对标、超越谷歌 Neural Turing Machine、 Facebook 的 Memory Networks等神经图灵机模型。优化的神经图灵机可用于各类seq2seq任务、计算机数据结构操作、问题回答(QA)、语义判断等任务。 | 6/1/2021 | 基础研究不授权,应用可授权 | |
TrueRNN: G2P | 是 | 是 | 研发完成 | 高难度数据超过Transformer | 在复杂G2P任务中,超越 SOTA, Transformer | 9/14/2021 | 基础研究不授权,应用可授权 |
TrueRNN: OCR | 是 | 是 | 可行性通过 | 基准数据性能优异 | 超越 SOTA | 9/25/2021 | 基础研究不授权,应用可授权 |
TrueRNN: ASR | 是 | 是 | 可行性通过 | SOTA | 超越 SOTA | 10/3/2021 | 基础研究不授权,应用可授权 |
TrueRNN: seq2seq | 是 | 是 | 研发中 | 超越SOTA。一种新的、性能更好的代替 Transformer 的 seq2seq 底层技术。 | 3/15/2022 | 基础研究不授权,应用可授权 | |
CuteNLU | 是 | 研发中 | SOTA | 实现 SOTA。一种基于现有 NLU 算法的易用语言理解框架。 | 可商业非商业授权 | ||
TrueSemantics | 是 | 研发中 | 语义相关任务(机器翻译、意图理解、问题回答)超越 LSA, BERT, GPT-3,实现通用人工智能的语义基础 | ||||
NeoConvNet | 是 | 研发中 | 远超所有CNN变体SOTA,展示计算机视觉的最佳实践和精度 | 11/28/2021 | 基础研究不授权,应用可授权 | ||
NeuroArchV | 是 | 是 | 研发阶段 II | Layer I 研发完成 | 设计基于新型神经网络模型的第五代计算机架构、基本操作和基本运算和存储单元 | 12/20/2021 | 基础研究暂不授权,应用可授权 |
多模态语义推理机 | 是 | 研发中 | 以正确的途径实现通用人工智能,超越 OpenCOG, OpenNARS 等框架 | ||||
神经计算机ASIC设计 | 是 | 研发中 | 保护人工智能算法产权、加速边缘计算、减少神经计算机能耗 | ||||
NeoVisionArch | 是 | 是 | 研发中 | 一种不同于 ConvNet 的深度神经视觉模型,采用新的 kernel 和基本运算,减少特征密度和提升学习性能。 |
TrueRNN: 以 RNN, LSTM, GRU 为基础的新一代序列学习、预测、转换模型,在语音识别、语音合成、语言文本处理(陌生词发音、机器翻译、语言理解)等领域,通过对于特定领域数学模型的研发和创新,进一步提升当前 SOTA 性能。
NeoConvNet: 修正 ConvNet 自1980年 Fukushima 的原型以及 LeCun 的CNN一直存在的瓶颈,成为下一代深度学习视觉的主干。自动驾驶的下一代视觉技术,自动驾驶行业的拯救者。
多模态语义推理机:具有符号运算模态和神经运算模态的计算机,同时处理多个信息输入模态(视觉、语音、语义)等,同时具有传统计算机优势、神经计算机的学习和通用智能推理能力。