语言维基:人工智能技術研發公告
本站研發團隊在人工智能、深度學習、自然語言處理等領域,進行廣泛的前沿創新研究。部分研究處於世界領先水平,您可以在此了解部分項目的研發進展。您也可以與我們聯繫,諮詢部分技術詳細資料、合作和授權。
- 語言處理方面的基礎算法研發
- RNN和LSTM的升級和優化。我們掌握的深度學習模型與技術,優於現有biLSTM、注意力機制LSTM、Transformer等。語音識別、機器翻譯應用潛能,優於百度、谷歌、訊飛的現有系統。
- 研發下一代可解釋AI核心技術
- 世界首創頂尖語義學習算法研究
- 優於目前計算語言學領域的語法分析、語義嵌入(word embedding)、GPT-3等前沿方法。研發出下一代的語義學習算法,可以更高效、穩定的處理自然語言語義。可以賦能機器人對話、自動翻譯、自動問題回答、商業諮詢等領域。
- 包含豐富的模糊語義邏輯能力,可進行自然語言和世界知識級別的邏輯推理
- NLP技術開發和應用
- 小語種語音、文字識別。運用最前沿技術,填補小語種處理的空白。正在研發滿文文字識別(OCR)、滿語和維吾爾語機器翻譯、語音合成與識別等。
- 漢字識別新算法
- 正在研發優於CNN的漢字識別算法,取代第一代深度學習技術。
- 超越深度學習的計算機視覺技術
- 語言是對於外在世界和自身思想表達,我們提供與先進的語言技術匹配的計算機視覺技術。2012年興起的深度學習的計算機視覺能力,並未與自然語言完美的連接,以至於很多視覺語言任務(例如圖像轉標題)都不能達到滿意的準確率和實用性。但是,我們在視覺領域,極大的超越了深度學習的局限性,不但性能上要超越ResNet, EfficientDet, YoloV5和ViT,而且提供了視覺場景的豐富的語義分割和語義關係識別。
技術估值
- 目前處於初創階段。預期5年內估值目標價:1億-100億美金(對標百度、谷歌)。跨代技術可以取代現有語言處理類技術領航者,搜索引擎、對話系統等。
2021年語言維基人工智能/機器學習基礎算法 Edit
技術項目 | 基礎研究 | 應用研究 | 研究階段 | 性能 | 性能預期 | 公布日期 | 對外授權 |
---|---|---|---|---|---|---|---|
TrueNorm | 是 | 可行性已驗證 | 專家組評審通過 | 獨家創新的深度神經網絡歸一化(normalization)算法,可以超越和取代 LayerNorm 和 BatchNorm | 3/1/2021 | 基礎研究不授權,應用可授權 | |
TrueNB | 是 | 可行性已驗證 | 專家組評審通過 | 獨家基於神經科學基礎研究創新的CNN改進架構,可大幅提升各種計算機視覺、自然語言任務性能 | 5/1/2021 | 基礎研究不授權,應用可授權 | |
TrueNTM | 是 | 研發中 V0.2 | 專家組評審通過 | 自研技術對標、超越谷歌 Neural Turing Machine、 Facebook 的 Memory Networks等神經圖靈機模型。優化的神經圖靈機可用於各類seq2seq任務、計算機數據結構操作、問題回答(QA)、語義判斷等任務。 | 6/1/2021 | 基礎研究不授權,應用可授權 | |
TrueRNN: G2P | 是 | 是 | 研發完成 | 高難度數據超過Transformer | 在複雜G2P任務中,超越 SOTA, Transformer | 9/14/2021 | 基礎研究不授權,應用可授權 |
TrueRNN: OCR | 是 | 是 | 可行性通過 | 基準數據性能優異 | 超越 SOTA | 9/25/2021 | 基礎研究不授權,應用可授權 |
TrueRNN: ASR | 是 | 是 | 可行性通過 | SOTA | 超越 SOTA | 10/3/2021 | 基礎研究不授權,應用可授權 |
TrueRNN: seq2seq | 是 | 是 | 研發中 | 超越SOTA。一種新的、性能更好的代替 Transformer 的 seq2seq 底層技術。 | 3/15/2022 | 基礎研究不授權,應用可授權 | |
CuteNLU | 是 | 研發中 | SOTA | 實現 SOTA。一種基於現有 NLU 算法的易用語言理解框架。 | 可商業非商業授權 | ||
TrueSemantics | 是 | 研發中 | 語義相關任務(機器翻譯、意圖理解、問題回答)超越 LSA, BERT, GPT-3,實現通用人工智能的語義基礎 | ||||
NeoConvNet | 是 | 研發中 | 遠超所有CNN變體SOTA,展示計算機視覺的最佳實踐和精度 | 11/28/2021 | 基礎研究不授權,應用可授權 | ||
NeuroArchV | 是 | 是 | 研發階段 II | Layer I 研發完成 | 設計基於新型神經網絡模型的第五代計算機架構、基本操作和基本運算和存儲單元 | 12/20/2021 | 基礎研究暫不授權,應用可授權 |
多模態語義推理機 | 是 | 研發中 | 以正確的途徑實現通用人工智能,超越 OpenCOG, OpenNARS 等框架 | ||||
神經計算機ASIC設計 | 是 | 研發中 | 保護人工智能算法產權、加速邊緣計算、減少神經計算機能耗 | ||||
NeoVisionArch | 是 | 是 | 研發中 | 一種不同於 ConvNet 的深度神經視覺模型,採用新的 kernel 和基本運算,減少特徵密度和提升學習性能。 |
TrueRNN: 以 RNN, LSTM, GRU 為基礎的新一代序列學習、預測、轉換模型,在語音識別、語音合成、語言文本處理(陌生詞發音、機器翻譯、語言理解)等領域,通過對於特定領域數學模型的研發和創新,進一步提升當前 SOTA 性能。
NeoConvNet: 修正 ConvNet 自1980年 Fukushima 的原型以及 LeCun 的CNN一直存在的瓶頸,成為下一代深度學習視覺的主幹。自動駕駛的下一代視覺技術,自動駕駛行業的拯救者。
多模態語義推理機:具有符號運算模態和神經運算模態的計算機,同時處理多個信息輸入模態(視覺、語音、語義)等,同時具有傳統計算機優勢、神經計算機的學習和通用智能推理能力。