產品特性
訓練推理一體
一套核心支撐訓練到推理,無需模型轉換,精度損失最小化。
前後處理可放入計算圖推理,訓練推理精確對齊,python C++ 不用寫兩遍。
traced module → megengine lite → megflow,從模型到高並發視頻流處理服務只需幾行python代碼。
超低硬體門檻
DTR 算法減少 75% 顯存占用,1080 也能訓 transformer。
自研 pushdown 記憶體分配算法,帶來最低的記憶體/顯存占用。
自動代碼裁剪可使部署檔案 binary size 下降 10 倍,有效降低推理硬體成本。
全平台高效推理
高效的推理性能,在各類 CPU、GPU 上均可享受到極致性能體驗。
自動 layout、kernel 算法選擇機制,輕鬆達到最優推理性能。
跨平台模型精度對齊,一套代碼走天下。
發展過程
2020年3月,MegEngine發布Alpha版本,正式向全球開發者開源;
2020年6月,MegEngine Beta版本正式發布,與小米的MACE深度學習推理框架、OPEN AI LAB(開放智慧型)的Tengine框架實現了深度集成。其中,MegEngine Beta版本迎來3項性能升級:ARM系列CPU支持、完善量化訓練和推理功能、推理功能最佳化;
2020年9月,MegEngine V1. 0 預覽版對外發布。新增5大技術特性:全新的Imperative Runtime、自動代碼裁剪功能、更多的國產硬體支持、10餘項推理側性能最佳化、基於MLIR的靜態子圖最佳化引擎;
2020年10月,曠視深度學習框架天元(MegEngine)1. 0正式版對外發布
2021年6月,曠視深度學習框架天元(MegEngine)V1.4版本對外發布,首次引入動態圖顯存最佳化技術,可以大幅降低顯存占用問題,幫助深度學習開發者節省硬體成本,用有限的硬體資源訓練出更大的模型。具體而言,開發者增加 2 行代碼,即可在相同顯存情況下,訓練 3 倍大的模型。
2021年9月,發布MegEngine Lite; 基於 MegEngine 的套用落地方案 Trace Module 正式開源。
2022年3月,發布MegEngine v1.8.2,CUDA 添加大卷積核的 direct conv 實現。
2022年9月,發布MegEngine v1.11.0,新增 CUDA INT4 支持。
配套工具
MegSpot:一款高效、專業、跨平台的圖片&視頻對比套用。
MegFlow:提供快速視覺套用落地流程。
MegPeak:處理器測評工具,可以測試目標處理器的指令的峰值頻寬、指令延遲、記憶體峰值頻寬以及任意指令組合峰值頻寬。
MegCC:面向推理的深度學習模型編譯器。
MgeConvert:適用於 MegEngine 模型的轉換器, 可將MegEngine導出的mge靜態圖模型或TracedModule模型轉換為第三方模型檔案。
BaseCls:極其全面的分類模型庫,提供了海量模型的訓練代碼和預訓練權重,全部算法均可以快速部署到硬體上。
社區生態
曠視推出了一系列活動推動開發者生態建設:
曠視的天元模型中心提供了大量的圖像分類、圖像檢測、圖像分割、關鍵點、自然語言處理、生成對抗網路等方面的基礎預訓練模型,讓開發者可以便捷上手,站在巨人的肩膀上開始自己的科研工作;
曠視推出了《深度學習實踐》和《天元深度學習框架入門》系列視頻課程,幫助開發者快速學習掌握天元使用方法。
曠視舉辦面向高校學生和全球AI青年人才的開源大賽和人才培養計畫活動。2020年9月,曠視舉辦的人工智慧開源大賽,吸引了包括清華大學、北京大學在內的全國49所高校和十餘家企業參加。
2021年6月,為推動我國農業人工智慧相關專業的教學改革,鼓勵研究、開發和利用人工智慧,加強農業人工智慧領域的產學研合作,為我國農業人工智慧創新創業人才的脫穎而出創造條件,由中國人工智慧學會、中國農業工程學會主辦,中國農業大學信息與電氣工程學院、中國人工智慧學會神經網路與計算智慧型專委會、曠視科技有限公司承辦的第一屆中國農業人工智慧創新創業大賽暨第三屆中國AI+創新創業大賽隆重舉行。
曠視發起了開發者培訓計畫、支持計畫、貢獻者計畫,吸引並鼓勵開發者參與開源社區的生態建設。