3月25日下午,中國人工智能領軍企業、新一代人工智能開源開放平臺OpenI啟智社區發起成員單位曠視科技舉辦線上發布會,正式宣布在OpenI開源新一代AI生產力平臺Brain++的核心深度學習框架曠視天元(MegEngine),成為全球首個將底層框架開源的人工智能企業。
天元的前身是曠視內部自用的算法訓練推理引擎MegEngine,由曠視3名實習生在2013年啟動研發,并與2014年正式完成上線。這款完全自研的深度學習框架支撐了曠視6年以來在國際AI競賽的出色表現,以及公司產品和業務的落地,目前服務于曠視研究院1400余名AI開發者。

圖:曠視聯合創始人兼CTO唐文斌
發布會上,曠視聯合創始人兼CTO唐文斌正式宣布將MegEngine的代碼開源,并指出這是一套訓練推理一體化、動靜態合一的工業級深度學習框架,中文名字叫做天元。

圖:曠視正式宣布開源自研深度學習框架天元
降低AI開發門檻提升算法研發效率
曠視是全球最早用深度學習方法開展人工智能商業化探索的科技企業,但由于早期AI 開發工具的匱乏,曠視靠自主研發,從 0 到 1 地解決了算法生產的問題。直播現場,天元開源項目負責人、曠視研究院高級技術總監田忠博從開發經驗中的幾個痛點入手,向開發者介紹了天元的核心優勢和特性。
比如傳統深度學習研發中,產品從原型到生產部署往往需要分開設計和調用訓練框架和推理框架兩種框架,這就導致模型在訓練和推理的轉換的過程中出現不明原因的性能或精度損失,需要開發者手工進行優化,而算法在計算平臺部署的時候出現各種問題也無法追溯。
天元框架在設計之初就避免了這樣的問題,通過訓練、推理一體化的機制省去模型轉換的過程,可直接將訓練后的模型進行推理,并保證跨設備的模型精度對齊,同時天元內置自動模型優化、簡化流程,減少因手工操作的機會,降低出錯概率。
除此之外,天元還配置了 Python 和 C++ 接口,支持動態圖、靜態圖一鍵轉換和混合編程,可使用高級編程語言進行圖優化和圖編譯。在運行時管理環節,天元具備執行流與調度器,采用動態、靜態內存分配并存的方式,并通過獨創的自動的亞線性內存管理優化器可以得到更好的內存優化效果;在底層設計上,天元的計算內核不僅兼容主流計算設備,且支持多機多卡和分布式訓練。而為了解決模型復現困難的問題,天元則支持 PyTorch Module 導入,可針對計算機視覺任務進行優化。
相比主流的開源深度學習框架,天元具有訓練推理一體化、動靜合一、兼容并包、靈活高效的顯性優勢,無論對于深度學習”老司機“,還是剛剛轉型AI開發者的用戶來說都非常友好,極大程度上降低了深度學習的門檻,提升了算法訓練和部署的效率。
國產深度學習框架開源勢在必行
對于開發者來說,開源最大的意義在于技術共享和共建的成就感。20世紀末期,Linux 系統為中國開發者打開了通往開源”集市“的大門,開源軟件為國產操作系統和國產軟件平臺的從 0 到 1 開辟了基礎,同時中國的開發者們也為國際的開源社區做出了大量的貢獻。開源社區的發展壯大和成果共享,促使很多企業實現了快速的成長,同時也觸發了技術的加速迭代,和大批信息技術人才的涌現。
近年來,人工智能、大數據、云計算、移動互聯、物聯網等領域呈現多點聯動的集群式創新態勢,不僅使以感知和智能計算為核心的弱人工智能出現規?;瘧玫膽B勢,同時也推動深度學習、計算機視覺等技術加速演進,顛覆性變革的人工智能新理論、新技術和新方法日新月異。因此,開源、開放國產自主可控的人工智能深度學習,也將成為各主體提升創新效率的基礎。

圖:天元開源項目負責人、曠視研究院高級技術總監田忠博
自2017年,人工智能首次被寫入全國政府工作報告以來,我國在人工智能相關的重大計劃方面已經有非常詳細的布局,并相繼有了不少重大成果,但在一些關鍵領域仍有一些短板。中國工程院院士、鵬城實驗室主任、新一代人工智能產業技術創新戰略聯盟(AITISA)理事長高文曾指出,基礎理論和原創算法、高端芯片和計算設備、開源開放平臺和核心人才是中國人工智能需要攻堅的方向。
為促進人工智能領域的協同創新,構建開源開放的技術鏈、創新鏈和生態鏈、推動人工智能產業健康快速發展及廣泛應用,新一代人工智能產業技術創新戰略聯盟組織產學研用通力協作,構建了共享開源軟件、開源硬件、開放數據的新一代人工智能開源開放平臺——OpenI啟智平臺。平臺成立至今,基于鵬城云腦等重大基礎建設工程及AITISA聯盟一體兩翼的工作部署,匯聚了鵬城實驗室、北京智源人工智能研究院、北京大學、國防科技大學、北航等頂尖科研院校及華為、百度、微眾銀行、曠視、商湯科技、小米、京東等人工智能領域領軍企業,培育并發布了OpenI章魚、OpenI珊瑚、啟智Trustie、啟智DL深度學習框架/RL強化學習框架、OpenI縱橫、OpenI海參、OpenI海藻等多個開源項目。
曠視作為OpenI啟智平臺發起單位之一,也是國家科技部授予的十五個人工智能開放創新平臺之 “圖像感知國家新一代人工智能開放創新平臺”。近日,OpenI技術委員會正式通過曠視Brian++.天元進入OpenI啟智社區的開源項目孵化管道。目前,曠視已在OpenI啟智社區和GitHub 上同步發布了天元 Alpha 版的35萬行源代碼,開發者也可以通過天元官方網站的在線深度學習工具免費調用算力、獲取最新數據集和訓練腳本,進行簡單訓練和試用。曠視為天元的開發者還準備了全球頂尖算法預訓練模型的模型中心ModelHub,支持開發者開箱即用。

圖:天元Alpha版的35萬行代碼已發布于 OpenI 和 GitHub
對于天元框架開源后的發展規劃,曠視透露將在技術貢獻者的幫助下,于6月份推出 Beta 版本。“也許下一代天元并不是由曠視的研發團隊做出來的,而是與你一起共創出來。我們希望能夠吸引到一些優秀的技術人員來給我們更好的建議,一起貢獻代碼、共建更好的深度學習框架。”唐文斌表示。
開源不僅是開發者們共享技術成果的方式,更是推進技術產業化的催化劑。此次曠視能夠把公司最核心的底層技術與全球開發者共享,體現了中國科技企業的責任與擔當。未來,讓我們一起期待曠視天元的表現,也期待此次開源能真正地激發市場的創造力,讓傳統產業和中小企業都能用上深度學習和人工智能技術,加速人工智能產業落地。
相關鏈接:
相關鏈接:
曠世AI生產力平臺Brain++官網:
https://brainpp.megvii.com/
天元MegEngine官網:
https://megengine.org.cn/
OpenI項目地址:https://www.www.cnjfsc.com/html/2020/Framework_0325/18.html
GitHub:https://github.com/MegEngine
鵬城匯智:https://code.ihub.org.cn/projects/1189