2018 年 10 月,華為在上海舉辦的全連接大會上公布了兩款芯片:昇騰 910 和昇騰 310,并表示它們將在 2019 年面世。
2019 年 8 月 23 日,華為在深圳總部舉辦的昇騰 910 AI 處理器和 MindSpore 計算框架發(fā)布會上,正式發(fā)布算力最強的 AI 處理器 Ascend 910(昇騰 910),同時推出了全場景 AI 計算框架 MindSpore,后者將在 2020 年第一季度全面開源。
華為公司輪值董事長徐直軍在發(fā)布會上表示:昇騰 910、MindSpore 的推出,標志著華為已完成全棧全場景 AI 解決方案(Portfolio)的構建,也標志著華為 AI 戰(zhàn)略的執(zhí)行進入新的階段。
更多優(yōu)質內容請關注微信公眾號“AI 前線”(ID:ai-front)
昇騰 910 正式推出,華為 AI 生態(tài)再進一步
華為副董事長徐直軍仍然負責本次發(fā)布,在會上他宣布:昇騰 910 芯片正式發(fā)布。這標志著華為 AI 生態(tài)又向前邁進了一大步。
去年在上海的全連接大會上,徐直軍確認了華為“造芯”的傳聞,并 宣布推出昇騰 910 與昇騰 310 兩款芯片,其中:
-
昇騰 910,是目前全球已發(fā)布的單芯片計算密度最大的 AI 芯片;
-
昇騰 310,是目前面向計算場景最強算力的 AI SoC。
得益于達芬奇架構針對 AI 運算特征的設計,這兩款芯片能夠大大加速華為 AI 在平安城市、互聯(lián)網、金融、運營商、交通、電力等各行業(yè)的應用。
彼時,徐直軍就在演講中表示:昇騰 910 是目前為止計算密度最大的單芯片,最大功耗為 350W,半精度為(FP 16)256 Tera FLOPS,比英偉達 V100 的 125 Tera FLOPS 還要高出近 1 倍。若集齊 1024 個昇騰 910,將會出現(xiàn)迄今為止全球最大的 AI 計算集群,性能也將達到 256 個 P,不管多復雜的模型都能輕松訓練。
在今天的發(fā)布會上,華為給出的最新測試結果表明:在算力方面,昇騰 910 完全達到了設計規(guī)格,即:半精度 (FP16) 算力達到 256 Tera-FLOPS,整數精度 (INT8) 算力達到 512 Tera-OPS,重要的是,達到規(guī)格算力所需功耗僅 310W,明顯低于設計規(guī)格的 350W。徐直軍表示:
昇騰 910 總體技術表現(xiàn)超出預期,作為算力最強 AI 處理器,當之無愧。與此同時,華為已經把昇騰 910 用于實際 AI 訓練任務,比如在典型的 ResNet50 網絡的訓練中,昇騰 910 與 MindSpore 配合,與現(xiàn)有主流訓練單卡配合 TensorFlow 相比,顯示出接近 2 倍的性能提升。
那么這樣一款算力超強的 AI 芯片售價會不會很高呢?徐直軍表示目前昇騰 91最終價格還沒有討論出來,但是肯定不會比英偉達貴。
當然,徐直軍也同步了昇騰 310 的最新進展:自發(fā)布以來,基于昇騰 310 芯片的產品和云服務獲得廣泛應用。其中,基于昇騰 310 的 MDC 和很多國內外主流車企在園區(qū)巴士、新能源車、自動駕駛等場景已經深入合作。基于昇騰 310 的 Atlas 系列板卡、服務器,與數十家伙伴在智慧交通、智慧電力等數十個行業(yè)落地行業(yè)解決方案。基于昇騰 310,華為云提供了圖像分析類服務、OCR 服務、視頻智能分析服務等云服務。
面向未來,針對不同的場景,包括邊緣計算、自動駕駛車載計算、訓練等場景,華為將持續(xù)投資,推出更多的 AI 處理器,面向全場景持續(xù)提供更充裕、更經濟、更適配的 AI 算力。
全場景 AI 框架 MindSpore 將于 2020 年 Q1 開源
除了昇騰 910,MindSpore 計算框架是今天的另一位主角。
MindSpore 是支持端、邊、云獨立的和協(xié)同的統(tǒng)一訓練和推理框架,作為華為 AI 全棧全場景解決方案的重要一環(huán),MindSpore 被認為是華為布局 AI 生態(tài)的一張王牌。
很多人一直認為華為的優(yōu)勢在于硬件,但其實,華為近些年來在軟件上的進步也不容小覷。2018 年全連接大會上,華為接連推出了一系列軟件解決方案,除了 MindSpore,還有:兼具最優(yōu)開發(fā)算力和算子性能的 CANN(芯片算子庫和高度自動化算子開發(fā)工具),提供全流程服務的 AI 開發(fā)平臺 ModelArts。
據介紹,全場景支持,是在隱私保護日漸重要的背景下,實現(xiàn) AI 無所不在越來越基礎的需求,也是 MindSpore 的重要特色。針對不同的運行環(huán)境,MindSpore 框架架構上支持可大可小,適應全場景獨立部署。
MindSpore 框架通過協(xié)同經過處理后的、不帶有隱私信息的梯度、模型信息,而不是數據本身,以此實現(xiàn)在保證用戶隱私數據保護的前提下跨場景協(xié)同。除了隱私保護,MindSpore 還將模型保護 Built-in 到 AI 框架中,實現(xiàn)模型的安全可信。在原生適應每個場景包括端,邊緣和云,并能夠按需協(xié)同的基礎上,通過實現(xiàn) AI 算法即代碼,使開發(fā)態(tài)變得更加友好,顯著減少模型開發(fā)時間。
以一個 NLP(自然語言處理)典型網絡為例,相比其他框架,用 MindSpore 可降低核心代碼量 20%,開發(fā)門檻大大降低,效率整體提升 50% 以上。通過 MindSpore 框架自身的技術創(chuàng)新及其與昇騰處理器協(xié)同優(yōu)化,有效克服 AI 計算的復雜性和算力的多樣性挑戰(zhàn),實現(xiàn)了運行態(tài)的高效,大大提高了計算性能。除了昇騰處理器,MindSpore 同時也支持 GPU、CPU 等其它處理器。
從去年華為在 HC 大會透露即將推出自研 AI 框架 MindSpore 以來,業(yè)內一直有人抱有疑問:已經有了 TensorFlow、PyTorch 等成熟的 AI 框架,華為為什么還要開發(fā)一個新的框架?對于這個問題,徐直軍在現(xiàn)場回應稱:“這是因為我們現(xiàn)在還沒有看到哪一個框架能夠真正做到支撐全場景,而華為 MindSpore 的目標就是成為這樣一個框架”。
下面是 MindSpore 的詳細技術特性:
-
MindSpore 秉承“AI 算法即代碼”理念,提供一系列關鍵技術,其中 MindSpore 自動微分采用 Source 2 Source 方式實現(xiàn),在性能和可編程性上,顯著優(yōu)于業(yè)界圖和運算符重載方式,能夠實現(xiàn)任意算子的微分表達和編譯優(yōu)化,同時實現(xiàn)反向算子自動生成,極大地方便模型開發(fā)。
-
隨著數據集和模型規(guī)模越來越大,模型并行將成為必然,手工切分的模型并行:門檻高、效率低、調優(yōu)難,而 MindSpore 只需定義單機模型即可實現(xiàn)多機混合并行運行,無需了解 AI 集群細節(jié)。MindSpore 調試同時支持靜態(tài)圖和動態(tài)圖,且可用一條語句實現(xiàn)無縫切換,使得調試簡單而高效。
-
在運行態(tài)友好方面,MindSpore 提供 Ascend Native 運行技術,能夠幫助昇騰芯片的算力達到最優(yōu)發(fā)揮。主從控制模式中,CPU 和 GPU 交互會引入內存和數據開銷,MindSpore 能夠在芯片上完成神經網絡模型訓練的所有控制和執(zhí)行,減少和主機 CPU 的交互時間,速度更快。已有的分布式訓練方案引入中心控制來尋找梯度同步點,MindSpore 實現(xiàn)了去中心化的分布式梯度聚合,完全消除控制開銷。軟硬件優(yōu)化為不同類型算子,映射為最佳的計算單元和數據布局,獲得最佳性能。
綜上所述,MindSpore 為數據科學家及研究人員提供了全新的工具,使理論探索和創(chuàng)新變得更加簡單高效。為了更好促進 AI 的應用,徐直軍宣布
MindSpore 將在 2020 年 Q1 開源,助力每一位開發(fā)者,促進 AI 產業(yè)生態(tài)發(fā)展。
針對開源生態(tài),想必大家都很好奇,華為打算如何吸引開發(fā)者并贏得開發(fā)者的信任。徐直軍直言,對于 MindSpore 來說,最大的挑戰(zhàn)就是能不能像其他框架一樣建立一個足夠好的生態(tài)。但對此徐直軍很樂觀,他認為華為有其優(yōu)勢所在,比如算力和開發(fā)引擎,開發(fā)者可以在華為 AI 開發(fā)引擎上自由開發(fā)相應的服務與應用,將算力和 MindSpore 計算框架相結合,開發(fā)者可以打造很多其他框架不可能做到的事情。
至此,華為想做的全棧全場景 AI 解決方案已經初步形成。它將助力開發(fā)者克服 AI 開發(fā)過程中遇到的困難,包括訓練耗時長、調試部署繁、開發(fā)效率低等等。對于進入 AI 時代的華為來說,開發(fā)者已經成為和行業(yè)合作伙伴同樣重要的角色。華為想要打造的是打通底層硬件到上層軟件應用、開發(fā)者與行業(yè)兩手抓的全方位 AI 生態(tài)體系。
正如徐直軍所說:只有把生態(tài)打造起來,華為的全棧全場景解決方案才有生命力。為此,華為曾在去年推出了“沃土 AI 開發(fā)者使能計劃”,旨在培養(yǎng)更多 AI 人才、提升開發(fā)者的 AI 能力。直白地說,就是讓更多技術人成為 AI 開發(fā)者,并加入華為的 AI 生態(tài)圈。
今年 7 月,華為圍繞鯤鵬技術體系,打造了集技術支持、知識共享和產業(yè)互助為一體的 鯤鵬社區(qū),與客戶、伙伴、開發(fā)者共建開放共贏的鯤鵬生態(tài),致力于加速鯤鵬的產業(yè)化進程。
華為在 AI 和云兩大領域都建立了自己的開發(fā)者生態(tài),一個更加開放、進步的生態(tài)圈似乎正在逐步成形。
8 月 9 日,在華為開發(fā)者大會 2019 的現(xiàn)場,鴻蒙操作系統(tǒng) 正式發(fā)布,據華為消費者業(yè)務 CEO 余承東介紹:這是全世界第一個基于微內核的全場景分布式 OS,通信效率秒殺現(xiàn)有一眾操作系統(tǒng)。并表示:如果未來某天安卓不可用,鴻蒙將隨時可以頂上。
鴻蒙給國產操作系統(tǒng)打了一針強心劑,但是華為面臨的情況仍然不容放松。
8 月 19 日,也就是本周一,美國商務部長威爾伯·羅斯 (Wilbur Ross) 表示:美國將允許美國公司在未來 90 天內,繼續(xù)與華為進行業(yè)務往來。這一決策確實部分緩解了對華為的技術封鎖,雖然目前華為“軟硬兼?zhèn)?rdquo;,但 90 天后該怎么做,仍然是個不小的挑戰(zhàn)。
正如華為創(chuàng)始人任正非所說:美方的做法對美國本土的公司也造成了深遠的影響。不少美國公司曾游說美國政府放緩對華為的限制,因為他們或多或少都與華為有著不同程度的合作關系,兩敗俱傷的結局一定不是大多數人希望看到的。
雖然面臨著不少困難,但是華為的未來仍然值得期待。今天,徐直軍在回答記者提問時再次強調:
外部的事件對于華為 AI 的發(fā)展沒有任何影響,目前一切都在按照計劃發(fā)展。隨著 5G 時代的到來,華為希望通過實現(xiàn)模型的閉環(huán)、實時更新,保證企業(yè) AI 應用始終處于最佳狀態(tài),并將 AI 技術與 5G、云、物聯(lián)網、邊緣計算、區(qū)塊鏈、大數據、數據庫等技術充分協(xié)同,發(fā)揮出更大的價值。
在答記者問環(huán)節(jié),徐直軍透露:華為正在開發(fā)自己的自動駕駛解決方案,同時,今年即將在上海舉辦的全連接大會上,將會有更加重磅的 AI 產品發(fā)布,AI 前線也將持續(xù)保持關注。
來源 | AI前線
作者 | 陳思、蔡芳芳