【 圖片來源:IEEE所有者:iStockphoto 】
自2017年以來,研究人員一直使用AI神經(jīng)網(wǎng)絡(luò)來幫助設(shè)計更好更快的AI神經(jīng)網(wǎng)絡(luò)。
迄今為止,這種應(yīng)用在很大程度上是一種學(xué)術(shù)追求,主要是因為這種方法需要數(shù)萬個GPU hours。然而,下個月,麻省理工學(xué)院(MIT)的研究團隊將展示所謂的“神經(jīng)架構(gòu)搜索”算法,該算法可以將AI優(yōu)化AI的過程加快240倍或者更多。
優(yōu)化后的AI速度更快,精準(zhǔn)度更高。而這個新算法的出現(xiàn)將助力優(yōu)化后的AI廣泛應(yīng)用于圖像識別算法和其他相關(guān)應(yīng)用。
MIT電子工程和計算機科學(xué)的助教Song Han表示:“我們團隊在模型大小、推理延遲、準(zhǔn)確性和模型容量等多個方面做出了權(quán)衡。”他還補充說:“這些因素組成了一個巨大的設(shè)計空間。以前,人們都在設(shè)計基于人類啟發(fā)的神經(jīng)網(wǎng)絡(luò)。而新算法試圖將這種勞動密集型的、基于人類啟發(fā)的方式轉(zhuǎn)變?yōu)橐粋€基于學(xué)習(xí)的、基于AI的設(shè)計方式。就像AI可以學(xué)習(xí)下棋一樣,AI也可以學(xué)習(xí)設(shè)計一個神經(jīng)網(wǎng)絡(luò)。”
就像在圍棋和國際象棋中獲勝的AI程序教給大師們新策略一樣,AI優(yōu)化AI這一新的探索為設(shè)計AI神經(jīng)網(wǎng)絡(luò)提供了全新的方法。此類神經(jīng)網(wǎng)絡(luò)被稱為卷積神經(jīng)網(wǎng)絡(luò)(CNN),MIT團隊研究的新算法促進了這種神經(jīng)網(wǎng)絡(luò)的發(fā)展。CNN通常作為圖像識別程序的神經(jīng)網(wǎng)絡(luò)。除此之外,它在自然語言處理和藥物發(fā)現(xiàn)等領(lǐng)域也有所應(yīng)用。
MIT的Han指出,一旦他們團隊的算法建立起最優(yōu)的CNN,得到系統(tǒng)分類圖像的速度很可能是其他神經(jīng)架構(gòu)搜索構(gòu)建的AI的1.8倍。
Han說,團隊能夠以如此驚人的速度精確定位最優(yōu)的CNN設(shè)計,有三個重要的想法:
第一、他們減少了運行神經(jīng)架構(gòu)搜索的GPU內(nèi)存負(fù)載。一般來說,標(biāo)準(zhǔn)的神經(jīng)結(jié)構(gòu)搜索可以同時檢查網(wǎng)絡(luò)中神經(jīng)層之間所有可能的連接。然而,Han的團隊每次只在GPU的內(nèi)存中保存一條路徑。這個技巧可以在僅使用十分之一內(nèi)存空間的情況下,對參數(shù)空間進行完整的搜索,從而使他們的搜索覆蓋更多的網(wǎng)絡(luò)配置,而不會耗盡芯片上的空間。
第二、從已丟棄的神經(jīng)網(wǎng)絡(luò)搜索中刪除整個路徑,這明顯加快了神經(jīng)網(wǎng)絡(luò)搜索的速度。
第三、讓神經(jīng)網(wǎng)絡(luò)搜索意識到AI系統(tǒng)可能正在運行的硬件的延遲時間——無論是CPU還是GPU加速的移動平臺系統(tǒng)。
Han說,令人驚訝的是,關(guān)于一些圖像識別神經(jīng)網(wǎng)絡(luò)的傳統(tǒng)觀點是錯誤的。在某種意義上,AI網(wǎng)絡(luò)設(shè)計師在設(shè)計主要運行在GPU系統(tǒng)上的網(wǎng)絡(luò)時,他們的想法仍然停留在CPU時代。
CNN在其圖像識別算法中使用過濾器,這些算法是由3×3、5×5或7×7像素組成的正方形網(wǎng)格。一般來說,7x7的過濾器很少見,因為人們認(rèn)為,運行更多的3x3過濾器比運行單個7x7過濾器更快。
然而,Han說,經(jīng)過AI優(yōu)化的AI使用了相當(dāng)數(shù)量的7x7過濾器。他還表示,這是當(dāng)今大多數(shù)AI計算中GPU占主導(dǎo)地位的原因。“目前,我們已經(jīng)發(fā)現(xiàn)GPU上運行7x7更簡單,因為GPU有很大的并行度,”Han補充道,“而且調(diào)用一個大型內(nèi)核比調(diào)用幾個小型內(nèi)核更有效。”
在談到他的團隊的算法時,Han說:“它為人類工程師未來設(shè)計神經(jīng)網(wǎng)絡(luò)提供了良好的反饋。”然而,這并不意味著AI能夠構(gòu)建更強大的版本。
來源:雷鋒網(wǎng)
作者:Mark Anderson