在人工智慧領域,谷歌相比對手走在了最前列。最近,該公司收購了多倫多大學一家神經網絡方面的初創公司DNNResearch。據悉,這家公司創始人是機器“深度學習”(Deep Learning)方面的領軍人物。此外,谷歌也公開討論過新型人工智慧技術,其中涉及了安卓手機上的語音搜索。谷歌在語音識別技術和計算機視覺精確度方面都創造了好幾項紀錄。
但是現在,微軟研究團隊表示,它們新開發出了一種新型人工智慧系統,名叫Adam。微軟在其近期組織的學術峰會上也是首次提到了這項新技術。微軟表示, Adam 相比此前的系統,在圖片識別方面精準度提升了一倍,尤其是在識別狗的品種或者蔬菜種類方面。“Adam 旨在探索人類大腦的奧秘。”微軟研究院院長彼得·李(Peter Lee)。
彼得·李宣稱,在ImageNet 22K標準測試中,Adam 神經網絡在圖片識別方面的表現要比谷歌Brain快。ImageNet 22K標準主要向谷歌在線服務(包括安卓設備語音識別和谷歌地圖等)提供了一種人工智慧測評計算方法。這項測試需要係統具備處理2.2萬張圖片數據能力。在Adam之前,只有少數人工智慧模型能夠處理如此規模龐大的數據輸入,其中就包括谷歌Brain。
不過,Adam並非憑藉“深度學習”算法來打敗谷歌,它的取勝之道是優化設備數據處理和調整系統與設備之間交流。微軟這項研究的奠基人為Trishul Chilimbi。有意思人的是,Trishul Chilimbi此前並非人工智慧領域專家,而是從事大規模計算機系統研究。
與其他“深度學習”系統類似,Adam運行於一組標準計算機服務器陣列,實際上它使用了微軟Azure 雲計算服務。“深度學習”旨在通過構建人腦神經網絡系統,更加緊密地模仿人類大腦工作方式。Adam在運行過程中需要大量的服務器,就如同人腦在運轉過程中需複雜的神經網絡一樣。兩者的區別在於,Adma利用的是一項名為“非同步”(asynchrony)技術。
隨著計算系統變得日益複雜,系統內各部分彼此之間在交流時變得越來越困難。不過,“非同步”技術能夠幫助解決這一問題。從根本上講, “非同步”將系統分為多個小部分,它們在“分享”各自運算和融合為一體前,彼此都是獨立運行的。問題在於,儘管這種技術能夠很好的應用在智慧型手機和筆記本電腦上(智慧型手機和筆記本電腦的內部計算分散在諸多不同芯片之上),但在包含了很多不同服務器的系統中(如神經網絡),這項技術的表現算不上成功。
但是,諸多研究人員以及包括谷歌在內的科技公司在過去幾年時間都在這一領域投入很多精力,而微軟正是憑藉華盛頓大學研發的“HOGWILD!”技術才占得先機。
“HOGWILD!”技術起初只是讓機器內部每個處理器能夠更為獨立的運行。不同芯片甚至都能夠寫入相同的存儲單元之中,彼此之間不會受到“重疊”影響。對於大部分系統來說,這種技術絕對不算什麼“好東西”,它們可能會導致數據衝突,因為一台設備覆蓋了其設備已完成數據編碼。但在某些情況下,這種技術運作良好。正如華盛頓大學研究員所展示的,“HOGWILD!”可以大幅提升單個設備的運算速度。微軟Adam在此基礎之上做了改進,應用了“HOGWILD!”技術。“我們比HOGWILD!更瘋狂,因為Adam的異步性更強。”Chilimbi表示。
儘管神經網絡分佈極其密集,且數據衝突風險很大,但這種方法行得通,是因為如果系統能夠避開數據衝突,這種“衝突”則會帶來一種相同的運算。
微軟表示,Adam可以幫助神經網絡更快速、更精確的來“訓練”設備對圖片的認知能力。讓人感到驚訝的是,Adam運行的竟然是傳統的計算機芯片,而非專門用於圖形處理的GPU。目前,很多“深度學習”系統使用的是GPU,就是為了避免數據通信瓶頸。但Chilimbi表示,微軟Adam選擇的是不同的路徑。
神經網絡依靠的是海量數據,它所處理的數據比標準計算機芯片 CPU要多得多。這也是為什麼它們需要分散到很多機器上的原因。作為另一種選擇,GPU可以來處理如此龐大的數據,且速度更快。但問題是,如果人工智慧系統數據未能完全與GPU或者運行於多個GPU之上的單一服務器匹配,系統將會崩潰。
另外,數據中心的通訊系統運行速度還不足以跟上GPU處理信息的速度,這將會導致數據傳輸堵塞。正因為如此,一些專家表示, GPU並非處理大型神經網絡系統的最佳選擇。
微軟將Adam描述為一種“奇幻”的系統,但某些深度學習領域專家則表示,微軟Adam系統的工作原理跟谷歌人工智慧並非完全不用。專家表示,如果不知道更多有關微軟如何優化神經網絡的細節,人們就很難知道微軟Adam團隊是如何來實現他們所宣稱的成果。
前谷歌Brain部門研究人員馬特·賽勒(Matt Zeiler)表示:“微軟的研究成果跟人類已發現的研究成功背道而馳,但這也是它的亮點之處。”他表示,如果微軟能夠增加更多設備,那Adam的識別準確率就會越高。
微軟彼特·李表示, Adam項目目前還處於初級階段。到目前為止,它只是在一款應用內部進行測試。測試結果顯示,當你使用手機拍照時,Adam能夠準確的識別照片上的物體。彼特·李使用Adam辨別出了狗的品種以及有毒的蟲子。微軟目前還未披露何時向大眾市場推出這款應用的計劃。不過,彼特·李表示,Adam未來肯定可以在電子商務、機器人,以及敏感度分析領域得到“重用”。微軟目前也正在討論研究,如果Adam運行在編程閘陣列(field-programmable arrays)或運行常規軟件處理器上時,它的效率是否會提高。事實上,微軟已經在測試這類芯片來提升Bing服務。
此外,彼特·李堅信,Adam將可以成為真正的人工智慧技術,這種智慧技術將跟人類處理語言、視覺和文本形態內容功能接近。但是,想要達到這種水平,微軟還需要做很多。自上世紀50年代,人類就已經開始朝這個目標邁進。但現在,可以肯定的是,我們離目標又近了一步。