機器智能標志著一個新的計算時代的開始,這個時代需要一種從根本上不同于以往的處理器和軟件工具。這個迅速增長的新市場為Graphcore創(chuàng)造了打造一家大型全球科技公司的機會。
基于AI算法的更大需求
眾所周知,使用AI算法的公司通常會選擇使用GPU,而機器學習算法需要快速處理海量數(shù)據(jù),這使得企業(yè)對硬件的需求日益攀升。
與傳統(tǒng)處理器不同,Graphcore所設計的這款芯片是專為機器學習系統(tǒng)打造,這種芯片可以部署于各種機器學習的應用,例如聯(lián)網設備、自動駕駛、云計算以及機器人等領域,他們相信越來越多的企業(yè)將使用這些技術。
芯片產業(yè)鏈復雜,從技術研發(fā)、產品迭代及資金鏈需求角度而言,初創(chuàng)公司的成長挑戰(zhàn)都是巨大的。盡管如此,Graphcore還是迅速打開了行業(yè)知名度,原因之一離不開英國產業(yè)市場的特殊性。
在這樣的大環(huán)境下,Graphcore想要在AI硬件這個快速發(fā)展的行業(yè)中對標巨頭英特爾和英偉達,成長為一個英國本土大型上市企業(yè),并且不會出售給競爭對手。
根據(jù)IDC數(shù)據(jù)預測,認知和人工智能系統(tǒng)在2017年全球收入將達到125億美元,并預計在2020年增長到460億美元。投資者之所以紛紛押注芯片制造商,也是因為這項技術是這一增長趨勢背后最為重要基礎支持。
Graphcore的誕生和目標
與一般的新銳公司不同,Graphcore在人工智能學習的反應速度以及低能耗方面,其開發(fā)的產品要比目前市場上所有的圖像處理解決方案好10到100倍。
Graphcore成立于2016年,其總部位于英國布里斯托,兩位聯(lián)合創(chuàng)始人Nigel Toon、Simons Knowles此前還共同創(chuàng)立過市值4.35億美金的3G蜂窩芯片公司Icera,后賣給英偉達。
Graphcore頻受資本和學界青睞,主要來自于其核心產品一款名為IPU的AI芯片,與常見的IPU(ImageProcessingUnit,圖像處理器)不同,其IPU主要應用于無人駕駛汽車和云計算,專門為強大的機器習得系統(tǒng)設計。
此外還開發(fā)了一套可以幫助用戶無縫使用TensorFlow和MXNet等機器學習框架的接口,并為此提供了一個包含工具、驅動和應用庫的開源軟件框架Poplar。
總的來說,Graphcore認為先做Training然后做Inference的機制,未來一定會被Learning取代,即未來理想的人工智能應該能夠在部署之后還能保持持續(xù)的學習和進化。
市場看好融資多輪順暢
自創(chuàng)立以來,Graphcore就吸收了不少戰(zhàn)略投資方,其中A輪包括三星和博世,以及該輪融資中的寶馬和微軟。
在2017年初,Graphcore完成的3000萬美元融資就備受關注,因為這次投資方里包括了三星集團、德國汽車巨頭Bosch以及Arm創(chuàng)始人HermannHauser,還吸引了DeepMind聯(lián)合創(chuàng)始人DemisHassabis、Uber首席科學家ZoubinGhahramani以及AtomicoandDellTechnologiesCapital的投資。
2017年10月,Graphcore接受了紅杉資本5千萬美元的投資,這是最近成為風險投資新寵的AI芯片公司之一。
2018年12月,英國AI芯片公司Graphcore宣布完成新一輪2億美元融資,寶馬旗下風投公司iVentures和微軟作為戰(zhàn)略投資方加入,公司估值達到17億美元。這樣一來,其融資總額超過3億美元。
本輪融資為Graphcore的D輪融資,在最近一個月里敲定,新晉投資人和早期投資人各占一半金額。由其早期投資人Skype創(chuàng)始人NiklasZennstrm'sAtomico以及歐洲大型投資公司Sofina領投。寶馬iVentures和微軟、美利安全球投資者均是該輪融資的新晉投資方。
合理的推測是,博世和寶馬將為Graphcore推進自動駕駛和車聯(lián)網市場提供便利,而三星則是手機和語音助手領域的窗口,戴爾還將為其提供云計算芯片市場的DOE和渠道資源。
此外,羅伯特博世風險投資公司、C4風險投資公司、戴爾科技資本、以色列最大風投Pitango、三星和紅杉資本等跟投。
IPU的核心特征及難點
根據(jù)公開資料顯示,GraphcoreIPU的一些關鍵特征包括:
①同時支持Training和Inference。
②采用同構多核(many-core)架構,超過1000個獨立的處理器。每個處理器核的處理能力和具體支持的操作還不清楚。支持all-to-all的核間通信,采用Bulk Synchronous Parallel的同步計算模型。
③采用大量片上memory,不直接連接DRAM,這可能是他們的架構中最激進的一個選擇。
Graphcore IPU的多功能性,即支持多種機器學習技術的高效表現(xiàn)適合各種應用,無論是智能語音助手還是自動駕駛車輛。因為GraphcoreIPU的靈活性,能夠在數(shù)據(jù)中心和車輛中使用相同的處理器,以減少用戶的開發(fā)時間和工作量。
此外,Graphcore IPU的規(guī)模很大,通常包括數(shù)千到數(shù)百萬個頂點,這也意味著巨大的并行性。同時IPU是稀疏的,大多數(shù)頂點只連接到其他一小部分頂點,即低精度。
對于新架構,幾乎Graphcore運行神經網絡模型的所有計算機系統(tǒng),甚至包括Google的特殊硬件,都使用RAM存儲。從RAM中獲取神經網絡的權重需要耗費大量的計算資源,所以處理器可以幫忙解決。
在Graphcore的芯片上,權重存儲在處理器中的高速緩存中,而不是存儲在RAM中,也不需要移動,因此,事情就變得比較簡單了??赡芪覀儠玫揭粋€系統(tǒng),比如一萬億個權重。
與微軟戴爾的緊密合作
11月18日至22日,Graphcore在美國丹佛舉辦的SC19上展示與微軟最新聯(lián)合發(fā)布的微軟Azure上GraphcoreIPU相關產品與介紹,并提供相關的注冊信息。
另外,使用了Graphcore第一個IPU技術的戴爾易安信DSS8440也將首次對外展示。
微軟和Graphcore的開發(fā)人員使用BERT語言模型實現(xiàn)了最先進的性能和準確性,僅用一個IPU服務器系統(tǒng)和8個C2IPU處理器PCIe卡就可以在56個小時內訓練BERTbase。通過BERT推理,吞吐量提高了3倍,延遲改善了20%以上,從而可以更快地交付結果。
微軟和Graphcore已經緊密合作了兩年多。就在11月14日,Graphcore宣布了與微軟的具體合作內容,并正式發(fā)布MicrosoftAzure上Graphcore智能處理單元(IPU)的預覽版。這是重大公有云供應商首次提供Grapchore IPU,這些IPU從構建之初便旨在支持下一代機器學習。
其強大的并行處理能力實現(xiàn)了快速訓練模型并進行超低延時運行,這也使的Graphcore能夠在自然語言處理以及在理解自動駕駛視頻方面取得重大進展。因此,IPU強大的并行處理能力是我們區(qū)別于其他處理器的一個重要因素。
Graphcore還將與戴爾公司一起展示第一個IPU技術,該技術旨在滿足企業(yè)客戶構建本地機器智能計算的需求。在戴爾公司的DellEMCDSS8440是一款采用Graphcore技術的機器學習服務器。
該系統(tǒng)使用8個GraphcoreC2IPU處理器PCIe卡提供1.6PetaFlops的機器智能計算,每個卡有2個IPU處理器,所有卡都在標準4U機箱中與高速IPU-link技術連接。
這個全新的芯片速度會非??欤梢灾魏芏嗖煌纳窠浵到y(tǒng),擁有極高的擴展性。Arm聯(lián)合創(chuàng)始人甚至把Graphcore IPU成為芯片產業(yè)的第三次革命。
結尾:
隨著人工智能對芯片算力和帶寬的需求越來越高,現(xiàn)在大多數(shù)的ASIC AI芯片并不能滿足當下的需求。為此打造一個全新架構的AI芯片就成為迫切需求,這也正是Graphcore IPU正在做的事情。