最近,“新基建”真是火出了圈。尤其是3月4日,中央政治局常委會會議研究當前新冠肺炎疫情防控和穩(wěn)定經(jīng)濟社會運行重點工作,其中提出“加快5G網(wǎng)絡、數(shù)據(jù)中心等新型基礎設施建設進度”,為“新基建”摁下快進鍵。事實上,“新基建”不是一個新概念。2018年底召開的中央經(jīng)濟工作會議就明確了5G、人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等“新型基礎設施建設”的定位,隨后“加強新一代信息基礎設施建設”被寫入2019年政府工作報告。2020年開年的首次國務院常務會議也明確提及“新基建”。
在當前疫情防控和經(jīng)濟恢復的大背景下,由于在穩(wěn)定投資等方面的巨大作用,“新基建”進入一個加速推進的快車道。
華為,清華大學,曠世等人工智能企業(yè)開源,推動新基建發(fā)展3月20日,清華大學計算機系圖形實驗室開源AI框架計圖(Jittor),這是由中國科學界開源的首個AI框架。接著3月25日,曠視科技在線上發(fā)布曠視AI生產(chǎn)力平臺Brain++,同時,也宣布開源新一代AI生產(chǎn)力平臺Brain++的核心深度學習框架曠視天元(MegEngine)。緊接著28日,華為在2020年開發(fā)者大會中宣布正式開源一款支持端邊云全場景的深度學習訓練推理框架MindSpore。
其實,開源深度學習框架的重要性不言而喻。在傳統(tǒng)深度學習研發(fā)中,產(chǎn)品從原型到生產(chǎn)部署往往需要分開設計并調(diào)用訓練框架和推理框架兩種框架,這就導致模型在訓練和推理的轉(zhuǎn)換的過程中容易出現(xiàn)不明原因的性能或精度損失,需要開發(fā)者手工進行優(yōu)化,而算法在計算平臺部署的時候出現(xiàn)的各種問題也無法追溯。
針對以上問題,開源框架在設計之初就可以很好規(guī)避,它不僅可以降低AI開發(fā)門檻,還可以提升算法研發(fā)效率。
開源意義:技術開放與AI快速落地
那么,什么是開源深度學習框架?
在講述深度學習框架之前,首先先了解深度學習。
大多數(shù)人對于深度學習并不陌生,深度學習即Deep Learning,源于人工神經(jīng)網(wǎng)絡的研究,是機器學習的一個分支,它主要依賴于深度神經(jīng)元網(wǎng)絡,這種深度神經(jīng)元網(wǎng)絡就類似于人類的大腦,其學習過程也與人類極其相似,并且還可以用海量的數(shù)據(jù)和高級算法來提高自主學習與分析事物特征的能力。
而開源深度學習框架則是在深度學習初始階段基礎之上,由深度學習研究開發(fā)者將大量重復代碼寫成一個框架,然后放到網(wǎng)上讓所有其他研究開發(fā)者一起使用,主要是為了提高研究開發(fā)者的工作效率。
所以,“開源”就意味著開放自己的源代碼給別人查閱和使用,開發(fā)者可以將開源框架用在任何平臺,任何領域里。例如,如果有圖像數(shù)據(jù),就可以將開源框架用在圖像識別領域,如果有語音數(shù)據(jù)就可以將開源框架用在語音識別里等等。對于使用者而言,開源框架即拿即用。
早前,百度高級副總裁、AI技術平臺體系總負責人王海峰就表示:“開源、開放對于人工智能時代至關重要。首先,人工智能技術的發(fā)展需要所有人的協(xié)同推進,因此開源、開放就顯得特別重要;其次,人工智能技術會賦能各行各業(yè),開源、開放可以讓各行各業(yè)便捷地使用人工智能,讓社會各界都受益”。
曠視科技則把開源框架做了一個很好理解的比喻,他們向筆者稱,開源框架的作用就是為開發(fā)者提供一個良好的開發(fā)環(huán)境,如果把算法研發(fā)比做炒菜的過程,有無框架的區(qū)別就是,現(xiàn)在不需要廚師自己去造鍋、生火和洗菜,直接炒菜就可以了。
曠視科技天元開源框架
“開源框架就是讓研發(fā)人員獲得從數(shù)據(jù)到算法產(chǎn)業(yè)化的一攬子技術能力,不用重復造輪子也可以推進AI快速落地。”曠視科技表示。
對于開發(fā)者來說,“開源”最大的意義就在于其“技術共享與共建”。曠視科技介紹,“20世紀末期,Linux 系統(tǒng)為中國開發(fā)者打開了通往開源“集市”的大門,開源軟件為國產(chǎn)操作系統(tǒng)和國產(chǎn)軟件平臺從0到1開辟了基礎,同時中國的開發(fā)者們也為國際的開源社區(qū)做出了大量的貢獻”。
開源社區(qū)的發(fā)展壯大和成果共享,促使很多企業(yè)實現(xiàn)了快速的成長,同時也觸發(fā)了技術的加速迭代,和大批信息技術人才的涌現(xiàn)。
開源:利于企業(yè)生態(tài)化,加快新基建步伐
據(jù)筆者了解,在曠視、華為等發(fā)布開源之前,早在2016年,百度就開放了自主研發(fā)的開源PaddlePaddle深度學習平臺。據(jù)了解,百度PaddlePaddle是國內(nèi)最早的開源深度學習框架,并且打破了國產(chǎn)AI框架的開源。
除百度開源PaddlePaddle外,還有臉書Torch、蒙特利爾理工學院Theano、谷歌Tensorflow、騰訊Angel、阿里X-DeepLearning等。據(jù)悉,目前,全球市場被臉書Torch、谷歌Tensorflow占據(jù)了90%以上的開發(fā)者市場。
筆者查詢資料獲悉:此前,百度相關人士曾對媒體介紹道“深度學習框架就像智能時代的操作系統(tǒng),它向下連接芯片、大型計算機系統(tǒng),向上承接各種業(yè)務模型、行業(yè)應用,在生態(tài)中處于核心位置,如果一直基于海外谷歌和Facebook的框架,等著別人開放功能,會喪失率先打開未知領域的機會”。
同時,如果只偏重在上層應用、忽視了底層技術,國內(nèi)底層人才將空心化。
億歐智庫產(chǎn)業(yè)互聯(lián)網(wǎng)研究副總監(jiān)薄純敏也向筆者表示:“目前,國內(nèi)研發(fā)開源深度學習框架的企業(yè)比較少,而且也沒有非常核心的開源深度學習框架,市場幾乎被谷歌與臉書占據(jù)”。
她分析,國內(nèi)企業(yè)開發(fā)開源框架主要有兩個原因:第一、大公司想要通過開源框架建立企業(yè)生態(tài)化;第二、大公司建立完生態(tài)化后,希望通過技術或產(chǎn)品的開源,去獲取想要的數(shù)據(jù)資源,然后對這些數(shù)據(jù)進行分析與整合,再利用。
開源的本質(zhì)是開放,而目前開源是被大多數(shù)企業(yè)當作戰(zhàn)略來發(fā)展的,因為所有行業(yè)最終的目標就是通過開放實現(xiàn)生態(tài)化。就拿騰訊來說,第一步,它是通過開放來進行企業(yè)生態(tài)化;第二步,則是通過生態(tài)來給社會、企業(yè)等提供開源框架的解決方案。
除此之外,開源框架對初進入AI行業(yè)的初創(chuàng)公司而言,可以很好降低最開始的研究基礎門檻;對于本身就對AI技術比較感興趣的愛好者而言,他們不一定會商業(yè)化,他們可以會通過開源框架做一些小的系統(tǒng)研發(fā)。不僅如此,開源框架還可以構(gòu)建全社會技術共享的大生態(tài)。
在筆者看來,AI作為新基建中的一部分,開源深度學習框架進一步加速了AI技術落地,這對于最近大家比較關注的新基建項目也有很大促進作用,AI 加速落地在一定程度上,也可加快新型基礎設施建設的步伐。曠視科技表示:“通過開源、開放的方式,可以讓每一個AI開發(fā)者都有能力快速實現(xiàn)算法從0到1的創(chuàng)造,進而創(chuàng)造更大的價值”。
不過,從目前的現(xiàn)實情況來看,開源深度學習框架確實可以給AI行業(yè)技術落地帶來促進作用,但是也會導致一些底層技術研發(fā)的滯后。薄純敏稱,“這就好比現(xiàn)在大家用的手機一樣,大部分都局限于Android與IOS系統(tǒng),這些系統(tǒng)本身很好,大家都可以用,但是卻不利于行業(yè)底層技術的多元化發(fā)展”。
開源框架的使用也一樣,當開源框架開放后,大家就會拿來即用,會停留在一些開源框架中,而不去思考、不去進行更深層次的多元化開源底層技術研發(fā)。