剛剛,斯坦福全球AI報(bào)告正式發(fā)布。
從去年開始,斯坦福大學(xué)主導(dǎo)、來自MIT、OpenAI、哈佛、麥肯錫等機(jī)構(gòu)的多位專家教授,組建了一個(gè)小組,每年發(fā)布AIindex年度報(bào)告,全面追蹤人工智能的發(fā)展現(xiàn)狀和趨勢。
“我們用硬數(shù)據(jù)說話?!眻?bào)告的負(fù)責(zé)人、斯坦福大學(xué)教授、前任谷歌首席科學(xué)家YoavShoham談到這份最新的報(bào)告時(shí)表示。
今年的報(bào)告,從學(xué)術(shù)、工業(yè)、開源、政府等方面詳細(xì)介紹了人工智能發(fā)展的現(xiàn)狀,并且記錄了計(jì)算機(jī)視覺、自然語言理解等領(lǐng)域的技術(shù)進(jìn)展。
報(bào)告要點(diǎn):
一、美國AI綜合實(shí)力最強(qiáng)
美國的AI論文發(fā)布數(shù)量雖然不是第一,但美國學(xué)者論文被引用的次數(shù)卻是全球第一,比全球平均水平高出83%。
2018年美國AI創(chuàng)業(yè)公司的數(shù)量,比2015年增長2.1倍。而從2013年到2017年,美國AI初創(chuàng)企業(yè)獲得的融資額增長了4.5倍。均高于平均水平一倍以上。
二、中國AI追趕速度驚人
清華2017年學(xué)AI和機(jī)器學(xué)習(xí)的學(xué)生數(shù)量,是2010年16倍。
70%的AAAI論文來自美國或中國,兩國獲接收的論文數(shù)量相近,但中國提交的論文總量比美國多30%。
基于經(jīng)同行評議論文數(shù)據(jù)庫Scopus的數(shù)據(jù),2018年發(fā)布AI論文最多的地區(qū)是歐洲(28%)、中國(25%)和美國(17%)。
與2000相比,2016年中國AI學(xué)者論文被引用的次數(shù),提高了44%。
中國一年的機(jī)器人部署安裝量,從2012到現(xiàn)在增長了500%。ROS.org來自中國的訪問量,2017年比2012年增加了18倍。
三、全球AI發(fā)展提速但仍不均衡
2017年,全球ML人才需求已經(jīng)是2015年的35倍。
整體來說,自2016年以來,美國、加拿大、英國政府在國會(huì)/議會(huì)會(huì)議中對人工智能和機(jī)器學(xué)習(xí)的提及激增。
80%的AI教授是男性,統(tǒng)計(jì)數(shù)據(jù)來自UC伯克利、斯坦福、UIUC、CMU、UCLondon、牛津和蘇黎世聯(lián)邦理工學(xué)院。
美國AI工作崗位的應(yīng)聘者中71%為男性。
看過這份報(bào)告之后,人工智能大牛吳恩達(dá)總結(jié)了兩點(diǎn):1、AI正在快速發(fā)展,不管是學(xué)術(shù)界還是工業(yè)界都是如此。2、AI的發(fā)展仍不均衡,在多樣性、包容性方面仍需努力。
以下是這份報(bào)告的主要內(nèi)容:
AI論文情況分析
發(fā)表總量增長迅猛
從1996年到2017年,CS領(lǐng)域的年發(fā)表論文增長了約五倍(6x),AI領(lǐng)域的年發(fā)表論文增長了約七倍(8x)。對比一下,所有學(xué)科的年發(fā)表論文總量增長了不到兩倍(
劃重點(diǎn),AI論文的年發(fā)表量,比CS論文增長要快。
各地區(qū)AI論文發(fā)表情況
2017年,Scopus上面的AI論文,有83%來自美國以外的地方。具體數(shù)據(jù)是,28%來自歐洲,25%來自中國,17%來自美國。
從2007年到2017年,中國的年發(fā)表AI論文數(shù)增長了150%。
細(xì)分領(lǐng)域論文發(fā)表情況
2017年發(fā)表的AI論文中,有56%來自機(jī)器學(xué)習(xí)與概率推理這一研究方向。
對比一下,2010年發(fā)表的AI論文,只有28%來自這個(gè)方向。
另外,圖表里顯示的大部分研究方向,在2014-2017年間,復(fù)合年均增長率(CAGR)比2010-2014年要高。
比如,神經(jīng)網(wǎng)絡(luò)這一方向的論文發(fā)表數(shù)量,2014-2017年之間,復(fù)合年均增長率達(dá)到37%(如圖中紅色曲線),最為突出。
做個(gè)對比,在2010-2014年之間,神經(jīng)網(wǎng)絡(luò)論文發(fā)表數(shù),復(fù)合年均增長率僅有3%。
arXiv論文
自2010年以來,arXiv論文總體呈現(xiàn)迅速增長,從2010年發(fā)布的1,073篇,到2017年發(fā)布的13,325篇,增長超過11倍(12x)。許多細(xì)分領(lǐng)域也呈現(xiàn)增長。
這表示,論文作者們傾向于把自己的研究成果傳播出去,不論是經(jīng)過同行評審還是在AI會(huì)議上發(fā)表的論文。這也體現(xiàn)了,AI這個(gè)領(lǐng)域競爭激烈的特質(zhì)。
在細(xì)分領(lǐng)域中,計(jì)算機(jī)視覺(CV)是自2014年起增長最快的一個(gè)(上圖藍(lán)色曲線),從1,099篇增長到2017年的4,895篇,漲幅近400%。
AI論文引用量
FWCI是領(lǐng)域權(quán)重引用影響系數(shù),可以用來衡量論文的影響力。
報(bào)告重新定義了一種“改裝版”(Re-based)的FWCI,不按地區(qū),而按世界平均值,來計(jì)算影響力。
在這個(gè)標(biāo)準(zhǔn)之下,雖然歐洲發(fā)表的AI論文數(shù)高于中國和美國,不過論文影響力曲線比較平緩;相比之下,中國發(fā)表的論文影響力增長劇烈:與2000年相比,2016年平均每位中國AI論文作者的引用率增長了44%。
不過在這方面,美國依然全球領(lǐng)先,美國AI論文作者的平均引用率,比世界平均值高出83%。
AAAI論文
AAAI2018,提交論文,中美占70%,中選論文,中美占67%。
中國的論文提交數(shù)高出美國約1/3,但二者中選論文數(shù)相差無幾,中國入選265篇,美國入選268篇。
高校AI課程注冊情況
AI和ML進(jìn)軍高校的速度提升了不少。
報(bào)告顯示,截止到2017年底,AI課程注冊人數(shù)是2012年的3.4倍,ML課程注冊人數(shù)是2012年的5倍。
其中,UC伯克利的ML課程的注冊人數(shù)增長最快,是2012年的6.8倍,但此數(shù)值較2016年增長速度有明顯下降。
報(bào)告進(jìn)一步統(tǒng)計(jì)了非美國地區(qū)院校AI+ML課程注冊人數(shù)的變化。結(jié)果顯示,清華是非美國院校外增長率最高的高校,幾乎是第二名多倫多大學(xué)的2倍。
縱向?qū)Ρ葋砜?,清華2017年AI+ML課程注冊人數(shù)是2010年的16倍。
學(xué)術(shù)會(huì)議熱度
在大型會(huì)議中,NeurIPS(曾用名NIPS)、CVPR和ICML,是參與人數(shù)最多的三大AI會(huì)議。自2012年以來,論參與人數(shù)的增長率,這三者也領(lǐng)先于其他會(huì)議。
NeurIPS和ICML參與人數(shù)增長最快:將2018年與2012年相比,NeuRIPS增長3.8倍(4.8x),ICML增長5.8倍(6.8x)。
上面討論的是大型會(huì)議,但小型會(huì)議的參與人數(shù)同樣有明顯的增長,甚至可以比大型會(huì)議的增長更加明顯。
這里最突出的是,ICLR2018的參會(huì)人數(shù)達(dá)到了2012年的20倍。
原因很可能是近年來,AI領(lǐng)域越來越關(guān)注深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)了。
AI創(chuàng)業(yè)投資情況
從2015年1月到2018年1月,人工智能創(chuàng)業(yè)公司的數(shù)量增長到了原來的2.1倍,而所有活躍的創(chuàng)業(yè)公司增長到了原來的1.3倍。
大多數(shù)情況下,創(chuàng)業(yè)公司的增長都保持相對穩(wěn)定,而人工智能創(chuàng)業(yè)公司呈指數(shù)級增長。
在風(fēng)投資金方面,從2013年到2017年,人工智能領(lǐng)域的風(fēng)投資金增長到了原來的4.5倍,而所有的風(fēng)投資金只增長到了原來的2.08倍。這些數(shù)據(jù)都是年度數(shù)據(jù),不是逐年累積的。
圖表中有兩個(gè)高峰期,1997-2000年風(fēng)投資金的激增,對應(yīng)的是網(wǎng)絡(luò)泡沫時(shí)期。2014-2015年出現(xiàn)了一個(gè)較小的增長,因?yàn)楫?dāng)時(shí)正處于一個(gè)相對較大的經(jīng)濟(jì)增長時(shí)期。
人才需求
報(bào)告顯示,近幾年,社會(huì)需要的AI相關(guān)人才大幅度增加,目前對有ML技能的人才需求最大,其次是深度學(xué)習(xí)。
可以看出,ML人才需求也是這兩年增長速度最快的。
報(bào)告統(tǒng)計(jì),2017年,全球ML人才需求是2015年的35倍,從2016年到2017年的增幅尤為明顯。全球?qū)I人才的需求在2016年驟增。
專利
2014年,大約30%的人工智能專利發(fā)明人來自美國,其次是韓國和日本,各擁有16%。
在韓國和中國臺(tái)灣地區(qū),專利的增長速度較快。2014年人工智能專利的數(shù)量幾乎是2004年的5倍。
財(cái)報(bào)電話會(huì)議中提及AI和ML的次數(shù)
2015年,科技公司在財(cái)報(bào)電話會(huì)議中提及AI和ML的次數(shù)開始有所增加。
2016年,其他行業(yè)提及AI次數(shù)才開始增長。
相比之下,科技行業(yè)的公司提及AI和ML的次數(shù)遠(yuǎn)比其他行業(yè)多。
在財(cái)報(bào)電話會(huì)議中,除了科技行業(yè)之外,提及AI次數(shù)最多的公司,基本上分布在消費(fèi)、金融和醫(yī)療保健行業(yè)。
機(jī)器人安裝量
2012年到2017年,中國機(jī)器人年安裝量增長了500%,其他地區(qū),比如韓國和歐洲,分別增長了105%和122%。
在安裝量較小的地區(qū)中,中國臺(tái)灣比較突出,在2012-2017年增長最快。
開源框架GitHub標(biāo)星數(shù)
各框架的標(biāo)星數(shù)反映著他們在開發(fā)者群體中的流行程度。不過,因?yàn)殚_發(fā)者們?nèi)粘2粫?huì)“取關(guān)”GitHub項(xiàng)目,所以這些星星都是多年來積攢下的。
我們可以明顯發(fā)現(xiàn),TensorFlow的受歡迎程度在開發(fā)者中遙遙領(lǐng)先、穩(wěn)步增長。
排除了第一熱門,第二名和第三名分別是scikit-learn和BVLC/caffe。
TensorFlow官方力推的keras排到了第四,但近一年來幾無增長勢頭。
另外兩大熱門PyTorch和MXNet分別排到了第七和第六,尤其是PyTorch,作為一個(gè)年輕的框架,自2017年初發(fā)布以來至今,GitHub標(biāo)星數(shù)至少增長了4倍。獲取新用戶的勢頭很猛,不知道其中有多少被TensorFlow逼瘋的人類。
各類任務(wù)最新成績
這個(gè)部分分為CV和NLP兩塊,分別列舉了各主流任務(wù)從發(fā)展之初到現(xiàn)在的成績進(jìn)步情況。
ImageNet圖像識(shí)別準(zhǔn)確率
2017年是ImageNet比賽的最后一屆,2018年這項(xiàng)比賽就不再進(jìn)行了。不過,驗(yàn)證集依然有人在用。
藍(lán)色的線條為ImageNet挑戰(zhàn)賽歷年的成績變化,由于每年比賽所用的數(shù)據(jù)不同,旁邊多了一條黃色線條,是以ImageNet2012驗(yàn)證集為評價(jià)標(biāo)準(zhǔn)繪制的。
可以看出,到2015年,機(jī)器在圖像分類任務(wù)上的能力已經(jīng)明顯超越了人眼,而即使比賽不再繼續(xù),學(xué)術(shù)研究者依然在認(rèn)真推進(jìn)該任務(wù)的表現(xiàn)。
這也側(cè)面說明,如果一項(xiàng)工作有了明確的評價(jià)標(biāo)準(zhǔn)和固定的挑戰(zhàn)內(nèi)容,研究者們圍繞此競爭,更容易讓技術(shù)在該領(lǐng)域取得突破。
ImageNet訓(xùn)練速度
這張圖是訓(xùn)練ImageNet圖像分類神經(jīng)網(wǎng)絡(luò)所需時(shí)間的歷年變化(當(dāng)然,是買得起足夠計(jì)算資源的人和機(jī)構(gòu)所用的時(shí)長)。
從2017年6月的1小時(shí),到2018年11月的4分鐘,ImageNet圖像分類神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度提升了16倍,除了硬件方面的貢獻(xiàn),算法上的提升也不容小覷。
圖像分割COCO
ImageNet挑戰(zhàn)賽“退休”之后,CV領(lǐng)域的朋友們就把重點(diǎn)放在了微軟的COCO,挑戰(zhàn)語義分割和實(shí)例分割。
四年來,COCO數(shù)據(jù)集上圖像分割挑戰(zhàn)的精確度已經(jīng)提升了0.2,2018年的成績比2015提升了72%。不過,目前還沒有超過0.5,這一項(xiàng)還有充足的進(jìn)步空間。
另外值得一提的是,COCO比賽近年來占據(jù)冠軍位置的多是來自中國的公司,包括曠視、商湯等計(jì)算機(jī)視覺獨(dú)角獸日常包攬數(shù)個(gè)項(xiàng)目的冠軍。
語法分析(Parsing)
在確定句子結(jié)構(gòu)這種語法分析的任務(wù)上,2003年到2018年的15年間,AI的表現(xiàn)(F1Score得分)提升了將近10%。
機(jī)器翻譯
在機(jī)器翻譯任務(wù)上,報(bào)告拿英語-德語互相翻譯舉例,評估了AI模型在經(jīng)典機(jī)器翻譯評估算法BLEU標(biāo)準(zhǔn)中的表現(xiàn)。
報(bào)告顯示,2018年英語轉(zhuǎn)德語的BLEU評分是2008年的3.5倍,德語轉(zhuǎn)英語成績是2008年的2.5倍。
機(jī)器問答:AI2ReasoningChallenge(ARC)
在問答領(lǐng)域,AI表現(xiàn)進(jìn)步更明顯,可以按月計(jì)數(shù)了。
報(bào)告統(tǒng)計(jì)了2018年從四月到11月間,AI在ARC推理挑戰(zhàn)賽上成績的變化:簡單組得分從63%提升到69%,挑戰(zhàn)組得分從27%提升到42%。
這些,都僅是半年間的進(jìn)步。
機(jī)器問答:GLUE
同樣用于機(jī)器問答的GLUE基準(zhǔn)(GeneralLanguageUnderstandingevaluation)推出至今只有7個(gè)月的時(shí)間,但目前的表現(xiàn)已經(jīng)比半年前提升了90%。
GLUE的推出者、紐約大學(xué)助理教授SamBowman說,雖然圍繞GLUE的大型社區(qū)還沒有出現(xiàn),不過已經(jīng)有了像谷歌BERT這樣的代表性技術(shù)用了GLUE基準(zhǔn),面世一個(gè)月內(nèi)已經(jīng)被引用8次。在EMNLP會(huì)議中,GLUE時(shí)常被討論,可能會(huì)成為語言理解領(lǐng)域中的一個(gè)基準(zhǔn)線。
政府提及
整體來說,自2016年以來,美國、加拿大、英國政府在國會(huì)/議會(huì)會(huì)議中提及人工智能和機(jī)器學(xué)習(xí)的次數(shù)激增。
2016年之前,機(jī)器學(xué)習(xí)很少被提及,與人工智能相比,機(jī)器學(xué)習(xí)在總提及量中只占很小的一部分。