中國科學(xué)院院士、清華大學(xué)人工智能研究院院長張鈸(受訪者供圖)
當(dāng)前,由人工智能引領(lǐng)的新一輪科技革命和產(chǎn)業(yè)變革方興未艾。 在移動互聯(lián)網(wǎng)、大數(shù)據(jù)、超級計算、傳感網(wǎng)、腦科學(xué)等新理論新技術(shù)驅(qū)動下,人工智能呈現(xiàn)深度學(xué)習(xí)、跨界融合、人機(jī)協(xié)同、群智開放、自主操控等新特征,正在對經(jīng)濟(jì)發(fā)展、社會進(jìn)步、全球治理等方面產(chǎn)生重大而深遠(yuǎn)的影響。
近年來,中央在多次重要會議中對人工智能的重要性和發(fā)展前景進(jìn)行闡述。 加快發(fā)展新一代人工智能是我們贏得全球科技競爭主動權(quán)的重要戰(zhàn)略抓手。
當(dāng)前,我國人工智能產(chǎn)業(yè)發(fā)展處于什么階段? 如何看待當(dāng)前的發(fā)展態(tài)勢? 未來應(yīng)如何引導(dǎo)產(chǎn)業(yè)安全有序健康發(fā)展? 圍繞這些問題,近日,人民網(wǎng)科技頻道專訪了中國科學(xué)院院士、清華大學(xué)人工智能研究院院長張鈸。
張鈸表示,當(dāng)前中國在人工智能產(chǎn)業(yè)發(fā)展方面與國際先進(jìn)水平的差距并不是很大,但企業(yè)質(zhì)量有待與數(shù)量"看齊",在拓寬應(yīng)用場景、加強(qiáng)數(shù)據(jù)安全和算法安全等方面加大功夫。
他提出"第三代人工智能"的概念,并表示希望通過政策和法規(guī)之外的技術(shù)途徑解決人工智能的安全問題。
以下為專訪實(shí)錄 :
人民網(wǎng)科技:人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,加快發(fā)展新一代人工智能是事關(guān)我國能否抓住新一輪科技革命和產(chǎn)業(yè)變革機(jī)遇的戰(zhàn)略問題。 對于當(dāng)前我國人工智能產(chǎn)業(yè)發(fā)展進(jìn)程,您怎么看?
張鈸:業(yè)界普遍認(rèn)為,人工智能到目前為止經(jīng)歷了兩代。 "第一代人工智能"是知識驅(qū)動型的,也被稱作"符號主義";"第二代人工智能"是數(shù)據(jù)驅(qū)動型的,就是大家現(xiàn)在非常熟悉的"大數(shù)據(jù)""深度學(xué)習(xí)"。
人工智能最早于1956年起步于國外,而在中國則起步于1978年。 不過這60年中,前面40年左右,也就是"第一代人工智能",其進(jìn)展較小。 真正的進(jìn)展主要是在近20年里取得的,也就是"第二代人工智能"。 就目前來看,中國和國際上的發(fā)展差距并不是很大。
聚焦產(chǎn)業(yè)領(lǐng)域,我們所說的人工智能產(chǎn)業(yè)實(shí)際上分為兩個大類:一類是傳統(tǒng)信息產(chǎn)業(yè)的智能化,典型的就是如BAT、字節(jié)跳動這樣的互聯(lián)網(wǎng)公司。 他們在發(fā)展過程中積累了大量用戶,然后根據(jù)這些用戶數(shù)據(jù)建立了相應(yīng)的模型或畫像,也就是建立所謂的用戶"知識圖譜"。 以物品配送為例,由用戶位置、商家位置、以及騎手的位置等信息組成的幾千萬甚至上億的數(shù)據(jù),建立成庫,再通過人工智能的算法將其匹配、優(yōu)化,可以大大提升配送效率。 通過這種方式升級傳統(tǒng)產(chǎn)業(yè),已經(jīng)取得了非常大的效益。 在這方面,中國是做得不錯的。
人民網(wǎng)科技:人臉識別、智能音箱、智能客服...... 近年來,不僅越來越多的企業(yè)開始涉足人工智能,"人工智能"也成為高考考生最關(guān)注的專業(yè)方向之一。 在您看來,當(dāng)前人工智能是否"過熱"?
張鈸:據(jù)統(tǒng)計,全球10億美金估值以上的人工智能企業(yè)一共有40家,其中美國20家,中國15家。 從數(shù)量上來說,中國穩(wěn)處于第二位。 然而需要注意的是,這些企業(yè)雖然估值很高,但盈利能力還很有限,大部分可能還在虧本。 這是不容過度樂觀的。
我認(rèn)為,人工智能核心產(chǎn)業(yè)應(yīng)該是獨(dú)立于信息產(chǎn)業(yè)的,像智能交通、智慧醫(yī)療、智慧城市、自動駕駛這樣由人工智能技術(shù)發(fā)展出來的產(chǎn)業(yè)。 這方面的產(chǎn)業(yè)我們現(xiàn)在還處于發(fā)展初期。
人民網(wǎng)科技:最近,"戴頭盔看房"的新聞上了熱搜,也由此引發(fā)了人臉識別技術(shù)是否被濫用的討論。 我們的人工智能產(chǎn)業(yè)要想健康發(fā)展,還面臨著哪些挑戰(zhàn)? 應(yīng)該如何突破?
張鈸:剛才我提到,全世界人工智能的"明星"初創(chuàng)企業(yè),中國占了超過三分之一。 數(shù)量雖然多,但質(zhì)量仍有待提升。 這些企業(yè)除了盈利能力有限之外,還存在嚴(yán)重的"同質(zhì)化"現(xiàn)象。
為什么會出現(xiàn)這種現(xiàn)象? 首先,應(yīng)用場景有限。 除了人臉識別、安防等,別的領(lǐng)域不好用。 第二,不安全。 包括數(shù)據(jù)的不安全和算法的不安全。 我認(rèn)為這兩方面是當(dāng)前制約我們?nèi)斯ぶ悄墚a(chǎn)業(yè)發(fā)展的主要因素。
首先是數(shù)據(jù)的不安全。 我們知道,現(xiàn)在人工智能應(yīng)用效果很大程度上依賴數(shù)據(jù)質(zhì)量,但由此會帶來隱私泄漏等安全問題,如果解決不好隱私保護(hù)的問題,人工智能產(chǎn)業(yè)不可能健康發(fā)展。
第二是算法的不安全。 所謂算法的不安全,就是在一定條件下訓(xùn)練出來的模型,如果用到條件不大一樣的地方就行不通了。 術(shù)語也叫做算法對于測試環(huán)境的脆弱性,或者叫"不魯棒性"。 以無人駕駛為例,人工智能訓(xùn)練的時候不可能窮盡所有的情境,當(dāng)遇到新的突發(fā)事件便無法處理了。 同時,這種脆弱性還使得人工智能系統(tǒng)容易被攻擊、被欺騙。
對于人工智能的安全問題,我們不僅需要從政策、法規(guī)等方面進(jìn)行治理,也要盡可能地從技術(shù)層面來解決,這也是我們提出"第三代人工智能"的初衷。
所謂的"第三代人工智能",其發(fā)展路徑融合了第一代的知識驅(qū)動和第二代的數(shù)據(jù)驅(qū)動的人工智能,利用知識、數(shù)據(jù)、算法和算力4個要素,建立新的可解釋和魯棒的AI理論與方法,發(fā)展安全、可信、可靠和可擴(kuò)展的AI技術(shù)。
人民網(wǎng)科技:當(dāng)前,以深度學(xué)習(xí)為特征的"第二代人工智能"還處于方興未艾的階段,業(yè)界能否接受"第三代人工智能"的概念?
張鈸:人工智能經(jīng)歷了60多年的發(fā)展,現(xiàn)在看來,前面這些年的發(fā)展基本上還只是"序幕"。 盡管現(xiàn)在我們看到人工智能的各種應(yīng)用很多,但實(shí)際上用到的技術(shù)基本上還是傳統(tǒng)的信息處理,人工智能真正的問題還沒有被深入研究。
此前,大多數(shù)人還不太能接受"第三代人工智能"的概念,因為大家對"第二代人工智能"的期望特別高,覺得靠深度學(xué)習(xí),人工智能就可以不斷發(fā)展下去。 但后來發(fā)現(xiàn)并非如此。
我們是在2015年左右較早提出"第三代人工智能"這一觀點(diǎn)的,后來有國外學(xué)者在2018年也提出了類似的觀點(diǎn)。
人民網(wǎng)科技:"第三代人工智能"要從技術(shù)層面出發(fā)來解決人工智能的安全問題,具體該如何發(fā)展?
張鈸:發(fā)展"第三代人工智能",我們提出要建立可解釋和魯棒性人工智能理論;然后在此基礎(chǔ)上,發(fā)展安全、可信、可靠和可擴(kuò)展的人工智能技術(shù);最后,推動創(chuàng)新應(yīng)用。 也就是說,要創(chuàng)新應(yīng)用、發(fā)展產(chǎn)業(yè),必須先解決前面兩個問題。
具體來說,我們的方法是把知識和數(shù)據(jù)結(jié)合起來。 在這四、五年里,我們做了一些相關(guān)的工作,部分成果也已經(jīng)實(shí)現(xiàn)了產(chǎn)業(yè)化應(yīng)用。 最近通過我們孵化的企業(yè)RealAI推出的數(shù)據(jù)安全平臺RealSecure、算法安全平臺RealSafe,就是這些成果的直接體現(xiàn)。
需要指出的是,這些工作目前也只能在特定情況下"就事論事"地去解決一些安全性問題。 也就是說,人工智能的安全問題目前還沒有找到根本的解法,而且很可能會成為永恒的話題。 正所謂"道高一尺,魔高一丈"。 人工智能安全領(lǐng)域未來將會處于一種攻防不斷對抗的狀態(tài),因此算法也必須不斷更新。
發(fā)展"第三代人工智能"將是一個長期的過程。 我們現(xiàn)在還處于摸索階段。 但好在人工智能有個特點(diǎn),就是每個階段性成果都會有很大的應(yīng)用價值。 這也是為什么各國目前都很重視發(fā)展人工智能的重要原因之一。