在全球抗擊新冠肺炎(Covid-19)疫情方面,各種各樣的高新科技都有望“大顯身手”,其中最突出的是自然語(yǔ)言處理技術(shù)。無(wú)論是在抗疫一線,還是在社區(qū)管控、疫苗研發(fā)等大后方,自然語(yǔ)言處理技術(shù)發(fā)揮的作用都不可忽視。目前世界上有多個(gè)研究團(tuán)隊(duì)使用該技術(shù)抗擊新冠疫情,并取得了可喜的成果。
在新冠疫情中,最早正式發(fā)出疫情警告的并不是世界衛(wèi)生組織或美國(guó)疾控中心,而是加拿大一家名為“藍(lán)點(diǎn)”(BlueDot)的健康監(jiān)測(cè)平臺(tái);它早在2019年12月31日就向其客戶發(fā)出了提前疫情警告,避開(kāi)危險(xiǎn)區(qū)域。該平臺(tái)設(shè)計(jì)了疾病監(jiān)測(cè)分析程序,使用自然語(yǔ)言處理技術(shù)來(lái)篩選65種語(yǔ)言的新聞報(bào)道,以及航空公司數(shù)據(jù)和動(dòng)物疾病暴發(fā)的報(bào)道,在疫情暴發(fā)之初發(fā)揮了監(jiān)測(cè)功能。
前不久,美國(guó)艾倫人工智能研究所發(fā)布了“新冠肺炎開(kāi)放研究數(shù)據(jù)集”(CORD-19)的資源管理器以及全文本搜索引擎,并表示希望它可以幫助人們探索數(shù)據(jù)集并確定潛在的研究成果。該機(jī)構(gòu)語(yǔ)言學(xué)家道格·雷蒙德博士說(shuō):“過(guò)去幾年,我們?cè)谧匀徽Z(yǔ)言處理方面取得了長(zhǎng)足進(jìn)步,CORD-19這類(lèi)數(shù)據(jù)集的實(shí)用性可能會(huì)比幾年前更大,因?yàn)楝F(xiàn)在我們有了更多可用的工具?!?/span>
美國(guó)政府曾經(jīng)宣布聯(lián)合艾倫人工智能研究所、微軟研究院、美國(guó)國(guó)立衛(wèi)生研究院等機(jī)構(gòu)共同發(fā)布有關(guān)新冠疫情的學(xué)術(shù)文獻(xiàn)的開(kāi)放研究數(shù)據(jù)集CORD-19,并呼吁世界各地的人工智能專家采取行動(dòng),開(kāi)發(fā)新的文本和數(shù)據(jù)挖掘技術(shù),以幫助科學(xué)界回答與新冠疫情相關(guān)的高優(yōu)先級(jí)科學(xué)問(wèn)題。其目的是為醫(yī)學(xué)和自然語(yǔ)言處理研究人員發(fā)布疫情數(shù)據(jù)集,以獲得有助于對(duì)抗此次疫情的真知灼見(jiàn)。
美國(guó)哈佛大學(xué)醫(yī)學(xué)院的研究人員借助自然語(yǔ)言處理技術(shù)最近開(kāi)發(fā)出了一種工具,可以評(píng)估新冠患者的病例、社交媒體和健康衛(wèi)生數(shù)據(jù)。他們率先努力通過(guò)使用機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析查看來(lái)自各種來(lái)源的數(shù)據(jù)和信息來(lái)尋找新冠病毒的解決方案。借助自然語(yǔ)言處理工具,他們還可以搜索有關(guān)新冠病毒的在線信息,并了解爆發(fā)的當(dāng)前位置。
中國(guó)疾病預(yù)防控制中心的研究人員最近在使用科技巨頭阿里巴巴達(dá)摩院的自然語(yǔ)言處理技術(shù)開(kāi)展病歷文本分析和流行病學(xué)調(diào)查工作,并取得了階段性成果。達(dá)摩院的研究團(tuán)隊(duì)通過(guò)自然語(yǔ)言處理回顧性數(shù)據(jù)、使用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練CT影像的識(shí)別系統(tǒng),它可以快速鑒別新冠影像與普通病毒性肺炎影像的區(qū)別,最終識(shí)別準(zhǔn)確率高達(dá) 96%。
智能問(wèn)診系統(tǒng)能夠在線為病患提供問(wèn)診服務(wù),其使用應(yīng)用語(yǔ)義理解、情感分析等自然語(yǔ)言處理技術(shù),通過(guò)問(wèn)題預(yù)判、意圖反問(wèn)、分類(lèi)識(shí)別、相似度匹配等方法,不僅能夠解答何種情況需要就醫(yī),還能實(shí)現(xiàn)疫情防控動(dòng)態(tài)進(jìn)展、科學(xué)防護(hù)知識(shí)、謠言鑒別等問(wèn)題精準(zhǔn)解答,并支持人機(jī)協(xié)作、自主學(xué)習(xí)、會(huì)話引導(dǎo)等功能。
在疫情防控期間,中國(guó)百度靈醫(yī)智惠推出的“智能咨詢助手”,包含新冠問(wèn)題解答、標(biāo)準(zhǔn)化預(yù)問(wèn)診路徑、在線醫(yī)生咨詢輔助三大模塊;它通過(guò)自然語(yǔ)言處理技術(shù)賦能在線健康咨詢平臺(tái)、政府疫情防控平臺(tái)、互聯(lián)網(wǎng)醫(yī)院等第三方平臺(tái),助力其直接為公眾提供有關(guān)新冠的在線科普、在線咨詢,倍數(shù)級(jí)提升效率。
疫情發(fā)生至今,情況愈演愈烈,人們一邊要提防新冠肺炎的傳染,一邊又要不斷接受著海量的真假難辨的信息的轟炸。但對(duì)于后者,自然語(yǔ)言處理技術(shù)能夠幫助人們提取信息的主要觀點(diǎn),識(shí)別文章情緒甚至分析文章的可信度;這在抗疫信息戰(zhàn)中將“謠言”粉碎,促進(jìn)輿論生態(tài)良性循環(huán),從而為抗疫工作提供一份助力。
自然語(yǔ)言處理技術(shù)在對(duì)抗新冠疫情中發(fā)揮了重大作用。雖然自然語(yǔ)言處理技術(shù)不是萬(wàn)能神藥,但可以幫助研究人員更快地從醫(yī)療數(shù)據(jù)中提取更有用的信息,挖掘其中的規(guī)律,從而加快疫苗研發(fā)進(jìn)程,也有助于進(jìn)行更有效的治療。自然語(yǔ)言處理技術(shù)在本次疫情中的應(yīng)用證明其在分析醫(yī)療和臨床數(shù)據(jù)中大有可為。
由上可知,自然語(yǔ)言處理可以在抗擊新冠疫情中大顯身手,為打贏這場(chǎng)疫情攻堅(jiān)戰(zhàn)提供了極為有效的技術(shù)支撐。有了自然語(yǔ)言處理技術(shù)相助,抗疫工作將變得更安全、更高效。正如中國(guó)著名學(xué)者周海中教授曾經(jīng)所言:“自然語(yǔ)言處理是極有吸引力的研究領(lǐng)域,它具有重大的理論意義和實(shí)用價(jià)值?!?/span>
文/李言(作者單位:德國(guó)人工智能研究中心[DFKI])