在科技領(lǐng)域,跨界、融合帶來(lái)的新生事物具備的顛覆性競(jìng)爭(zhēng),而只是技術(shù)和經(jīng)濟(jì)層面的競(jìng)爭(zhēng)。
而在病毒領(lǐng)域,跨界、融合產(chǎn)生的新病毒往往意味著災(zāi)難。一個(gè)天上飛的鳥落下的糞便不小心與地上某個(gè)禽類的食物結(jié)合被這個(gè)禽類所食,那么其上可能帶來(lái)的病毒與禽類體內(nèi)病毒進(jìn)行雜交進(jìn)化一個(gè)新的病毒。而這個(gè)病毒獲得跨界傳播的能力,將對(duì)整個(gè)人類造成大的災(zāi)難。最快速的了解新的病毒帶來(lái)的病例成因早日實(shí)現(xiàn)對(duì)癥下藥,成為打贏“抗疫”的關(guān)鍵。今天AI等新技術(shù)在積極發(fā)揮著作用。
目前新型冠狀病毒疫情進(jìn)入了攻堅(jiān)戰(zhàn)階段。除了一線醫(yī)務(wù)人員前赴后繼的戰(zhàn)斗之外,對(duì)于新冠病毒的疫苗研發(fā)和藥物篩中也在爭(zhēng)分奪秒的進(jìn)行中。此次“抗疫”戰(zhàn)爭(zhēng)中,AI等科技技術(shù)在默默貢獻(xiàn)中。關(guān)注抗擊疫情中的科技公司的動(dòng)向,就會(huì)發(fā)現(xiàn)包括阿里云、華為云、中科曙光、騰訊云、上海超算中心等積極主動(dòng)并免費(fèi)提供超算能力,AI算法來(lái)助力開展抗新冠病毒的疫苗研發(fā)和藥物篩選中。
要最快解決此次新型冠狀病毒疫情,目前來(lái)看除了全國(guó)動(dòng)員在家“悶”死病毒之外,對(duì)于從早期對(duì)病毒基因組的數(shù)據(jù)分析及AI建模到如何對(duì)疑似患者的快速、精準(zhǔn)臨床診斷,以及抗新冠病毒的疫苗研發(fā)和藥物篩選中也需要和時(shí)間賽跑。在其中AI正在發(fā)揮其作用。
AI技術(shù)能夠加速“疫情”中數(shù)據(jù)分析
AI作為一種工具,有三要素在支撐,算力、算法和數(shù)據(jù)?;谌齻€(gè)特點(diǎn),目前AI等科技公司都是提供具備高性能、高可靠性、高性價(jià)比的計(jì)算、存儲(chǔ)、分析和AI能力支持的,能夠讓科研過程固化可執(zhí)行,提高效率的工具。
而讓AI在疾病基因的分析和診斷中發(fā)揮。首先要依靠醫(yī)學(xué)界的專家發(fā)現(xiàn)病毒。就像上海華山醫(yī)院張文宏就談到醫(yī)療專家要“要非常準(zhǔn)確的知道現(xiàn)在搜索的病毒是什么,才能相應(yīng)的病毒做相應(yīng)的抗病毒治療。”
我們應(yīng)讓人工智能與病理學(xué)家形成互補(bǔ),提高人工診斷的效率與可靠度。依靠科技手段 “面對(duì)未知的病毒的時(shí)候,通過把其基因序列全部打碎,通過深度測(cè)序的平臺(tái),把所有的序列全部恢復(fù),然后通大數(shù)據(jù)開始拼接,通過組裝序列,經(jīng)過大數(shù)據(jù)分析,分析出其演化關(guān)系,通過數(shù)據(jù)庫(kù)記錄分析獲得遺傳標(biāo)志,來(lái)最終告訴你這是什么病毒?!?張文宏站在醫(yī)生的角度言簡(jiǎn)意賅的闡述了AI的作用。
比如針對(duì)此次新冠病毒,AI等新技術(shù)的應(yīng)用一個(gè)核心的作用就是讓醫(yī)學(xué)專家們不用把大量的時(shí)間放在海量的數(shù)據(jù)分析上,而是能夠?qū)⒆约旱臅r(shí)間、精力以及醫(yī)學(xué)經(jīng)驗(yàn)投入到應(yīng)對(duì)傳染病風(fēng)險(xiǎn)之上。把數(shù)據(jù)分析、重復(fù)的信息的收集等任務(wù),交給AI來(lái)處理。
目前集成了AI功能的基因組測(cè)序平臺(tái)能夠提供從基因組數(shù)據(jù)管理、生物信息分析流程、科研分析管理到知識(shí)圖譜整個(gè)流程的服務(wù),快速實(shí)現(xiàn)基因組數(shù)據(jù)分析及AI建模,讓基因組分析更便捷。
比如將深度學(xué)習(xí)算法及藥物分析服務(wù)融入藥物研發(fā)過程,令藥企能更快速高效地完成藥物研發(fā),節(jié)約研發(fā)成本,讓研發(fā)更快速。
具備醫(yī)療影像標(biāo)注、影像分析服務(wù)及AI模型預(yù)測(cè)服務(wù),全方位滿足醫(yī)療影像研發(fā)需求,讓影像分析更方便。很大程度上幫助了醫(yī)生提高閱片效率、減少漏診誤診的情況。一個(gè)醫(yī)生可能一天看一百個(gè)病人,一個(gè)月看了兩千個(gè)病人,一年可能看幾萬(wàn)個(gè)病人,他通過這樣的方式去累計(jì)經(jīng)驗(yàn)。一個(gè)15年經(jīng)驗(yàn)的醫(yī)生,和一個(gè)剛出來(lái)做3個(gè)月的醫(yī)生,他們兩個(gè)的經(jīng)驗(yàn)不同,在對(duì)一些影像圖片上面的判斷就不是一樣的級(jí)別。
深度學(xué)習(xí)會(huì)提取圖像特征。然后影像專家先把上面做一個(gè)標(biāo)注,等到標(biāo)注有更大的樣本的時(shí)候,就可以做到輔助醫(yī)學(xué)診斷。比如通過AI對(duì)疑似患者肺部CT影像進(jìn)行病灶的自動(dòng)檢出、定位、彌漫性程度的多維分析并生成自動(dòng)報(bào)告,幫助醫(yī)護(hù)人員快速篩查疑似新冠病例并進(jìn)行隔離與進(jìn)一步確診,從而減少交叉感染的風(fēng)險(xiǎn),同時(shí)產(chǎn)品的隨訪功能還可幫助醫(yī)生對(duì)患者的治療效果進(jìn)行精準(zhǔn)量化評(píng)估,用AI為一線醫(yī)務(wù)工作者提供有跡可循、有據(jù)可依的智能輔助。
聯(lián)合科研成為AI技術(shù)應(yīng)用在疾病領(lǐng)域的主要形式
在整個(gè)“抗疫”過程中,包括分離毒株、藥物篩選、意思病例檢測(cè)、新藥研發(fā)等需要基于AI技術(shù)進(jìn)行大量的數(shù)據(jù)分析。目前科技公司在病毒基因組計(jì)算分析、抗病毒藥物研發(fā)和抗疫醫(yī)療影像分析領(lǐng)域,將提供海量AI算力和算法的強(qiáng)有力支持。這就需要具有強(qiáng)大的CPU及GPU算力調(diào)度能力,能夠?yàn)榛驕y(cè)序、醫(yī)療工程提供穩(wěn)定高效的算力支持的平臺(tái)。
最近關(guān)于“抗疫”的戰(zhàn)役中,我們看到科技公司聯(lián)合醫(yī)療機(jī)構(gòu)、科研機(jī)構(gòu)成為最高效的一種模式。比如華中科技大學(xué)同濟(jì)醫(yī)學(xué)院基礎(chǔ)醫(yī)學(xué)院、華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬武漢兒童醫(yī)院、西安交通大學(xué)第一附屬醫(yī)院、中科院北京基因組研究所、華為云聯(lián)合科研團(tuán)隊(duì)宣布,篩選出五種可能對(duì)2019新型冠狀病毒(2019-nCoV)有效的抗病毒藥物。
其中華為云EI醫(yī)療智能體平臺(tái)(EIHealth)集成了醫(yī)藥領(lǐng)域眾多算法、工具、AI模型和自動(dòng)化流水線提供大規(guī)模計(jì)算機(jī)輔助。
在幾位教授的指導(dǎo)下,針對(duì)數(shù)十個(gè)靶向蛋白和上億小分子化合物,通過醫(yī)療智能體平臺(tái)完成了蛋白質(zhì)同源模建,分子動(dòng)力學(xué)模擬計(jì)算,和大規(guī)模虛擬藥物篩選,短時(shí)間內(nèi)完成了上千萬(wàn)次的模擬計(jì)算,讓以往耗時(shí)數(shù)月的計(jì)算機(jī)輔助藥物篩選在數(shù)小時(shí)內(nèi)完成。
比如在新冠肺炎疫情上,疑似患者的快速、精準(zhǔn)臨床診斷仍是挑戰(zhàn)。2月1日,由浙江省疾控中心、阿里達(dá)摩院和杰毅生物聯(lián)合研發(fā)上線的自動(dòng)化全基因組檢測(cè)分析平臺(tái),讓原來(lái)數(shù)小時(shí)的疑似病例基因分析縮短至半小時(shí)。重點(diǎn)在“全基因組”這幾個(gè)字,全基因組以為著海量的基因數(shù)據(jù),需要對(duì)平臺(tái)的算力、AI算法、數(shù)據(jù)處理和分更高的要求。阿里達(dá)摩院創(chuàng)新的采用分布式設(shè)計(jì)的分析算法,并基于蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB)等公共數(shù)據(jù)集的數(shù)據(jù)進(jìn)行算法的優(yōu)化訓(xùn)練。這樣的AI突破,對(duì)于有效提升疑似病例確診效率,及時(shí)阻斷病毒的傳播,必然會(huì)有極大助益。
我們也看到為助力研究機(jī)構(gòu)加速新藥篩查和疫苗研發(fā),騰訊云組建了應(yīng)急工作小組,免費(fèi)開放云超算等能力。目前,已向中山大學(xué)藥學(xué)院羅海彬教授團(tuán)隊(duì)提供了批量GPU云服務(wù)器免費(fèi)使用權(quán),幫助該團(tuán)隊(duì)推進(jìn)病毒藥物的篩選工作;向北京生命科學(xué)研究所/清華大學(xué)生物醫(yī)學(xué)交叉研究院的黃牛教授實(shí)驗(yàn)室提供了大量標(biāo)準(zhǔn)的CPU算力以及對(duì)象儲(chǔ)存能力,幫助他們進(jìn)行基于結(jié)構(gòu)的藥物分子設(shè)計(jì)的離線計(jì)算任務(wù)。
與此同時(shí),基于新型冠狀病毒靶標(biāo)結(jié)構(gòu)的化合物虛擬篩選工作正在北京生命科學(xué)研究所/清華大學(xué)生物醫(yī)學(xué)交叉研究院黃牛教授實(shí)驗(yàn)室推進(jìn)。從原理上講,藥物通過與體內(nèi)的生物靶標(biāo)相互作用而發(fā)揮藥效,若能夠根據(jù)藥物靶標(biāo)結(jié)構(gòu)來(lái)計(jì)算篩選和設(shè)計(jì)小分子配體,將可大大降低創(chuàng)新藥前期研發(fā)的成本與周期。針對(duì)新型冠狀病毒的多個(gè)靶點(diǎn),黃牛教授實(shí)驗(yàn)室通過騰訊云秒級(jí)交付的海量高性能計(jì)算、存儲(chǔ)資源,快速計(jì)算篩選數(shù)億級(jí)別的化合物數(shù)據(jù)庫(kù),結(jié)合實(shí)驗(yàn)驗(yàn)證,來(lái)尋找新型結(jié)構(gòu)類型的先導(dǎo)化合物,為下一步新藥研發(fā)工作提供依據(jù)。
總結(jié),AI對(duì)于基因組的分析和診斷,有幾個(gè)關(guān)鍵點(diǎn)。首先數(shù)據(jù)庫(kù)的檢索功能,在獲取到病毒基因信息后,通常需要與已知數(shù)據(jù)庫(kù)的基因組匹配來(lái)找出可能存在的突變。而突變與疾病的對(duì)應(yīng)關(guān)系的判斷大部分依靠海量的數(shù)據(jù)庫(kù)資源,因此如果人工來(lái)完成這些工作是不現(xiàn)實(shí)的,這個(gè)時(shí)候便體現(xiàn)出了人工智能的價(jià)值。
其次算法的優(yōu)化,我們看到包括華為云、阿里達(dá)摩院都是采用了最新的AI算法和分布式數(shù)據(jù)庫(kù),來(lái)優(yōu)化人工智能的技術(shù)路徑,能夠更有效的對(duì)大量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行學(xué)習(xí)和整合,挖掘并計(jì)算其中的關(guān)聯(lián)。縮短人工智能可以持續(xù)不斷的挖掘并更新突變位點(diǎn)和疾病的潛在聯(lián)系。
再次海量的數(shù)據(jù)喂養(yǎng),與在Google AI實(shí)踐中曾有關(guān)于診斷乳腺癌的人工智能的報(bào)道。它只需幾秒鐘,就能取得比人類醫(yī)生花上幾十個(gè)小時(shí)還要準(zhǔn)確的診斷。在基于醫(yī)學(xué)圖像的診斷上,結(jié)合人工智能的效率可以說(shuō)是大大增加了癌病的診斷。這需要基于大量患者的成百上千張醫(yī)療影像,基于深度學(xué)習(xí)算法的訓(xùn)練。經(jīng)歷了大量迭代訓(xùn)練后,實(shí)現(xiàn)算法的精準(zhǔn)度越來(lái)越高,實(shí)現(xiàn)在疾病分析豐富臨床經(jīng)驗(yàn)的專家的診斷結(jié)果與AI工具的診斷結(jié)果是否一致來(lái)判斷AI分析的價(jià)值。
除此之外,業(yè)內(nèi)專家對(duì)至頂網(wǎng)表示目前基于“深度學(xué)習(xí)”的AI技術(shù)要發(fā)揮作用,一個(gè)好的云數(shù)據(jù)庫(kù)其實(shí)是非常關(guān)鍵的一個(gè)點(diǎn),因?yàn)槿绻t(yī)院里面每個(gè)科室的數(shù)字是零散的,那么很難做這個(gè)工作。基于云數(shù)據(jù)庫(kù),不管是從公有云還是從私有云,幫助醫(yī)院把這些數(shù)據(jù)規(guī)范起來(lái)。從數(shù)據(jù)的采集,到它的存儲(chǔ),到預(yù)處理,形成一套規(guī)范的AI服務(wù)。這樣的話,數(shù)據(jù)即使在有些單位是分散的,需要的時(shí)候還是可以復(fù)合起來(lái)使用。
同時(shí)在深度學(xué)習(xí)的技術(shù)上面,對(duì)這些數(shù)據(jù)做訓(xùn)練的時(shí)候,不僅僅是把數(shù)據(jù)丟到深度學(xué)習(xí)里面去訓(xùn)練就好了,而且我們還要對(duì)這些數(shù)據(jù)做一些特征提取。我們把數(shù)據(jù)的維度降低了以后,再去訓(xùn)練就可以得到一個(gè)相對(duì)比較好的效果。當(dāng)然,這個(gè)數(shù)據(jù)積累以后,越來(lái)越多的數(shù)據(jù)積累以后,準(zhǔn)確率會(huì)越來(lái)越高。
最后,醫(yī)療過程是一個(gè)復(fù)雜,周期長(zhǎng)的過程,AI輔助只是其中一個(gè)環(huán)節(jié),我們希望能夠通過AI等科技技術(shù)幫助到醫(yī)藥領(lǐng)域的專家,加速疾病基因檢測(cè)和相關(guān)藥物研發(fā)過程。