2020年11月20日,2020中國5G+工業(yè)互聯(lián)網(wǎng)大會在武漢開幕。習近平總書記向大會發(fā)來賀信,“希望湖北省和武漢市以此次大會召開為契機,弘揚偉大抗疫精神,大力推動數(shù)字經(jīng)濟發(fā)展,為推動經(jīng)濟高質(zhì)量發(fā)展、服務(wù)構(gòu)建新發(fā)展格局作出貢獻”。
8月底,我國首批8家AI大模型產(chǎn)品獲批名單出爐,由東湖高新區(qū)和中國科學院自動化研究所共建武漢人工智能研究院打造的“紫東太初”大模型位列其中,這也是全球首個圖文音三模態(tài)大模型,曾于去年9月榮獲2022世界人工智能大會最高獎項——SAIL大獎。
“這也意味著人工智能大模型開始真正進入大眾的視野,賦能千行百業(yè)?!苯?,武漢人工智能研究院(以下簡稱“武智院”)院長王金橋在接受長江日報《在場》欄目專訪時表示,貫徹落實習近平總書記重要指示精神,將堅持以原始創(chuàng)新和核心技術(shù)研發(fā)為主導,以產(chǎn)業(yè)落地為目標,促進人工智能“走深向?qū)崱敝厮芮邪贅I(yè)。
“夢想光谷”AI繪畫創(chuàng)作比賽優(yōu)秀獲獎作品吸引了市民駐足。參賽者依托“江城洛神”AI創(chuàng)作平臺,將簡短的文本描述通過Al創(chuàng)作出心目中的光谷。而“江城洛神”正是基于“紫東太初”大模型打造的人工智能內(nèi)容創(chuàng)作平臺。記者周超 攝
01
圖文音三模態(tài)大模型
升級為多模態(tài)
王金橋介紹,大模型取名“紫東太初”,一是寓意紫氣東來、混沌初開,代表人工智能從專用邁向了通用,從感知智能邁向了認知智能;二是“紫東”與中國科學院自動化研究所的諧音相通,代表著自動化所自身的意義和使命。
3個月前,中國科學院自動化研究所聯(lián)合武智院發(fā)布“紫東太初”2.0全模態(tài)大模型,該大模型是在千億參數(shù)三模態(tài)大模型“紫東太初”1.0基礎(chǔ)上的升級,在此前語音、圖像和文本三模態(tài)的基礎(chǔ)上,加入了視頻、信號、3D點云等模態(tài)數(shù)據(jù),突破了認知增強的多模態(tài)關(guān)聯(lián)等關(guān)鍵技術(shù),具備全模態(tài)理解能力、生成能力和關(guān)聯(lián)能力。這意味著在實際應用場景中,它將能夠為行業(yè)創(chuàng)造更大價值。
今年以來,國內(nèi)人工智能大模型如雨后春筍般涌現(xiàn)。據(jù)不完全統(tǒng)計,截至今年5月,國內(nèi)已扎堆發(fā)布10億級參數(shù)規(guī)模以上基礎(chǔ)大模型79個,“百模大戰(zhàn)”打響。其中,絕大多數(shù)都是語言類大模型。
“我們是國內(nèi)最早開始大模型研究的團隊之一?!蓖踅饦蚪榻B,得益于中國科學院自動化研究所在多模態(tài)數(shù)據(jù)領(lǐng)域的多年積累,團隊一開始就選擇了多模態(tài)大模型這條更艱難的路,實現(xiàn)語音、圖像和文本等多種模態(tài)交叉協(xié)同與有機融合,打造更加擬人的人工智能。“在這條研發(fā)路徑上,我們走在了世界前列。”他說。
在武智院的操作平臺上,王金橋給出了一張奔跑的小狗的照片,“紫東太初”立刻識別并描繪出照片中的景象:一只黑白相間的狗在鐵軌上奔跑著,身后是綠色的樹林。當他提出“以光谷為主題做首詩”時,“紫東太初”迅速地完成了一首七言絕句。
長江日報記者注意到,“紫東太初”被形象地設(shè)計成一個身穿漢服的小女孩,取名“小初”。
王金橋解釋說,身穿漢服代表著“紫東太初”從算法到硬件、算力全棧國產(chǎn)化,全鏈條“中國造”;而小女孩則意味著國內(nèi)的通用人工智能還處于剛剛起步的階段,“和10多歲的孩子的能力差不多”。
上月舉行的東湖算力與大數(shù)據(jù)創(chuàng)新大會上,基于“紫東太初”全模態(tài)大模型搭建的“紫東太初”大模型開放服務(wù)平臺2.0正式發(fā)布。
該平臺瞄準當前人工智能大規(guī)模應用難題,將全力推動人工智能在各行業(yè)的廣泛應用,實現(xiàn)人工智能大模型高效落地、提升行業(yè)效率。
“在智能世界‘混沌初開’之際,希望‘紫東太初’的開放體驗能夠為用戶打開一扇探索AI未來的大門?!蓖踅饦蚪榻B,該平臺已于近日對外開放體驗,用戶可通過各種方式與AI進行交互,享受到更為便捷、高效的AI服務(wù)。
02
已在多個領(lǐng)域
形成規(guī)模化應用落地
光谷資本大廈內(nèi),中國光谷人工智能AI藝術(shù)展正在展出。在現(xiàn)場體驗區(qū),參觀者只需要輸入幾個關(guān)鍵詞或簡單的文本描述,就能通過“江城洛神”人工智能內(nèi)容創(chuàng)作平臺生成一幅幅獨一無二的繪畫作品,實現(xiàn)“妙語生畫”?!叭斯ぶ悄茏鳛橐环N技術(shù),和藝術(shù)有了越來越多的融合?!蓖踅饦蛘f。
“江城洛神”正是基于“紫東太初”大模型打造的人工智能內(nèi)容創(chuàng)作平臺,通過多模態(tài)技術(shù)實現(xiàn)圖像編輯與生成,輔助內(nèi)容生產(chǎn),用戶無需任何專業(yè)技能,只需輕輕一點,便可輕松創(chuàng)造出屬于自己的藝術(shù)作品,可廣泛運用于設(shè)計、影視、游戲等多個領(lǐng)域。
以室內(nèi)裝修設(shè)計領(lǐng)域為例,只需提供一張戶型圖,“江城洛神”就可自動生成多種裝修設(shè)計樣式,提示詞越多、越精細,生成質(zhì)量就越高,還能根據(jù)不同提示自動對結(jié)果進行編輯。
兩周前,武漢市2023年數(shù)字經(jīng)濟應用場景“揭榜掛帥”揭榜項目名單公布,“紫東太初”大模型入選。
“‘紫東太初’大模型正賦能千行百業(yè),推動數(shù)字經(jīng)濟全面發(fā)展?!蓖踅饦蚪榻B,“紫東太初”人工智能開放服務(wù)平臺目前已成功應用于汽車制造質(zhì)檢、媒體信息服務(wù)、文化旅游、手語教育、紡織生產(chǎn)質(zhì)檢、醫(yī)療器械等10余個領(lǐng)域,形成規(guī)?;瘧寐涞亍?
在智慧醫(yī)療領(lǐng)域,武智院聯(lián)手九州通打造基于“紫東太初”大模型的醫(yī)療器械智能管理平臺,自動識別管理2000多種醫(yī)療器械,能效提升30倍,精度實現(xiàn)99.9%,并將迅速推廣到更多醫(yī)院;
在法律咨詢領(lǐng)域,“紫東太初”大模型僅需0.5秒就可完成案件的分析、拆解、定責,將法律案件研判的效率提升100倍左右;
在文化娛樂領(lǐng)域,“紫東太初”大模型變身“人工智能導師”,從科技角度對歌曲的審美和傳播做出全新推薦,為歌唱比賽參賽歌手們提出個性化建議……
據(jù)介紹,截至目前,武智院已與湖北三環(huán)集團、湖北港口集團、九州通集團、光谷人才集團、武漢光庭等10余家單位在智能制造、智能網(wǎng)聯(lián)汽車、智慧醫(yī)療、虛擬數(shù)字人等領(lǐng)域開展實質(zhì)性合作,并與東風集團、湖北電信、湖北廣電、長江通信、愛帝集團、集度汽車等40余家企業(yè)達成合作意向,助力數(shù)字經(jīng)濟與實體經(jīng)濟深度融合。
“人工智能未來的10年將是AIGC(Artificial Intelligence Generated Content,即生成式人工智能)的10年,如果說這個賽道有一萬米,那么現(xiàn)在才剛剛跑了100米?!蓖踅饦虮硎?,未來,武智院還將圍繞更多產(chǎn)業(yè)打造場景化模型和垂直類模型,推動“紫東太初”大模型在更多領(lǐng)域落地應用,“并借此不斷提升大模型正確知識的學習能力和生成能力,使‘紫東太初’自身也不斷地升級進化”。