由聲智科技研發(fā)的“AI數(shù)字人垃圾分類管家”融合了人臉識別、智能語音交互、行為識別等技術(shù),使垃圾分類管理更加方便快速。
一臺可以書寫的智能交互機(jī)械臂,用毛筆寫下“一起向未來”;一部多足行走機(jī)器人和一部跳舞機(jī)器人,共同跳起了一段舞蹈,隨后,跳舞機(jī)器人還單獨(dú)進(jìn)行了一段武術(shù)表演,抱拳開臂,馬步弓步,一招一式憨態(tài)可掬。這是記者在北京聲智科技有限公司(以下稱“聲智科技”)展廳里看到的景象。
聲智科技成立于2016年,專注于聲學(xué)前沿技術(shù)和人工智能領(lǐng)域,主要面向數(shù)智健康、數(shù)智城市等場景提供產(chǎn)品和解決方案。憑借持續(xù)創(chuàng)新研發(fā),聲智科技獲得了吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)、北京市科技進(jìn)步二等獎(jiǎng)等多個(gè)獎(jiǎng)項(xiàng)。
突破技術(shù)難點(diǎn)
“聲智科技是從研發(fā)遠(yuǎn)場語音交互技術(shù)起步的,你剛才看到的那幾個(gè)智能機(jī)器人搭載了聲智科技研發(fā)的智能語音交互技術(shù)?!甭曋强萍紕?chuàng)始人陳孝良說,隨著物聯(lián)網(wǎng)技術(shù)的普及,語音成為人機(jī)交互的新入口,支持遠(yuǎn)場語音交互的產(chǎn)品市場潛力很大。
“遠(yuǎn)場語音識別技術(shù)面臨諸多研發(fā)難點(diǎn),比如環(huán)境噪聲、人聲、房間混響的干擾等。若采用常規(guī)語音處理方法,會導(dǎo)致信號失真和資源消耗大,使得語音識別技術(shù)準(zhǔn)確率低,應(yīng)用困難?!标愋⒘颊f。
憑借深厚技術(shù)積累和持續(xù)研發(fā),聲智科技先后攻克了多項(xiàng)遠(yuǎn)場語音交互關(guān)鍵技術(shù),包括回聲抵消技術(shù)、噪聲消除技術(shù)、聲源定位技術(shù)、語音識別技術(shù)等。如今,這些技術(shù)已應(yīng)用于一些消費(fèi)級電子產(chǎn)品中,聲智科技也成為國內(nèi)不少知名企業(yè)的合作伙伴。
“我們意識到,伴隨著人工智能的快速發(fā)展,人機(jī)交互、協(xié)同過程中的多數(shù)問題,都不能靠單一技術(shù)解決,需要將語音、圖像識別、大數(shù)據(jù)等技術(shù)結(jié)合起來。只有推進(jìn)多模態(tài)、多技能的融合,才能實(shí)現(xiàn)更多場景的應(yīng)用。”聲智科技副總裁李良斌說。
他介紹,聲智科技的做法是,用“多模態(tài)”確保機(jī)器具有“聲、光、電、熱、力、磁”多種感知技術(shù);用“遠(yuǎn)場”解決機(jī)器在遠(yuǎn)距離場域中對多模態(tài)信號的分析;用“多技能”賦予智能系統(tǒng)多種能力,通過多技能相互協(xié)同,完成復(fù)雜任務(wù)。
基于這種技術(shù)理念,聲智科技研發(fā)推出核心技術(shù)產(chǎn)品——壹元人工智能開發(fā)框架?;谶@個(gè)框架,聲智科技融合了遠(yuǎn)場聲光、多模態(tài)識別等多項(xiàng)技術(shù),圍繞智慧社區(qū)、智慧交通、智慧辦公、智慧醫(yī)院等應(yīng)用場景,提供AI產(chǎn)品及解決方案。
截至目前,聲智科技已經(jīng)參與了50余項(xiàng)國家行業(yè)標(biāo)準(zhǔn)的制定,擁有國內(nèi)專利2000余項(xiàng)。在2020年前,聲智科技總?cè)谫Y金額超過3億元。陳孝良說,這些融資全部投入到核心技術(shù)的持續(xù)研發(fā)上。
助力智慧防疫
新冠肺炎疫情暴發(fā)以來,聲智科技自主研發(fā)的技術(shù)產(chǎn)品,用于多地的防疫服務(wù)中。
記者剛走進(jìn)中關(guān)村前沿技術(shù)創(chuàng)新中心的一樓大廳,就聽到清脆的聲音:“您現(xiàn)在的體溫是36.5攝氏度,沒有發(fā)熱癥狀”。聲音來自一臺測溫機(jī)器人,在機(jī)器人顯示屏上,除了實(shí)時(shí)顯示被檢測者的紅外熱成像信息和溫度值,還能查看全國疫情數(shù)據(jù),測溫精度在正負(fù)0.2攝氏度。
聲智科技首席知識官常樂介紹,這個(gè)測溫機(jī)器人可在幾秒鐘內(nèi)完成1米至6米范圍內(nèi)多個(gè)目標(biāo)的高精度測溫,支持實(shí)時(shí)AI語音合成播報(bào),自動(dòng)上傳預(yù)警信息。目前,該機(jī)器人已在北京、廣州、青島、成都等地落地使用。
“小易小易,上樓”“小易小易,去10樓”,在北京海淀醫(yī)院的電梯里,只需要一句簡單的指令,就能實(shí)現(xiàn)乘梯上下樓,全程免按鍵,實(shí)現(xiàn)零接觸。
“聲智科技研發(fā)的智慧語音電梯,融合語音與圖像等交互技術(shù),不依賴手機(jī)、IC卡等設(shè)備,無論使用者是在電梯外,還是在電梯轎廂內(nèi),都可以通過可視化人機(jī)交互方式搭乘電梯。”常樂介紹,這方便了老人、兒童等用戶的日常生活,在疫情防控期間還有效降低了接觸傳播感染風(fēng)險(xiǎn)。
目前,聲智科技已推出第二代AI智能電梯系統(tǒng),增加手勢識別功能,殘障人士也可以實(shí)現(xiàn)免接觸控制電梯。2021年,為解決電動(dòng)自行車入戶充電的監(jiān)管難題,減少電池充電爆炸起火等隱患,企業(yè)又迭代推出了第三代AI智能電梯。
“未來,我們希望AI技術(shù)能滿足復(fù)雜場景的靈活、大范圍應(yīng)用?!崩盍急蟊硎?,聲智科技將繼續(xù)加強(qiáng)核心技術(shù)研發(fā),讓更多AI產(chǎn)品落地,使萬物互聯(lián)更智能。