久久99国产精品久久99_日韩在线第二页_日韩人妻无码一区二区三区久久_久久亚洲私人国产精品

咨詢(xún)熱線:021-80392549

 QQ在線  企業(yè)微信
 資訊 > 人工智能 > 正文

人工智能在音頻語(yǔ)音助理方面的作用

2020/03/16300

硅基麥克風(fēng)的出現(xiàn)重塑了音頻領(lǐng)域。市場(chǎng)研究公司Yole Development相信,在未來(lái)幾年,人工智能將引領(lǐng)市場(chǎng)演變和轉(zhuǎn)型。

語(yǔ)音交互是自然的,這就是為什么它正在成為人機(jī)交互的主要接口?;谡Z(yǔ)音的個(gè)人助理(VPA)在智能手機(jī)、智能音箱、智能手表、無(wú)線耳機(jī)、汽車(chē)、智能電視及其遙控器中越來(lái)越受歡迎?,F(xiàn)在甚至垃圾桶都集成了語(yǔ)音識(shí)別。而真正的價(jià)值在于高音頻質(zhì)量和對(duì)麥克風(fēng)周?chē)h(huán)境的理解。

對(duì)于Yole development來(lái)說(shuō),音頻是下一個(gè)被人工智能(AI)滲透的領(lǐng)域。

人工智能如何發(fā)聲

基于語(yǔ)音的虛擬個(gè)人語(yǔ)音助理(VPA)是當(dāng)今音頻行業(yè)的主要驅(qū)動(dòng)力?;谝纛l系統(tǒng)的傳統(tǒng)組件,如音頻編解碼器、麥克風(fēng)、揚(yáng)聲器和音頻放大器,他們都在使用人工智能來(lái)計(jì)算和分析語(yǔ)音數(shù)據(jù)。例如計(jì)算支持復(fù)雜的音頻功能,如語(yǔ)音識(shí)別和源定位。它可以在云中執(zhí)行,也可以在消費(fèi)設(shè)備的邊緣處執(zhí)行。這些分析在云中執(zhí)行需要很高的處理能力和訪問(wèn)大量數(shù)據(jù),。

Yole光電和傳感部門(mén)的技術(shù)和市場(chǎng)分析師Dimitrios Damianos表示:“人工智能的附加價(jià)值是用于自然語(yǔ)言處理,聲音是與機(jī)器互動(dòng)的一種更自然的方式。你不需要使用鍵盤(pán)和雙手,你只需要發(fā)聲即可。然而,為了理解用戶在說(shuō)什么,他們的語(yǔ)言以及他們的意思需要進(jìn)行大量的處理?!叭斯ぶ悄苷谠黾咏獯a的價(jià)值,并幫助我們與設(shè)備溝通?!?/span>

當(dāng)被問(wèn)及VPA的快速滲透時(shí),Damianos將其歸因于其便捷性和效率。當(dāng)然,“我們相信和看到的是,像谷歌、蘋(píng)果、Facebook、亞馬遜和微軟(統(tǒng)稱(chēng)為GAFAM)這樣的大型科技公司試圖推動(dòng)這些VPA,因?yàn)樗鼈兲崛〉臄?shù)據(jù)有真正的價(jià)值?!?/span>

Yole公司MEMS和傳感器部門(mén)的技術(shù)和市場(chǎng)分析師Alexis Debray:對(duì)于用戶來(lái)說(shuō),音頻比圖像更容易被接受。他們認(rèn)為音頻“不那么具有侵入性,所以這是GAFAM從人們那里收集數(shù)據(jù)的好方法,GAFAM的主要業(yè)務(wù)就是數(shù)據(jù)。一些公司利用數(shù)據(jù)做生意,而另一些公司利用隱私和設(shè)置技術(shù)來(lái)確保用戶的隱私。例如,蘋(píng)果公司就宣揚(yáng)隱私,并使之成為強(qiáng)大的營(yíng)銷(xiāo)資產(chǎn)。

Damianos說(shuō)到:對(duì)大型科技公司來(lái)說(shuō),它們的實(shí)際價(jià)值是盡可能多地從環(huán)境中提取信息,這意味著VPA不僅會(huì)傾聽(tīng)用戶的聲音,還會(huì)傾聽(tīng)他們周?chē)沫h(huán)境,并了解他們的環(huán)境。例如,“如果你在廚房里,麥克風(fēng)可以聽(tīng)到刀架在柜臺(tái)上的聲音,立刻就知道你在廚房里,并給出一個(gè)菜譜?!边@就是情景人工智能。

人工智能對(duì)話之后的下一個(gè)階段很可能是完全感知,虛擬助手,無(wú)論是智能揚(yáng)聲器還是智能手表,都可以像人類(lèi)一樣與用戶交流。Damianos介紹,完全的意識(shí)是概念性的,并帶有問(wèn)號(hào)。“我們還不知道時(shí)間軸,但可能會(huì)在人工智能對(duì)話之后的5到6年。這將取決于人工智能的發(fā)展和該領(lǐng)域公司的發(fā)展。

雖然這些一直監(jiān)聽(tīng)的系統(tǒng)可以在汽車(chē)人機(jī)界面中挽救生命,但它們也引起了人們對(duì)用戶隱私保護(hù)的擔(dān)憂。為了防止可能的誤用,Debray強(qiáng)調(diào),數(shù)據(jù)處理應(yīng)該盡可能快地進(jìn)行,并盡可能靠近麥克風(fēng)。“離麥克風(fēng)越近,隱私泄露的可能性就越小。”

隱私包含多個(gè)維度,因?yàn)橛脩艨赡芟M[藏自己的性別、年齡或情緒。展望未來(lái),Debray表示,他有信心麥克風(fēng)、ASIC或應(yīng)用處理器領(lǐng)域的參與者將開(kāi)發(fā)出確保用戶隱私的技術(shù)。麥克風(fēng)可以消除聲音中的情緒,只呈現(xiàn)音頻數(shù)據(jù)。

Yole分析師預(yù)計(jì),GAFAM將繼續(xù)占據(jù)主導(dǎo)地位,因?yàn)槟壳八鼈儗?duì)分析的作用至關(guān)重要,但傳感器制造商顯然渴望在邊緣加入人工智能,并將音頻分析業(yè)務(wù)從云端分流出去。Damianos:“傳感器制造商希望增加他們的收入,并從音頻市場(chǎng)中分一杯羹。這不是一場(chǎng)來(lái)自大公司一方的戰(zhàn)斗。這是傳感器公司的一場(chǎng)戰(zhàn)斗。”

Alexis Debray:“傳感器公司確實(shí)在追求多樣化的戰(zhàn)略,“試圖向價(jià)值鏈移動(dòng),變得更加一體化?!?/span>

在最近的一次采訪中,Vesper Technologies Inc.首席執(zhí)行長(zhǎng)Matt Crowley曾表示,Vesper正在尋求提高其壓電MEMS麥克風(fēng)的智能化程度。“我們相信,在未來(lái),我們將在傳感器中嵌入一些與人工智能配對(duì)的傳感器。它將能夠?qū)W習(xí)人類(lèi)和動(dòng)物如何使用他們的感官——不僅僅是視覺(jué)、聽(tīng)覺(jué)、味覺(jué)、嗅覺(jué)和觸覺(jué),還有動(dòng)作或溫度——來(lái)了解他們的環(huán)境。我們的長(zhǎng)期愿景是,這些物體將使用多種仿生傳感器來(lái)了解它們的環(huán)境,并盡可能做出最佳反應(yīng)?!?/span>

此外,英飛凌(Infineon AG)也改變了自己的商業(yè)模式,從銷(xiāo)售麥克風(fēng)模類(lèi)產(chǎn)品轉(zhuǎn)向銷(xiāo)售Goertek和AAC等公司的產(chǎn)品,再到銷(xiāo)售成套的MEMS麥克風(fēng)。從一個(gè)MEMS麥克風(fēng)制造商到一個(gè)做制造、封裝、測(cè)試和銷(xiāo)售的綜合播放器?!斑@是戰(zhàn)略上的變化……這可能意味著,他們看到了VPA的動(dòng)向,希望在這個(gè)市場(chǎng)上找到自己的定位?!?/span>

同樣,美國(guó)樓氏電子Knowles,今天的領(lǐng)導(dǎo)者,擁有MEMS麥克風(fēng)市場(chǎng)39%的份額,最近從Ams AG收購(gòu)了MEMS麥克風(fēng)ASIC設(shè)計(jì)部門(mén)。這是引入混合信號(hào)電路設(shè)計(jì)知識(shí)產(chǎn)權(quán)的一種方式,同時(shí)也是應(yīng)對(duì)來(lái)自中國(guó)公司如Goertek和AAC日益激烈的競(jìng)爭(zhēng)的一種方式。

MEMS麥克風(fēng)為音質(zhì)提供有力支持

全球音頻市場(chǎng)繼續(xù)其增長(zhǎng)軌跡?;谡Z(yǔ)音的VPA需要更好的信噪比(SNR),以便在嘈雜的環(huán)境中準(zhǔn)確地捕捉人的聲音,因此MEMS麥克風(fēng)面臨著新的市場(chǎng)機(jī)遇。

據(jù)Yole稱(chēng),全球麥克風(fēng)、麥克風(fēng)和音頻芯片消費(fèi)市場(chǎng)的年化增長(zhǎng)率將達(dá)到6.6%,從2018年的141億美元增長(zhǎng)到2024年的208億美元。便宜,小巧,易于集成,麥克風(fēng)被廣泛采用,并達(dá)到很高的音量。Damianos:“我們使用了大約60億個(gè)麥克風(fēng),”目前麥克風(fēng)市場(chǎng)規(guī)模為17億美元,預(yù)計(jì)到2024年,其復(fù)合年增長(zhǎng)率將達(dá)到3%,達(dá)到20億美元。

MEMS麥克風(fēng)市場(chǎng)目前約占總市場(chǎng)的70%,將從2018年的12億美元增長(zhǎng)到2024年的16億美元。主要的驅(qū)動(dòng)市場(chǎng)包括智能手機(jī)、智能音箱以及可聽(tīng)設(shè)備(如無(wú)線耳機(jī))。Damianos 介紹:“在過(guò)去的幾年里,智能音箱和可聽(tīng)設(shè)備的市場(chǎng)經(jīng)歷了爆炸性的增長(zhǎng)。到2024年,智能音箱中的MEMS麥克風(fēng)的復(fù)合年增長(zhǎng)率將達(dá)到13%,達(dá)到12億只。到2024年,無(wú)線耳機(jī)的復(fù)合年增長(zhǎng)率將達(dá)到29%,達(dá)到13億部。

2019年智能手機(jī)用戶20%的人機(jī)互動(dòng)將使用語(yǔ)音助理

各大手機(jī)平臺(tái)也在積極投入,讓虛擬個(gè)人語(yǔ)音助理(VPA)的功能日益強(qiáng)大,甚至連蘋(píng)果Siri都會(huì)唱PPAP,研究機(jī)構(gòu)Gartner表示,相關(guān)技術(shù)進(jìn)展將促使用戶更常使用VPA,預(yù)計(jì)到2019年,智能型手機(jī)用戶20%的人機(jī)互動(dòng),都將使用VPA。

Gartner還公布了2016年第四季的行動(dòng)應(yīng)用調(diào)查,在中國(guó)、英國(guó)與美國(guó)調(diào)查了3021名手機(jī)用戶,發(fā)現(xiàn)美國(guó)有42%、英國(guó)有32%用戶在過(guò)去三個(gè)月內(nèi)使用過(guò)VPA功能,英美平均每天至少使用一次的用戶達(dá)37%。

有54%受訪的英美用戶過(guò)去三個(gè)月使用過(guò)蘋(píng)果的Siri,Google Now的過(guò)去三個(gè)月使用率在美國(guó)則為48%、英國(guó)41%。Gartner表示,隨著更多新功能的出現(xiàn)、更多語(yǔ)系支持,以及越來(lái)越多機(jī)種支持VPA,這類(lèi)接口的使用率將會(huì)逐步成長(zhǎng)。

Gartner表示,VPA的成長(zhǎng),會(huì)和同時(shí)間快速發(fā)展的「會(huì)話商務(wù)(conversaTIonal commerce)」相互加持,且不僅是語(yǔ)音識(shí)別為中心,通訊軟件語(yǔ)對(duì)話功能亦將扮演重要角色,例如Facebook Messenger的新商務(wù)功能便可讓用戶透過(guò)對(duì)話訂購(gòu)商品、呼叫Uber等,此外,騰訊的微信發(fā)展出的支付功能也已經(jīng)成為該通訊服務(wù)的重要功能。

Gartner表示,中國(guó)是目前全球會(huì)話商務(wù)最成熟的市場(chǎng),以通訊平臺(tái)為核心的市場(chǎng)發(fā)展?fàn)顩r已經(jīng)促使傳統(tǒng)商業(yè)進(jìn)行變革。微軟的Cortana也正整合入Skype,Cortana則負(fù)責(zé)扮演第三方服務(wù)提供商與消費(fèi)者之間、以對(duì)話呈現(xiàn)的互動(dòng)平臺(tái),協(xié)助用戶進(jìn)行機(jī)票、飯店預(yù)訂等商務(wù)活動(dòng)。

除了語(yǔ)音,Gartner亦預(yù)測(cè)現(xiàn)在是移動(dòng)電話主流互動(dòng)接口的觸控功能,將不再是消費(fèi)者唯一仰賴(lài)的接口,語(yǔ)音語(yǔ)動(dòng)作(gesture)的重要性將會(huì)在消費(fèi)性裝置上大增,預(yù)期到2020年將有70億臺(tái)個(gè)人設(shè)備、13億個(gè)穿戴式裝置與57億個(gè)其他類(lèi)消費(fèi)性物聯(lián)網(wǎng)終端裝置,將會(huì)僅有基本,或完全沒(méi)有觸控設(shè)計(jì)(Zero-Touch UI),使用傳感器針對(duì)周邊環(huán)境進(jìn)行情境信息搜集,如語(yǔ)音、環(huán)境、生物特征、移動(dòng)與動(dòng)作等信息,將會(huì)成為新型態(tài)UI的重要設(shè)計(jì)依據(jù)。

與此同時(shí),目前價(jià)值91億美元的微型揚(yáng)聲器市場(chǎng),預(yù)計(jì)在2024年將以3%的復(fù)合年增長(zhǎng)率達(dá)到109億美元。

但在2018年到2019年,智能手機(jī)市場(chǎng)放緩,可能是因?yàn)橹悄苁謾C(jī)越來(lái)越貴,手機(jī)硬件越來(lái)越好,使用壽命增加,用戶在升級(jí)之前等待的時(shí)間更長(zhǎng)。以前你每1.5年換一次手機(jī),現(xiàn)在是每2.5年換一次,而且還在增加, 我們預(yù)計(jì)麥克風(fēng)和微型揚(yáng)聲器市場(chǎng)將會(huì)下滑。事實(shí)上,可聽(tīng)設(shè)備和智能音箱的爆炸式增長(zhǎng)抵消了這種差異。VPA正在推動(dòng)所有這些設(shè)備中麥克風(fēng)和揚(yáng)聲器的集成化。

關(guān)鍵詞:




AI人工智能網(wǎng)聲明:

凡資訊來(lái)源注明為其他媒體來(lái)源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問(wèn)或質(zhì)疑,請(qǐng)立即與網(wǎng)站(www.gzlyhb.com)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。


聯(lián)系電話:021-31666777   新聞、技術(shù)文章投稿QQ:3267146135   投稿郵箱:syy@gongboshi.com

工博士人工智能網(wǎng)
商城
服務(wù)機(jī)器人
智能設(shè)備
協(xié)作機(jī)器人
智慧場(chǎng)景
AI資訊
人工智能
智能機(jī)器人
智慧城市
智慧農(nóng)業(yè)
視頻
工業(yè)機(jī)器人
教育機(jī)器人
清潔機(jī)器人
迎賓機(jī)器人
資料下載
服務(wù)機(jī)器人
工博士方案
品牌匯
引導(dǎo)接待機(jī)器人
配送機(jī)器人
酒店服務(wù)機(jī)器人
教育教學(xué)機(jī)器人
產(chǎn)品/服務(wù)
服務(wù)機(jī)器人
工業(yè)機(jī)器人
機(jī)器人零部件
智能解決方案
掃描二維碼關(guān)注微信
?掃碼反饋

掃一掃,反饋當(dāng)前頁(yè)面

咨詢(xún)反饋
掃碼關(guān)注

微信公眾號(hào)

返回頂部