如今,人工智能已成為普遍的流行語,但大多數(shù)消費者可能不知道它如何與日常生活息息相關(guān)。分析人員和技術(shù)新聞界中的某些人可能還會嘲笑該術(shù)語用于某些幾乎不像真正的人工智能的技術(shù)的頻率。也就是說,除了強大的數(shù)據(jù)中心外,還有一些平臺對于AI處理和驅(qū)動它們的NN(神經(jīng)網(wǎng)絡(luò))來說是很自然的。其中之一是AI推理(使用AI推理信息,而不是訓(xùn)練NN)在邊緣和口袋中,使用智能手機。
就像您想象的那樣,從Android到Apple的智能手機平臺差別很大,但是語音-文本翻譯和推薦器引擎(例如Google Assistant和Siri)等常見工作負載大量使用了常見的AI NN模型,在設(shè)備上執(zhí)行此操作可提高速度和延遲。
衡量移動設(shè)備中的AI性能
隨著任何新設(shè)備的推出以及熱門新應(yīng)用的出現(xiàn),精通技術(shù)的消費者和技術(shù)媒體成員希望能夠衡量和收集各種移動生態(tài)系統(tǒng)中設(shè)備的相對性能。此外,目前智能手機測試和評論中的AI處理性能正在發(fā)展,因此,在主要的應(yīng)用商店中當然會出現(xiàn)多種工具,這些工具聲稱能夠測量電話和其他移動設(shè)備的AI性能。而且-您猜對了-這些應(yīng)用程序的創(chuàng)建肯定不盡相同。為了解決這個問題,Marco和我深入研究了HotHardware,分析了三種主流AI基準測試中各種旗艦Android手機的性能,這些基準在某些情況下會產(chǎn)生截然不同的結(jié)果。
關(guān)鍵是要更好地了解實際測試的特定基準度量標準。測試是否代表盡可能接近實際的工作負載?理想的基準測試使用的是消費者可能會使用的實際應(yīng)用程序,但短短的基準測試可以使用流行應(yīng)用程序的相同核心軟件組件來代表實際的性能期望。在這種情況下,這意味著我們需要了解這些基準測試工具要針對哪些NN進行測試,以及要使用哪些數(shù)學精度和AI算法來處理這些工作量。