最需要產(chǎn)業(yè)界同心協(xié)力的議題,卻往往最具爭議性,這實(shí)在是個很諷刺的狀況;在那些議題中,爭議性最大的又莫過于性能基準(zhǔn)測試(performance benchmarking)。幸好,我們正緩慢地朝正確的方向前進(jìn),但還需要更多的努力。
測試基準(zhǔn)被廣泛應(yīng)用在評估各種電子裝置,為了取得高評價,芯片與系統(tǒng)供貨商都非常積極于目標(biāo)測試基準(zhǔn)的“優(yōu)化”;但有的時候那些優(yōu)化行動卻更像是人為操縱??萍夹侣劤涑庵还降幕鶞?zhǔn)檢驗(yàn)案例,那些只是冰山一角。
測試基準(zhǔn)還面臨其他的局限;技術(shù)創(chuàng)新的高速度使得透過能反映各種平臺上實(shí)際使用者體驗(yàn)的方式,精準(zhǔn)體驗(yàn)測試一套系統(tǒng)所有功能的任務(wù)成為挑戰(zhàn)。舉例來說,影像擷取以及編輯功能也許涉及眾多芯片以及應(yīng)用程序編程接口(API),要在Android、iOS與Windows手機(jī)平臺之間做有意義的比較,是白費(fèi)力氣的。
一套優(yōu)良的測試基準(zhǔn)應(yīng)該包含五項(xiàng)要素
首先,最基本的是透明度(transparency)。測試基準(zhǔn)有時候只比黑盒子好一點(diǎn),只提供測試結(jié)果數(shù)字,但對測試的過程或計分方法透露甚少;甚至有時候連被測試的功能或是所依循的標(biāo)準(zhǔn)都不明確。
測試基準(zhǔn)的擁有者往往以機(jī)密為理由,表示測試本身擁有知識產(chǎn)權(quán)或是利用了專屬信息;但我們認(rèn)為,測試基準(zhǔn)應(yīng)該是經(jīng)由一個跨產(chǎn)業(yè)的組織批準(zhǔn),且(或)所有的計分方式應(yīng)是受公開審查的。此外,測試基準(zhǔn)應(yīng)該要包含受測功能與標(biāo)準(zhǔn)的列表。
優(yōu)良測試基準(zhǔn)的第二個要素,應(yīng)該是能受獨(dú)立驗(yàn)證的。通常基準(zhǔn)檢驗(yàn)執(zhí)行機(jī)構(gòu)會在公布結(jié)果之前先為其背書,有些使用者或供貨商也會自己上傳或進(jìn)行某些基準(zhǔn)檢驗(yàn);雖然系統(tǒng)調(diào)節(jié)如超頻(overclocking)能對測試結(jié)果產(chǎn)生影響,與眾多用戶的平均測試成績差距太大的系統(tǒng),通常會被懷疑。
第三個要素是,測試基準(zhǔn)需要某種形式的監(jiān)督,以確保測試程序的一致性;優(yōu)化在基準(zhǔn)檢驗(yàn)程序中是不應(yīng)該被容忍的,所有的平臺所接受的測試程序應(yīng)該都是相同的。
第四,一個真正的測試基準(zhǔn),特別是移動裝置的測試基準(zhǔn),應(yīng)該要以某種形式的系統(tǒng)及測試來呈現(xiàn)。
特定零組件如CPU、GPU與內(nèi)存,很容易被挑出來測試,但其他如無線網(wǎng)絡(luò)鏈接性、傳感器性能、電池壽命、顯示器功能等卻很難量化;而任何一種移動終端的終極測試應(yīng)該是使用者體驗(yàn),優(yōu)良的測試基準(zhǔn)至少必須要能呈現(xiàn)這一點(diǎn)。最后一個測試基準(zhǔn)要素是會定期更新,最好是每年一次;產(chǎn)業(yè)界應(yīng)該停止使用不合時宜的測試基準(zhǔn)。
有鑒于眾多棘手的問題,采用一系列基準(zhǔn)來評估各種技術(shù)或平臺,似乎被視為最佳實(shí)踐方式;這通常導(dǎo)致有一長串的測試基準(zhǔn),而且測試結(jié)果各不相同。當(dāng)使用者看到那些讓人眼花撩亂的不同測試結(jié)果,恐怕感到非常沮喪。
一個新興的移動終端測試基準(zhǔn)
有個好消息是,一個最近推出的移動終端測試基準(zhǔn)AndEBench,可望能為以上種種問題帶來解決方案;該基準(zhǔn)是由嵌入式微處理器測試基準(zhǔn)聯(lián)盟(Embedded Microprocessor Benchmark Consortium,EEMBC)所開發(fā),聯(lián)盟成員包括ARM、Imagination Technologies、Intel、Marvell、Nvidia、Qualcomm與Samsung等大廠。
EEMBC還有管理委員會,能針對測試基準(zhǔn)的變更,以及可公布那些性能數(shù)據(jù)做最終裁決;該測試基準(zhǔn)的最新版本為AndEBench-Pro,是一個針對CPU、內(nèi)存、儲存、3D繪圖以及整體平臺性能的Java架構(gòu)測試,測試結(jié)果能以各自獨(dú)立、也能以匯總的形式來呈現(xiàn)。
AndEBench-Pro測試基準(zhǔn)的各功能計分比重
目前AndEBench測試基準(zhǔn)只鎖定Android平臺,而且并不支持最新的標(biāo)準(zhǔn)如OpenGL ES 3.0、OpenCL等,此外也缺乏測試全系統(tǒng)功能,或者是可能與特定使用模式相關(guān)的特定應(yīng)用。不過該測試基準(zhǔn)符合所有上述的優(yōu)良測試基準(zhǔn)要素,包括測試程序、計分方法的透明度,提供經(jīng)管理單位驗(yàn)證的測試結(jié)果,測試程序的一致性,以及定期更新。
不過AndEBench還不夠完善,EEMBC還在為采用該測試基準(zhǔn)的模式訂定標(biāo)準(zhǔn);而EEMBC也坦承,還需要更多的努力,來自產(chǎn)業(yè)界其他更多關(guān)鍵技術(shù)供貨商、行動裝置制造商的參與是必要的,才能改善基準(zhǔn)檢驗(yàn)的程序并確保該基準(zhǔn)能支持不同的平臺。
長久以來,測試基準(zhǔn)一直是產(chǎn)業(yè)界的爭議焦點(diǎn);不該再抱怨,現(xiàn)在正是整個產(chǎn)業(yè)界采取行動、為行動裝置系統(tǒng)測試基準(zhǔn)開發(fā)更完善標(biāo)準(zhǔn)的時候!
-
手機(jī)
+關(guān)注
關(guān)注
36文章
7006瀏覽量
161219 -
cpu
+關(guān)注
關(guān)注
68文章
11332瀏覽量
225994 -
gpu
+關(guān)注
關(guān)注
28文章
5283瀏覽量
136103
發(fā)布評論請先 登錄
晶圓級封裝的五項(xiàng)基本工藝
USB3.0中ESD應(yīng)用的五大要素
節(jié)日燈TSCA測試報告 圣誕燈TSCA五項(xiàng)PBT物質(zhì)檢測
美國EPA發(fā)布了TSCA 五項(xiàng)PBT物質(zhì)進(jìn)行管控
新消息!美國TSCA五項(xiàng)PBT物質(zhì)檢測測試要求
移動電源TSCA五項(xiàng)PBT物質(zhì)檢測報告
美國環(huán)保新規(guī)則-TSCA五項(xiàng)PBT物質(zhì)測試
使用集成示波器執(zhí)行五項(xiàng)常見調(diào)試任務(wù),不看肯定后悔
泰國央行發(fā)出通知禁止該國金融機(jī)構(gòu)進(jìn)行五項(xiàng)加密活動
谷歌將推出五項(xiàng)安卓新功能
谷歌針對Android和iOS版Chrome發(fā)布五項(xiàng)更新
浪潮信息AS13000G7榮獲MLPerf? AI存儲基準(zhǔn)測試五項(xiàng)性能全球第一
手機(jī)系統(tǒng)測試基準(zhǔn)的五項(xiàng)要素說明
評論