日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Neoverse生態(tài)及性能優(yōu)勢和遷移建議

jf_9aVl32Dp ? 來源:Arm軟件開發(fā)者 ? 作者:Arm軟件開發(fā)者 ? 2022-11-22 15:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

簡介:Arm Neoverse生態(tài)及性能優(yōu)勢和遷移建議

2022年11月5日,“倚天開啟云原生算力新時代”專場在杭州·云棲大會D館云棲科創(chuàng)SHOW場舉行,安謀科技(Arm China)高級軟件經(jīng)理別再平帶來了題為《Neoverse生態(tài)與軟件遷移》的主題分享,詳細(xì)的介紹了Arm Neoverse生態(tài)及性能優(yōu)勢和遷移建議,本文根據(jù)該演講整理而成。

01 Arm完善、豐富的生態(tài)成為國內(nèi)外多家云廠商首選

在Arm的生態(tài)系統(tǒng)中包含CPU架構(gòu)、CPU微架構(gòu),芯片實現(xiàn)三個概念,CPU架構(gòu)定義了用戶對CPU核心的期望行為,包括寄存器、內(nèi)存模型,異常模型等等,而CPU微架構(gòu)則是一個CPU核心的具體實現(xiàn),芯片則是芯片廠商在CPU核心的基礎(chǔ)上配合各種加速器和總線互聯(lián)最終實現(xiàn)。

950c000c-69a4-11ed-8abf-dac502259ad0.png

同一個CPU架構(gòu)可以有不同的微架構(gòu)實現(xiàn),例如上圖右側(cè)中的例子:Arm的Cortex A710和Arm的Neoverse N2兩款CPU核心,都是基于Armv9.0架構(gòu)實現(xiàn),同一款軟件也同樣可以在兩款CPU上運(yùn)行。

95663388-69a4-11ed-8abf-dac502259ad0.png

上圖中展示的是Arm的CPU架構(gòu)演進(jìn),Arm自2011年推出基于64位的Armv8架構(gòu)以來,保持著逐代演進(jìn)的節(jié)奏,根據(jù)市場和客戶的需求,不斷地在安全、性能、功能等方面加入不同的CPU特性,不同的CPU特性會組合成為一個CPU擴(kuò)展,也就是一個小(新)版本。Arm的CPU版本是逐年演進(jìn)且向前兼容的,像Neoverse N2是基于Armv9的架構(gòu),它可以同時兼容前代架構(gòu)的所有特性,系統(tǒng)軟件等也可以通過查詢系統(tǒng)寄存器了解當(dāng)前硬件所實現(xiàn)的具體CPU架構(gòu)特性。

96747aaa-69a4-11ed-8abf-dac502259ad0.png

2018年Arm戰(zhàn)略性地將服務(wù)器芯片設(shè)計和傳統(tǒng)客戶端芯片設(shè)計分離,推出了Arm Neoverse產(chǎn)品線,縱向看Arm Neoverse平臺有三個系列產(chǎn)品,V系列、N系列和E系列。V系列強(qiáng)調(diào)性能,可提供最高單核處理能力,主要用于HPC和數(shù)據(jù)中心云應(yīng)用等;N系列更注重性能、功耗和面積的平衡,具備最高的可擴(kuò)展性,主要適用于數(shù)據(jù)中心、云計算應(yīng)用;E系列更注重功耗和面積,主要應(yīng)用于無線接入等功耗受限的領(lǐng)域。

橫向看Neoverse平臺近幾年推出的CPU產(chǎn)品,N1平臺是第一代聚焦基礎(chǔ)設(shè)施的CPU實現(xiàn),目前已經(jīng)獲得廣泛應(yīng)用。在服務(wù)器領(lǐng)域,基于N1的產(chǎn)品有AWS和Ampere的服務(wù)器芯片,DPU領(lǐng)域有英特爾基于Neoverse N1的DPU實現(xiàn)。第二代是V1,屬V系列產(chǎn)品,更注重單核性能,新增2×256的SVE加速引擎,AWS的Graviton 3是基于V1來實現(xiàn)的,并且已經(jīng)于今年5月份正式商用。

N2是第一個支持Armv9架構(gòu)的CPU核心,支持2×128的SVE引擎,倚天710芯片也是基于N2平臺實現(xiàn)的。

Poseidon平臺基于Armv9.2架構(gòu),在N2的基礎(chǔ)上性能再提高30%,且增加了CCA架構(gòu)特性,支持機(jī)密計算。

96fea32e-69a4-11ed-8abf-dac502259ad0.png

上圖展示的是Arm Neoverse平臺推出以來,在最近兩年時間里取得的一些成就??梢钥吹皆谠粕?,AWS、微軟、谷歌、阿里云等都推出了基于Arm Neoverse的云實例。在智能網(wǎng)卡領(lǐng)域,Marvell推出了基于Neoverse的智能網(wǎng)卡,谷歌云和英特爾聯(lián)合推出了“Mt Evans”DPU。在企業(yè)領(lǐng)域,惠普發(fā)布了基于Ampere的ProLiant Gen11平臺,也代表Arm正進(jìn)入傳統(tǒng)的企業(yè)領(lǐng)域。同時在規(guī)范方面,Arm推出了System Ready認(rèn)證項目,針對Arm系統(tǒng)的軟硬件進(jìn)行測試認(rèn)證,確保最終Arm的系統(tǒng)可以開箱即用和安裝多樣的操作系統(tǒng),過去兩年已經(jīng)有五十多個系統(tǒng)獲得System Ready認(rèn)證。

971ee10c-69a4-11ed-8abf-dac502259ad0.png

聚焦云計算領(lǐng)域,從上圖中可以看到Arm Neoverse系統(tǒng)已經(jīng)被部署在公有云、私有云,混合云等方方面面,且已經(jīng)被國內(nèi)外主流云計算廠商所采用,比如阿里云、騰訊云、AWS、微軟、谷歌等。

976e287a-69a4-11ed-8abf-dac502259ad0.png

在云原生的軟件生態(tài)方面,Arm持續(xù)致力于開源軟件開發(fā)和支持。目前Arm對超過100個開源項目進(jìn)行投入,可以看到(上圖)自下而上從網(wǎng)絡(luò)、OS、虛擬化、容器,編程語言以及各種上層應(yīng)用負(fù)載,Arm都有很完善的支持。對底層網(wǎng)絡(luò)側(cè)的DPDK、OVS、ODP均可支持。在語言層面,OpenJDK、GoLang等也都可以在Arm平臺上直接運(yùn)行,包括壓縮方面的主流計算庫,Arm也可以很好的支持。

頂部(上圖)列出了一些主流的云負(fù)載應(yīng)用,有常見的一些數(shù)據(jù)庫、緩存、Web服務(wù)器、大數(shù)據(jù)、存儲等。左側(cè)(上圖)中可以看到Arm在CI/CD領(lǐng)域也有很大的投入,GitLab、Github Actions、Travis等都原生支持Arm系統(tǒng),方便開發(fā)者在Arm系統(tǒng)上進(jìn)行開發(fā)構(gòu)建。

983b986e-69a4-11ed-8abf-dac502259ad0.png

在操作系統(tǒng)領(lǐng)域,從主流的發(fā)行版OS到社區(qū)版OS,Arm都已經(jīng)是所謂的”第一等公民“,Red Hat Enterprise Linux、CentOS、SUSE、龍蜥社區(qū)等對Arm系統(tǒng)都有原生支持。

98882bca-69a4-11ed-8abf-dac502259ad0.png

在編譯器領(lǐng)域,在GCC和LLVM,Arm和生態(tài)伙伴一起合作,持續(xù)投入,確保在Silicon硬件系統(tǒng)面世以前,相應(yīng)的架構(gòu)特性和微架構(gòu)實現(xiàn)就在編譯器中獲得支持。隨著編譯器版本的更新,Arm會逐步支持相應(yīng)架構(gòu)特性,以及相應(yīng)微架構(gòu)實現(xiàn),保證客戶用最簡便的編譯方法獲得最優(yōu)化的運(yùn)行性能。

98af0f6a-69a4-11ed-8abf-dac502259ad0.png

從另一角度可以看到,Arm會把自己的IP路線圖和編譯器路線圖相配合,例如在2024年之后,相應(yīng)的編譯器就會支持Poseidon,我們會在Poseidon平臺落地前,就把相應(yīng)的功能支持加入到編譯器當(dāng)中,保證最終用戶拿到硬件之后可以第一時間用現(xiàn)有的編譯器獲得最好的性能。

02 多兼容,可擴(kuò)展,Arm多業(yè)務(wù)場景性能大幅提升

下圖中列了Neoverse平臺的N1、N2兩款CPU核心以及Cortex A72的性能對比及架構(gòu)特性的增強(qiáng)。Arm Neoverse N1這款CPU核心,對比Cortex A72有60%的性能提升,同時降低了30%的功耗。Arm Neoverse N1加入了很多服務(wù)器領(lǐng)域的架構(gòu)特性,例如獨(dú)立的L2 Cache,支持原子操作,同時也支持基本的RAS特性。

9927bcbc-69a4-11ed-8abf-dac502259ad0.png

接下來的Neoverse N2 CPU核心,在N1基礎(chǔ)上提升了35%的性能,且保持了同樣的功耗,使得N2有了非常好的可擴(kuò)展性,同時N2也是第一款支持Armv9架構(gòu)的CPU實現(xiàn),尤其指出N2實現(xiàn)了MPAM架構(gòu)特性,類似于傳統(tǒng)x86的RDT,可以把內(nèi)存及cache進(jìn)行隔離劃分,可以避免系統(tǒng)抖動及云環(huán)境下多租戶之間的相互影響。

997cc388-69a4-11ed-8abf-dac502259ad0.png

使用基于Arm Neoverse平臺的服務(wù)器,可以獲得更高的性能,更低的功耗,以及最終帶來更低的部署成本。給大家列一個端到端的例子,上圖中包含網(wǎng)絡(luò)服務(wù)的端到端的解決方案,可以看到從整個解決方案中的各種軟件,Arm都有相應(yīng)的性能提升,比較熟悉的包括前端的web服務(wù)、反向代理、防火墻,后端的數(shù)據(jù)庫、緩存,以及業(yè)務(wù)處理的Java、視頻編解碼等,Arm系統(tǒng)相對于同代的x86系統(tǒng),都有20%以上的性能優(yōu)勢。

99ac4176-69a4-11ed-8abf-dac502259ad0.png

相對于第一代N1來說,N2在各種應(yīng)用負(fù)載上均有大幅的性能提升,在MemcacheD、MySQL、NGINX上分別有30%、29%、48%的性能提升。

99d76e50-69a4-11ed-8abf-dac502259ad0.png

上圖中為大家展示的是我們基于Neoverse N2的倚天G8y實例,和傳統(tǒng)x86實例的實測對比結(jié)果,我們對Web服務(wù)器場景進(jìn)行測試,使用默認(rèn)的編譯器及軟件版本,最終測試得到的結(jié)果顯示,對于HTTP場景下,G8y實例相對于x86實例有20%的性能優(yōu)勢。如果再考慮加密層面,針對HTTPS進(jìn)行測試會有38%的性能優(yōu)勢。倚天G8y實例將于11月15號正式商用,相應(yīng)的測試參數(shù)都在上圖中列了出來,大家可以參考進(jìn)行對比測試。

99fc0594-69a4-11ed-8abf-dac502259ad0.png

同時我們也進(jìn)行了內(nèi)存數(shù)據(jù)庫Redis的測試,在pipeline參數(shù)分別設(shè)置為1、50、100的情況下,基于倚天710芯片的g8y實例相對于x86實例分別有10%、20%,36%的性能收益。其中整個軟件都是直接用現(xiàn)有的開源軟件項目直接下載并直接編譯安裝,無需經(jīng)過任何手動優(yōu)化即可獲得圖中的結(jié)果。

03 有效操作優(yōu)化保障代碼安全,實現(xiàn)性能提升

在上文中我們已經(jīng)看到,Arm本身有很完善的軟件生態(tài),尤其在云原生領(lǐng)域,用戶在使用的時候,基本無需進(jìn)行特殊代碼改動,接近于開箱即用的場景,我這邊給到大家的遷移建議主要是針對一些自研非開源的軟件,尤其是大家之前的軟件中使用了一些針對x86系統(tǒng)的手動優(yōu)化,在這些場景下,主要是在SIMD并發(fā)處理和內(nèi)存訪問優(yōu)化方面給大家提一些建議。

9a38ebc6-69a4-11ed-8abf-dac502259ad0.png

首先是SIMD單指令多數(shù)據(jù)的優(yōu)化,通過使用這種技術(shù),我們可以在一條指令中同時執(zhí)行多個操作,提高操作并行度,進(jìn)而最終提高IPC。Arm架構(gòu)主要包含兩個架構(gòu)擴(kuò)展,Neon和SVE,特別適合用在一些數(shù)據(jù)量比較大的處理場景,起到加速作用,例如視頻編解碼、圖形圖像處理、音頻語音處理、壓縮與解壓縮,以及一些網(wǎng)絡(luò)的處理等等。

9a99991c-69a4-11ed-8abf-dac502259ad0.png

首先來看Neon,我們可以把一個128比特的寄存器,當(dāng)做是幾個元素的集合,元素的大小可以是8、16、32、64位,元素可以被當(dāng)作整數(shù)或者浮點數(shù)進(jìn)行處理,但是要保證這里面的每個元素和數(shù)據(jù)類型是相同的,對應(yīng)的元素會組成一個通道,當(dāng)我們執(zhí)行一條Neon指令的時候,就可以同時處理多個數(shù)據(jù)元素,提高效率。

9ae3ef76-69a4-11ed-8abf-dac502259ad0.png

再看SVE架構(gòu)擴(kuò)展,其功能和Neon類似,但SVE相比Neon主要有兩個方面的優(yōu)勢:

1、從架構(gòu)角度看,Neon寄存器寬度固定為128比特,限制了它的擴(kuò)展。SVE在架構(gòu)上允許從128一直到2048比特的位寬,只要是128比特的整數(shù)倍就可以,給了設(shè)計者更大的靈活度。

2、從軟件角度看,SVE在軟件上不需要關(guān)心Vector具體的寬度,開發(fā)人員只需要寫一套代碼,就可以運(yùn)行在不同硬件上。

9b125226-69a4-11ed-8abf-dac502259ad0.png

關(guān)于使用Neon和SVE加速,最常用的方式是通過傳入一些編譯選項,或者編譯器識別當(dāng)前CPU類型去自動應(yīng)用Neon和SEV加速。但如果大家發(fā)現(xiàn)了一些熱點想要手動進(jìn)行優(yōu)化的時候,建議直接用intrinsics方式,相對于匯編代碼,代碼邏輯更清晰且更容易編寫,同時也便于編譯器進(jìn)一步進(jìn)行性能優(yōu)化。

9b5279f0-69a4-11ed-8abf-dac502259ad0.png

關(guān)于性能優(yōu)化的例子:Arm在SPDK當(dāng)中應(yīng)用Neon對算法進(jìn)行優(yōu)化,無論編碼還是解碼,基本上都有大約2倍的性能提升,在SPDK內(nèi)存清零操作中,使用SVE加速獲得了8倍的性能提升。右側(cè)(上圖)是代碼的示例,通過代碼示例,在右下角也可以看到,這套代碼沒有具體vector寬度的指定,不管最終SVE硬件的寬度是128還是256, 都可以直接運(yùn)行。另外也可以看到這個SVE版本的循環(huán)沒有針對尾循環(huán)的特殊處理,因為SVE擴(kuò)展配合特殊的循環(huán)指令以及相應(yīng)的掩碼預(yù)測寄存器,可以自動處理尾循環(huán)。

9b9de264-69a4-11ed-8abf-dac502259ad0.png

Arm和傳統(tǒng)x86 CPU之間一個很顯著的區(qū)別是它們的內(nèi)存模型(memory model)。大家最直觀的內(nèi)存序是順序內(nèi)存序(SC),這種情況下所有的內(nèi)存操作都不會亂序,好處是容易理解,但對于CPU的實現(xiàn)限制太嚴(yán),會嚴(yán)重影響CPU性能。目前比較多的是x86采用的TSO模型,相對于第一種SC,解除了一些限制,允許存儲和加載這兩個操作亂序。

Arm架構(gòu)則采用了一種限制更少的memory model,這種模型下所有的內(nèi)存加載和存儲操作都可以進(jìn)行亂序,這樣給了微架構(gòu)設(shè)計者最大的自主權(quán),可以帶來更高的性能。

9bc57c16-69a4-11ed-8abf-dac502259ad0.png

Arm為了提高性能允許各種內(nèi)存操作進(jìn)行亂序,當(dāng)我們需要按照一種固定的順序執(zhí)行時,Arm提供了各種內(nèi)存柵欄來保證內(nèi)存訪問的順序,幫助大家來保證代碼正確性。從左到右(上圖)分別是Load-Acquire / Store-Release半柵欄、DMB全柵欄、DSB、ISB,屏障的限制越來越強(qiáng),對性能的影響也越來越大,在保障正確性的前提下,盡量選擇比較弱的柵欄,做到恰到好處地實現(xiàn)正確性和性能的平衡。

我們的建議是寫代碼時,先選擇比較強(qiáng)的柵欄,保證代碼的正確性,后續(xù)進(jìn)行代碼評測優(yōu)化的過程中如果發(fā)現(xiàn)成為瓶頸的話,再選用一些比較弱的柵欄進(jìn)行優(yōu)化。

9c066f82-69a4-11ed-8abf-dac502259ad0.png

上圖是Arm對DPDK Virtio應(yīng)用進(jìn)行優(yōu)化的例子,包含前端后端,通過一個隊列進(jìn)行通信,相當(dāng)于一個生產(chǎn)者一個消費(fèi)者。這里最初使用的是全柵欄,后續(xù)在性能測試時發(fā)現(xiàn)是一個瓶頸,做優(yōu)化時把相應(yīng)的全柵欄DMB換成了半柵欄后,在PVP測試場景下獲得了20%的性能提升,只要改動這一處即可達(dá)到性能提升的效果。

9c5f1c22-69a4-11ed-8abf-dac502259ad0.png

這里說明一下,Arm memory model是一種硬件定義的內(nèi)存模型,對于大多數(shù)情況,我們并不建議大家直接操作依賴于具體架構(gòu)的匯編代碼,一種更推薦的方式是借助于語言定義的memory model,例如我們可以使用C++11或者C11的memory model,調(diào)用其API,這樣工具鏈會處理語言的memory model并自動映射到最終硬件架構(gòu)的memory model,這樣的操作方便移植且不容易出錯。

最后再次強(qiáng)調(diào),與內(nèi)存序相關(guān)的編程非常復(fù)雜,memory model是非常容易出問題的點,我們必須仔細(xì)權(quán)衡其正確性和性能。為了代碼的安全,建議大家在開發(fā)初期可以使用一些較強(qiáng)的屏障指令保證邏輯正確,在后續(xù)的代碼優(yōu)化過程當(dāng)中,通過移除一些冗余屏障或在必要時切換到較輕的屏障,最終達(dá)到提高性能的目的。

以上就是我要分享的全部內(nèi)容,謝謝大家。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11339

    瀏覽量

    226017
  • 遷移
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    8189
  • 生態(tài)系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    711

    瀏覽量

    21617

原文標(biāo)題:安謀科技(Arm China)高級軟件經(jīng)理別再平:Neoverse生態(tài)與軟件遷移

文章出處:【微信號:Arm軟件開發(fā)者,微信公眾號:Arm軟件開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    北京車展|Arm 生態(tài)加持,助力物理 AI 創(chuàng)新落地

    4 月 24 日,以“領(lǐng)時代·智未來”為主題的 2026 北京國際汽車展覽會盛大啟幕,本屆展會首次采用雙館聯(lián)展模式,拓寬產(chǎn)業(yè)展示維度,構(gòu)建整車產(chǎn)業(yè)與底層算力深度融合的發(fā)展生態(tài)。展會上包括黑芝麻智能
    的頭像 發(fā)表于 04-28 15:55 ?93次閱讀

    Arm親自下場!自研首款數(shù)據(jù)中心AGI CPU發(fā)布!

    Arm今日發(fā)布首款由 Arm 設(shè)計的數(shù)據(jù)中心 CPU——Arm AGI CPU,專為代理式 AI 基礎(chǔ)設(shè)施打造,可實現(xiàn)單機(jī)架性能達(dá)到 x86 平臺的兩倍以上。 ? ? ? 在公司超過
    的頭像 發(fā)表于 03-25 08:39 ?3095次閱讀
    <b class='flag-5'>Arm</b>親自下場!自研首款數(shù)據(jù)中心AGI CPU發(fā)布!

    如何在Arm Neoverse N2平臺上提升llama.cpp擴(kuò)展性能

    跨 NUMA 內(nèi)存訪問可能會限制 llama.cpp 在 Arm Neoverse 平臺上的擴(kuò)展能力。本文將為你詳細(xì)分析這一問題,并通過引入原型驗證補(bǔ)丁來加以解決。測試結(jié)果表明,在基于 Neoverse N2 平臺的系統(tǒng)上運(yùn)行
    的頭像 發(fā)表于 02-11 10:06 ?342次閱讀

    西門子EDA與Arm攜手合作加速系統(tǒng)設(shè)計驗證進(jìn)程與軟件啟動

    對芯片設(shè)計而言,加速產(chǎn)品的上市流程至關(guān)重要。為此,西門子EDA與Arm攜手合作,為Arm的合作伙伴提供了一系列基于Arm Neoverse CSS與
    的頭像 發(fā)表于 12-19 09:06 ?918次閱讀
    西門子EDA與<b class='flag-5'>Arm</b>攜手合作加速系統(tǒng)設(shè)計驗證進(jìn)程與軟件啟動

    Arm架構(gòu)助力Azure Cobalt 100虛擬機(jī)工作負(fù)載性能提升

    的 32 個地區(qū)上線,并且持續(xù)快速擴(kuò)展,為新一代數(shù)據(jù)中心工作負(fù)載帶來了性能、能效和可擴(kuò)展性的大幅提升。這些提升源于專為賦能現(xiàn)代云原生應(yīng)用設(shè)計的創(chuàng)新 Arm Neoverse 計算子系統(tǒng) (Compute Subsystems,
    的頭像 發(fā)表于 12-15 14:42 ?838次閱讀
    <b class='flag-5'>Arm</b>架構(gòu)助力Azure Cobalt 100虛擬機(jī)工作負(fù)載<b class='flag-5'>性能</b>提升

    Arm Neoverse平臺集成NVIDIA NVLink Fusion

    生態(tài)系統(tǒng),實現(xiàn)全緩存一致性與高帶寬互連。 隨著 AI 數(shù)據(jù)中心對 Arm Neoverse 的需求持續(xù)增長,客戶在將工作負(fù)載加速器連接至 Arm 平臺時擁有更多選擇。 人工智能 (A
    的頭像 發(fā)表于 11-26 11:08 ?592次閱讀

    Arm Neoverse CPU上大代碼量Java應(yīng)用的性能測試

    Java 是互聯(lián)網(wǎng)領(lǐng)域廣泛使用的編程語言。Java 應(yīng)用的一些特性使其性能表現(xiàn)與提前編譯的原生應(yīng)用(例如 C 程序)大相徑庭。由于 Java 字節(jié)碼無法直接在 CPU 上執(zhí)行,因此通常運(yùn)行時在
    的頭像 發(fā)表于 11-05 11:25 ?970次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CPU上大代碼量Java應(yīng)用的<b class='flag-5'>性能</b>測試

    全新Arm Lumex CSS平臺實現(xiàn)兩位數(shù)性能提升

    及下一代個人電腦加速其人工智能 (AI) 體驗的先進(jìn)計算平臺。Lumex CSS 平臺集成了搭載第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù)的最高性能 Arm CPU、GPU 及系統(tǒng) IP,不僅能助力生態(tài)
    的頭像 發(fā)表于 09-10 16:14 ?1080次閱讀
    全新<b class='flag-5'>Arm</b> Lumex CSS平臺實現(xiàn)兩位數(shù)<b class='flag-5'>性能</b>提升

    微電子所在芯粒集成電遷移EDA工具研究方向取得重要進(jìn)展

    優(yōu)勢,獲得廣泛青睞。但芯粒集成中普遍存在供電電流大、散熱困難等問題,導(dǎo)致其面臨嚴(yán)峻的電遷移可靠性挑戰(zhàn)。針對工藝層次高度復(fù)雜的芯粒集成系統(tǒng),如何實現(xiàn)電遷移問題的精確高效仿真,并完成電遷移
    的頭像 發(fā)表于 09-01 17:40 ?916次閱讀
    微電子所在芯粒集成電<b class='flag-5'>遷移</b>EDA工具研究方向取得重要進(jìn)展

    如何在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6?

    在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6!
    發(fā)表于 08-20 06:29

    Arm神經(jīng)超級采樣 以ML進(jìn)一步強(qiáng)化性能 實現(xiàn)卓越的移動端圖形性能

    作者:Arm 戰(zhàn)略與生態(tài)部主任工程師 Sergio Alapont 為滿足用戶對于手游體驗的期望,例如更清晰的畫面、更流暢的游戲體驗,以及更長的電池續(xù)航時間,全球手游開發(fā)者正面對著日益激增的壓力。在
    的頭像 發(fā)表于 08-14 18:15 ?4994次閱讀
    <b class='flag-5'>Arm</b>神經(jīng)超級采樣 以ML進(jìn)一步強(qiáng)化<b class='flag-5'>性能</b> 實現(xiàn)卓越的移動端圖形<b class='flag-5'>性能</b>

    西門子 Veloce CS 助力 Arm Neoverse 計算子系統(tǒng)驗證與確認(rèn)

    子系統(tǒng) (CSS) 的設(shè)計流程的一部分。 對于我們的生態(tài)合作伙伴而言,產(chǎn)品上市速度日益成為關(guān)注焦點,而這也是在當(dāng)前計算時代保持競爭力的關(guān)鍵。Arm Neoverse CSS 的核心要素之一
    的頭像 發(fā)表于 08-06 09:26 ?3104次閱讀

    包云崗:原位替代 ARM,并未真正發(fā)揮 RISC-V 的優(yōu)勢

    RISC-V 的核心優(yōu)勢在于開放開源的模塊化設(shè)計,相比之下,ARM優(yōu)勢在于成熟的生態(tài)閉環(huán)。因此,在第五屆(2025)RISC-V 中國峰會主論壇上,中國科學(xué)院計算技術(shù)研究所副所長、
    發(fā)表于 07-17 14:54 ?5257次閱讀

    Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現(xiàn) DeepSeek-R1 滿血版的部署,目前已可提供線上服務(wù)。
    的頭像 發(fā)表于 07-03 14:37 ?1463次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> N2平臺實現(xiàn)DeepSeek-R1滿血版部署

    Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀

    汽車市場的落地形態(tài),Zena 旨在解決汽車智能化轉(zhuǎn)型中的算力需求、開發(fā)效率與功能安全挑戰(zhàn)。以下從技術(shù)架構(gòu)、性能優(yōu)勢、應(yīng)用場景、生態(tài)系統(tǒng)及戰(zhàn)略意義展開分析: 一、技術(shù)架構(gòu):異構(gòu)集成與功能安全強(qiáng)化
    的頭像 發(fā)表于 05-29 09:51 ?2728次閱讀
    乌审旗| 延边| 锦屏县| 夏河县| 五常市| 无棣县| 新和县| 荥经县| 将乐县| 和龙市| 祁东县| 双流县| 平邑县| 崇仁县| 调兵山市| 乐清市| 县级市| 拜泉县| 金山区| 拜城县| 溧水县| 吉首市| 霸州市| 秦皇岛市| 麻江县| 陵川县| 沐川县| 错那县| 皮山县| 兰州市| 加查县| 五家渠市| 抚宁县| 新宾| 皮山县| 宁远县| 苍山县| 德令哈市| 邓州市| 固阳县| 汉阴县|