新疆信息港 > 財(cái)經(jīng) >向7nm時(shí)代的性能巔峰出擊！ARM Cortex-A76架構(gòu)解析

向7nm時(shí)代的性能巔峰出擊！ARM Cortex-A76架構(gòu)解析

2020-09-24 06:08:19

來源：互聯(lián)網(wǎng)

閱讀：-

ARM的處理器架構(gòu)基本上維持著一年一變。從早期的Cortex-A15到Cortex-A57，再到Cortex-A72、Cortex-A73以及Cortex-A75，ARM最近數(shù)年內(nèi)不斷通過發(fā)布全新架構(gòu)...

ARM的處理器架構(gòu)基本上維持著一年一變。從早期的Cortex-A15到Cortex-A57，再到Cortex-A72、Cortex-A73以及Cortex-A75，ARM最近數(shù)年內(nèi)不斷通過發(fā)布全新架構(gòu)，推動了移動計(jì)算性能的不斷前行。今年五月，ARM又發(fā)布了全新的Cortex-A76架構(gòu)，這款架構(gòu)瞄準(zhǔn)的是全新7nm工藝，其性能表現(xiàn)有望再攀高峰。

ARM在五月的ARM Tech Day上，發(fā)布了一個(gè)全新的架構(gòu)：Cortex-A76。和近期所有命名為“7x”的架構(gòu)一樣的是，Cortex-A76是一款主打高性能的大核心產(chǎn)品。實(shí)際上，這款全新的高性能架構(gòu)并不是那么簡單，它有可能將ARM帶入一個(gè)全新的市場，向從未正面交鋒的對手發(fā)起沖擊。

來自奧斯汀家族的高性能移動架構(gòu)

在本刊《移動世界的新王者—深度解析Cortex-A73》一文中，曾經(jīng)詳細(xì)梳理了ARM幾大研發(fā)中心對應(yīng)的產(chǎn)品及研發(fā)歷史。ARM的架構(gòu)研發(fā)團(tuán)隊(duì)有三個(gè)，分別位于美國得克薩斯州的奧斯汀、法國索菲亞以及英國劍橋。在過去一段時(shí)間中，其奧斯汀團(tuán)隊(duì)和旗下產(chǎn)品較少在人們面前出現(xiàn)，人們熟悉的Cortex-A73、Cortex-A75等都來自索非亞團(tuán)隊(duì)。實(shí)際上沉默是為了更好的爆發(fā)，奧斯汀團(tuán)隊(duì)早在2016年就已經(jīng)開始研發(fā)有關(guān)未來微架構(gòu)體系的相關(guān)內(nèi)容，尤其是在FP/SIMD方面，Cortex-A75就從奧斯汀團(tuán)隊(duì)的新架構(gòu)中吸取了不少“養(yǎng)分”。

奧斯汀團(tuán)隊(duì)最新的研發(fā)成果就是Cortex-A76。對ARM來說，Cortex-A76是一個(gè)全新研發(fā)的架構(gòu)，也是一個(gè)全新的起點(diǎn)—對一個(gè)以出售IP為主的企業(yè)來說，一般不會研發(fā)全新架構(gòu)，因?yàn)檫@往往意味著高昂的投入。但是ARM還是這樣做了，并宣稱其為第五代“年度節(jié)點(diǎn)”產(chǎn)品。從ARM過去五年的發(fā)展來看，其每年推出一個(gè)新的微體系架構(gòu)類似于英特爾的“Tick-Tock”，但在ARM這里實(shí)際上是“Tock-Tock-Tock”。ARM宣稱其每一代的GAGR（Compound Annual Growth Rate，年度復(fù)合增長率）高達(dá)25%，并全部來自于微架構(gòu)的改進(jìn)。

向7nm時(shí)代的性能巔峰出擊！ARM Cortex-A76架構(gòu)解析

▲Cortex-A76是一個(gè)“筆記本電腦”級別的處理器產(chǎn)品。

那么Cortex-A76為何值得ARM投入甚多，并讓重要的架構(gòu)研發(fā)團(tuán)隊(duì)從零開始、全力投入呢？這是因?yàn)镃ortex-A76的優(yōu)勢在于設(shè)計(jì)時(shí)兼顧了高性能和高效率。如果從傳統(tǒng)架構(gòu)改進(jìn)而來，研發(fā)人員不得不遇到很多掣肘，但是設(shè)計(jì)一個(gè)全新架構(gòu)，研發(fā)人員可以消除整個(gè)系統(tǒng)中的瓶頸，并打破之前微架構(gòu)的限制。

Cortex-A76的重點(diǎn)放在了高性能上，并且保持極高的能耗比使其能夠適應(yīng)不同的場合，包括對功耗及其敏感的移動設(shè)備等。鑒于Cortex-A76如此優(yōu)秀的特性，用ARM的話來說，Cortex-A76是一款“筆記本電腦”級別的高性能處理器架構(gòu)，同時(shí)還具有高效能。這個(gè)理念貫穿了ARM Tech Day的始終，ARM希望利用Cortex-A76的巨大性能提升來進(jìn)一步強(qiáng)化新興市場的競爭，例如高通正在宣傳其驍龍?zhí)幚砥鞯摹癆lways Connected PCs”，正是基于這個(gè)理由。

在一些寬泛的指標(biāo)中，ARM對Cortex-A76的具體期望如下：性能提高35%，功率效率（能耗比）提高40%，此外還有對機(jī)器學(xué)習(xí)的支持，性能提升至原有架構(gòu)的4倍等。ARM還給出了性能對比的基準(zhǔn)：10nm工藝、2.8GHz運(yùn)行的Cortex-A75架構(gòu)對比7nm工藝、3GHz運(yùn)行的Cortex-A76架構(gòu)。

▲ARM對Cortex-A76的性能期望。

另外，Cortex-A76還可以兼容最新的DynamIQ技術(shù)，可以將其配合Cortex-A55，組成一個(gè)兼顧高性能和高性能功耗比的處理器集群，廠商可以和目前的Cortex-A75搭配Cortex-A55那樣，推出Cortex-A76搭配Cortex-A55的“1+6”或者“2+6”處理器集群。值得一提的是，Cortex-A76在設(shè)計(jì)中也作出了一些取舍，比如ARM依舊指出Cortex-A75擁有最好的PPA（單位面積性能），因此Cortex-A75也并非落伍，在具體產(chǎn)品中使用誰將取決于廠商的需求。

▲Cortex-A76支持DynamIQ，能夠組成不同的核心。

接下來，本文將深入Cortex-A76的核心，帶你了解這一全新架構(gòu)。

▲Cortex-A76架構(gòu)設(shè)計(jì)的一些要點(diǎn)

Cortex-A76前端架構(gòu)

總體來看，Cortex-A76是這樣一個(gè)結(jié)構(gòu)：超標(biāo)量亂序結(jié)構(gòu)，擁有4個(gè)解碼前端（4發(fā)射），8個(gè)執(zhí)行端口，總流水線級數(shù)13級，執(zhí)行延遲為11級。在前端，ARM設(shè)計(jì)了一個(gè)新的預(yù)測/獲取單元，被稱為“基于預(yù)測的獲取”，這意味著分支預(yù)測單元將介入指令獲取單元的工作，這和之前所有的ARM微架構(gòu)都有所不同，能夠?qū)崿F(xiàn)更高的性能和更低的功耗。

▲Cortex-A76的架構(gòu)總覽

在分支預(yù)測單元方面，ARM首次采用了混合間接預(yù)測器。預(yù)測器和讀取單元分離，其支持的大型結(jié)構(gòu)獨(dú)立于機(jī)器其余部分運(yùn)行。獨(dú)立結(jié)構(gòu)意味著可以使用時(shí)鐘門控技術(shù)控制功耗，這對分支預(yù)測單元而言是能效比上的積極改進(jìn)。分支預(yù)測器方面，ARM設(shè)計(jì)了3級分支目標(biāo)緩存，一個(gè)16通路的nanoBTB，一個(gè)64通路的microBTB和一個(gè)6000通路的主BTB。

相比之下，雖然ARM在Cortex-A73和Cortex-A75的分支預(yù)測器上宣稱能夠預(yù)測所有分支，但是Cortex-A76的分支預(yù)測器顯然更為強(qiáng)大，能夠帶來比前代產(chǎn)品更強(qiáng)的分支預(yù)測效果，以提高效能。

▲Cortex-A76的前端，強(qiáng)化的預(yù)測部分的功能。

Cortex-A76的分支預(yù)測單元運(yùn)行速度是讀取單元的2倍，也就是32Bit/周期，這意味著每周期可以執(zhí)行多達(dá)8×32bit條指令，這些指令在由12個(gè)“區(qū)塊”所組成的指令提取單元前會組成一個(gè)指令提取隊(duì)列。相對應(yīng)的，讀取單元以16Bit/周期操作，執(zhí)行4×32bit的指令。以指令讀取單元2倍速度運(yùn)行的分支預(yù)測單元，能夠在預(yù)測錯(cuò)誤的情況下，隱藏流水線中的分支“氣泡”并避免錯(cuò)誤影響指令提取單元以及后續(xù)的核心其余部分，一些消息顯示核心方面能夠處理指令方面出現(xiàn)的8次錯(cuò)誤，大大提高了容錯(cuò)率。

所謂“氣泡”，是指那些可能存在的危險(xiǎn)導(dǎo)致流水線發(fā)生指令停滯或者延遲。在之前的微架構(gòu)中，即使預(yù)測正確，并且指令端能夠向解碼端發(fā)送大量的指令，但一旦指令輸入解碼端并被分解成微操作的時(shí)候，就有很大可能遇到“氣泡”。

流水管線方面，Cortex-A76擁有13級流水線和11級核心的延遲。在這個(gè)過程中，指令等待的關(guān)鍵路徑和階段可以重疊，比如發(fā)生在分支預(yù)測過程的第二個(gè)循環(huán)和指令提取過程的第一個(gè)循環(huán)之間。在最理想的情況下，核心延遲可以縮短3個(gè)周期。

在解碼和重命名階段，Cortex-A76的每個(gè)周期吞吐量為4個(gè)指令，也就是4發(fā)射方案。相比之下，Cortex-A73和Cortex-A75在這個(gè)階段的指令吞吐能力分別為2和3，所以Cortex-A76帶來了比Cortex-A75約33%的指令寬度增幅。Cortex-A72的指令吞吐能力為3，但是在Cortex-A73上變?yōu)?，主要是考慮到架構(gòu)需要進(jìn)一步優(yōu)化效率和功率，并盡可能高的提高前端設(shè)備的利用率。隨著Cortex-A76進(jìn)入4發(fā)射，ARM引來了自己最“寬”的微架構(gòu)，雖然相比三星或者蘋果，Cortex-A76依舊顯得比較“瘦”。

▲Cortex-A76的解碼和重命名階段的設(shè)計(jì)。

Cortex-A76的提取單元提供最多16個(gè)32bit的指令解碼隊(duì)列。流水線階段由2個(gè)指令對齊和解碼循環(huán)組成。在這一步，ARM決定使用2周期單元而不是之前架構(gòu)上的1周期單元。另外，在處理ASIMD/FP管線指令時(shí)，之前的索菲亞內(nèi)核在解碼階段依舊需要一個(gè)輔助周期，但是ARM似乎發(fā)現(xiàn)了其他的優(yōu)化方法，使得Cortex-A76的微架構(gòu)能滿足設(shè)計(jì)的需求。

解碼階段的每個(gè)周期采用4條指令，并且以每條指令1.06Mops的平均比率輸出宏操作。ARM同樣在寄存器重命名階段進(jìn)行了功耗優(yōu)化，做法和之前的分支預(yù)測單元類似，都是為功能模塊加入時(shí)鐘門控。Cortex-A76中的重命名單元時(shí)獨(dú)立的，通過時(shí)鐘門控控制整數(shù)、ASMID和標(biāo)志操作等。

另外，Cortex-A76的重命名和調(diào)度只需要使用1個(gè)循環(huán)，相比之前的2個(gè)周期有所減少。在宏指令方面，Cortex-A76的宏指令按照每條指令1.2uop的比例拆分為微操作，因此每個(gè)周期擁有高達(dá)8uops的調(diào)度次數(shù)，這比之前Cortex-A75的6uops和Cortex-A73的4uops增加了不少。

在亂序執(zhí)行方面，Cortex-A76的亂序窗口大小為128，緩沖區(qū)被分成負(fù)責(zé)指令管理和負(fù)責(zé)回收注冊的兩個(gè)方面，ARM稱其為混合提交系統(tǒng)。這里需要強(qiáng)調(diào)的是，ARM沒有把重點(diǎn)放在增加相關(guān)單元和設(shè)計(jì)方面，因?yàn)锳RM發(fā)現(xiàn)這部分的性能投資回報(bào)非常糟糕。一些數(shù)據(jù)表明重新排序緩沖區(qū)7%才能增加1%的性能，因此這部分設(shè)計(jì)只需要做到夠用就好。另外，ARM還表明自己試圖優(yōu)化前端，一伙的管理程序活動和系統(tǒng)調(diào)用方面的最低延遲，但是沒有更進(jìn)一步的消息。

Cortex-A76的后端架構(gòu)

再來看看后端的執(zhí)行部分。Cortex-A76的整數(shù)核心包含了6個(gè)執(zhí)行單元，其中圖中有4個(gè)單元分別是1個(gè)分支、2個(gè)ALU、1個(gè)ALU/MAC/DIV單元，再加上一個(gè)加載/存儲單元。其中的3個(gè)整數(shù)執(zhí)行流水線中的2個(gè)ALU進(jìn)行簡單算術(shù)操作，1個(gè)復(fù)雜流水線執(zhí)行乘法觸發(fā)和CRC操作。3個(gè)整數(shù)管道由一個(gè)深度為16的指令隊(duì)列提供指令服務(wù)，2個(gè)加載/存儲單元則由深度為12的指令隊(duì)列負(fù)責(zé)。

▲Cortex-A76的后端設(shè)計(jì)

浮點(diǎn)方面，ARM設(shè)計(jì)了2個(gè)執(zhí)行單元，其中一個(gè)執(zhí)行FMUL/FADD/FDIV/ALU/IMAC等，功能較為強(qiáng)大，另一個(gè)比較簡單只執(zhí)行FMUL/FADD/ALU，ASMID浮點(diǎn)核心由2個(gè)深度為16的隊(duì)列提供指令服務(wù)。

當(dāng)人們談及后端架構(gòu)時(shí)，往往會提到指令吞度量和延遲。Cortex-A76在指令延遲方面有很大進(jìn)步，這是由于其架構(gòu)設(shè)計(jì)可以在非常重要的指令上削減周期所致。Cortex-A76將乘法和乘法累加的延遲從之前的3個(gè)周期降低到了2個(gè)周期，吞吐量相比Cortex-A75保持不變。顯然，因?yàn)镃ortex-A76有3個(gè)整數(shù)流水線，這相當(dāng)于吞吐量相比Cortex-A75增加了50%，同時(shí)延遲更低。

在負(fù)責(zé)FP和ASMID操作的“VX”也就是矢量執(zhí)行流水線中它有著更顯著的改進(jìn)，ARM稱其為“最先進(jìn)”的設(shè)計(jì)，雖然這個(gè)結(jié)果已經(jīng)被炒作了好多年了。從設(shè)計(jì)來看，浮點(diǎn)算數(shù)運(yùn)算的延遲從3個(gè)周期降低到了2個(gè)周期，乘法累加從5個(gè)周期降低到了4個(gè)周期。ARM在這里稱執(zhí)行帶寬依舊是“雙128位ASMID”的意思是，對于Cortex-A75和之前的處理器，只有一個(gè)向量管線能夠使用128位，另一個(gè)則是64位，在Cortex-A76上，2個(gè)向量管線都是128位，所以4精度操作的吞吐能力相比前代產(chǎn)品增加了一倍。

Cortex-A76的數(shù)據(jù)緩存固定為64KB，并且是4路關(guān)聯(lián)的設(shè)計(jì)方案，負(fù)載延遲保持在4周期，數(shù)據(jù)標(biāo)簽和查找所需要的DTLB運(yùn)行在一個(gè)單獨(dú)的管道中。ARM的設(shè)計(jì)目標(biāo)是最大限度的提高M(jìn)LP/內(nèi)存級并行性，以便能夠支持更多的內(nèi)核。此外，Cortex-A76還設(shè)計(jì)了4個(gè)不同的預(yù)取引擎，這些并行運(yùn)行的預(yù)取引擎可以查看各種數(shù)據(jù)模式并將數(shù)據(jù)加載到緩存中。

就Cortex-A76的緩存層次而言，ARM設(shè)計(jì)的還是非常到位的，在帶寬和數(shù)據(jù)延遲方面達(dá)到兩全其美。64KB L1指令緩存和64KB L1數(shù)據(jù)緩存的讀取速度高達(dá)32Bit/周期。L2高速緩存可配置為256KB或者512KB，并且使用了第二代DSU設(shè)計(jì)，D端包括了一個(gè)2X 32Bit/周期寫入和讀取接口。L3緩存采用了獨(dú)占設(shè)計(jì)。整體而言，核心微架構(gòu)方面有關(guān)緩存的改進(jìn)據(jù)說可以將內(nèi)存帶寬提升最高達(dá)90%。

▲Cortex-A76的L1數(shù)據(jù)緩存設(shè)計(jì)

▲Cortex-A76的緩存加入了第二代DSU

Cortex-A76在存儲微架構(gòu)設(shè)計(jì)上的優(yōu)勢在于通過詳細(xì)優(yōu)化每一周期的運(yùn)行以最大化整個(gè)核心的內(nèi)存性能。在設(shè)計(jì)階段，工程師研究那些可以為性能或者功耗帶來0.25%差異的特性，如果可以達(dá)到，那么就被認(rèn)為是對核心有價(jià)值的設(shè)計(jì)。不要小看這些百分比，大量的小數(shù)據(jù)調(diào)優(yōu)后能夠帶來相當(dāng)顯著的性能提升。

▲Cortex-A76的緩存性能比前代產(chǎn)品有很大提升

在延遲方面，ARM認(rèn)為Cortex-A76做到了極致。ARM宣稱要使得自己的客戶能夠SoC上遵循自己的設(shè)計(jì)規(guī)范，以實(shí)現(xiàn)最高的性能并充分發(fā)揮優(yōu)勢。比如對主內(nèi)存每納秒的延遲提升將會帶來0.25%的性能。正如我們在驍龍845中所看到的，這顆SoC的問題在于其延遲較高的L4緩存，使得最終性能沒有達(dá)到ARM的期望。未來，ARM的客戶們需要更多的關(guān)注內(nèi)存子系統(tǒng)的相關(guān)延遲信息，否則處理器的性能和功耗將會產(chǎn)生較大差異，甚至高于不同的架構(gòu)帶來的差異。

性能和功耗預(yù)測

ARM對Cortex-A76的性能和功耗進(jìn)行了預(yù)測，包括微架構(gòu)設(shè)計(jì)差異、內(nèi)存子系統(tǒng)差異、頻率和系統(tǒng)等。

就通用IPC而言，相比Cortex-A75，ARM承諾Cortex-A76的整數(shù)效能提升25%，ASIMD/浮點(diǎn)效能提升35%，再加上90%的內(nèi)存效能提升，因此最終可以在GeekBench4中提升25%，JavaScript性能增加35%，在AI計(jì)算中，Cortex-A76的雙ASMID 128位計(jì)算單元使得半精度矩陣乘法的性能達(dá)到之前產(chǎn)品的3.9倍?？紤]到微架構(gòu)的改進(jìn)，這些數(shù)據(jù)是可信的。

▲ARM針對Cortex-A76的性能預(yù)測。

▲相比之前的Cortex-A75，Cortex-A76在給定工藝和頻率下綜合性能提升了35%。

需要注意的是，比較中的Cortex-A76使用的是更新的TSMC的7nm工藝，時(shí)鐘頻率也要更高一些。這一部分，ARM預(yù)測的結(jié)果是Cortex-A76在7nm工藝下可達(dá)3GHz，其GeekBench4的測試性能總分增加高達(dá)35%。

在單核心性能方面，Cortex-A76的情況是怎樣的呢？用目前常見的處理器為例的話，Cortex-A76在3GHz的情況下，單核心性能將和Exynos 9810、Apple A10接近，在2.5GHz情況下已經(jīng)勝出驍龍845不少。從這一點(diǎn)來看，Cortex-A76的性能表現(xiàn)最終還是取決于頻率情況，在過去的發(fā)布中，ARM總是在這一點(diǎn)上表現(xiàn)的過于樂觀，比如Cortex-A73最初預(yù)計(jì)高達(dá)2.8GHz，Cortex-A75甚至可達(dá)3GHz，最終實(shí)際產(chǎn)品不超過2.4GHz和2.8GHz。

由于不同的工藝和設(shè)計(jì)，即使采用一樣的核心架構(gòu)，都會導(dǎo)致頻率和功耗的差異。由于移動性能芯片一是以性能分檔，二是以功耗分檔，因此最終在不同目標(biāo)產(chǎn)品中使用時(shí)，有可能會降低頻率以更好的平衡功耗和性能，兩者都會帶來頻率降低。對于實(shí)際上市的第一批Cortex-A76產(chǎn)品而言，頻率可能難以達(dá)到3GHz，估計(jì)以2.5GHz左右居多。

在這里，ARM的預(yù)測則更為激進(jìn)一些，更偏向于高TDP平臺所能達(dá)到的頻率。ARM還展示了一張幻燈片，顯示了處理器在3.3GHz下的極限性能，此時(shí)Cortex-A76的性能幾乎可以達(dá)到Cortex-A73的2倍。需要注意的是，這里的功耗已經(jīng)超過了5W，因此使用場合可能并非電池供電的小尺寸移動設(shè)備。

再來看看功耗方面的改進(jìn)。ARM給出的數(shù)據(jù)是在750mW每內(nèi)核的功耗下，10nm工藝的Cortex-A75和7nm工藝的Cortex-A76對比時(shí)，后者的性能提高了40%；或者說在運(yùn)行同樣的SPECRAM2006，輸出同樣的性能時(shí)，Cortex-A76的只有對比產(chǎn)品的一半。在這所有的測試和對比中，我們尚未看到處理器更詳細(xì)的性能對比，包括3GHz下Cortex-A76的一些細(xì)節(jié)表現(xiàn)等。

從目前的工藝情況來看，臺積電的承諾是10nm FF相對于其16nm FF功耗下降40%，但是迄今為止臺積電還未在實(shí)際生產(chǎn)中出貨過Cortex-A75的產(chǎn)品，實(shí)際上只有三星的10nm LPP上生產(chǎn)過Cortex-A75相關(guān)的驍龍845處理器，從一些數(shù)據(jù)上來看三星的工藝可能略勝臺積電的10nm FF。

在能耗方面，ARM引用的是SEPCint2006的性能指標(biāo)，據(jù)猜測ARM在這個(gè)對比中使用的是2.8GHz的Cortex-A75作為參照，如果ARM要和驍龍845作對比的話，大概和2.4GHz的Cortex-A76相當(dāng)，考慮到工藝的進(jìn)步，這大概還為Cortex-A76留下了約15%的架構(gòu)優(yōu)勢。但是，由于Cortex-A76的目標(biāo)是性能提升35%，正如我們看到的那樣，提升頻率獲得性能后，功耗并非線性增長，因此功耗和效率優(yōu)勢在峰值性能下可能會很快的降低。

盡可能考慮所有因素后，我們認(rèn)為7nm的Cortex-A76在峰值性能的能耗比表現(xiàn)可以略微勝出目前的高端SoC，這是一個(gè)非常重要的指標(biāo)。如果更保守的來看的話，2.5GHz的情況下，Cortex-A76和Cortex-A73以及Cortex-A75相比，能耗比優(yōu)勢將會擴(kuò)大至30%。

總的來看的話，Cortex-A76的能源效率（能耗比）非常高，但是它也可以是一個(gè)受到TDP控制的設(shè)計(jì)，峰值性能下TDP較高，但這種處理器往往并不會使用在手機(jī)這樣的小尺寸產(chǎn)品中，因?yàn)樗鼈冃枰偷念l率以更好地控制發(fā)熱。對于筆記本電腦這類設(shè)備而言，Cortex-A76可以盡可能使用高頻率來獲取較高性能，畢竟大尺寸設(shè)備在散熱和電源方面都會有更好的表現(xiàn)。

未來兩代處理器的基礎(chǔ)

Cortex-A76并非一個(gè)龐大的架構(gòu)，而是在各方面都很均衡。除了性能的提升外，Cortex-A76在幾乎每一步設(shè)計(jì)中都非常關(guān)注電源效率，ARM希望得到的是能兩全其美的架構(gòu)。

Cortex-A76的相關(guān)產(chǎn)品目前已經(jīng)有兩家廠商與ARM在合作，很可能今年年底之前就有相關(guān)產(chǎn)品發(fā)布。其中華為海思是最重要的合作伙伴之一，高通在下一代產(chǎn)品上也可能采用Cortex-A76。至于三星，由于Cortex-A76沒有明顯超越M3，三星在改進(jìn)M3的能耗比后還可能進(jìn)一步推出M4，因此可能不再使用ARM公版或者改版。

根據(jù)ARM的規(guī)劃來看，Cortex-A76將成為未來2代處理器的基礎(chǔ)，也就是說未來的新的架構(gòu)將以Cortex-A76為基礎(chǔ)進(jìn)行進(jìn)一步開發(fā)，提高性能或者提高能耗比。根據(jù)ARM的數(shù)據(jù)，他們希望自己的產(chǎn)品年復(fù)合增長率為25%，這意味著未來幾年移動SoC就有希望追上PC處理器的性能，這會讓市場變得更加有趣。

久久久精品久久久久久96,91国高清在线,欧美日韩高清国产aⅴ一区,在线观看亚洲欧美一区二区三区

向7nm時(shí)代的性能巔峰出擊！ARM Cortex-A76架構(gòu)解析