久久久精品久久久久久96,91国高清在线,欧美日韩高清国产aⅴ一区,在线观看亚洲欧美一区二区三区

<sub id="e1sa3"></sub>

    <pre id="e1sa3"><del id="e1sa3"></del></pre>
    <noscript id="e1sa3"></noscript>

      新疆信息港歡迎您!

      新疆信息港
      新疆信息港 > 財(cái)經(jīng) >向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      2020-09-24 06:08:19
      來源:互聯(lián)網(wǎng)
      閱讀:-

      ARM的處理器架構(gòu)基本上維持著一年一變。從早期的Cortex-A15到Cortex-A57,再到Cortex-A72、Cortex-A73以及Cortex-A75,ARM最近數(shù)年內(nèi)不斷通過發(fā)布全新架構(gòu)...

      ARM的處理器架構(gòu)基本上維持著一年一變。從早期的Cortex-A15到Cortex-A57,再到Cortex-A72、Cortex-A73以及Cortex-A75,ARM最近數(shù)年內(nèi)不斷通過發(fā)布全新架構(gòu),推動了移動計(jì)算性能的不斷前行。今年五月,ARM又發(fā)布了全新的Cortex-A76架構(gòu),這款架構(gòu)瞄準(zhǔn)的是全新7nm工藝,其性能表現(xiàn)有望再攀高峰。

      ARM在五月的ARM Tech Day上,發(fā)布了一個(gè)全新的架構(gòu):Cortex-A76。和近期所有命名為“7x”的架構(gòu)一樣的是,Cortex-A76是一款主打高性能的大核心產(chǎn)品。實(shí)際上,這款全新的高性能架構(gòu)并不是那么簡單,它有可能將ARM帶入一個(gè)全新的市場,向從未正面交鋒的對手發(fā)起沖擊。

      來自奧斯汀家族的高性能移動架構(gòu)

      在本刊《移動世界的新王者—深度解析Cortex-A73》一文中,曾經(jīng)詳細(xì)梳理了ARM幾大研發(fā)中心對應(yīng)的產(chǎn)品及研發(fā)歷史。ARM的架構(gòu)研發(fā)團(tuán)隊(duì)有三個(gè),分別位于美國得克薩斯州的奧斯汀、法國索菲亞以及英國劍橋。在過去一段時(shí)間中,其奧斯汀團(tuán)隊(duì)和旗下產(chǎn)品較少在人們面前出現(xiàn),人們熟悉的Cortex-A73、Cortex-A75等都來自索非亞團(tuán)隊(duì)。實(shí)際上沉默是為了更好的爆發(fā),奧斯汀團(tuán)隊(duì)早在2016年就已經(jīng)開始研發(fā)有關(guān)未來微架構(gòu)體系的相關(guān)內(nèi)容,尤其是在FP/SIMD方面,Cortex-A75就從奧斯汀團(tuán)隊(duì)的新架構(gòu)中吸取了不少“養(yǎng)分”。

      奧斯汀團(tuán)隊(duì)最新的研發(fā)成果就是Cortex-A76。對ARM來說,Cortex-A76是一個(gè)全新研發(fā)的架構(gòu),也是一個(gè)全新的起點(diǎn)—對一個(gè)以出售IP為主的企業(yè)來說,一般不會研發(fā)全新架構(gòu),因?yàn)檫@往往意味著高昂的投入。但是ARM還是這樣做了,并宣稱其為第五代“年度節(jié)點(diǎn)”產(chǎn)品。從ARM過去五年的發(fā)展來看,其每年推出一個(gè)新的微體系架構(gòu)類似于英特爾的“Tick-Tock”,但在ARM這里實(shí)際上是“Tock-Tock-Tock”。ARM宣稱其每一代的GAGR(Compound Annual Growth Rate,年度復(fù)合增長率)高達(dá)25%,并全部來自于微架構(gòu)的改進(jìn)。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76是一個(gè)“筆記本電腦”級別的處理器產(chǎn)品。

      那么Cortex-A76為何值得ARM投入甚多,并讓重要的架構(gòu)研發(fā)團(tuán)隊(duì)從零開始、全力投入呢?這是因?yàn)镃ortex-A76的優(yōu)勢在于設(shè)計(jì)時(shí)兼顧了高性能和高效率。如果從傳統(tǒng)架構(gòu)改進(jìn)而來,研發(fā)人員不得不遇到很多掣肘,但是設(shè)計(jì)一個(gè)全新架構(gòu),研發(fā)人員可以消除整個(gè)系統(tǒng)中的瓶頸,并打破之前微架構(gòu)的限制。

      Cortex-A76的重點(diǎn)放在了高性能上,并且保持極高的能耗比使其能夠適應(yīng)不同的場合,包括對功耗及其敏感的移動設(shè)備等。鑒于Cortex-A76如此優(yōu)秀的特性,用ARM的話來說,Cortex-A76是一款“筆記本電腦”級別的高性能處理器架構(gòu),同時(shí)還具有高效能。這個(gè)理念貫穿了ARM Tech Day的始終,ARM希望利用Cortex-A76的巨大性能提升來進(jìn)一步強(qiáng)化新興市場的競爭,例如高通正在宣傳其驍龍?zhí)幚砥鞯摹癆lways Connected PCs”,正是基于這個(gè)理由。

      在一些寬泛的指標(biāo)中,ARM對Cortex-A76的具體期望如下:性能提高35%,功率效率(能耗比)提高40%,此外還有對機(jī)器學(xué)習(xí)的支持,性能提升至原有架構(gòu)的4倍等。ARM還給出了性能對比的基準(zhǔn):10nm工藝、2.8GHz運(yùn)行的Cortex-A75架構(gòu)對比7nm工藝、3GHz運(yùn)行的Cortex-A76架構(gòu)。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲ARM對Cortex-A76的性能期望。

      另外,Cortex-A76還可以兼容最新的DynamIQ技術(shù),可以將其配合Cortex-A55,組成一個(gè)兼顧高性能和高性能功耗比的處理器集群,廠商可以和目前的Cortex-A75搭配Cortex-A55那樣,推出Cortex-A76搭配Cortex-A55的“1+6”或者“2+6”處理器集群。值得一提的是,Cortex-A76在設(shè)計(jì)中也作出了一些取舍,比如ARM依舊指出Cortex-A75擁有最好的PPA(單位面積性能),因此Cortex-A75也并非落伍,在具體產(chǎn)品中使用誰將取決于廠商的需求。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76支持DynamIQ,能夠組成不同的核心。

      接下來,本文將深入Cortex-A76的核心,帶你了解這一全新架構(gòu)。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76架構(gòu)設(shè)計(jì)的一些要點(diǎn)

      Cortex-A76前端架構(gòu)

      總體來看,Cortex-A76是這樣一個(gè)結(jié)構(gòu):超標(biāo)量亂序結(jié)構(gòu),擁有4個(gè)解碼前端(4發(fā)射),8個(gè)執(zhí)行端口,總流水線級數(shù)13級,執(zhí)行延遲為11級。在前端,ARM設(shè)計(jì)了一個(gè)新的預(yù)測/獲取單元,被稱為“基于預(yù)測的獲取”,這意味著分支預(yù)測單元將介入指令獲取單元的工作,這和之前所有的ARM微架構(gòu)都有所不同,能夠?qū)崿F(xiàn)更高的性能和更低的功耗。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76的架構(gòu)總覽

      在分支預(yù)測單元方面,ARM首次采用了混合間接預(yù)測器。預(yù)測器和讀取單元分離,其支持的大型結(jié)構(gòu)獨(dú)立于機(jī)器其余部分運(yùn)行。獨(dú)立結(jié)構(gòu)意味著可以使用時(shí)鐘門控技術(shù)控制功耗,這對分支預(yù)測單元而言是能效比上的積極改進(jìn)。分支預(yù)測器方面,ARM設(shè)計(jì)了3級分支目標(biāo)緩存,一個(gè)16通路的nanoBTB,一個(gè)64通路的microBTB和一個(gè)6000通路的主BTB。

      相比之下,雖然ARM在Cortex-A73和Cortex-A75的分支預(yù)測器上宣稱能夠預(yù)測所有分支,但是Cortex-A76的分支預(yù)測器顯然更為強(qiáng)大,能夠帶來比前代產(chǎn)品更強(qiáng)的分支預(yù)測效果,以提高效能。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76的前端,強(qiáng)化的預(yù)測部分的功能。

      Cortex-A76的分支預(yù)測單元運(yùn)行速度是讀取單元的2倍,也就是32Bit/周期,這意味著每周期可以執(zhí)行多達(dá)8×32bit條指令,這些指令在由12個(gè)“區(qū)塊”所組成的指令提取單元前會組成一個(gè)指令提取隊(duì)列。相對應(yīng)的,讀取單元以16Bit/周期操作,執(zhí)行4×32bit的指令。以指令讀取單元2倍速度運(yùn)行的分支預(yù)測單元,能夠在預(yù)測錯(cuò)誤的情況下,隱藏流水線中的分支“氣泡”并避免錯(cuò)誤影響指令提取單元以及后續(xù)的核心其余部分,一些消息顯示核心方面能夠處理指令方面出現(xiàn)的8次錯(cuò)誤,大大提高了容錯(cuò)率。

      所謂“氣泡”,是指那些可能存在的危險(xiǎn)導(dǎo)致流水線發(fā)生指令停滯或者延遲。在之前的微架構(gòu)中,即使預(yù)測正確,并且指令端能夠向解碼端發(fā)送大量的指令,但一旦指令輸入解碼端并被分解成微操作的時(shí)候,就有很大可能遇到“氣泡”。

      流水管線方面,Cortex-A76擁有13級流水線和11級核心的延遲。在這個(gè)過程中,指令等待的關(guān)鍵路徑和階段可以重疊,比如發(fā)生在分支預(yù)測過程的第二個(gè)循環(huán)和指令提取過程的第一個(gè)循環(huán)之間。在最理想的情況下,核心延遲可以縮短3個(gè)周期。

      在解碼和重命名階段,Cortex-A76的每個(gè)周期吞吐量為4個(gè)指令,也就是4發(fā)射方案。相比之下,Cortex-A73和Cortex-A75在這個(gè)階段的指令吞吐能力分別為2和3,所以Cortex-A76帶來了比Cortex-A75約33%的指令寬度增幅。Cortex-A72的指令吞吐能力為3,但是在Cortex-A73上變?yōu)?,主要是考慮到架構(gòu)需要進(jìn)一步優(yōu)化效率和功率,并盡可能高的提高前端設(shè)備的利用率。隨著Cortex-A76進(jìn)入4發(fā)射,ARM引來了自己最“寬”的微架構(gòu),雖然相比三星或者蘋果,Cortex-A76依舊顯得比較“瘦”。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76的解碼和重命名階段的設(shè)計(jì)。

      Cortex-A76的提取單元提供最多16個(gè)32bit的指令解碼隊(duì)列。流水線階段由2個(gè)指令對齊和解碼循環(huán)組成。在這一步,ARM決定使用2周期單元而不是之前架構(gòu)上的1周期單元。另外,在處理ASIMD/FP管線指令時(shí),之前的索菲亞內(nèi)核在解碼階段依舊需要一個(gè)輔助周期,但是ARM似乎發(fā)現(xiàn)了其他的優(yōu)化方法,使得Cortex-A76的微架構(gòu)能滿足設(shè)計(jì)的需求。

      解碼階段的每個(gè)周期采用4條指令,并且以每條指令1.06Mops的平均比率輸出宏操作。ARM同樣在寄存器重命名階段進(jìn)行了功耗優(yōu)化,做法和之前的分支預(yù)測單元類似,都是為功能模塊加入時(shí)鐘門控。Cortex-A76中的重命名單元時(shí)獨(dú)立的,通過時(shí)鐘門控控制整數(shù)、ASMID和標(biāo)志操作等。

      另外,Cortex-A76的重命名和調(diào)度只需要使用1個(gè)循環(huán),相比之前的2個(gè)周期有所減少。在宏指令方面,Cortex-A76的宏指令按照每條指令1.2uop的比例拆分為微操作,因此每個(gè)周期擁有高達(dá)8uops的調(diào)度次數(shù),這比之前Cortex-A75的6uops和Cortex-A73的4uops增加了不少。

      在亂序執(zhí)行方面,Cortex-A76的亂序窗口大小為128,緩沖區(qū)被分成負(fù)責(zé)指令管理和負(fù)責(zé)回收注冊的兩個(gè)方面,ARM稱其為混合提交系統(tǒng)。這里需要強(qiáng)調(diào)的是,ARM沒有把重點(diǎn)放在增加相關(guān)單元和設(shè)計(jì)方面,因?yàn)锳RM發(fā)現(xiàn)這部分的性能投資回報(bào)非常糟糕。一些數(shù)據(jù)表明重新排序緩沖區(qū)7%才能增加1%的性能,因此這部分設(shè)計(jì)只需要做到夠用就好。另外,ARM還表明自己試圖優(yōu)化前端,一伙的管理程序活動和系統(tǒng)調(diào)用方面的最低延遲,但是沒有更進(jìn)一步的消息。

      Cortex-A76的后端架構(gòu)

      再來看看后端的執(zhí)行部分。Cortex-A76的整數(shù)核心包含了6個(gè)執(zhí)行單元,其中圖中有4個(gè)單元分別是1個(gè)分支、2個(gè)ALU、1個(gè)ALU/MAC/DIV單元,再加上一個(gè)加載/存儲單元。其中的3個(gè)整數(shù)執(zhí)行流水線中的2個(gè)ALU進(jìn)行簡單算術(shù)操作,1個(gè)復(fù)雜流水線執(zhí)行乘法觸發(fā)和CRC操作。3個(gè)整數(shù)管道由一個(gè)深度為16的指令隊(duì)列提供指令服務(wù),2個(gè)加載/存儲單元則由深度為12的指令隊(duì)列負(fù)責(zé)。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76的后端設(shè)計(jì)

      浮點(diǎn)方面,ARM設(shè)計(jì)了2個(gè)執(zhí)行單元,其中一個(gè)執(zhí)行FMUL/FADD/FDIV/ALU/IMAC等,功能較為強(qiáng)大,另一個(gè)比較簡單只執(zhí)行FMUL/FADD/ALU,ASMID浮點(diǎn)核心由2個(gè)深度為16的隊(duì)列提供指令服務(wù)。

      當(dāng)人們談及后端架構(gòu)時(shí),往往會提到指令吞度量和延遲。Cortex-A76在指令延遲方面有很大進(jìn)步,這是由于其架構(gòu)設(shè)計(jì)可以在非常重要的指令上削減周期所致。Cortex-A76將乘法和乘法累加的延遲從之前的3個(gè)周期降低到了2個(gè)周期,吞吐量相比Cortex-A75保持不變。顯然,因?yàn)镃ortex-A76有3個(gè)整數(shù)流水線,這相當(dāng)于吞吐量相比Cortex-A75增加了50%,同時(shí)延遲更低。

      在負(fù)責(zé)FP和ASMID操作的“VX”也就是矢量執(zhí)行流水線中它有著更顯著的改進(jìn),ARM稱其為“最先進(jìn)”的設(shè)計(jì),雖然這個(gè)結(jié)果已經(jīng)被炒作了好多年了。從設(shè)計(jì)來看,浮點(diǎn)算數(shù)運(yùn)算的延遲從3個(gè)周期降低到了2個(gè)周期,乘法累加從5個(gè)周期降低到了4個(gè)周期。ARM在這里稱執(zhí)行帶寬依舊是“雙128位ASMID”的意思是,對于Cortex-A75和之前的處理器,只有一個(gè)向量管線能夠使用128位,另一個(gè)則是64位,在Cortex-A76上,2個(gè)向量管線都是128位,所以4精度操作的吞吐能力相比前代產(chǎn)品增加了一倍。

      Cortex-A76的數(shù)據(jù)緩存固定為64KB,并且是4路關(guān)聯(lián)的設(shè)計(jì)方案,負(fù)載延遲保持在4周期,數(shù)據(jù)標(biāo)簽和查找所需要的DTLB運(yùn)行在一個(gè)單獨(dú)的管道中。ARM的設(shè)計(jì)目標(biāo)是最大限度的提高M(jìn)LP/內(nèi)存級并行性,以便能夠支持更多的內(nèi)核。此外,Cortex-A76還設(shè)計(jì)了4個(gè)不同的預(yù)取引擎,這些并行運(yùn)行的預(yù)取引擎可以查看各種數(shù)據(jù)模式并將數(shù)據(jù)加載到緩存中。

      就Cortex-A76的緩存層次而言,ARM設(shè)計(jì)的還是非常到位的,在帶寬和數(shù)據(jù)延遲方面達(dá)到兩全其美。64KB L1指令緩存和64KB L1數(shù)據(jù)緩存的讀取速度高達(dá)32Bit/周期。L2高速緩存可配置為256KB或者512KB,并且使用了第二代DSU設(shè)計(jì),D端包括了一個(gè)2X 32Bit/周期寫入和讀取接口。L3緩存采用了獨(dú)占設(shè)計(jì)。整體而言,核心微架構(gòu)方面有關(guān)緩存的改進(jìn)據(jù)說可以將內(nèi)存帶寬提升最高達(dá)90%。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76的L1數(shù)據(jù)緩存設(shè)計(jì)

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76的緩存加入了第二代DSU

      Cortex-A76在存儲微架構(gòu)設(shè)計(jì)上的優(yōu)勢在于通過詳細(xì)優(yōu)化每一周期的運(yùn)行以最大化整個(gè)核心的內(nèi)存性能。在設(shè)計(jì)階段,工程師研究那些可以為性能或者功耗帶來0.25%差異的特性,如果可以達(dá)到,那么就被認(rèn)為是對核心有價(jià)值的設(shè)計(jì)。不要小看這些百分比,大量的小數(shù)據(jù)調(diào)優(yōu)后能夠帶來相當(dāng)顯著的性能提升。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲Cortex-A76的緩存性能比前代產(chǎn)品有很大提升

      在延遲方面,ARM認(rèn)為Cortex-A76做到了極致。ARM宣稱要使得自己的客戶能夠SoC上遵循自己的設(shè)計(jì)規(guī)范,以實(shí)現(xiàn)最高的性能并充分發(fā)揮優(yōu)勢。比如對主內(nèi)存每納秒的延遲提升將會帶來0.25%的性能。正如我們在驍龍845中所看到的,這顆SoC的問題在于其延遲較高的L4緩存,使得最終性能沒有達(dá)到ARM的期望。未來,ARM的客戶們需要更多的關(guān)注內(nèi)存子系統(tǒng)的相關(guān)延遲信息,否則處理器的性能和功耗將會產(chǎn)生較大差異,甚至高于不同的架構(gòu)帶來的差異。

      性能和功耗預(yù)測

      ARM對Cortex-A76的性能和功耗進(jìn)行了預(yù)測,包括微架構(gòu)設(shè)計(jì)差異、內(nèi)存子系統(tǒng)差異、頻率和系統(tǒng)等。

      就通用IPC而言,相比Cortex-A75,ARM承諾Cortex-A76的整數(shù)效能提升25%,ASIMD/浮點(diǎn)效能提升35%,再加上90%的內(nèi)存效能提升,因此最終可以在GeekBench4中提升25%,JavaScript性能增加35%,在AI計(jì)算中,Cortex-A76的雙ASMID 128位計(jì)算單元使得半精度矩陣乘法的性能達(dá)到之前產(chǎn)品的3.9倍??紤]到微架構(gòu)的改進(jìn),這些數(shù)據(jù)是可信的。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲ARM針對Cortex-A76的性能預(yù)測。

      向7nm時(shí)代的性能巔峰出擊!ARM Cortex-A76架構(gòu)解析

      ▲相比之前的Cortex-A75,Cortex-A76在給定工藝和頻率下綜合性能提升了35%。

      需要注意的是,比較中的Cortex-A76使用的是更新的TSMC的7nm工藝,時(shí)鐘頻率也要更高一些。這一部分,ARM預(yù)測的結(jié)果是Cortex-A76在7nm工藝下可達(dá)3GHz,其GeekBench4的測試性能總分增加高達(dá)35%。

      在單核心性能方面,Cortex-A76的情況是怎樣的呢?用目前常見的處理器為例的話,Cortex-A76在3GHz的情況下,單核心性能將和Exynos 9810、Apple A10接近,在2.5GHz情況下已經(jīng)勝出驍龍845不少。從這一點(diǎn)來看,Cortex-A76的性能表現(xiàn)最終還是取決于頻率情況,在過去的發(fā)布中,ARM總是在這一點(diǎn)上表現(xiàn)的過于樂觀,比如Cortex-A73最初預(yù)計(jì)高達(dá)2.8GHz,Cortex-A75甚至可達(dá)3GHz,最終實(shí)際產(chǎn)品不超過2.4GHz和2.8GHz。

      由于不同的工藝和設(shè)計(jì),即使采用一樣的核心架構(gòu),都會導(dǎo)致頻率和功耗的差異。由于移動性能芯片一是以性能分檔,二是以功耗分檔,因此最終在不同目標(biāo)產(chǎn)品中使用時(shí),有可能會降低頻率以更好的平衡功耗和性能,兩者都會帶來頻率降低。對于實(shí)際上市的第一批Cortex-A76產(chǎn)品而言,頻率可能難以達(dá)到3GHz,估計(jì)以2.5GHz左右居多。

      在這里,ARM的預(yù)測則更為激進(jìn)一些,更偏向于高TDP平臺所能達(dá)到的頻率。ARM還展示了一張幻燈片,顯示了處理器在3.3GHz下的極限性能,此時(shí)Cortex-A76的性能幾乎可以達(dá)到Cortex-A73的2倍。需要注意的是,這里的功耗已經(jīng)超過了5W,因此使用場合可能并非電池供電的小尺寸移動設(shè)備。

      再來看看功耗方面的改進(jìn)。ARM給出的數(shù)據(jù)是在750mW每內(nèi)核的功耗下,10nm工藝的Cortex-A75和7nm工藝的Cortex-A76對比時(shí),后者的性能提高了40%;或者說在運(yùn)行同樣的SPECRAM2006,輸出同樣的性能時(shí),Cortex-A76的只有對比產(chǎn)品的一半。在這所有的測試和對比中,我們尚未看到處理器更詳細(xì)的性能對比,包括3GHz下Cortex-A76的一些細(xì)節(jié)表現(xiàn)等。

      從目前的工藝情況來看,臺積電的承諾是10nm FF相對于其16nm FF功耗下降40%,但是迄今為止臺積電還未在實(shí)際生產(chǎn)中出貨過Cortex-A75的產(chǎn)品,實(shí)際上只有三星的10nm LPP上生產(chǎn)過Cortex-A75相關(guān)的驍龍845處理器,從一些數(shù)據(jù)上來看三星的工藝可能略勝臺積電的10nm FF。

      在能耗方面,ARM引用的是SEPCint2006的性能指標(biāo),據(jù)猜測ARM在這個(gè)對比中使用的是2.8GHz的Cortex-A75作為參照,如果ARM要和驍龍845作對比的話,大概和2.4GHz的Cortex-A76相當(dāng),考慮到工藝的進(jìn)步,這大概還為Cortex-A76留下了約15%的架構(gòu)優(yōu)勢。但是,由于Cortex-A76的目標(biāo)是性能提升35%,正如我們看到的那樣,提升頻率獲得性能后,功耗并非線性增長,因此功耗和效率優(yōu)勢在峰值性能下可能會很快的降低。

      盡可能考慮所有因素后,我們認(rèn)為7nm的Cortex-A76在峰值性能的能耗比表現(xiàn)可以略微勝出目前的高端SoC,這是一個(gè)非常重要的指標(biāo)。如果更保守的來看的話,2.5GHz的情況下,Cortex-A76和Cortex-A73以及Cortex-A75相比,能耗比優(yōu)勢將會擴(kuò)大至30%。

      總的來看的話,Cortex-A76的能源效率(能耗比)非常高,但是它也可以是一個(gè)受到TDP控制的設(shè)計(jì),峰值性能下TDP較高,但這種處理器往往并不會使用在手機(jī)這樣的小尺寸產(chǎn)品中,因?yàn)樗鼈冃枰偷念l率以更好地控制發(fā)熱。對于筆記本電腦這類設(shè)備而言,Cortex-A76可以盡可能使用高頻率來獲取較高性能,畢竟大尺寸設(shè)備在散熱和電源方面都會有更好的表現(xiàn)。

      未來兩代處理器的基礎(chǔ)

      Cortex-A76并非一個(gè)龐大的架構(gòu),而是在各方面都很均衡。除了性能的提升外,Cortex-A76在幾乎每一步設(shè)計(jì)中都非常關(guān)注電源效率,ARM希望得到的是能兩全其美的架構(gòu)。

      Cortex-A76的相關(guān)產(chǎn)品目前已經(jīng)有兩家廠商與ARM在合作,很可能今年年底之前就有相關(guān)產(chǎn)品發(fā)布。其中華為海思是最重要的合作伙伴之一,高通在下一代產(chǎn)品上也可能采用Cortex-A76。至于三星,由于Cortex-A76沒有明顯超越M3,三星在改進(jìn)M3的能耗比后還可能進(jìn)一步推出M4,因此可能不再使用ARM公版或者改版。

      根據(jù)ARM的規(guī)劃來看,Cortex-A76將成為未來2代處理器的基礎(chǔ),也就是說未來的新的架構(gòu)將以Cortex-A76為基礎(chǔ)進(jìn)行進(jìn)一步開發(fā),提高性能或者提高能耗比。根據(jù)ARM的數(shù)據(jù),他們希望自己的產(chǎn)品年復(fù)合增長率為25%,這意味著未來幾年移動SoC就有希望追上PC處理器的性能,這會讓市場變得更加有趣。

      推薦閱讀:中冀網(wǎng)

      免責(zé)聲明:本文僅代表企業(yè)觀點(diǎn),與新疆信息港無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。