對於主流與入門市場消費者而言,AMD Ryzen 處理器系列雖然提供相較於 Intel 的另外一種選擇,卻沒有在低階款式放入顯示功能。相隔接近一年之後,桌上型電腦平台也利用包含繪圖核心的 Raven Ridge,推出第二代 Ryzen 處理器。
處理器 SoC 化,顯示功能半買半相送
消費市場自從 AMD Athlon 64 處理器整合記憶體控制器之後,處理器本身便走向了 SoC(System on Chip)設計。所謂的 SoC 如同其中文翻譯「系統單晶片」,便是把整個電腦系統所需的主要零件都內建於單一晶片之中,譬如處理器、記憶體控制器、I/O 匯流排通道、數位類比轉換器、供電處理等,並依據該晶片整合性程度而呈現不同功能,或許還需要額外 1~2 顆的伴隨晶片輔助運作或是擴展功能,例如訊號電平協定轉換晶片,I/O 晶片等。
以 AMD 近期最新的 Ryzen 處理器系列而言,本身就是個頗為完整的 SoC 設計,具備數條 PCIe 3.0 通道、SATA 6Gb/s、USB 2.0/3.1 Gen1、HD Audio bus、SPI 等(注意部分通道組合具有互斥性),其所搭配傳統意義上的晶片組 X370、B350、A320(傳聞交由 ASMedia 設計),只是負責將處理器的 PCIe 3.0 x4 通道轉換成 PCIe 2.0、SATA 6Gb/s、SATA Express、USB 2.0/3.1 Gen1/3.1 Gen2 等週邊 I/O。最現實的例子,就是第一代 Ryzen 處理器依靠自身的通道配置方式,最多僅能擠出 2 埠 SATA 6Gb/s,且會影響 PCIe NVMe 的使用,並無法滿足當今需求。
▲AMD Ryzen(代號 Summit Ridge)處理器功能區塊圖,SoC 化的設計卻少了顯示輸出功能。
Intel 方面 SoC 化較為徹底的為 Atom 系列(包含部分 Pentium 與 Celeron 系列),但同樣也有著 I/O 過少的問題,因此目前僅限於小型或是迷你型、嵌入式電腦使用。Ryzen 雖然是 SoC 設計,卻不包含顯示輸出部分,因此對上 Core i3 和 Core i5 的入門 Ryzen 3 至主流 Ryzen 5 處理器,將因為建置成本需要計入 1 張顯示卡,導致這場仗打得較為辛苦。
事情總會有轉圜的餘地,代號 Summit Ridge 的 Ryzen 處理器於去年上半年成功推出之後,便不斷地出現包含顯示輸出功能的 Raven Ridge 消息,終於在去年 10 月首先發表使用在行動平台的 Ryzen 7 2700U 以及 Ryzen 5 2500U,近期桌上型版本 Ryzen 5 2400G 和 Ryzen 3 2200G 也即將推出,記憶體相容性日趨成熟,表定規格直接支援 JEDEC DDR4-2933。相對沒有顯示功能的 Ryzen 5 1400 和 Ryzen 3 1200 而言,建議零售價相等甚至更低,並不會對購買者造成負擔。
▲Ryzen 5 2400G 與 Ryzen 3 2200G 規格一覽表。
▲Ryzen 3 1200、Ryzen 3 2200G、Ryzen 5 1400、Ryzen 5 2400G 比較表。
注意主機板 HDMI 輸出能力
依照 AMD 過去往例,這次雖然推出了新款第二代 Ryzen 處理器,卻依然能夠相容先前推出的 X370、B350、A320 晶片組主機板,只需進行 BIOS 更新即可支援,對於主機板製造商或消費者而言都是有利面向。而今年 4 月之後,新款 X470 晶片組主機板就會陸續上市,最大的變革可能將晶片組 PCIe 2.0 升級成 PCIe 3.0,以便提供更多頻寬給予 NVMe 協定 SSD 使用。
Ryzen 5 2400G 和 Ryzen 3 2200G 無論是針對一般或是具備 HDR 顯示能力的螢幕,最高均可輸出 3840 x 2160@60Hz,最多 3 螢幕輸出,但處理器是否原生具備 HDMI 2.0 功能則尚待釐清。目前市面所販售的 X370、B350、A320 晶片組主機板,已知 BIOSTAR X370GT7 以額外安裝 TI SN75DP159 Level Shifter Retimer 晶片,確定支援 HDMI 2.0。今年第二季 AMD 也將推出符合 PlayReady 3 的驅動程式,屆時可以再觀察是否能夠支援播放具有版權保護的 4K HDR 內容。
▲BIOSTAR X370GT7 使用 TI SN75DP1595 支援 HDMI 2.0 輸出。
連結性小幅變化
為了解決內部功能區塊相互連結、傳輸資料、控制等問題,AMD 使用 Infinity Fabric 串聯各個功能區塊,在 Ryzen 5 2400G 和 Ryzen 3 2200G 內部也是如此;Infinity Fabric 負責連接 CCX、系統記憶體、記憶體控制器,以及其餘 SoC 部分如 I/O 集線器等。在 Raven Ridge 產品之中,還額外多出繪圖核心、多媒體編解碼引擎、顯示引擎等負責視訊運算輸出部分。
▲Raven Ridge 內部拓樸區塊圖。
▲Raven Ridge 晶片照片,不難看出左方具有 4 個類似區塊之處為處理器核心,右方則有 11 個相似區塊為繪圖核心。
SoC I/O 連結性部分,Raven Ridge 的 USB 3.1 升級成為 Gen2 10Gbps,其中 2 個還支援 DisplayPort Alternate 模式,能夠利用 USB-C 埠輸出畫面;USB 3.1 Gen1 則是縮為 1 個,並額外多出 1 個 USB 2.0,SATA 6Gb/s 似乎也不再與 PCIe 通道共用,固定為 2 個。用於連結其它週邊裝置的 PCIe 3.0 通道依然維持 8 條,扣除連結晶片組所需 4 條之後,只剩下 4 條可以用來連接 1 個 PCIe 3.0 x4 NVMe SSD。至於用來連結顯示卡的 PCIe 3.0 通道則是縮為 8 條,AMD 宣稱主流獨立顯示卡受到的效能衝擊不大,縮減的原因為簡化 SoC 設計。
▲Ryzen 5 2400G 和 Ryzen 3 2200G 的 SoC I/O 通道數量一覽表。
目前市面上的 X370、B350、A320 主機板均與 Summit Ridge 相同時間點問世,雖然 Raven Ridge 桌上型電腦版本 Ryzen 5 2400G 和 Ryzen 3 2200G 依然採用 AM4 腳位插槽,主機板更新 BIOS 即可支援,但是似乎無法完全迎合 Raven Ridge 週邊連結性的變化,或許未來還會出現專門為 Ryzen 5 2400G 和 Ryzen 3 2200G 所設計的主機板也不一定。
再訪 Zen 微架構
AMD Ryzen 上市之初,與 Zen 微架構相互提及的經常是 Excavator 微架構,至今給予的測試文件依然使用它為比較基準。Zen 微架構效能部分透過數種方式獲得升級,包含進入 14nm/14nm+ 製程製造,改採 Simultaneous Multi-Threading 同步多執行緒架構(最高單核雙執行緒),同時拋棄過往 2 個實體核心(AMD 稱為 1 個模組)之間共用部分單元的 Clustered Multithreading 叢集多執行緒設計。
Zen 微架構的指令排程視窗,整數部分從 48 提升至 84,浮點數則從 60 提升至 96,還有個可以容納高達 2000 條的 Op-Cache 微指令快取,對於較常使用的微指令能夠跳過部分 L2 與 L3 快取讀取動作,而解碼器單一時脈週期能夠解碼 4 條指令,微指令配發器則可以在單一週期分配 6 個與 4 個微指令進入整數與浮點數執行作業。
▲Zen 微架構概觀改進部分。
Zen 導入使用類神經元網路為基礎的分支預測單元,能夠以更為聰穎的方式最佳化指令預取以及工作路徑,並與解碼單元分離,先行將擷取來的指令放入 64K/4-way L1 指令快取等待後續解碼。L1 資料快取雖然是比較小的 32KB,但卻擴增到 8-way,更是一改過往 Write Through 策略改為 Write Back;L2 快取則提供 512KB/8-way,L1 和 L2 存取速度相較前一代微架構均為 2 倍。
Summit Ridge 晶片設計共有 2 個 CCX,這 2 個 CCX 分別具有 4MB/16-way L3 快取,合計共 8MB 供所有實體核心共用;若要從 CCX 0 存取 CCX 1 的 L3 快取,則是透過前述 Infinity Fabric 進行,相較存取 CCX 自身的 L3 快取來得緩慢;Raven Ridge 晶片僅包含 1 個 CCX,因此 L3 快取只有 4MB。AMD 將 Zen 微架構的 L3 快取設計成 L1 和 L2 的 Victim Cache,也就是從 L1 和 L2 排除的指令或資料會先儲存在 L3 快取等待未來再度使用,L3 並非儲存預取指令或資料用途,然而 L3 快取頻寬為前代的 5 倍。
▲Zen 架構的快取階層設計,注意 Raven Ridge 只包含 1 個 CCX,L3 快取因而減半僅為4MB。
Summit Ridge 使用 Global Foundries 14nm FinFET 製程製造,而 Raven Ridge 則是略微進步改採 14nm+,AMD 表示此舉除了縮小晶粒核心面積,也能夠降低耗電量/性能曲線,前述 Op-Cache 因為降低了存取遠方 L2、L3 快取的需求,同時有著省電效果。再者 Zen 內部分割成許多頻率/電源區域,不需要全力運作時便放緩,Stack Engine 則是個位於微指令佇列和配發器之間,1 個獨立的低耗電位址操作單元; 此外開發 Move elimination 技術,移動暫存器資料的動作改由重新映射達成,不需要透過額外的微指令操作。
▲Zen 架構針對省電性的強化設計。
SenseMI 技術最佳化效能與功耗
在 Zen 微架構之中,AMD 在晶片上安排多個感測器,能夠以千分之一秒的速度感知並傳遞電流、電壓、瓦數、溫度等資訊,使用智慧型網格將它們串在一起,並饋入 Infinity Fabric 的控制迴圈當中,以此為依據預測未來運作情形,調整 Ryzen 處理器運作狀況。
SenseMI 的「MI」代表 machine intelligence 機械智慧之意,以感應器收集資訊為基礎達成數種功能。Pure Power 依據收集而來的溫度、速度、電壓等各種資訊,動態即時控制管理電力消耗,最佳化矽晶片的電量與效能比值。透過 Pure Power 在背後撐腰,Precision Boost 2 從 Precision Boost 僅有雙核與全核心加速,進階至依據實際工作量決定各個核心的加速時脈(以 25MHz 為單位)。
▲Pure Power 依據感測器傳回的資訊,即時最佳化功耗表現。
▲Precision Boost 2 調整粒度更為細緻,而非第一代僅有雙核與全核心 2 種加速分類。
Neural Net Prediction 即為 Zen 架構導入的神經元網路分支預測,即時利用 AI 人工智慧演算法分析學習程式作業,並超前預測未來指令,先行載入至指令快取。相對指令而言,資料也是預測的一環,Smart Prefetch 也是先行預測未來所需資料,擷取過後放入處理器快取,未來執行時就不必再等待擷取資料造成的延遲。
▲Neural Net Prediction 利用 AI 人工智慧演算法,依據軟體執行結果建立決策模型,擷取未來可能需要使用的指令並放入快取。
▲依據程式存取資料的脈絡模式,Smart Fetch 預估未來所需資料,先行讀取並放入快取等待利用。
(下一頁:Radeon Vega、Fluid Motion、燒機溫度耗電量)
from T客邦 http://ift.tt/2Ch9D4t
沒有留言:
張貼留言