Xilinx 精选产品和方案
 

白皮書 | Versal 平台的系統級優勢

過去幾年裡,計算行業見證了數據的大規模爆發以及機器學習( ML )與 AI 應用的激增。其結果是對更高吞吐量和實時計算能力愈發強烈的需求,與此同時還要保持靈活應變能力,以便跟上不斷演進的工作負載需求和不斷變化的協議。

賽靈思 Versal 產品組合提供了一種顛覆性架構,將同類最佳的 7nm 可編程邏輯與標量處理引擎、空間處理硬體引擎、矢量處理智能引擎相結合,同時採用領先的存儲器和接口技術,從而為一系列市場和應用提供了一款基礎性平台,助其打造靈活應變的特定領域架構。

Versal ACAP 可在廣泛市場和應用中打造未來產品:數據中心互聯、存儲與計算加速、從邊緣到雲端的 AI 加速、5G 無線、有線應用、自動駕駛、航空航天以及眾多其他市場。



 
系統級性能

Versal 架構並非傳統 FPGA 架構。自誕生以來,其宗旨始終是提供比增量架構結果質量( QoR )性能更高的系統級性能。具體而言, 賽靈思的目標是較之上一代和替代性可編程邏輯架構高達 5 倍的系統級性能

Versal 架構解決了三大挑戰:
> 系統級單位功耗性能
> 高能效計算與數據遷移功能
> 可編程邏輯中的金屬縮放限制

以往的 FPGA 基準測試完全基於架構的 QoR。而且部分由於金屬時延帶來的問題,今天的可編程邏輯架構在性能上與前幾代相比提高不多。下圖所示的是 24 個 RTL 設計的綜合 Geomean FMAX 性能,將賽靈思上一代 Virtex® UltraScale+™ FPGA 與英特爾 Agilex 器件的架構性能進行比較



 

軟體可編程架構

為滿足不斷演進發展的需求,Versal 架構也提供了軟件可編程平台。綜合全面的軟體開發堆棧有助於充分發揮 Versal ACAP 的全部功能

- 硬體開發者:
  Vivado 設計套件。 Vivado 工具採用最新的 ML 算法,在實現一流的 QoR 的同時,為 IP 集成和可編程 NoC
  配置提供了完整的 IP 接口。

- 軟體及AI 開發者:
  Vitis 統一軟體平台。 Vitis 工具依托約 1,000 個硬體/AI 引擎加速開源庫,使用 C/C++ 和 Python 提供完整的
  軟體編程抽象。對於 AI 開發者,Vitis AI 直接支持 TensorFlow 和 Pytorch 等 ML 框架,便於量化和編譯受訓
  模型,而且僅用幾分鐘就能在預構建的 AI 加速疊加 IP 上運行。

將 Versal 架構結合 Vivado、Vitis/Vitis AI 以及賽靈思一直以來的可編程能力和靈活應變能力,能夠為眾多突破性產品奠定基礎。

 

Versal ACAP 與同類 FPGA 對比


- 基於 CNN 的圖像檢測 2.7-8.2倍單位功耗性能

在眾多應用領域,運用機器學習技術已成為普遍現象。事實上,很難找到一個還沒有被機器學習轉變的行業。

為了展示在 Versal ACAP 上實現的推斷吞吐量性能,賽靈思用 ML Perf Data Center Inference v1.0 測量了基準測試的結果。搭載在賽靈思 VCK5000 型 AI 推斷開發卡上的 VC1902 是賽靈思 Versal AI Core 系列的首款器件,在多種硬體可編程平台上運行 ResNet50 v1.5 圖像檢測基準測試時,均表現出行業領先性能。


 

- 5G 無線波束成形 2.14倍單位功耗性能

大規模 MIMO 無線電是全球 5G 商業部署的主要組成部分。為支持波束成形,5G NR 中定義了物理和更高層的流程和控制信令。Versal 架構提供的自適應計算靈活性和性能,能夠滿足難度大且不斷演進的 5G NR 設計要求。由乘法器、存儲器和互聯構成的傳統 FPGA 架構相比,Versal AI 引擎技術既提高了所需的計算密度,又降低了功耗

下圖所示的是在 Versal AI Core VC1902 量產 ACAP 上運行的無線 5G 應用的預測性能,與同類可編程器件的預測性能的對比。




 

- 網絡加速 可提供大於 16W 的功率裕度

在雲端提供商和企業數據中心中,從 CPU 卸載各類關鍵應用的需求存越來越強烈,特別是圍繞網絡加速領域。新一類硬體加速器已在市場上興起,作用是幫助卸載高 CPU 佔用的應用處理


賽靈思網絡加速器通過卸載計算密集型網絡進程,不但顯著增強了對 CPU 的有效利用,還可提供可擴展的組合式數據平面編程能力。新通過添加硬化 IP 等大量基礎功能,Versal 架構在有利於網絡加速器應用的同時,支持定制數據平面處理

下圖所示是運行在 Versal 器件上的網絡加速器應用與同類可編程器件的預測功耗比較。與同類產品相比,使用功耗 75W 的 PCIe 卡承載 Versal 架構功能時能留出 16W 的功率裕度。
 




 

- DCI 橋接和傳輸 2.2倍單位功耗性能

隨著數據中心向 400G 和最終的 800G 發展,數據中心互聯( DCI )設備將繼續向靈活性提出需求。這些網絡負載不斷增長,要求路由器/交換機晶片採用最新的 SerDes 速率(5G 到 112G),從而實現全密度運行,為 DCI 橋接和傳輸功能提供支持。此外,為防止基礎設施設備遭遇頻繁的網絡攻擊,也經常需要具備在線加密/解密等安全功能。

賽靈思 Versal ACAP SmartPHY 解決方案能夠連接高達 2.4Tb/s 的傳輸/網絡接口,直接對接光通信,並在單個器件中集成最高 1.6Tb/s 的全雙工加密。這是目前業界最高的單器件密度,能幫助 OEM 系統提供商開發差異化產品。

下圖所示的是等效 DCI 橋接設計中的 Versal 器件的功耗估算與同類可編程器件的預測性能對比。




 
Versal ACAP 是一類全新的產品,功能和異構集成度均得到顯著改善。通過在 Versal 架構(如 AI 引擎、NoC、100G MRMAC、600G DCMAC、400G 高速加密引擎和 600G Interlaken)內硬化大量基礎 IP, Versal ACAP 相對於同類 FPGA 擁有壓倒性的性能和單位功耗性能優勢,可為多種類型的應用大幅提升系統級性能。

 

點擊下載完整版白皮書 Versal 平台的系統級優勢 深入了解 Versal 平台核心價值。



閱讀原文



avnet.com/apac  
Copyright ©2022 Avnet, Inc. All rights reserved.