Xilinx 精选产品和方案
 

AI 引擎機器學習核心與計算圖程式指南


AMD Versal™ AI Core 系列和 Versal AI Edge 系列旨在憑藉 AI 引擎機器學習 ( ML ) 架構來提供突破性的 AI 推斷加速。這些裝置的設計應用範圍廣泛,包括用於雲端動態工作負載以及超高頻寬網絡,同時還可提供進階安全性功能。 AI 和資料科學家以及軟硬體開發者均可充分利用高運算密度的優勢來加速提升任何應用的效能。 AI 引擎機器學習擁有先進的張量運算能力,非常適合用於高度最佳化的 AI 和 ML 應用。

AI 引擎機器學習裝置包含二維陣列,由具有單指令流多資料流( SIMD ) 向量單元的超長指令字( VLIW ) 處理器構成,專為計算密集型應用而高度優化,特別適用於機器學習( ML ) 等AI 技術。




AI 引擎機器學習陣列支援三種等級並行度:

指令層級並行度 ( ILP ):透過 VLIW 架構,允許在單一時脈週期內執行多次運算。
SIMD:透過向量暫存器,允許並行執行多項計算。
多核心:透過 AI 引擎機器學習陣列,支援並行執行多個 AI 引擎機器學習核。

指令層級並行度包括1 次標量操作、1 次移動、2 次向量讀取(載入)、1 次向量寫入(儲存)和1 個可執行的向量指令,總計每個時脈週期達6 路VLIW 指令。的確資料級並行度是透過向量級操作來實現的,其中每個時脈週期可執行多組資料操作。

每個 AI 引擎機器學習都包含向量處理器和標量處理器、專用程式記憶體、本地 64 KB 資料記憶體、支援存取其本身和三個相鄰 AI 引擎機器學習內的本機記憶體。它還可存取 DMA 引擎和 AXI4 互連開關,以透過串流與其他 AI 引擎機器學習進行通訊或與可程式邏輯 ( PL ) 或 DMA 進行通訊。請參閱《Versal 自適應 SoC AIE ML 架構手冊》 ( AM020 ) 以取得有關 AI 引擎機器學習陣列和介面的具體詳細資訊。



雖然對於 AI 引擎機器學習而言,大部分標準 C 語言程式碼均可編譯,但程式碼可能需要重構才能充分利用硬體所提供的並行度。 AI 引擎機器學習的優點在於,它能夠在每個時脈週期內使用2 個向量執行乘累積加( MAC ) 運算、為下一項運算載入2 個向量、儲存來自上一項運算的單一向量,並遞增一個指標或執行另一次標量運算。稱為本徵函數的專用函數可讓您以 AI 引擎機器學習向量處理器和標量處理器為目標,並提供多個常用向量函數和標量函數的實現,使您能夠專注於處理目標演算法。 AI 引擎機器學習不僅包含其向量單元,還包含一個標量單元用於所有標準 C 語言程式碼程式。

AI 引擎機器學習程式使用以 C++ 編寫的資料流計算圖(自適應資料流計算圖)規格。此規範可使用 AI 引擎編譯器進行編譯並執行。自適應資料流 ( ADF ) 計算圖應用由多個節點和邊緣組成,其中節點表示計算內核函數,邊緣則表示資料連接。應用程式中的核心可編譯為在 AI 引擎機器學習上運行,這些核心構成了 ADF 計算圖規範的基礎構建塊。 ADF 計算圖屬於 Kahn 進程網絡,其中包含並行運行的 AI 引擎核心。 AI 引擎核心在資料流和緩衝器上執行運算。這些內核會耗用輸入資料塊並產生輸出資料塊。核心還可包含靜態資料或運行時參數 ( RTP ) 實參,包括非同步實參或同步實參。


下圖顯示

ADF 計算圖的概念視圖及其與處理器系統 ( PS )、可程式邏輯 ( PL ) 和 DDR 記憶體的對接介面。它包括:

• AI 引擎機器學習:
每個 AI 引擎機器學習都是一個 VLIW 處理器,其中包含一個標量單元、一個向量單元、兩個載入單元和一個儲存單元。

• AI 引擎核心:
核心是以 AI 引擎機器學習中運行的 C/C++ 編寫的。

• ADF 計算圖:
ADF 計算圖是具有單一或多個 AI 引擎核心(以資料流式傳輸和/或緩衝器連接)的 Kahn 進程網路。它憑藉著以下特定構造來與PL、全域記憶體和PS 進行交互,此類構造有:PLIO(計算圖中的端口屬性,用於建立往來可編程邏輯的流媒體連接)、GMIO(計算圖中的端口屬性,用於建立往來全域記憶體的外部記憶體對映連線)和RTP。



如需了解有關 AI 引擎機器學習記憶體拼塊存取的信息,請參閱 AI 引擎機器學習記憶體拼塊存取。
如需了解有關 AI 引擎機器學習外部記憶體存取的信息,請參閱 AI 引擎機器學習外部記憶體存取。


本文檔第2 章到第5 章聚焦AI 引擎內核編程,不僅涉及單內核編程,還涵蓋了多方面的內容,如內核之間的數據通信,這些內容都是將應用分區為多個內核以達成所需的吞吐量所必不可少的概念。

本文檔第 6 到 14 章焦點包括 AI 引擎計算圖編程構造、核心之間的資料通訊類型、透過主機應用來控制 AI 引擎計算圖以及高級計算圖編程構造。



取得完整版

《AI 引擎機器學習核心與計算圖程式指南(UG1603)》,請掃描二維碼進行下載。



閱讀原文

www.avnet.com/apac  
Copyright ©2024 Avnet, Inc. All rights reserved.