脈動陣列的簡單示意圖(一維架構)。上圖為傳統架構,處理單元(PE)每次操作後,都要回到主記憶體更新資料,存取一次記憶體就各需要花 100 奈秒,於是每秒最多只能執行五百萬次的操作。下圖為脈動陣列,有多個處理單元並行工作,最後再送回主記憶體,在當時可提升至每秒三千萬次的操作。這種架構有效地增加了計算密度和資料處理速度,對於高效能運算和AI晶片設計相當重要。圖|研之有物(資料來源|孔祥重)

訂閱電子報

立即訂閱研之有物電子報,一起探索這世界