電子發燒友網>可編程邏輯> > 正文

FPGA與GPU計算存儲加速對比:單位功耗性能考量因素

2021年08月20日 11:57 ? 次閱讀

為了提升計算基礎設施的性能,并緊跟數據分析與 AI 不斷攀升的需求,眾多企業將硬件加速視為主要的解決方案。在大多數情況下,先進的可編程硬件(主要是指 GPUFPGA)是加速的主要方式。通過使用這種先進的硬件,企業正在贏得計算優勢;然而,對于編程難度,他們仍然存在合理的擔憂。

poYBAGEfKIWAMSiTAANJzyTSf9k555.png

圖 1:分析/AI 流水線組件

硬件制造商正在將加速方法應用于計算存儲,這是專門設計用于包含內嵌計算元素的存儲。這種方法已經被證明可以為分析和 AI 應用提供優異的性能(圖 1)。使用或者不使用機器學習輔助的分析以及驗證,都可以借助計算存儲器件進行加速。這些器件提供了一個關鍵的優勢,使得成本高昂的計算被卸載到存儲器件上,而不必在服務器 CPU 上完成。與標準的存儲/CPU 方法相比,通過計算存儲獲得的優勢包括:

1. 借助應用專用編程定制可編程硬件,獲得更高性能

2. 將計算任務從服務器卸載到存儲器件,釋放 CPU 資源

3. 數據與計算共址,降低數據傳輸需求

這種新穎的方法前景光明。不過,您應根據具體用例評估這種方法,考量性能、成本、功耗和易用性。性價比和單位功耗性能在選擇加速硬件評估時,占據主要比率。在本文中,我們將研討單位功耗性能(另一篇文章則專門研討性價比)。

計算存儲功耗比較

3種系統

在這個場景中,我們將比較以 CSV 數據讀取用例為主的三種工具:英偉達 GPUDirect 存儲 和RAPIDS存儲,以及基于賽靈思技術的三星 SmartSSD 存儲。CSV 讀取在計算密集型流水線中起著重要的作用(參見圖 1)。

在下文中,我們將性能定義成 CSV 的處理速率,或處理“帶寬”。我們先快速回顧一下三種系統的運行方式。

英偉達 GPUDirect 存儲

·端到端滿足分析和 AI 需求

·將 GPU 用作計算單元,緊貼基于 NVMe 的存儲器件布局 (GPUDirect)

·使用 CUDA 進行編程 (RAPIDS)

英偉達用其 CSV 數據讀取技術衡量相對于標準 SSD 的性能提升。結果如圖 1 所示。使用 1 到 8 個加速器時,對應的吞吐量是 4 到 23GB/s。

三星 SmartSSD 驅動器

·將賽靈思 FPGA 用作計算單元

·與存儲邏輯內嵌駐留在同一個內部 PCIe 互聯上

·通過編程在存儲平臺上開展運算

賽靈思數據分析解決方案合作伙伴 Bigstream 與三星合作,為 Apache Spark 設計加速器,包括用于 CSV 和 Parquet 處理的 IP。SmartSSD 的測試使用單機模式的 CSV 解析引擎,以便開展比較。結果如圖 2 所示,使用 1 到 12 個加速器時,對應的吞吐量是 4 到 23GB/s,同時也給出英偉達的結果(使用 1 到 8 個加速器)。請注意,本討論中的所有結果都按 x 軸上的加速器數量進行參數化。

這些結果令人振奮,但在選擇您的解決方案時,請務必將功耗情況納入考慮。

poYBAGEfKJiAMRnjAAGoUIW3J0c769.png

圖 2:SmartSSD 驅動器的 CSV 解析性能結果

單位功耗性能比較

圖 3 顯示了將功耗考慮在內后的分析結果。它們代表單位功耗達到的性能水平,根據上述討論中引用的相關材料,給出了以下假設:

·Tesla V100 GPU:最大功耗 200 瓦

·SmartSSD 驅動器 FPGA:最大功耗 30 瓦

poYBAGEfKKSAZzVDAAFnh5Dujr4099.png

圖 3:CSV 解析的每瓦功耗帶寬比較

在這個場景下,計算表明,在全部使用 8 個加速器的情況下,SmartSSD 的單位功耗性能比 GPUDirect Storage 高 25 倍。

FPGA 與 GPU 對比:有關單位功耗性能的最終思考

計算存儲的優勢在于能增強數據分析和 AI 應用的性能。然而,要讓這種方法具備可實際部署的能力和實用性,就必須在評估時將功耗納入考慮。

針對用于 CSV 數據解析的兩種不同的計算存儲方法,我們已經提出按功耗參數化的吞吐量性能曲線。結果顯示,在使用相似數量的加速器進行比較時,SmartSSD 驅動器的單位功耗性能優于 GPUDirect存儲方法。

GPUDirect 是英偉達通過 NVIDIA DGX-2 應用平臺提供的研究系統。

三星 SmartSSD 驅動器是一種可部署的量產型 PCIe 可插拔平臺,現在已經通過賽靈思及分銷商供貨。

如需了解更多信息,請查看:

· 有關 Bigstream 與 SmartSSD 計算存儲器件結合使用,加速大數據和數據分析的電子書。

· Bigstream 硬件加速 Apache Spark解決方案。

· 有關使用三星 SmartSSD 驅動器給工作負載帶來優勢的 三星 SmartSSD 頁面。

下載發燒友APP

打造屬于您的人脈電子圈

關注電子發燒友微信

有趣有料的資訊及技術干貨

關注發燒友課堂

鎖定最新課程活動及技術直播

電子發燒友觀察

一線報道 · 深度觀察 · 最新資訊
收藏 人收藏
分享:

評論

相關推薦

小鳥科技借助Xilinx Kintex? FPG...

賽靈思FPGA平臺出色的性能和簡潔易用的 Vivado?開發工具,助力小鳥科技將業界領先的專業音視頻....
發表于 2021-08-20 14:22? 0次閱讀
小鳥科技借助Xilinx Kintex? FPG...

借助自適應加速平臺打造能適應快速環境變化的機器人

隨著機器人能夠適應不斷改變的環境,它們的價值和潛在影響也在迅速攀升。
發表于 2021-08-20 14:19? 0次閱讀
借助自適應加速平臺打造能適應快速環境變化的機器人

Xilinx賦能深維科技GIF2WebP動圖方案...

Xilinx? Alveo? U200加速卡助力深維科技 (DeePoly)ThunderImage....
發表于 2021-08-20 11:52? 102次閱讀
Xilinx賦能深維科技GIF2WebP動圖方案...

淺析HarmonyOS基于AI的通用文字識別技術

在資訊大爆炸的時代,我們經常面臨文件、圖片找不到的情況,HarmonyOS基于AI的通用文字識別技術....
發表于 2021-08-20 10:42? 104次閱讀
淺析HarmonyOS基于AI的通用文字識別技術

華為城市智能體 助力打造智慧之城

田子坊整個商業區目前已經接入240+煙感,70+傾角儀,16+垃圾桶滿溢等感知設備,并且通過布設8個....
發表于 2021-08-20 10:13? 212次閱讀
華為城市智能體 助力打造智慧之城

FPGA、Verilog HDL與VHDL的優缺...

Verilog HDL 優點:類似C語言,上手容易,靈活。大小寫敏感。在寫激勵和建模方面有優勢。 缺....
發表于 2021-08-20 10:03? 68次閱讀
FPGA、Verilog HDL與VHDL的優缺...

北鯤云計算平臺為藥物研發提供有力支撐

近年來,隨著中國科技的飛速發展,云計算已成為當前最具前沿的一項新興技術,被廣泛應用于生命科學、芯片設....
發表于 2021-08-20 09:42? 41次閱讀
北鯤云計算平臺為藥物研發提供有力支撐

NVDIA第三季度數據中心營收預計大增 分析師看...

據外媒報道,英偉達(Nvidia) 周三公布強勁財報與優于預期的財測后, 近半數的分析師提高目標價,....
發表于 2021-08-20 09:05? 333次閱讀
NVDIA第三季度數據中心營收預計大增 分析師看...

一文看懂FPGA行業 5G技術更新迭代 驅動FP...

作者:國信證券
發表于 2021-08-19 17:20? 838次閱讀
一文看懂FPGA行業 5G技術更新迭代 驅動FP...

FPGA、Verilog HDL與VHDL的利弊

Verilog HDL 優點:類似C語言,上手容易,靈活。大小寫敏感。在寫激勵和建模方面有優勢。 缺點:很多錯誤在編譯...
發表于 2021-08-19 16:07? 0次閱讀
FPGA、Verilog HDL與VHDL的利弊

詞典筆熱度再加磅,百度&阿爾法蛋...

8月18日,“AI這時代 星辰大?!俣仁澜?021”大會在線上召開,會上,小度作為百度旗下軟硬件....
發表于 2021-08-19 12:17? 197次閱讀
詞典筆熱度再加磅,百度&阿爾法蛋...

百度世界大會2021的智能時代啟示錄 沒有捷徑的...

過去一年里,借“新技術革命”實現超車、擺脫“卡脖子”困境,是國人對中國科技的迫切期待,也成為中國科技....
發表于 2021-08-19 12:01? 839次閱讀
百度世界大會2021的智能時代啟示錄 沒有捷徑的...

如何解決FPGA引腳與LVDS信號相連時兼容性的...

很多工程師在使用Xilinx開發板時都注意到了一個問題,就是開發板中將LVDS的時鐘輸入(1.8V電....
發表于 2021-08-19 10:08? 712次閱讀
如何解決FPGA引腳與LVDS信號相連時兼容性的...

Dialog半導體公司推出針對高性能汽車AI S...

DA914X-A器件提供前所未有的高達40A的電流等級,相對于同時需要電源控制器和分立式FET的電源....
發表于 2021-08-19 09:07? 350次閱讀
Dialog半導體公司推出針對高性能汽車AI S...

智能電話機器人的應用可幫助我們解決一些難題

隨著人工智能的快速發展,越來越多的智能產品出現在我們的日常生活中,很多人會問,人工智能的發展對人類有....
發表于 2021-08-18 18:03? 73次閱讀
智能電話機器人的應用可幫助我們解決一些難題

對于電話機器人我們該如何做出正確的選擇

AI智能目前已經成為發展最快的科學領域之一,也得到了廣泛的社會關注,隨著一款新型產品——電話機器人的....
發表于 2021-08-18 17:58? 89次閱讀
對于電話機器人我們該如何做出正確的選擇

熱資本下的冷思考,國產GPU挑戰與機遇并存

 GPU自誕生以來,就瞄向類型高度統一的、相互無依賴的大規模數據和不需要被打斷的純凈的計算環境。
發表于 2021-08-18 17:40? 578次閱讀
熱資本下的冷思考,國產GPU挑戰與機遇并存

如何實現兩塊FPGA之間的通信總結

1、兩塊fpga之間采用12根線連接,包括8根數據線,2根同步時鐘線,2根使能信號線。 2、每塊fpga的引腳配置為[3:0]...
發表于 2021-08-18 16:58? 235次閱讀
如何實現兩塊FPGA之間的通信總結

iqoo8pro值得入手嗎 優缺點有哪些

昨日晚間,iQOO 8系列正式發布 ,售價3799元起。iQOO此次一共發布了iQOO8和iQOO8....
發表于 2021-08-18 16:47? 1177次閱讀
iqoo8pro值得入手嗎 優缺點有哪些

全能科技旗艦榮耀Magic3系列賦活《千里江山圖...

8月18日,榮耀Magic3系列攜手中國國家地理、天貓超級品牌日賦活《千里江山圖》的視頻震撼上線。視....
發表于 2021-08-18 15:36? 132次閱讀
全能科技旗艦榮耀Magic3系列賦活《千里江山圖...

FPGA入門:表面現象揭秘——邏輯關系

神奇的0和1,緣何能夠如此的變化多端?從某種意義上看,無非就是數字本身固有的各種各樣的邏輯關系在使然。在今天的數...
發表于 2021-08-18 14:45? 0次閱讀
FPGA入門:表面現象揭秘——邏輯關系

RISC-V CON China在線研討會:818 RISC-V 如何成為芯主流

會議地址: 中獎公示:第一輪:【RISC-V中國峰會】 定制T恤 收貨地址填寫: 開源指令集架構(ISA) R...
發表于 2021-08-18 13:55? 202次閱讀
RISC-V CON China在線研討會:818 RISC-V 如何成為芯主流

曙光人工智能指定教材順利出版

隨著人工智能在教育、金融、醫療等諸多領域的廣泛和深度應用,已經顯露出AI服務社會、經濟的價值。人工智....
發表于 2021-08-18 11:48? 358次閱讀
曙光人工智能指定教材順利出版

安晟培半導體通過AI推理應用程序進一步增強 Am...

中國,北京(2021 年 8 月 5 日)——安晟培半導體科技有限公司(Ampere Computi....
發表于 2021-08-18 11:38? 969次閱讀
安晟培半導體通過AI推理應用程序進一步增強 Am...

阿爾法蛋AI詞典筆T10,憑何用AI力量革新行業...

近年來,隨著人工智能與教育場景深度融合,“AI+教育”正推動教育領域的深刻變革。課堂答疑、監考判卷、....
發表于 2021-08-18 11:22? 23次閱讀
阿爾法蛋AI詞典筆T10,憑何用AI力量革新行業...

百度世界大會2021直播在哪看

百度世界大會2021直播在哪看?
發表于 2021-08-18 10:33? 1765次閱讀
百度世界大會2021直播在哪看

FPGA新產品:帶RISC-V硬核的FPGA系統...

不久前,Microchip發布新聞稿介紹了其新的中等帶寬現場可編程門陣列(FPGA)和FPGA系統級....
發表于 2021-08-18 10:07? 1678次閱讀
FPGA新產品:帶RISC-V硬核的FPGA系統...

邏輯層接口的IO口如何使用

上篇博文:【FPGA】SRIO IP核系統總覽以及端口介紹(一)(User Interfaces 之....
發表于 2021-08-18 09:35? 484次閱讀
邏輯層接口的IO口如何使用

【TFT-LCD學習記錄2】 R61509V3 彩屏 FPGA 驅動程序設計 精選資料推薦

1 程序說明2 用 matlab 產生  .coe 文件3...
發表于 2021-08-18 06:47? 0次閱讀
【TFT-LCD學習記錄2】 R61509V3 彩屏 FPGA 驅動程序設計  精選資料推薦

嵌入式軟件開發工程師與FPGA開發工程師 精選資料分享

我是一名初入職場的萌新,工作不久從嵌入式軟件工程師轉到了FPGA工程師,這篇文章簡單講講兩者的區別。嵌入式軟件...
發表于 2021-08-18 06:37? 0次閱讀
嵌入式軟件開發工程師與FPGA開發工程師  精選資料分享

世優科技專注快速動畫研究,已累計復活300個虛擬...

成立于2017年的Superplastic,通過運營一系列的虛擬偶像,全網粉絲超過500萬,2020....
發表于 2021-08-17 17:47? 36次閱讀
世優科技專注快速動畫研究,已累計復活300個虛擬...

曠視科技成立人工智能物流產業聯盟 實現實體產業數...

最近出版的《人民日報》,聚焦曠視科技服務無錫服裝企業夢燕的創新故事,折射出人工智能與物聯網加速融合,....
發表于 2021-08-17 16:34? 1282次閱讀
曠視科技成立人工智能物流產業聯盟 實現實體產業數...

公路病害檢測有了“智慧眼”,思謀AI“助力”廣東...

近日,思謀科技與廣東省某高速企業達成合作,智慧交通一體化平臺病害檢測模塊已成熟落地,將使廣東省高速公....
發表于 2021-08-17 16:12? 627次閱讀
公路病害檢測有了“智慧眼”,思謀AI“助力”廣東...

FPGA廠商京微齊力入選北京市2021年度第三批...

日前,北京市經濟和信息化局發布了關于對北京市2021年度第三批擬認定“專精特新”中小企業名單進行公示....
發表于 2021-08-17 16:02? 935次閱讀
FPGA廠商京微齊力入選北京市2021年度第三批...

可編程邏輯器件隨著半導體集成電路的4個階段

可編程邏輯器件伴隨著半導體集成電路的發展而不斷發展,其發展可以劃分為以下4個階段。
發表于 2021-08-17 09:16? 1760次閱讀
可編程邏輯器件隨著半導體集成電路的4個階段

CIC抽取濾波器MATLAB仿真和FPGA實現

CIC抽取濾波器MATLAB仿真和FPGA實現(1)設計理想濾波器目標:1、濾波器在有效頻段內紋波滿足設計要求。...
發表于 2021-08-17 08:27? 0次閱讀
CIC抽取濾波器MATLAB仿真和FPGA實現

Open Images Extended合集中引...

發布人:Google Research 軟件工程師 Candice Schumann 和 Susan....
發表于 2021-08-16 17:20? 273次閱讀
Open Images Extended合集中引...

SoC開發者將要面臨哪些挑戰

高性能計算中,計算、存儲、網絡三大部件不可或缺。長久以來,追求更高的算力一直是產業的主要創新方向。如....
發表于 2021-08-16 17:02? 1024次閱讀
SoC開發者將要面臨哪些挑戰

如何構建醫院后勤智能管理系統

由于我國醫療信息化建設起步較晚,資金支持不足,缺乏統籌規劃等,與世界平均水平相比還有較大差距,尤其是....
發表于 2021-08-16 15:53? 41次閱讀
如何構建醫院后勤智能管理系統

基于FPGA 的CRC校驗碼生成器

發表于 2021-08-16 15:37? 202次閱讀
基于FPGA 的CRC校驗碼生成器

澎峰Artix 7 FPGA開發套件新品上線 奉...

新款的RV開發板,已經新鮮出爐啦!這次帶來的 Perf-V1開發板 ,既可以學習 FPGA編程 ,也....
發表于 2021-08-16 14:18? 1807次閱讀
澎峰Artix 7 FPGA開發套件新品上線 奉...

oppo enco air耳機怎么樣?拆解評測 ...

耳機外殼是由膠以及四周的卡扣固定。利用撬片,沿著耳機機身合模的位置撬開。主板上有透明塑料蓋保護,后蓋....
發表于 2021-08-16 11:10? 2300次閱讀
oppo enco air耳機怎么樣?拆解評測 ...

云天勵飛聚焦視覺人工智能技術和產品研發AI解決方...

上海證券交易所網站更新最新信息,AI企業云天勵飛上會通過。過去一段時間,AI企業科創上市接連受挫,依....
發表于 2021-08-16 11:08? 818次閱讀
云天勵飛聚焦視覺人工智能技術和產品研發AI解決方...

樂鑫科技物聯網ESP32-C3芯片進入測試及軟件...

公司的研發是軟硬件雙輪驅動,除以上芯片設計方面,還不斷在軟件技術上進行投入,圍繞AIoT 的核心,覆....
發表于 2021-08-16 10:27? 739次閱讀
樂鑫科技物聯網ESP32-C3芯片進入測試及軟件...

如何幫助半導體開發實現基于模型設計芯片的完整流程

MATLAB 和 Simulink 方便了半導體器件的設計空間探索和自頂向下的設計,使工程師們能夠相....
發表于 2021-08-16 10:09? 259次閱讀
如何幫助半導體開發實現基于模型設計芯片的完整流程

淺談集成FPGA的兩種方式:eFPGA(SoC)...

目前流行的兩種集成方案分別是embedded FPGA(以下簡稱eFPGA集成方案)以及FPGA C....
發表于 2021-08-16 09:53? 1278次閱讀
淺談集成FPGA的兩種方式:eFPGA(SoC)...

FPGA的特點和優勢

基于上述特點,FPGA芯片早期作為ASIC芯片的半定制化電路替代品應用于部分場景中,近年來,隨著微軟....
發表于 2021-08-16 09:20? 186次閱讀
FPGA的特點和優勢

安防芯片漲價50%!海思退、群雄起,10多家廠商...

電子發燒友網報道(文/黃晶晶)安防芯片原本是一個高度集中的市場,由于海思缺芯短期內得不到緩解,它逐漸....
發表于 2021-08-16 08:18? 1994次閱讀
安防芯片漲價50%!海思退、群雄起,10多家廠商...

京東方全系列8K超高清顯示屏助力央視實現全球首次...

京東方智能公交站牌不受天氣影響,烈日暴曬也能清晰顯示,風吹雨淋也不會生銹模糊,全勤營業。
發表于 2021-08-14 10:52? 2530次閱讀
京東方全系列8K超高清顯示屏助力央視實現全球首次...

Lattice基于三星28nm FD-SOI平臺...

Lattice基于三星28nm FD-SOI平臺推出了一系列FPGA產品,包括在嵌入式視頻方面應用比....
發表于 2021-08-14 10:07? 2522次閱讀
Lattice基于三星28nm FD-SOI平臺...

FPGA與GPU計算存儲單位功耗性能

為了提升計算基礎設施的性能,并緊跟數據分析與 AI 不斷攀升的需求,眾多企業將硬件加速視為主要的解決....
發表于 2021-08-13 17:45? 3433次閱讀
FPGA與GPU計算存儲單位功耗性能

剖析GPU分支分歧對性能的影響

在先前文章中,我們談到現代GPU發展出SIMT(Single Instruction Multipl....
發表于 2021-08-13 16:07? 186次閱讀
剖析GPU分支分歧對性能的影響

Xilinx Vivado 2017.2安裝教程

發表于 2021-08-13 15:47? 202次閱讀
Xilinx Vivado 2017.2安裝教程

NVIDIA發力人工智能 AI推動醫療步入新紀元

人工智能的最終目的是讓人類更好地生活。AI技術與醫療產業相結合,可以幫助人類更加精準地篩查疾病、優化....
發表于 2021-08-13 15:21? 3092次閱讀
NVIDIA發力人工智能 AI推動醫療步入新紀元

什么是 SOM (System-on-Modul...

什么是 SOM (System-on-Module)? SOM (System-on-Module)....
發表于 2021-08-13 14:20? 231次閱讀
什么是 SOM (System-on-Modul...

使用28335與fpga通信傳輸數據到fpga中隔兩個數據重復傳輸,丟失兩個數據

使用28335dma和xintf 傳輸0-31數到fpga ep4e6 fifo中,數據了每隔兩個重復一次,丟失兩個數據,如圖,請大神幫忙看看那...
發表于 2021-08-13 11:47? 202次閱讀
使用28335與fpga通信傳輸數據到fpga中隔兩個數據重復傳輸,丟失兩個數據

NVIDIA研究團隊憑借數字化身榮獲“最佳展示”...

在一場演示盛宴中,NVIDIA 研究人員為數字化身技術作品注入了四個 AI 模型,在 SIGGRAP....
發表于 2021-08-13 11:41? 240次閱讀
NVIDIA研究團隊憑借數字化身榮獲“最佳展示”...

NVIDIA發布RTX A2000 GPU加速設...

全新RTX A2000 GPU采用小巧、節能的設計,適用于更多臺式機,同時加速設計工作流程中的AI和....
發表于 2021-08-13 11:06? 2258次閱讀
NVIDIA發布RTX A2000 GPU加速設...

NVIDIA研究團隊分享了實時路徑追蹤和內容創建...

NVIDIA在夏季的多場頂級圖形大會上展示其如何為藝術家、創作者和游戲玩家推動實時路徑追蹤和內容創作....
發表于 2021-08-13 10:59? 215次閱讀
NVIDIA研究團隊分享了實時路徑追蹤和內容創建...

如何利用AI追蹤或研究大型的小動物群落

研究動物有多種原因,無論是為了醫學研究還是為了更深入地了解它們的行為。特別是斑馬魚,它們不僅可用性高....
發表于 2021-08-13 10:54? 1692次閱讀
如何利用AI追蹤或研究大型的小動物群落

如何利用運行在NVIDIA的EGX平臺上的NVI...

在我們的物理空間中,對自動化,提高運營效率和安全性的呼聲之高前所未有。大約有10億個攝像頭 -物聯網....
發表于 2021-08-13 10:45? 151次閱讀
如何利用運行在NVIDIA的EGX平臺上的NVI...
狠狠cao在线视频观看_青青青视频在线观看_免费的三级黄网站