1. <label id="xw3od"><meter id="xw3od"><bdo id="xw3od"></bdo></meter></label>

      <label id="xw3od"><meter id="xw3od"></meter></label>
       加入收藏
       免費(fèi)注冊
       用戶登陸
      首頁 展示 供求 職場 技術(shù) 智造 職業(yè) 活動(dòng) 視點(diǎn) 品牌 鐠社區(qū)
      今天是:2025年5月10日 星期六   您現(xiàn)在位于: 首頁 →  技術(shù) → 綠色能源(技術(shù)聚焦)
      PCIe結(jié)構(gòu)和RAID如何在GPUDirect存儲(chǔ)中釋放全部潛能
      2023/1/6 9:43:40    
      隨著更快的圖形處理單元(GPU)能夠提供明顯更高的計(jì)算能力,存儲(chǔ)設(shè)備和GPU存儲(chǔ)器之間的數(shù)據(jù)路徑瓶頸已經(jīng)無法實(shí)現(xiàn)最佳應(yīng)用程序性能。NVIDIA的Magnum IO GPUDirect存儲(chǔ)解決方案通過在存儲(chǔ)設(shè)備和GPU存儲(chǔ)器之間實(shí)現(xiàn)直接路徑,可以極大地幫助解決該問題。然而,同等重要的是要使用容錯(cuò)系統(tǒng)來優(yōu)化其已經(jīng)非常出色的能力,從而確保在發(fā)生災(zāi)難性故障時(shí)備份關(guān)鍵數(shù)據(jù)。該解決方案通過PCIe?結(jié)構(gòu)連接邏輯RAID卷,在PCIe 4.0規(guī)范下,這可以將數(shù)據(jù)速率提高到26GB/s。為了解如何實(shí)現(xiàn)這些優(yōu)勢,首先需要檢查該解決方案的關(guān)鍵組件及其如何協(xié)同工作來提供結(jié)果。


      Magnum IO GPUDirect存儲(chǔ)


      Magnum IO GPUDirect存儲(chǔ)解決方案的關(guān)鍵優(yōu)勢是其能夠消除主要性能瓶頸之一,方法是不使用CPU中的系統(tǒng)存儲(chǔ)器將數(shù)據(jù)從存儲(chǔ)設(shè)備加載到GPU中進(jìn)行處理。通常將數(shù)據(jù)移動(dòng)到主機(jī)存儲(chǔ)器并傳送到GPU,這依賴于CPU系統(tǒng)存儲(chǔ)器中的回彈緩沖區(qū),在數(shù)據(jù)傳送到GPU之前,會(huì)在其中創(chuàng)建數(shù)據(jù)的多個(gè)副本。但是,通過這種路徑移動(dòng)大量數(shù)據(jù)會(huì)產(chǎn)生延遲時(shí)間,降低GPU性能,并在主機(jī)中占用許多CPU周期。借助Magnum IO GPUDirect存儲(chǔ)解決方案,無需訪問CPU并避免了回彈緩沖區(qū)效率低下。

      性能直接隨著傳送數(shù)據(jù)量的增加而提高,傳送數(shù)據(jù)量則隨著人工智能(AI)、機(jī)器學(xué)習(xí)(ML)、深度學(xué)習(xí)(DL)和其他數(shù)據(jù)密集型應(yīng)用所需的大型分布式數(shù)據(jù)集呈指數(shù)級(jí)增長。當(dāng)數(shù)據(jù)在本地存儲(chǔ)或遠(yuǎn)程存儲(chǔ)時(shí),可以實(shí)現(xiàn)這些優(yōu)勢,從而允許以比CPU存儲(chǔ)器中的頁面緩存更快的速度訪問數(shù)拍字節(jié)的遠(yuǎn)程存儲(chǔ)。 


      優(yōu)化RAID性能


      該解決方案中的下一個(gè)元素是包括RAID功能,用于保持?jǐn)?shù)據(jù)冗余和容錯(cuò)能力。雖然軟件RAID可以提供數(shù)據(jù)冗余,但底層軟件RAID引擎仍然使用精簡指令集計(jì)算機(jī)(RISC)架構(gòu)進(jìn)行操作,例如奇偶校驗(yàn)計(jì)算。當(dāng)比較高級(jí)RAID級(jí)別(例如RAID 5和RAID 6)的寫I/O延遲時(shí)間時(shí),硬件RAID仍然比軟件RAID快得多,因?yàn)樘峁┝藢S锰幚砥鱽韴?zhí)行這些操作和回寫高速緩存。在流傳輸應(yīng)用中,軟件RIAD的長期RIAD響應(yīng)時(shí)間會(huì)導(dǎo)致數(shù)據(jù)堆積在高速緩存中。硬件RAID解決方案不存在緩存數(shù)據(jù)堆積問題,并且具有專門的備用電池,可以防止出現(xiàn)災(zāi)難性系統(tǒng)掉電時(shí)數(shù)據(jù)丟失的情況。

      標(biāo)準(zhǔn)硬件RAID雖然減輕了主機(jī)的奇偶校驗(yàn)管理負(fù)擔(dān),但大量數(shù)據(jù)仍需經(jīng)過RAID控制器才能發(fā)送到NVMe驅(qū)動(dòng)器,導(dǎo)致數(shù)據(jù)路徑更加復(fù)雜。針對(duì)此問題的解決方案是NVMe優(yōu)化的硬件RAID,該解決方案提供了簡化的數(shù)據(jù)路徑,無需經(jīng)過固件或RAID片上控制器即可傳送數(shù)據(jù)。它還允許維護(hù)基于硬件的保護(hù)和加密服務(wù)。


      混合PCIe結(jié)構(gòu)


      PCIe Gen 4現(xiàn)在是存儲(chǔ)子系統(tǒng)內(nèi)的基本系統(tǒng)互連接口,但標(biāo)準(zhǔn)PCIe交換網(wǎng)具有與前幾代相同的基于樹的基本層級(jí)。這意味著,主機(jī)間通信需要非透明橋接(NTB)來實(shí)現(xiàn)跨分區(qū)通信,這使其變得復(fù)雜,特別是在多主機(jī)多交換網(wǎng)配置中。Microchip的PAX PCIe高級(jí)結(jié)構(gòu)交換網(wǎng)等解決方案能夠克服這些限制,因?yàn)樗鼈冎С秩哂嗦窂胶脱h(huán),而這是使用傳統(tǒng)PCIe無法實(shí)現(xiàn)的。

      結(jié)構(gòu)交換網(wǎng)具有兩個(gè)獨(dú)立的域,主機(jī)虛擬域(專用于每個(gè)物理主機(jī))和結(jié)構(gòu)域(包含所有端點(diǎn)和結(jié)構(gòu)鏈路)。來自主機(jī)域的事務(wù)會(huì)在結(jié)構(gòu)域中轉(zhuǎn)換為ID和地址,反之,結(jié)構(gòu)域中通信的非分層路由也是如此。這樣,系統(tǒng)中的所有主機(jī)便可共享連接到交換網(wǎng)和端點(diǎn)的結(jié)構(gòu)鏈路。

      在嵌入式CPU上運(yùn)行的結(jié)構(gòu)固件通過可配置的下行端口數(shù)虛擬化符合PCIe標(biāo)準(zhǔn)的交換網(wǎng)。因此,交換網(wǎng)將始終顯示為具有直連端點(diǎn)的標(biāo)準(zhǔn)單層PCIe設(shè)備,而與這些端點(diǎn)在結(jié)構(gòu)中的位置無關(guān)。由于結(jié)構(gòu)交換網(wǎng)會(huì)攔截來自主機(jī)的所有配置平面通信(包括PCIe枚舉過程)并選擇最佳路徑,因此它可以實(shí)現(xiàn)這一點(diǎn)。這樣,GPU等端點(diǎn)便可綁定到域中的任何主機(jī)。

      在以下示例中,我們給出了雙主機(jī)PCIe結(jié)構(gòu)引擎設(shè)置。此處,我們可以看到,結(jié)構(gòu)虛擬化允許每個(gè)主機(jī)看到一個(gè)透明PCIe拓?fù)洌渲邪粋(gè)上行端口、三個(gè)下行端口和三個(gè)連接到它們的端點(diǎn),并且主機(jī)可以正確枚舉它們。圖3中的有趣之處是具有一個(gè)包含兩個(gè)虛擬功能的SR-IOV SSD,通過Microchip的PCIe高級(jí)結(jié)構(gòu)交換網(wǎng),同一驅(qū)動(dòng)器的虛擬功能可以共享給不同的主機(jī)。 

      這種PAX結(jié)構(gòu)交換網(wǎng)解決方案還支持在各結(jié)構(gòu)之間直接跨域點(diǎn)對(duì)點(diǎn)傳輸,因此可減少根端口阻塞并進(jìn)一步緩解CPU性能瓶頸。


      性能優(yōu)化


      在探索了NVMe驅(qū)動(dòng)器和GPU之間數(shù)據(jù)傳輸?shù)男阅軆?yōu)化過程中涉及的所有組件之后,現(xiàn)在可以結(jié)合使用這些組件來實(shí)現(xiàn)預(yù)期的結(jié)果。

      盡管使用的是高性能NVMe控制器,但由于根端口的開銷,PCI Gen 4×4(4.5GB/s)的最大數(shù)據(jù)速率也限制為3.5GB/s。不過,通過RAID(邏輯卷)同時(shí)聚合多個(gè)驅(qū)動(dòng)器(SmartRAID控制器可為四個(gè)NVMe驅(qū)動(dòng)器各創(chuàng)建兩個(gè)RAID卷,并通過根端口創(chuàng)建傳統(tǒng)PCIe點(diǎn)對(duì)點(diǎn)路由。這會(huì)將數(shù)據(jù)速率提高到9.5GB/s。

      但是,利用跨域點(diǎn)對(duì)點(diǎn)傳輸,可以通過結(jié)構(gòu)鏈路而不是根端口來路由通信,從而實(shí)現(xiàn)26GB/s的速率,這是使用SmartROC 3200 RAID控制器可達(dá)到的最高速率。在最后一個(gè)場景中,交換網(wǎng)提供不受固件影響的直接數(shù)據(jù)路徑,并且仍然保持基于硬件的RAID保護(hù)和加密服務(wù),同時(shí)充分利用GPUDirect存儲(chǔ)的全部潛能。


      總結(jié)


      高性能PCIe結(jié)構(gòu)交換網(wǎng)(例如Microchip的PAX)允許多主機(jī)共享支持單根I/O虛擬化(SR-IOV)的驅(qū)動(dòng)器,以及動(dòng)態(tài)劃分可在多個(gè)主機(jī)之間共享的GPU和NVMe SSD池。Microchip的PAX結(jié)構(gòu)交換網(wǎng)可以將端點(diǎn)資源動(dòng)態(tài)重新分配給需要這些資源的任何主機(jī)。

      這種解決方案還使用了SmartROC 3200 RAID控制器系列支持的SmartPQI驅(qū)動(dòng)程序,因此無需自定義驅(qū)動(dòng)程序。Microchip的SmartROC 3200 RAID控制器是目前惟一能夠提供最高傳輸速率(即26GB/s)的設(shè)備。它具有極低的延遲時(shí)間,可向主機(jī)提供最多16個(gè)PCIe Gen 4通道,并向后兼容PCIe Gen 2。與Microchip基于Flashtec系列的NVMe SSD結(jié)合使用時(shí),可在多主機(jī)系統(tǒng)中發(fā)揮PCIe和Magnum IO GPUDirect存儲(chǔ)的全部潛能。

      總體而言,上述所有特性使其能夠構(gòu)建一種強(qiáng)大的系統(tǒng),該系統(tǒng)可以滿足AI、ML、DL以及其他高性能計(jì)算應(yīng)用的實(shí)時(shí)需求。(Wilson Kwong,Microchip公司技術(shù)工程師;Sandeep Dattaprasad,Microchip公司產(chǎn)品營銷經(jīng)理)
      → 『關(guān)閉窗口』
       365pr_net
       [ → 我要發(fā)表 ]
      上篇文章:家庭連接聯(lián)盟(HCA)
      下篇文章:什么是邊緣計(jì)算?和云計(jì)算之間有何區(qū)別?
      → 主題所屬分類:  綠色能源 → 技術(shù)聚焦
       熱門文章
       如何申請EtherCAT技術(shù)協(xié)會(huì)(ETG)會(huì)員資格 (184280)
       臺(tái)北國際計(jì)算機(jī)展(COMPUTEX 2015)參展商名… (106046)
       上海市集成電路行業(yè)協(xié)會(huì)(SICA) (94105)
       USB-IF Members Company List (84455)
       第十七屆中國專利優(yōu)秀獎(jiǎng)項(xiàng)目名單(507項(xiàng)) (76325)
       蘋果授權(quán)MFi制造商名單-Authorized MFi Lic… (70200)
       臺(tái)北國際計(jì)算機(jī)展(COMPUTEX 2015)參展商名… (69459)
       中國130家太陽能光伏組件企業(yè)介紹(3) (56592)
       PLC論壇 (53364)
       中國130家太陽能光伏組件企業(yè)介紹(2) (49917)
       最近更新
       一本面向設(shè)計(jì)工程師精心修訂和更新的《ESD應(yīng)用手冊… (3月10日)
       表皮電子學(xué)的代表作:石墨烯紋身 (2月26日)
       在晶圓級(jí)大規(guī)模生產(chǎn)中引入脈沖激光沉積(PLD)技術(shù) (1月21日)
       你聽說過PiezoMEMS技術(shù)嗎? (1月21日)
       旨在挑戰(zhàn)EUV的納米壓印光刻技術(shù)(Nanoimprint L… (1月3日)
       新UV光刻機(jī)專利顯著提高能效并降低半導(dǎo)體制造成本 (11月6日)
       將GaN極性半導(dǎo)體晶圓的兩面用于功能器件 (9月30日)
       驅(qū)動(dòng)增強(qiáng)終端側(cè)生成式AI體驗(yàn)的技術(shù):LoRA (6月11日)
       AI TOPS和NPU性能指標(biāo)指南 (6月11日)
       驅(qū)動(dòng)增強(qiáng)終端側(cè)生成式AI體驗(yàn)的技術(shù):多模態(tài)生成式AI (6月11日)
       文章搜索
      搜索選項(xiàng):            
        → 評(píng)論內(nèi)容 (點(diǎn)擊查看)
      您是否還沒有 注冊 或還沒有 登陸 本站?!
      關(guān)于我們 ┋ 免責(zé)聲明 ┋ 產(chǎn)品與服務(wù) ┋ 聯(lián)系我們 ┋ About 365PR ┋ Join 365PR
      Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產(chǎn)通互聯(lián)網(wǎng)有限公司 版權(quán)所有
      E-mail:postmaster@365pr.net 不良信息舉報(bào) 備案號(hào):粵ICP備06070889號(hào)
      主站蜘蛛池模板: 国产一级片免费看| 免费观看成人毛片a片2008| 亚洲网址在线观看你懂的| 59pao成国产成视频永久免费| 亚洲一区二区影视| 九月婷婷亚洲综合在线| 日本黄色动图免费在线观看| 亚洲精品二三区伊人久久| 亚洲XX00视频| 69视频免费观看l| 国产亚洲欧美日韩亚洲中文色| 亚洲日本va在线视频观看| 又粗又大又黑又长的免费视频| 国产成人精品亚洲一区| 亚洲免费视频在线观看| 国产午夜免费福利红片| 久久永久免费人妻精品| 小说区亚洲自拍另类| 少妇中文字幕乱码亚洲影视| 免费jjzz在在线播放国产| 91青青国产在线观看免费| 瑟瑟网站免费网站入口| 亚洲的天堂av无码| 亚洲色婷婷综合开心网| 免费无码黄十八禁网站在线观看| 久久精品成人免费观看97| 77777亚洲午夜久久多喷| 亚洲成a人片77777kkkk| www.亚洲色图.com| 在线a级毛片免费视频| 国产免费一区二区三区在线观看| 激情无码亚洲一区二区三区 | 日木av无码专区亚洲av毛片| 国产一区二区三区在线观看免费| 51在线视频免费观看视频| 中文无码日韩欧免费视频| 色偷偷亚洲第一综合| 亚洲一区二区三区不卡在线播放| 亚洲AV区无码字幕中文色| 精品亚洲一区二区三区在线播放 | 亚洲精品国产自在久久|