1. <label id="xw3od"><meter id="xw3od"><bdo id="xw3od"></bdo></meter></label>

      <label id="xw3od"><meter id="xw3od"></meter></label>
       加入收藏
       免費注冊
       用戶登陸
      首頁 展示 供求 職場 技術 智造 職業 活動 視點 品牌 鐠社區
      今天是:2025年5月10日 星期六   您現在位于: 首頁 →  技術 → 電子材料(技術聚焦)
      通過架構定制(DSA)迭代為AI提供通用算力
      2023/4/12 13:37:40    
      Domain-Specific Architectures(DSA)是后摩爾時代持續提升處理器性能的一種技術理念,即采用可編程的專用集成電路(ASICs)去加速特定的高強度的處理器負載,比如加速圖形渲染、加速AI神經網絡的前向推理計算、提高巨量網絡數據的吞吐等。

      架構的定義包含指令集架構與微架構。指令集架構是軟件與硬件進行對話的接口,如果說一條指令是一個單詞,那么指令集(ISA)就是詞典,而軟件程序就像是一本使用特定詞典中的詞匯編寫出來的一本書。

      通過對架構進行面向特定領域的設計,縮小應用范圍,獲得更高的性能,或者更好的能效比,保持可編程的靈活性,這就是DSA的理念。
      - 面向領域的架構設計可以以較低的成本獲取較高的算力,以滿足算力需求。
      - 指令集架構的可編程性帶來了相對通用的算力,為下一代算法的應用和覆蓋更廣泛的領域提供了無限的可能。

      GPU也是一種的DSA,GPU的發展論證了DSA取得的成功。DSA、GPU、AI這是個互相成就的故事。而Nvidia的GPGPU硬件的成功,與其CUDA生態豐富的算力軟件包、易于使用的編程接口、優秀的編譯器脫不開干系。由此我們可以得出一條結論,對于DSA算力硬件來說,這些都是走向商業成功的必要條件。

      從TX1推出開始,對標TX1的競品層出不窮。TX1的算力來自于GPGPU,而更加客制化的ASIC,利用卷積操作的空間局部性進行數據復用的精妙設計,在達到同等甚至更高算力的同時硬件的成本更低。最普遍的設計是一個高能效比的CPU小核如Arm Cortex A7/A53加固化的2D圖像處理(CV)模塊與固化的神經網絡處理(DNN/NPU)模塊。

      由于小CPU的計算能力非常受限,將主要負責應用軟件的任務調度部分,AI應用的前處理(非DNN算法模型部分)主要由2D圖像處理模塊來承接。問題在于前處理是非常碎片化的算法,除了個別的插值、顏色域轉換功能幾乎所有圖像處理軟件都會用到,其他所需功能非常的廣泛。僅OpenCV的核心函數、圖像處理函數就包含矩陣變換、濾波、分辨率變換、顏色空間轉換、直方圖等等幾個大類,其中每個大類中的子方法又會有若干個,無法定義哪些功能需要被固化。這還不包含3D數據處理能力與特征描述子的使用。算法廠商的需求各不相同,固化的多了浪費面積,固化的少了產品開發的難度將大幅提升。

      ONNX是一種針對機器學習所設計的開放式的文件格式,用于存儲訓練好的模型。它使得不同的人工智能框架訓練得到的網絡模型可以以相同的格式進行存儲。 ONNX的規范及代碼主要由微軟,亞馬遜,Facebook和IBM等公司共同開發。以NVIDIA的AI軟件生態中最富盛名的DNN推理開發工具庫TensortRT為例,5.1版本支持87個ONNX算子,到了7.1版本支持的ONNX算子數量為108個。功能高度固化的ASIC無法對新增的算子計算類型進行支持,將會越來越約束算法的迭代。而在這之上進行AI產品開發的算法工程師們無異于是戴著鐐銬跳舞。

      Google公司研發了張量處理單元 (TPU),TPU v1 于2015年投入生產,并被谷歌內部用于其應用程序。TPU是一種應用于AI領域,為AI算法提供算力的ASIC,利用了神經網絡對于數值精度不敏感的特性,其思想核心是采用低精度矩陣Systolic Array提供巨大算力,同時提供滿足AI需求的最小化的運算功能。此版本(即TPUv1)的云服務從未對用戶開放開發使用。現在TPUv2以及后續版本被廣泛的應用于谷歌的搜索排序、語音識別、以圖搜圖、谷歌翻譯等領域。

      通過以上的成功案例我們可以發現,GPGPU、TPU的迭代的共同點是通過越來越高度的架構定制帶來了越來越澎湃的專用算力。同時保留或者新增通用的算力。通過高度優化的編譯器和豐富的軟件棧,讓用戶能夠輕松的將硬件算力充分地利用起來。那么通用算力、編譯器、軟件棧這些顯然都在CPU平臺是最豐富最成熟的,而對于CPU來說 “Domain-specific architecture design is all you need”。(張底剪報)
      → 『關閉窗口』
       365pr_net
       [ → 我要發表 ]
      上篇文章:合作應對來自小芯片封裝的10大挑戰
      下篇文章:數字聲紋,讓我們通過聲音辨別出一個人
      → 主題所屬分類:  電子材料 → 技術聚焦
       熱門文章
       如何申請EtherCAT技術協會(ETG)會員資格 (184280)
       臺北國際計算機展(COMPUTEX 2015)參展商名… (106046)
       上海市集成電路行業協會(SICA) (94105)
       USB-IF Members Company List (84455)
       第十七屆中國專利優秀獎項目名單(507項) (76325)
       蘋果授權MFi制造商名單-Authorized MFi Lic… (70200)
       臺北國際計算機展(COMPUTEX 2015)參展商名… (69459)
       中國130家太陽能光伏組件企業介紹(3) (56591)
       PLC論壇 (53363)
       中國130家太陽能光伏組件企業介紹(2) (49917)
       最近更新
       一本面向設計工程師精心修訂和更新的《ESD應用手冊… (3月10日)
       表皮電子學的代表作:石墨烯紋身 (2月26日)
       在晶圓級大規模生產中引入脈沖激光沉積(PLD)技術 (1月21日)
       你聽說過PiezoMEMS技術嗎? (1月21日)
       旨在挑戰EUV的納米壓印光刻技術(Nanoimprint L… (1月3日)
       新UV光刻機專利顯著提高能效并降低半導體制造成本 (11月6日)
       將GaN極性半導體晶圓的兩面用于功能器件 (9月30日)
       驅動增強終端側生成式AI體驗的技術:LoRA (6月11日)
       AI TOPS和NPU性能指標指南 (6月11日)
       驅動增強終端側生成式AI體驗的技術:多模態生成式AI (6月11日)
       文章搜索
      搜索選項:            
        → 評論內容 (點擊查看)
      您是否還沒有 注冊 或還沒有 登陸 本站?!
      關于我們 ┋ 免責聲明 ┋ 產品與服務 ┋ 聯系我們 ┋ About 365PR ┋ Join 365PR
      Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產通互聯網有限公司 版權所有
      E-mail:postmaster@365pr.net 不良信息舉報 備案號:粵ICP備06070889號
      主站蜘蛛池模板: 亚洲AV无码专区电影在线观看| 亚洲中文字幕在线观看| 亚洲国产综合专区电影在线| 国产又黄又爽又大的免费视频| 在线观看亚洲精品国产| 久久99久久成人免费播放| 中文字幕精品亚洲无线码一区| 美女被免费网站91色| 亚洲国产高清在线| 一区二区三区福利视频免费观看| 亚洲影院在线观看| 四虎永久在线观看免费网站网址 | 尤物视频在线免费观看| 亚洲国产婷婷综合在线精品| AAAAA级少妇高潮大片免费看| 日韩亚洲欧洲在线com91tv| 青青青国产手机频在线免费观看| 亚洲专区在线视频| 成人免费午夜在线观看| 老湿机一区午夜精品免费福利 | 95免费观看体验区视频| 亚洲三级在线播放| 永久免费bbbbbb视频| 免费人成在线观看播放a| 亚洲欧洲国产精品香蕉网| 99爱视频99爱在线观看免费| 7777久久亚洲中文字幕| 国产一级一片免费播放i| 精精国产www视频在线观看免费| 亚洲色图在线观看| 香蕉视频在线观看免费国产婷婷| xxxxxx日本处大片免费看| 亚洲一区免费观看| 国产精品成人免费综合| 成人A片产无码免费视频在线观看| 亚洲福利一区二区精品秒拍| 四虎影在线永久免费观看| 免费黄色电影在线观看| 亚洲精品理论电影在线观看| 亚洲精品国产精品乱码不卡√| 亚洲人成网站免费播放|