1. <label id="xw3od"><meter id="xw3od"><bdo id="xw3od"></bdo></meter></label>

      <label id="xw3od"><meter id="xw3od"></meter></label>
       加入收藏
       免費注冊
       用戶登陸
      首頁 展示 供求 職場 技術 智造 職業 活動 視點 品牌 鐠社區
      今天是:2025年7月7日 星期一   您現在位于: 首頁 →  智造 → 辦公電子(應用指南)
      Graphcore PopRT實現零代碼模型推理部署
      日期:2023/4/16 12:01:28   作者:
      當你和ChatGPT聊天時,你有沒有想過,在那個閃爍的光標背后,正在發生什么?

      ChatGPT在收到你的輸入指令后,到生產出答案的過程就是推理。AI推理是將用戶輸入的數據,通過訓練好的模型產生有價值信息的過程。在LLM類模型應用、自動駕駛、量化交易、搜索、推薦等很多場景中,對于AI推理效率的要求非常高。為進一步幫助克服AI應用部署的時延痛點,Graphcore搭配C600推出了高性能推理SDK——PopRT,幫助開發者實現零代碼推理部署已經訓好的模型,同時帶來低時延和高吞吐量,極大縮短AI業務商業變現時間窗口,為企業用戶贏得市場先機。


      PopRT構成


      PopRT包括轉換器、編譯器和運行時:

          轉換器
              提供對op-fusion、constant-folding等廣泛使用的優化方法內置支持
              提供對FP16和FP8訓練后量化的內置支持,這種訓練后量化可以實現更低的時延和更高的吞吐量,并且精度損失很小
              支持將多個模型融合為一個
          編譯器
              支持模型切分和流水線
              為運行時導出PopEF(Poplar可執行格式)
          運行時
              支持自動批處理
              支持移除填充以減少對自然語言處理(NLP)模型的無用計算(或通過移除填充對自然語言處理模型進行更有效的推理)
              支持針對CV(計算機視覺)模型的多模型推理


      部署和運行


      Graphcore始終堅持降低IPU的使用門檻,廣泛支持各類主流的機器學習框架,讓開發者能夠在自己熟悉的環境中工作,專注創新。

      PopRT優化模型可與英偉達Triton和TF-Serving一起部署,并可以通過PopRT運行時API很容易地與第三方框架和服務平臺集成。


      優化推理性能


      搭配Grapchore C600高端推訓一體加速卡,PopRT使得開發者可以“一鍵”零代碼部署已經訓練好的AI應用,可以大幅加速計算機視覺、自動語音識別、自然語言處理(BERT、GPT類)、多模態和推薦系統的AI應用的部署速度,加速整個數據中心的各項工作負載,縮短研發到商用的時間。

      欲了解各類模型在C600的優異性能,請聯系info_china@graphcore.ai


      在C600上使用PopRT


      C600是擬未為云和數據中心打造的高端推訓一體加速卡,主打推理,兼做訓練,可以支持各種主流的AI應用,在搜索和推薦等業務上別具優勢。為了使得C600在推理場景發揮更大效能,PopRT在C600的基礎上進一步針對推理進行了優化,低時延和高吞吐使得用戶可以高效地進行推理,一鍵部署已經訓好的模型。

      現在,15億參數量的GPT2-XL已經在C600上成功部署(詳情請見本次推送首條)。在PopRT的加持下,GPT2-XL的推理延時在C600上已經達到1 ms/token的水平。這意味著在實際應用場景中,模型可以快速響應用戶的請求,極大提高用戶體驗。

      查詢進一步信息,請訪問官方網站http://www.graphcore.cn/0-code-deploy-graphcore-poprt/http://docs.graphcore.ai/projects/poprt-user-guide/zh_CN/latest/http://github.com/graphcore/PopRT。(Donna Zhang,張底剪報)
      → 『關閉窗口』
       發布人:-----
       [ → 我要發表 ]
      上篇文章:1700V SiC MOSFET無需考慮功率轉換中的權衡問題
      下篇文章:MIPI提高新一代圖像數據的傳輸性能
      → 主題所屬分類:  辦公電子 → 應用指南
       熱門文章
       中航光電(158廠)電連接器產品選型指南 (63261)
       國巨(Yageo)片式電阻電容產品規格書 (57116)
       下一代前傳網絡接口(NGFI)白皮書 (49070)
       2013年移動經濟(The Mobile Economy 2013… (47572)
       鐳射二極管 (44696)
       使用NFC進行藍牙配對(Using NFC for Bluet… (44623)
       mirasol顯示器與競爭性顯示技術的比較 - Qualco… (41254)
       為濾波電路選擇合適的運算放大器 (41202)
       CodeWarrior Development Studio (40568)
       u-blox產品目錄(Product Catalog 16… (40122)
       最近更新
       用樹莓派Pico W和Lora Hat構建網格節點 (5月8日)
       用Pulsus PLD系統實現突破性piezoMEMS器件 (1月21日)
       復旦芯片實現感存算一體化:像人眼一樣智能 (9月29日)
       增強型人工智能為Meteor Lake處理器的設計提速 (5月15日)
       教育行業數字化自主創新飛騰生態解決方案白皮書 (4月2日)
       人形機器人設計原則及人類智能和內部身體系統仿真 (2月2日)
       用傳感器讓中央空調更節能環保,精確測量溫濕度、… (1月30日)
       不干膠標簽印刷UL認證 (11月22日)
       基于廣芯微UM3242F-RET6主控芯片的DC-AC逆… (11月9日)
       實現生成式AI的關鍵半導體技術 (8月10日)
       文章搜索
      搜索選項:            
        → 評論內容 (點擊查看)
      您是否還沒有 注冊 或還沒有 登陸 本站?!
      關于我們 ┋ 免責聲明 ┋ 產品與服務 ┋ 聯系我們 ┋ About 365PR ┋ Join 365PR
      Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產通互聯網有限公司 版權所有
      E-mail:postmaster@365pr.net 不良信息舉報 備案號:粵ICP備06070889號
      主站蜘蛛池模板: 亚洲乱码国产乱码精华| 怡红院免费的全部视频| h在线观看视频免费网站| 好看的电影网站亚洲一区| 亚洲视频精品在线观看| 国产午夜无码精品免费看动漫| 亚洲午夜福利精品无码| 亚洲黄色在线观看网站| 日韩精品无码专区免费播放| 亚洲大尺度无码无码专区| a级毛片在线免费观看| 亚洲Av无码精品色午夜| 日本亚洲欧洲免费天堂午夜看片女人员 | 久久亚洲国产精品| 国产精品免费看久久久| 亚洲好看的理论片电影| 国产免费的野战视频| 亚洲欧美日韩综合俺去了| 国产精品色午夜免费视频| 黄人成a动漫片免费网站| 亚洲国产成人精品久久久国产成人一区二区三区综 | caoporm超免费公开视频| 亚洲日韩激情无码一区| 男人j进入女人j内部免费网站| 亚洲无删减国产精品一区| 一色屋成人免费精品网站| 色婷婷六月亚洲综合香蕉| 亚洲国产综合无码一区二区二三区| 亚洲美女视频网址| 操美女视频免费网站| 深夜福利在线视频免费| 免费高清在线爱做视频| 免费人成大片在线观看播放电影| 亚洲中文字幕无码日韩| 免费福利视频导航| 国产精品观看在线亚洲人成网| 色噜噜亚洲精品中文字幕| 日本黄网站动漫视频免费| 人妻仑乱A级毛片免费看| 久久亚洲AV无码精品色午夜麻豆| 日韩中文无码有码免费视频|