加入收藏
免費注冊
用戶登陸
首頁
展示
供求
職場
技術
智造
職業
活動
視點
品牌
鐠社區
今天是:2025年7月7日 星期一 您現在位于:
首頁
→
智造
→ 辦公電子(應用指南)
Graphcore PopRT實現零代碼模型推理部署
日期:2023/4/16 12:01:28 作者:
當你和ChatGPT聊天時,你有沒有想過,在那個閃爍的光標背后,正在發生什么?
ChatGPT在收到你的輸入指令后,到生產出答案的過程就是推理。AI推理是將用戶輸入的數據,通過訓練好的模型產生有價值信息的過程。在LLM類模型應用、自動駕駛、量化交易、搜索、推薦等很多場景中,對于AI推理效率的要求非常高。為進一步幫助克服AI應用部署的時延痛點,Graphcore搭配C600推出了高性能推理SDK——PopRT,幫助開發者實現零代碼推理部署已經訓好的模型,同時帶來低時延和高吞吐量,極大縮短AI業務商業變現時間窗口,為企業用戶贏得市場先機。
PopRT構成
PopRT包括轉換器、編譯器和運行時:
    轉換器
        提供對op-fusion、constant-folding等廣泛使用的優化方法內置支持
        提供對FP16和FP8訓練后量化的內置支持,這種訓練后量化可以實現更低的時延和更高的吞吐量,并且精度損失很小
        支持將多個模型融合為一個
    編譯器
        支持模型切分和流水線
        為運行時導出PopEF(Poplar可執行格式)
    運行時
        支持自動批處理
        支持移除填充以減少對自然語言處理(NLP)模型的無用計算(或通過移除填充對自然語言處理模型進行更有效的推理)
        支持針對CV(計算機視覺)模型的多模型推理
部署和運行
Graphcore始終堅持降低IPU的使用門檻,廣泛支持各類主流的機器學習框架,讓開發者能夠在自己熟悉的環境中工作,專注創新。
PopRT優化模型可與英偉達Triton和TF-Serving一起部署,并可以通過PopRT運行時API很容易地與第三方框架和服務平臺集成。
優化推理性能
搭配Grapchore C600高端推訓一體加速卡,PopRT使得開發者可以“一鍵”零代碼部署已經訓練好的AI應用,可以大幅加速計算機視覺、自動語音識別、自然語言處理(BERT、GPT類)、多模態和推薦系統的AI應用的部署速度,加速整個數據中心的各項工作負載,縮短研發到商用的時間。
欲了解各類模型在C600的優異性能,請聯系info_china@graphcore.ai
在C600上使用PopRT
C600是擬未為云和數據中心打造的高端推訓一體加速卡,主打推理,兼做訓練,可以支持各種主流的AI應用,在搜索和推薦等業務上別具優勢。為了使得C600在推理場景發揮更大效能,PopRT在C600的基礎上進一步針對推理進行了優化,低時延和高吞吐使得用戶可以高效地進行推理,一鍵部署已經訓好的模型。
現在,15億參數量的GPT2-XL已經在C600上成功部署(詳情請見本次推送首條)。在PopRT的加持下,GPT2-XL的推理延時在C600上已經達到1 ms/token的水平。這意味著在實際應用場景中,模型可以快速響應用戶的請求,極大提高用戶體驗。
查詢進一步信息,請訪問官方網站
http://www.graphcore.cn/0-code-deploy-graphcore-poprt/
,
http://docs.graphcore.ai/projects/poprt-user-guide/zh_CN/latest/
,
http://github.com/graphcore/PopRT
。(Donna Zhang,張底剪報)
→
『關閉窗口』
發布人:
-----
[
→ 我要發表
]
上篇文章:
1700V SiC MOSFET無需考慮功率轉換中的權衡問題
下篇文章:
MIPI提高新一代圖像數據的傳輸性能
→ 主題所屬分類:
辦公電子
→
應用指南
熱門文章
中航光電(158廠)電連接器產品選型指南
(
63261
)
國巨(Yageo)片式電阻電容產品規格書
(
57116
)
下一代前傳網絡接口(NGFI)白皮書
(
49070
)
2013年移動經濟(The Mobile Economy 2013…
(
47572
)
鐳射二極管
(
44696
)
使用NFC進行藍牙配對(Using NFC for Bluet…
(
44623
)
mirasol顯示器與競爭性顯示技術的比較 - Qualco…
(
41254
)
為濾波電路選擇合適的運算放大器
(
41202
)
CodeWarrior Development Studio
(
40568
)
u-blox產品目錄(Product Catalog 16…
(
40122
)
最近更新
用樹莓派Pico W和Lora Hat構建網格節點
(5月8日)
用Pulsus PLD系統實現突破性piezoMEMS器件
(1月21日)
復旦芯片實現感存算一體化:像人眼一樣智能
(9月29日)
增強型人工智能為Meteor Lake處理器的設計提速
(5月15日)
教育行業數字化自主創新飛騰生態解決方案白皮書
(4月2日)
人形機器人設計原則及人類智能和內部身體系統仿真
(2月2日)
用傳感器讓中央空調更節能環保,精確測量溫濕度、…
(1月30日)
不干膠標簽印刷UL認證
(11月22日)
基于廣芯微UM3242F-RET6主控芯片的DC-AC逆…
(11月9日)
實現生成式AI的關鍵半導體技術
(8月10日)
文章搜索
搜索選項:
文章標題
發布人
請選擇文章的類別
白皮書店
消費電子
辦公電子
汽車電子
通信電子
固態照明
安全電子
工業電子
醫療電子
家庭電子
參考設計
應用指南
數據手冊
產品透視
移動電子
參考設計
應用指南
數據手冊
產品透視
辦公電子
參考設計
應用指南
數據手冊
產品透視
通信網絡
參考設計
應用指南
數據手冊
產品透視
汽車電子
參考設計
應用指南
數據手冊
產品透視
工業電子
參考設計
應用指南
數據手冊
產品透視
固態照明
參考設計
應用指南
數據手冊
產品透視
安全電子
參考設計
應用指南
數據手冊
產品透視
醫療電子
參考設計
應用指南
數據手冊
產品透視
產品目錄
電子元件
半導體器件
顯示器材
綠色能源
電子材料
電子測量
電子制造
通用資源
設計技巧
常用數據
開發工具
IC代換
→
評論內容
(點擊查看)
(沒有相關評論)
您是否還沒有
注冊
或還沒有
登陸
本站?!
關于我們
┋
免責聲明
┋
產品與服務
┋
聯系我們
┋
About 365PR
┋
Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產通互聯網有限公司 版權所有
E-mail:postmaster@365pr.net
不良信息舉報
備案號:
粵ICP備06070889號
主站蜘蛛池模板:
亚洲乱码国产乱码精华
|
怡红院免费的全部视频
|
h在线观看视频免费网站
|
好看的电影网站亚洲一区
|
亚洲视频精品在线观看
|
国产午夜无码精品免费看动漫
|
亚洲午夜福利精品无码
|
亚洲黄色在线观看网站
|
日韩精品无码专区免费播放
|
亚洲大尺度无码无码专区
|
a级毛片在线免费观看
|
亚洲Av无码精品色午夜
|
日本亚洲欧洲免费天堂午夜看片女人员
|
久久亚洲国产精品
|
国产精品免费看久久久
|
亚洲好看的理论片电影
|
国产免费的野战视频
|
亚洲欧美日韩综合俺去了
|
国产精品色午夜免费视频
|
黄人成a动漫片免费网站
|
亚洲国产成人精品久久久国产成人一区二区三区综
|
caoporm超免费公开视频
|
亚洲日韩激情无码一区
|
男人j进入女人j内部免费网站
|
亚洲无删减国产精品一区
|
一色屋成人免费精品网站
|
色婷婷六月亚洲综合香蕉
|
亚洲国产综合无码一区二区二三区
|
亚洲美女视频网址
|
操美女视频免费网站
|
深夜福利在线视频免费
|
免费高清在线爱做视频
|
免费人成大片在线观看播放电影
|
亚洲中文字幕无码日韩
|
免费福利视频导航
|
国产精品观看在线亚洲人成网
|
色噜噜亚洲精品中文字幕
|
日本黄网站动漫视频免费
|
人妻仑乱A级毛片免费看
|
久久亚洲AV无码精品色午夜麻豆
|
日韩中文无码有码免费视频
|