加入收藏
免費(fèi)注冊(cè)
用戶登陸
首頁(yè)
展示
供求
職場(chǎng)
技術(shù)
智造
職業(yè)
活動(dòng)
視點(diǎn)
品牌
鐠社區(qū)
今天是:2025年5月10日 星期六 您現(xiàn)在位于:
首頁(yè)
→
智造
→ 辦公電子(應(yīng)用指南)
Graphcore PopRT實(shí)現(xiàn)零代碼模型推理部署
日期:2023/4/16 12:01:28 作者:
當(dāng)你和ChatGPT聊天時(shí),你有沒(méi)有想過(guò),在那個(gè)閃爍的光標(biāo)背后,正在發(fā)生什么?
ChatGPT在收到你的輸入指令后,到生產(chǎn)出答案的過(guò)程就是推理。AI推理是將用戶輸入的數(shù)據(jù),通過(guò)訓(xùn)練好的模型產(chǎn)生有價(jià)值信息的過(guò)程。在LLM類(lèi)模型應(yīng)用、自動(dòng)駕駛、量化交易、搜索、推薦等很多場(chǎng)景中,對(duì)于AI推理效率的要求非常高。為進(jìn)一步幫助克服AI應(yīng)用部署的時(shí)延痛點(diǎn),Graphcore搭配C600推出了高性能推理SDK——PopRT,幫助開(kāi)發(fā)者實(shí)現(xiàn)零代碼推理部署已經(jīng)訓(xùn)好的模型,同時(shí)帶來(lái)低時(shí)延和高吞吐量,極大縮短AI業(yè)務(wù)商業(yè)變現(xiàn)時(shí)間窗口,為企業(yè)用戶贏得市場(chǎng)先機(jī)。
PopRT構(gòu)成
PopRT包括轉(zhuǎn)換器、編譯器和運(yùn)行時(shí):
    轉(zhuǎn)換器
        提供對(duì)op-fusion、constant-folding等廣泛使用的優(yōu)化方法內(nèi)置支持
        提供對(duì)FP16和FP8訓(xùn)練后量化的內(nèi)置支持,這種訓(xùn)練后量化可以實(shí)現(xiàn)更低的時(shí)延和更高的吞吐量,并且精度損失很小
        支持將多個(gè)模型融合為一個(gè)
    編譯器
        支持模型切分和流水線
        為運(yùn)行時(shí)導(dǎo)出PopEF(Poplar可執(zhí)行格式)
    運(yùn)行時(shí)
        支持自動(dòng)批處理
        支持移除填充以減少對(duì)自然語(yǔ)言處理(NLP)模型的無(wú)用計(jì)算(或通過(guò)移除填充對(duì)自然語(yǔ)言處理模型進(jìn)行更有效的推理)
        支持針對(duì)CV(計(jì)算機(jī)視覺(jué))模型的多模型推理
部署和運(yùn)行
Graphcore始終堅(jiān)持降低IPU的使用門(mén)檻,廣泛支持各類(lèi)主流的機(jī)器學(xué)習(xí)框架,讓開(kāi)發(fā)者能夠在自己熟悉的環(huán)境中工作,專(zhuān)注創(chuàng)新。
PopRT優(yōu)化模型可與英偉達(dá)Triton和TF-Serving一起部署,并可以通過(guò)PopRT運(yùn)行時(shí)API很容易地與第三方框架和服務(wù)平臺(tái)集成。
優(yōu)化推理性能
搭配Grapchore C600高端推訓(xùn)一體加速卡,PopRT使得開(kāi)發(fā)者可以“一鍵”零代碼部署已經(jīng)訓(xùn)練好的AI應(yīng)用,可以大幅加速計(jì)算機(jī)視覺(jué)、自動(dòng)語(yǔ)音識(shí)別、自然語(yǔ)言處理(BERT、GPT類(lèi))、多模態(tài)和推薦系統(tǒng)的AI應(yīng)用的部署速度,加速整個(gè)數(shù)據(jù)中心的各項(xiàng)工作負(fù)載,縮短研發(fā)到商用的時(shí)間。
欲了解各類(lèi)模型在C600的優(yōu)異性能,請(qǐng)聯(lián)系info_china@graphcore.ai
在C600上使用PopRT
C600是擬未為云和數(shù)據(jù)中心打造的高端推訓(xùn)一體加速卡,主打推理,兼做訓(xùn)練,可以支持各種主流的AI應(yīng)用,在搜索和推薦等業(yè)務(wù)上別具優(yōu)勢(shì)。為了使得C600在推理場(chǎng)景發(fā)揮更大效能,PopRT在C600的基礎(chǔ)上進(jìn)一步針對(duì)推理進(jìn)行了優(yōu)化,低時(shí)延和高吞吐使得用戶可以高效地進(jìn)行推理,一鍵部署已經(jīng)訓(xùn)好的模型。
現(xiàn)在,15億參數(shù)量的GPT2-XL已經(jīng)在C600上成功部署(詳情請(qǐng)見(jiàn)本次推送首條)。在PopRT的加持下,GPT2-XL的推理延時(shí)在C600上已經(jīng)達(dá)到1 ms/token的水平。這意味著在實(shí)際應(yīng)用場(chǎng)景中,模型可以快速響應(yīng)用戶的請(qǐng)求,極大提高用戶體驗(yàn)。
查詢(xún)進(jìn)一步信息,請(qǐng)?jiān)L問(wèn)官方網(wǎng)站
http://www.graphcore.cn/0-code-deploy-graphcore-poprt/
,
http://docs.graphcore.ai/projects/poprt-user-guide/zh_CN/latest/
,
http://github.com/graphcore/PopRT
。(Donna Zhang,張底剪報(bào))
→
『關(guān)閉窗口』
發(fā)布人:
-----
[
→ 我要發(fā)表
]
上篇文章:
1700V SiC MOSFET無(wú)需考慮功率轉(zhuǎn)換中的權(quán)衡問(wèn)題
下篇文章:
MIPI提高新一代圖像數(shù)據(jù)的傳輸性能
→ 主題所屬分類(lèi):
辦公電子
→
應(yīng)用指南
熱門(mén)文章
中航光電(158廠)電連接器產(chǎn)品選型指南
(
62807
)
國(guó)巨(Yageo)片式電阻電容產(chǎn)品規(guī)格書(shū)
(
57017
)
下一代前傳網(wǎng)絡(luò)接口(NGFI)白皮書(shū)
(
48993
)
2013年移動(dòng)經(jīng)濟(jì)(The Mobile Economy 2013…
(
47520
)
使用NFC進(jìn)行藍(lán)牙配對(duì)(Using NFC for Bluet…
(
44501
)
鐳射二極管
(
43702
)
mirasol顯示器與競(jìng)爭(zhēng)性顯示技術(shù)的比較 - Qualco…
(
41196
)
為濾波電路選擇合適的運(yùn)算放大器
(
41085
)
CodeWarrior Development Studio
(
40526
)
u-blox產(chǎn)品目錄(Product Catalog 16…
(
39540
)
最近更新
用樹(shù)莓派Pico W和Lora Hat構(gòu)建網(wǎng)格節(jié)點(diǎn)
(5月8日)
用Pulsus PLD系統(tǒng)實(shí)現(xiàn)突破性piezoMEMS器件
(1月21日)
復(fù)旦芯片實(shí)現(xiàn)感存算一體化:像人眼一樣智能
(9月29日)
增強(qiáng)型人工智能為Meteor Lake處理器的設(shè)計(jì)提速
(5月15日)
教育行業(yè)數(shù)字化自主創(chuàng)新飛騰生態(tài)解決方案白皮書(shū)
(4月2日)
人形機(jī)器人設(shè)計(jì)原則及人類(lèi)智能和內(nèi)部身體系統(tǒng)仿真
(2月2日)
用傳感器讓中央空調(diào)更節(jié)能環(huán)保,精確測(cè)量溫濕度、…
(1月30日)
不干膠標(biāo)簽印刷UL認(rèn)證
(11月22日)
基于廣芯微UM3242F-RET6主控芯片的DC-AC逆…
(11月9日)
實(shí)現(xiàn)生成式AI的關(guān)鍵半導(dǎo)體技術(shù)
(8月10日)
文章搜索
搜索選項(xiàng):
文章標(biāo)題
發(fā)布人
請(qǐng)選擇文章的類(lèi)別
白皮書(shū)店
消費(fèi)電子
辦公電子
汽車(chē)電子
通信電子
固態(tài)照明
安全電子
工業(yè)電子
醫(yī)療電子
家庭電子
參考設(shè)計(jì)
應(yīng)用指南
數(shù)據(jù)手冊(cè)
產(chǎn)品透視
移動(dòng)電子
參考設(shè)計(jì)
應(yīng)用指南
數(shù)據(jù)手冊(cè)
產(chǎn)品透視
辦公電子
參考設(shè)計(jì)
應(yīng)用指南
數(shù)據(jù)手冊(cè)
產(chǎn)品透視
通信網(wǎng)絡(luò)
參考設(shè)計(jì)
應(yīng)用指南
數(shù)據(jù)手冊(cè)
產(chǎn)品透視
汽車(chē)電子
參考設(shè)計(jì)
應(yīng)用指南
數(shù)據(jù)手冊(cè)
產(chǎn)品透視
工業(yè)電子
參考設(shè)計(jì)
應(yīng)用指南
數(shù)據(jù)手冊(cè)
產(chǎn)品透視
固態(tài)照明
參考設(shè)計(jì)
應(yīng)用指南
數(shù)據(jù)手冊(cè)
產(chǎn)品透視
安全電子
參考設(shè)計(jì)
應(yīng)用指南
數(shù)據(jù)手冊(cè)
產(chǎn)品透視
醫(yī)療電子
參考設(shè)計(jì)
應(yīng)用指南
數(shù)據(jù)手冊(cè)
產(chǎn)品透視
產(chǎn)品目錄
電子元件
半導(dǎo)體器件
顯示器材
綠色能源
電子材料
電子測(cè)量
電子制造
通用資源
設(shè)計(jì)技巧
常用數(shù)據(jù)
開(kāi)發(fā)工具
IC代換
→
評(píng)論內(nèi)容
(點(diǎn)擊查看)
(沒(méi)有相關(guān)評(píng)論)
您是否還沒(méi)有
注冊(cè)
或還沒(méi)有
登陸
本站?!
關(guān)于我們
┋
免責(zé)聲明
┋
產(chǎn)品與服務(wù)
┋
聯(lián)系我們
┋
About 365PR
┋
Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產(chǎn)通互聯(lián)網(wǎng)有限公司 版權(quán)所有
E-mail:postmaster@365pr.net
不良信息舉報(bào)
備案號(hào):
粵ICP備06070889號(hào)
主站蜘蛛池模板:
一级毛片免费观看
|
在线观看免费无码视频
|
免费A级毛片无码A∨免费
|
亚洲精品国产精品乱码不卡√
|
猫咪免费观看人成网站在线
|
国产成人一区二区三区免费视频
|
a视频在线观看免费
|
亚洲成a人片在线观看日本麻豆
|
国产精品亚洲一区二区三区
|
日本一线a视频免费观看
|
色噜噜噜噜亚洲第一
|
国产一区二区三区免费视频
|
美女隐私免费视频看
|
亚洲日韩中文在线精品第一
|
亚洲V无码一区二区三区四区观看
|
人妻在线日韩免费视频
|
亚洲AV无码一区二区二三区入口
|
18禁超污无遮挡无码免费网站国产
|
亚洲性线免费观看视频成熟
|
成人性生交视频免费观看
|
亚洲精品V天堂中文字幕
|
国产精品免费小视频
|
日韩久久无码免费毛片软件
|
国产亚洲精品激情都市
|
鲁丝片一区二区三区免费
|
亚洲美免无码中文字幕在线
|
在线观看免费人成视频
|
亚洲AV日韩AV一区二区三曲
|
中国亚洲女人69内射少妇
|
久久综合国产乱子伦精品免费
|
亚洲人成网网址在线看
|
国产极品粉嫩泬免费观看
|
亚洲美女免费视频
|
亚洲另类无码专区首页
|
亚洲男人av香蕉爽爽爽爽
|
蜜桃成人无码区免费视频网站
|
777亚洲精品乱码久久久久久
|
女人被男人桶得好爽免费视频
|
全黄A免费一级毛片
|
中文字幕亚洲精品资源网
|
日本19禁啪啪无遮挡免费动图
|