1. <label id="xw3od"><meter id="xw3od"><bdo id="xw3od"></bdo></meter></label>

      <label id="xw3od"><meter id="xw3od"></meter></label>
       加入收藏
       免費(fèi)注冊(cè)
       用戶登陸
      首頁(yè) 展示 供求 職場(chǎng) 技術(shù) 智造 職業(yè) 活動(dòng) 視點(diǎn) 品牌 鐠社區(qū)
      今天是:2025年5月10日 星期六   您現(xiàn)在位于: 首頁(yè) →  智造 → 辦公電子(應(yīng)用指南)
      Graphcore PopRT實(shí)現(xiàn)零代碼模型推理部署
      日期:2023/4/16 12:01:28   作者:
      當(dāng)你和ChatGPT聊天時(shí),你有沒(méi)有想過(guò),在那個(gè)閃爍的光標(biāo)背后,正在發(fā)生什么?

      ChatGPT在收到你的輸入指令后,到生產(chǎn)出答案的過(guò)程就是推理。AI推理是將用戶輸入的數(shù)據(jù),通過(guò)訓(xùn)練好的模型產(chǎn)生有價(jià)值信息的過(guò)程。在LLM類(lèi)模型應(yīng)用、自動(dòng)駕駛、量化交易、搜索、推薦等很多場(chǎng)景中,對(duì)于AI推理效率的要求非常高。為進(jìn)一步幫助克服AI應(yīng)用部署的時(shí)延痛點(diǎn),Graphcore搭配C600推出了高性能推理SDK——PopRT,幫助開(kāi)發(fā)者實(shí)現(xiàn)零代碼推理部署已經(jīng)訓(xùn)好的模型,同時(shí)帶來(lái)低時(shí)延和高吞吐量,極大縮短AI業(yè)務(wù)商業(yè)變現(xiàn)時(shí)間窗口,為企業(yè)用戶贏得市場(chǎng)先機(jī)。


      PopRT構(gòu)成


      PopRT包括轉(zhuǎn)換器、編譯器和運(yùn)行時(shí):

          轉(zhuǎn)換器
              提供對(duì)op-fusion、constant-folding等廣泛使用的優(yōu)化方法內(nèi)置支持
              提供對(duì)FP16和FP8訓(xùn)練后量化的內(nèi)置支持,這種訓(xùn)練后量化可以實(shí)現(xiàn)更低的時(shí)延和更高的吞吐量,并且精度損失很小
              支持將多個(gè)模型融合為一個(gè)
          編譯器
              支持模型切分和流水線
              為運(yùn)行時(shí)導(dǎo)出PopEF(Poplar可執(zhí)行格式)
          運(yùn)行時(shí)
              支持自動(dòng)批處理
              支持移除填充以減少對(duì)自然語(yǔ)言處理(NLP)模型的無(wú)用計(jì)算(或通過(guò)移除填充對(duì)自然語(yǔ)言處理模型進(jìn)行更有效的推理)
              支持針對(duì)CV(計(jì)算機(jī)視覺(jué))模型的多模型推理


      部署和運(yùn)行


      Graphcore始終堅(jiān)持降低IPU的使用門(mén)檻,廣泛支持各類(lèi)主流的機(jī)器學(xué)習(xí)框架,讓開(kāi)發(fā)者能夠在自己熟悉的環(huán)境中工作,專(zhuān)注創(chuàng)新。

      PopRT優(yōu)化模型可與英偉達(dá)Triton和TF-Serving一起部署,并可以通過(guò)PopRT運(yùn)行時(shí)API很容易地與第三方框架和服務(wù)平臺(tái)集成。


      優(yōu)化推理性能


      搭配Grapchore C600高端推訓(xùn)一體加速卡,PopRT使得開(kāi)發(fā)者可以“一鍵”零代碼部署已經(jīng)訓(xùn)練好的AI應(yīng)用,可以大幅加速計(jì)算機(jī)視覺(jué)、自動(dòng)語(yǔ)音識(shí)別、自然語(yǔ)言處理(BERT、GPT類(lèi))、多模態(tài)和推薦系統(tǒng)的AI應(yīng)用的部署速度,加速整個(gè)數(shù)據(jù)中心的各項(xiàng)工作負(fù)載,縮短研發(fā)到商用的時(shí)間。

      欲了解各類(lèi)模型在C600的優(yōu)異性能,請(qǐng)聯(lián)系info_china@graphcore.ai


      在C600上使用PopRT


      C600是擬未為云和數(shù)據(jù)中心打造的高端推訓(xùn)一體加速卡,主打推理,兼做訓(xùn)練,可以支持各種主流的AI應(yīng)用,在搜索和推薦等業(yè)務(wù)上別具優(yōu)勢(shì)。為了使得C600在推理場(chǎng)景發(fā)揮更大效能,PopRT在C600的基礎(chǔ)上進(jìn)一步針對(duì)推理進(jìn)行了優(yōu)化,低時(shí)延和高吞吐使得用戶可以高效地進(jìn)行推理,一鍵部署已經(jīng)訓(xùn)好的模型。

      現(xiàn)在,15億參數(shù)量的GPT2-XL已經(jīng)在C600上成功部署(詳情請(qǐng)見(jiàn)本次推送首條)。在PopRT的加持下,GPT2-XL的推理延時(shí)在C600上已經(jīng)達(dá)到1 ms/token的水平。這意味著在實(shí)際應(yīng)用場(chǎng)景中,模型可以快速響應(yīng)用戶的請(qǐng)求,極大提高用戶體驗(yàn)。

      查詢(xún)進(jìn)一步信息,請(qǐng)?jiān)L問(wèn)官方網(wǎng)站http://www.graphcore.cn/0-code-deploy-graphcore-poprt/http://docs.graphcore.ai/projects/poprt-user-guide/zh_CN/latest/http://github.com/graphcore/PopRT。(Donna Zhang,張底剪報(bào))
      → 『關(guān)閉窗口』
       發(fā)布人:-----
       [ → 我要發(fā)表 ]
      上篇文章:1700V SiC MOSFET無(wú)需考慮功率轉(zhuǎn)換中的權(quán)衡問(wèn)題
      下篇文章:MIPI提高新一代圖像數(shù)據(jù)的傳輸性能
      → 主題所屬分類(lèi):  辦公電子 → 應(yīng)用指南
       熱門(mén)文章
       中航光電(158廠)電連接器產(chǎn)品選型指南 (62807)
       國(guó)巨(Yageo)片式電阻電容產(chǎn)品規(guī)格書(shū) (57017)
       下一代前傳網(wǎng)絡(luò)接口(NGFI)白皮書(shū) (48993)
       2013年移動(dòng)經(jīng)濟(jì)(The Mobile Economy 2013… (47520)
       使用NFC進(jìn)行藍(lán)牙配對(duì)(Using NFC for Bluet… (44501)
       鐳射二極管 (43702)
       mirasol顯示器與競(jìng)爭(zhēng)性顯示技術(shù)的比較 - Qualco… (41196)
       為濾波電路選擇合適的運(yùn)算放大器 (41085)
       CodeWarrior Development Studio (40526)
       u-blox產(chǎn)品目錄(Product Catalog 16… (39540)
       最近更新
       用樹(shù)莓派Pico W和Lora Hat構(gòu)建網(wǎng)格節(jié)點(diǎn) (5月8日)
       用Pulsus PLD系統(tǒng)實(shí)現(xiàn)突破性piezoMEMS器件 (1月21日)
       復(fù)旦芯片實(shí)現(xiàn)感存算一體化:像人眼一樣智能 (9月29日)
       增強(qiáng)型人工智能為Meteor Lake處理器的設(shè)計(jì)提速 (5月15日)
       教育行業(yè)數(shù)字化自主創(chuàng)新飛騰生態(tài)解決方案白皮書(shū) (4月2日)
       人形機(jī)器人設(shè)計(jì)原則及人類(lèi)智能和內(nèi)部身體系統(tǒng)仿真 (2月2日)
       用傳感器讓中央空調(diào)更節(jié)能環(huán)保,精確測(cè)量溫濕度、… (1月30日)
       不干膠標(biāo)簽印刷UL認(rèn)證 (11月22日)
       基于廣芯微UM3242F-RET6主控芯片的DC-AC逆… (11月9日)
       實(shí)現(xiàn)生成式AI的關(guān)鍵半導(dǎo)體技術(shù) (8月10日)
       文章搜索
      搜索選項(xiàng):            
        → 評(píng)論內(nèi)容 (點(diǎn)擊查看)
      您是否還沒(méi)有 注冊(cè) 或還沒(méi)有 登陸 本站?!
      關(guān)于我們 ┋ 免責(zé)聲明 ┋ 產(chǎn)品與服務(wù) ┋ 聯(lián)系我們 ┋ About 365PR ┋ Join 365PR
      Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產(chǎn)通互聯(lián)網(wǎng)有限公司 版權(quán)所有
      E-mail:postmaster@365pr.net 不良信息舉報(bào) 備案號(hào):粵ICP備06070889號(hào)
      主站蜘蛛池模板: 一级毛片免费观看| 在线观看免费无码视频| 免费A级毛片无码A∨免费| 亚洲精品国产精品乱码不卡√| 猫咪免费观看人成网站在线| 国产成人一区二区三区免费视频 | a视频在线观看免费| 亚洲成a人片在线观看日本麻豆| 国产精品亚洲一区二区三区| 日本一线a视频免费观看| 色噜噜噜噜亚洲第一| 国产一区二区三区免费视频| 美女隐私免费视频看| 亚洲日韩中文在线精品第一 | 亚洲V无码一区二区三区四区观看| 人妻在线日韩免费视频| 亚洲AV无码一区二区二三区入口 | 18禁超污无遮挡无码免费网站国产| 亚洲性线免费观看视频成熟| 成人性生交视频免费观看| 亚洲精品V天堂中文字幕| 国产精品免费小视频| 日韩久久无码免费毛片软件| 国产亚洲精品激情都市| 鲁丝片一区二区三区免费| 亚洲美免无码中文字幕在线| 在线观看免费人成视频| 亚洲AV日韩AV一区二区三曲| 中国亚洲女人69内射少妇| 久久综合国产乱子伦精品免费| 亚洲人成网网址在线看| 国产极品粉嫩泬免费观看 | 亚洲美女免费视频| 亚洲另类无码专区首页| 亚洲男人av香蕉爽爽爽爽| 蜜桃成人无码区免费视频网站 | 777亚洲精品乱码久久久久久| 女人被男人桶得好爽免费视频| 全黄A免费一级毛片| 中文字幕亚洲精品资源网| 日本19禁啪啪无遮挡免费动图|