1. <label id="xw3od"><meter id="xw3od"><bdo id="xw3od"></bdo></meter></label>

      <label id="xw3od"><meter id="xw3od"></meter></label>
       加入收藏
       免費注冊
       用戶登陸
      首頁 展示 供求 職場 技術 智造 職業 活動 視點 品牌 鐠社區
      今天是:2025年4月1日 星期二   您現在位于: 首頁 →  技術 → 工業電子(技術聚焦)
      驅動增強終端側生成式AI體驗的技術:多模態生成式AI
      2024/6/11 11:44:42    
      改善情境化和定制化一直是用戶體驗的長期需求。例如,消費者希望終端能夠自動利用來自智能手機數據和傳感器的情境信息和自定義偏好,讓體驗更直觀和無縫,比如基于當前位置、時刻和食物選擇偏好推薦餐廳用餐,創造愉悅體驗。

      盡管生成式AI已展現出新興的和變革性的能力,但其仍有很大改進空間。類似多模態生成式AI等這樣的技術可應對生成式AI更加情境化和定制化的體驗趨勢。多模態生成式AI模型輸入和輸出多種模態,以提供更佳響應和答案。

       
      多模態AI模型能夠更好的理解世界


      大語言模型(LLM)為純文本訓練模型帶來了驚艷的能力。如果模型能夠支持包含更多知識的不同信息形式,能帶來怎樣的提升呢?

      人類能夠通過語言和閱讀文字學到很多東西,但也需要通過各種感官和互動形成對世界的理解:
      ● 我們的眼睛讓我們能夠看到球在傾斜地面上滾動的場景,以及當球滾到沙發后面會如何消失。
      ● 我們的耳朵可以識別語音中的情緒或警報聲來源的方向。
      ● 我們與世界的接觸和互動讓我們知道如何用手握住泡沫塑料咖啡杯,以及如何在走路時避免摔倒。

      類似的例子不勝枚舉。盡管語言可以描述幾乎所有這些事情,但它可能不如其他模態做得那么好或那么高效。

      正如人類需要利用各種感官學習,生成式AI除了利用文本之外還可以使用更多其他模態學習:這正是多模態生成式AI模型的作用所在。

      多模態生成式AI模型可基于一系列模態進行訓練,包括文本、圖像、語音、音頻、視頻、3D、激光雷達(LIDAR)、射頻(RF)、以及幾乎任何傳感器數據。

      通過利用所有這些傳感器,融合數據,并更全面地理解世界,多模態生成式AI模型可以提供更佳答案。AI研究人員已經做到了這一點,他們利用不同模態的一系列數據在云端訓練多模態大模型(LMM),讓模型更“智能”。OpenAI GPT-4V和谷歌Gemini就是這類LMM。

      這能給用戶帶來什么?舉例來說,LMM可以充當通用助手,接收任何模態的輸入,為更廣泛的問題類型提供大幅改進的答案。比如基于復雜的停車標志回答用戶可否停車,或基于振動噪音回答用戶該如何修理洗碗機故障。

      下一步,部署LMM進行推理:盡管生成式AI推理可在云端運行,但在邊緣終端側運行有著諸多好處,比如隱私、可靠性、成本效益和即時性。例如,傳感器和相應的傳感器數據來源于邊緣終端,因此在終端側處理和保存數據更具成本效益和可擴展性。
       

      終端側LLM現在具備視覺理解能力


      高通AI研究近期演示了全球首個在Android手機上運行的多模態LLM。我們展示了一個超過70億參數的大語言和視覺助理大模型(LLaVA),其可接受包括文本和圖像在內的多種類型的數據輸入,并生成關于圖像的多輪對話。通過全棧AI優化,LLaVA能夠在搭載第三代驍龍8移動平臺的參考設計上以實時響應的速度在終端側生成token。

      具有語言理解和視覺理解能力的LMM能夠賦能諸多用例,例如識別和討論復雜的視覺圖案、物體和場景。例如,視覺AI助手可以幫助視力障礙者更好地理解周圍環境并與之互動,從而提高生活質量。
       

      終端側LLM現在具備聽覺理解能力


      在搭載驍龍X Elite的Windows PC上,高通近期還展示了全球首個在終端側運行的超70億參數的LMM,可接受文本和環境音頻輸入(如音樂、交通環境音頻等),并基于音頻內容生成多輪對話。

      音頻提供的更多情境信息可以幫助LMM針對用戶的提示給出更佳答案。我們很高興看到終端側LMM現已支持視覺、語音和音頻模態,并期待對更多模態的支持。 

      生成式AI時代剛剛開始,無限創新即將到來。
       

      更多終端側生成式AI技術進步即將到來


      打造能夠更好理解情境信息的AI模型是獲得更佳答案和體驗提升的必要條件,多模態生成式AI正是即將應用于未來終端的最新變革性技術之一。歡迎閱讀博客第二部分,我將深入介紹LoRA,探究它將如何幫助應對現有挑戰,為消費者和企業規模化提供情境化、定制化和個性化體驗。查詢進一步信息,請訪問官方網站http://www.qualcomm.cn/news/blogs/2024/05/blog-2024-05-30。(張怡,張底剪報)
      → 『關閉窗口』
       365pr_net
       [ → 我要發表 ]
      上篇文章:AI工程師如何建立團隊在AI和AI方面的技能
      下篇文章:AI TOPS和NPU性能指標指南
      → 主題所屬分類:  工業電子 → 技術聚焦
       熱門文章
       如何申請EtherCAT技術協會(ETG)會員資格 (183349)
       臺北國際計算機展(COMPUTEX 2015)參展商名… (105918)
       上海市集成電路行業協會(SICA) (93888)
       USB-IF Members Company List (84356)
       第十七屆中國專利優秀獎項目名單(507項) (76209)
       蘋果授權MFi制造商名單-Authorized MFi Lic… (69990)
       臺北國際計算機展(COMPUTEX 2015)參展商名… (69404)
       中國130家太陽能光伏組件企業介紹(3) (56539)
       PLC論壇 (53288)
       中國130家太陽能光伏組件企業介紹(2) (49853)
       最近更新
       一本面向設計工程師精心修訂和更新的《ESD應用手冊… (3月10日)
       表皮電子學的代表作:石墨烯紋身 (2月26日)
       在晶圓級大規模生產中引入脈沖激光沉積(PLD)技術 (1月21日)
       你聽說過PiezoMEMS技術嗎? (1月21日)
       旨在挑戰EUV的納米壓印光刻技術(Nanoimprint L… (1月3日)
       新UV光刻機專利顯著提高能效并降低半導體制造成本 (11月6日)
       將GaN極性半導體晶圓的兩面用于功能器件 (9月30日)
       驅動增強終端側生成式AI體驗的技術:LoRA (6月11日)
       AI TOPS和NPU性能指標指南 (6月11日)
       驅動增強終端側生成式AI體驗的技術:多模態生成式AI (6月11日)
       文章搜索
      搜索選項:            
        → 評論內容 (點擊查看)
      您是否還沒有 注冊 或還沒有 登陸 本站?!
      關于我們 ┋ 免責聲明 ┋ 產品與服務 ┋ 聯系我們 ┋ About 365PR ┋ Join 365PR
      Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產通互聯網有限公司 版權所有
      E-mail:postmaster@365pr.net 不良信息舉報 備案號:粵ICP備06070889號
      主站蜘蛛池模板: 亚洲熟女少妇一区二区| 亚洲日产2021三区| 亚洲一区二区女搞男| 日韩av无码免费播放| 亚洲国产成人无码av在线播放 | 全黄a免费一级毛片人人爱| 一个人看的在线免费视频| 精品亚洲成AV人在线观看| 99re8这里有精品热视频免费| 亚洲国产综合专区在线电影| 好吊妞998视频免费观看在线| 国产成人1024精品免费| 亚洲av永久无码精品三区在线4| 亚洲成a人片在线播放| 亚洲国产精品婷婷久久| 日韩一级免费视频| 日韩人妻一区二区三区免费| 相泽南亚洲一区二区在线播放| 亚洲成a人片在线观看无码专区 | 亚洲国产精品久久久久婷婷软件 | 亚洲自偷自拍另类12p| 日韩一级免费视频| 波多野结衣在线免费观看| 一个人免费观看日本www视频| 亚洲最大的黄色网| 亚洲AV无码一区二区三区系列| 国产成人无码免费视频97| 黄色永久免费网站| 最近免费mv在线观看动漫| 国产精品亚洲精品日韩电影| 亚洲国产精品xo在线观看| 亚洲国产精品久久久天堂| 亚洲av无码国产精品色在线看不卡| 成人午夜免费福利视频| 免费无码av片在线观看| 免费观看四虎精品成人| 亚洲欧美精品午睡沙发| 亚洲国产一成久久精品国产成人综合 | 中国china体内裑精亚洲日本| 亚洲AV日韩AV永久无码免下载| 日韩亚洲国产高清免费视频|