【A breakthough in LLM】完全用手機端芯片推理的大模型MLC LLM來了 當前頭條

2023-06-05 08:16:40 來源:雪球網

今天中午,量子位公眾號宣傳了LLM領域最新的進展,陳天奇團隊的MLC LLM,實現了全球首個能夠完全用安卓和蘋果手機端芯片推理的大模型,個人用A breakthough in LLM來形容這個技術,完全不過分!

我看了一下開源的Github的日志記錄,發現針對適配安卓手機的模型,3天前上傳了3Billion參數的模型,2天前上傳了7Billion參數的模型,MLC LLM絕對是最新的還未被大范圍報道的大模型領域的技術突破。


(資料圖片)

下面直接使用一些本人自問自答的方式展開,來給大家介紹這個突破性的技術!

================================================================

1. MLC LLM 是什么?

MLC LLM是一個通用的解決方案,它允許任何語言模型以本機方式部署在一組不同的硬件后端和本機應用程序上,此外,它還為每個人提供了一個高效的框架,以針對自己的用例進一步優化模型性能。一切都在本地運行,無需服務器支持,并通過手機和筆記本電腦上的本地GPU進行加速。

2. 哪些設備上可以運行MLC LLM?

iPhone手機; 安卓; Windows Linux Mac; Web瀏覽器

3. 重點關注的當然是手機端的推理,硬件要求有哪些?

對手機性能要求較高,一般是6GRAM起步的手機,基本是就是目前各家廠商的旗艦級手機的性能要求,其中安卓手機需要用支持OpenCL的帶GPU的高通驍龍8Gen 2 手機(雪球愛者之貽總結)。

具體來說,iPhone手機可以試試這個TestFlight頁面(僅限于前9000名用戶, 網頁鏈接),安裝并使用我們為iPhone構建的示例iOS聊天應用程序。Vicuna-7B需要4GB的RAM,RedPajama-3B需要2.2GB才能運行。考慮到iOS和其他正在運行的應用程序,我們需要一款最新的iPhone,Vicuna-7B為6GB,RedPajama-3B為4GB才能運行該應用程序。該應用程序僅在iPhone 14 Pro Max、iPhone 14 Pro和iPhone 12 Pro上進行測試。安卓手機,在此處下載APK文件網頁鏈接 并安裝在您的手機上。然后,您可以開始與LLM聊天。當你第一次打開應用程序時,需要下載參數,加載過程可能會很慢。在未來的運行中,參數將從緩存中加載(這很快),您可以離線使用該應用程序。我們目前的演示依賴于手機上的OpenCL支持,需要大約6GB的RAM,如果你有一部帶有最新Snapdragon芯片的手機,你可以嘗試演示。作者在三星Galaxy S23上測試了我們的演示。

4. MLC LLM 使用 手機芯片推理的表現如何?

根據量子位公眾號的測試,文字創作能力還算不錯,

難題代碼類問題,還有待加強

5. 團隊開發MLC LLM的初心是什么?

近年來,在生成人工智能(AI)和大型語言模型(LLM)方面取得了顯著進展,這些領域正變得越來越普遍。得益于開源舉措,現在可以使用開源模型開發個人人工智能助理。然而,LLM往往是資源密集型的,并且對計算要求很高。為了創建可擴展的服務,開發人員可能需要依靠強大的集群和昂貴的硬件來運行模型推理。此外,部署LLM還帶來了一些挑戰,例如不斷發展的模型創新、內存限制以及對潛在優化技術的需求。

該項目的目標是在一系列設備上開發、優化和部署用于推理的人工智能模型,不僅包括服務器級硬件,還包括用戶的瀏覽器、筆記本電腦和移動應用程序。

6. MLC LLM的開發過程中克服了哪些關鍵技術挑戰?

為了實現這一點,我們需要解決計算設備和部署環境的多樣性問題。一些關鍵挑戰包括:

支持不同型號的CPU、GPU,以及潛在的其他協處理器和加速器。

在用戶設備的本地環境上部署,這些設備可能沒有現成的python或其他必要的依賴項。

通過仔細規劃分配和積極壓縮模型參數來解決內存限制。

MLC LLM提供了一個可重復、系統和可定制的工作流程,使開發人員和人工智能系統研究人員能夠以注重生產力的Python優先方法實現模型和優化。這種方法能夠快速試驗新模型、新思想和新的編譯器通道,然后將本機部署到所需的目標。此外,我們正在通過拓寬TVM后端來不斷擴展LLM加速,以使模型編譯更加透明和高效。

7. MLC LLM 團隊未來將大模型引入消費類設備的發展方向?

將LLM引入消費類設備的機會非常多。以下是一些可能的未來的可能不完整的列表:

個性化。聰明的語言模型知道很多東西,另一方面,他們不一定知道我們最喜歡的歌曲或寫作風格。在一個可能的未來,有些人可能希望有一個個人的人工智能伴侶。這些模型可能不是最聰明的,但它們了解我們自己,可以用來放大我們的日常工作流程。它們還可以與服務器上更強大的模型一起工作,以創造更放大的體驗。它們也可以是在開放的強大模型之上構建的適配器形式。然而,要創建這樣的個性化人工智能,我們需要將個人數據輸入到模型中,理想情況下是在我們自己的消費設備上運行。

專業化和應用程序集成。語言模型可以做很多事情,但也有一些領域,也許我們只需要對其進行一點精簡。看到未來的游戲利用這些模型的一些變體來為每一場游戲產生獨特的體驗也就不足為奇了。專門研究游戲對話框是現有應用程序如何從集成LLM中獲益的一個例子。擁有直接在游戲機上運行的專業模型可以創造很多有趣的機會。

離線支持和客戶端-服務器混合使用案例。我們并不是一直都能上網。當我們離線、飛行或想去一個不容易上網的地方時,如果能有一些功能較弱但仍然智能的人工智能助手來幫助我們,那就太好了。在另一種情況下,讓不同的人工智能組件協同工作,在本地卸載部分計算,并與云上運行的模型協作,也是一件好事?;蛘呤褂靡环N服務,根據我們所處的環境,在兩者之間無縫地移動計算。

去中心化。還有一個有趣的未來。雖然每個消費者設備的計算功能可能不如數據中心上的計算功能強大,但當消費者設備連接在一起時,可以做很多功能強大的事情。在去中心化人工智能領域有很多有趣的運動,如果得到正確的工具支持,看看它們能實現什么將是很有趣的。

向消費者硬件部署LLM面臨的挑戰:

討論的想法都是(可能的)未來。除了談論它們,更有趣的是,我們如何才能實現一些可能的未來。具體來說,我們是否可以為開源社區做出貢獻,以推動以下目標:

使每個人都能在任何地方本地開發、優化和部署人工智能模型,包括服務器環境和消費設備。

讓我們從這里的一個關鍵元素開始——硬件加速。大型模型需要大量計算,并且有大量的內存需求。重要的是要利用硬件加速來真正將一些大型號帶到消費設備上。

8. MLC LLM產業機會有哪些?

本人觀點,就是邊緣端AI芯片(Soc芯片),是特指專門做端側深度學習模型推理的芯片,包括GPU, NPU, TPU以及上游IP那些公司,這點與周五漲停的邊緣計算$美格智能(SZ002881)$還是有所不同的。

MLC LLM產業機會,應該是$芯原股份(SH688521)$瑞芯微 全志科技等這些做端側深度學習模型推理的芯片的公司,他們擁有最豐富的邊緣端深度學習模型推理優化經驗及硬件加速方案支持。

此外最正宗的,是在美股的蘋果和高通,而且對目前的$高通(QCOM)$是巨大利好。因為安卓端,目前只支持搭載高通驍龍8Gen2芯片的安卓旗艦機。

關鍵詞:

相關文章

熱文推薦

【A breakthough in LLM】完全用手機端芯片推理的大模型MLC LLM來了 當前頭條
【A breakthough in LLM】完全用手機端芯片推理的大模型MLC LLM來了 當前頭條

今天中午,量子位公眾號宣傳了LLM領域最新的進展,陳......更多>

股票投資的幾個超級陷阱 全球觀焦點
股票投資的幾個超級陷阱 全球觀焦點

凡事從投資實戰、理性的角度,去衡量、去思考,你就會......更多>

房子,好慘 全球實時
房子,好慘 全球實時

周五傳兩個小作文,一個是地產要出大力丸級別的政策。......更多>

4個月賣1751.5億元:彩票盯上年輕人 有人在財神殿前跪著刮_聚看點
4個月賣1751.5億元:彩票盯上年輕人 有人在財神殿前跪著刮_聚看點

一位彩票店老板表示,最近店里的年輕面孔比以往多了,......更多>

排行推薦

全球看點:縣城停車費貴比省城 任丘“智慧泊車”陷“車主拒繳-員工欠薪”僵局
全球看點:縣城停車費貴比省城 任丘“智慧泊車”陷“車主拒繳-員工欠薪”僵局
總投資超2億元,規劃有近1 9萬個停車位的任丘智慧泊... 更多>
“二陽”來襲藥品供應充足 中成藥更暢銷終端加速去庫|傳真 世界動態
“二陽”來襲藥品供應充足 中成藥更暢銷終端加速去庫|傳真 世界動態
“大概從五月初開始,逐漸有人‘二陽’或者‘一陽’了... 更多>
全球最資訊丨被動元件客戶端、渠道商及制造商三方庫存已削減至1至1.5個月以內
全球最資訊丨被動元件客戶端、渠道商及制造商三方庫存已削減至1至1.5個月以內
被動元件自2021年第四季開始步入庫存調整期,一線大廠... 更多>
中信證券:蘋果預計將發布MR 計算平臺載體迎來 iPhone時刻
中信證券:蘋果預計將發布MR 計算平臺載體迎來 iPhone時刻
中信證券研報表示,復盤全球計算平臺載體的發展邏輯及... 更多>
A股:周末市場利好加持,下周將迎來暴風雨,說一個明確預判!
老朋友都知道甜妹的觀點,向來爽快直接,新來的朋友不... 更多>
格力的雞肋產品何時休? 環球今頭條
昨天看到董明珠又出來站臺格力新研發的什么荔枝專用保... 更多>
快手:推出人民幣柜臺 6月19日生效
證券時報e公司訊,快手在港交所公告,新推出的公司人... 更多>
湖北省首筆長江一級支流跨市生態補償資金到位
日前,位于長江一級支流通順河下游的武漢市向上游的仙... 更多>
世界新消息丨微軟遠程桌面使用技巧圖解(微軟遠程桌面使用技巧)
1、日前微軟發布了自己的官方遠程桌面APP微軟遠程桌面... 更多>
玲瓏骰子安紅豆入骨相思君知否怎么回答 玲瓏骰子安紅豆入骨相思君知否_當前觀察
1、意思是:手中玲瓏骰子上的顆顆紅點,都是最為相思... 更多>
全球要聞:雷山縣氣象臺發布雷電黃色預警信號【Ⅲ/較重】【2023-06-05】
雷山縣氣象臺6月5日3時42分發布雷電黃色預警信號:預... 更多>
上單Gap,WBG痛失好局!OMG擊敗WBG,斬獲首勝!
第一局比賽,WBG并沒有表現出第一場打JDG時的狀態,反... 更多>
四次方怎么算_四次方-世界今日報
1、1)最好的方法是:啟用數學公式編輯器(全面:象分數,... 更多>
環球熱點評!新疆生產建設兵團出版社有限責任公司_關于新疆生產建設兵團出版社有限責任公司簡介
1、新疆生產建設兵團出版社有限責任公司于2007年07月1... 更多>

天天觀察:風聲繩子視頻_風聲 繩刑

周口旅游景點大全排行(周口旅游景

全球快資訊丨心理學是什么時候出現

內科包括哪些項目_內科包括哪些

(體育)三人籃球世界杯:中國女籃

【星穹鐵道 銀狼同人】你是要賞金

林產生物化學加工_關于林產生物化學

FMVP最高得分對比:庫里31.2分,科

天天熱推薦:石基信息—酒店信息管

每日熱訊!這是一個拼理解力和認知的

无码国产69精品久久久久网站| 99久久人妻无码精品系列蜜桃| 精品久久久久久中文| 久热这里只精品99国产6_99| 国产精品免费播放| 中文字幕精品视频| 久久精品无码av| 午夜精品不卡电影在线观看| 无码精品一区二区三区在线| 精品91自产拍在线观看| 国产精品扒开腿做爽爽的视频| 99视频有精品视频免费观看| 国产精品亚洲二区在线观看| 精品国产线拍大陆久久尤物| 久久精品一区二区三区AV| 久热这里只精品99re8久| 国产精品主播一区二区| 精品午夜久久网成年网| 国产精品久久毛片完整版| 久久精品一区二区东京热| 国产成人精品一区二三区在线观看| 亚洲国产午夜精品理论片在线播放| 日韩国产精品无码一区二区三区| 久久久这里有精品中文字幕| 国产在线国偷精品产拍| 多人伦精品一区二区三区视频| 亚洲精品永久www忘忧草| 久久精品国产99精品国产2021| 久久精品成人免费观看97 | 精品欧洲AV无码一区二区男男 | 人人妻人人澡人人爽人人精品电影| 精品国产热久久久福利| 国产剧情AV麻豆香蕉精品| 国自产精品手机在线视频香蕉 | 亚洲精品国产免费| 99久久精品国产亚洲| 久久精品私人影院免费看| 精品无人区麻豆乱码1区2区| 久久国产精品免费一区| 国产精品久操视频| 精品国产高清在线拍|