英偉達AI芯片勁敵來了!AMD推出MI300X,可運行多達800億參數模型
2023-06-14 22:31:55 來源:雪球網 小 中
憑借發(fā)布的新品,AMD正式向英偉達的AI芯片王者地位發(fā)起挑戰(zhàn)。
美東時間6月13日周二,AMD舉行了新品發(fā)布會,其中最重磅的新品當屬性用于訓練大模型的ADM最先進GPU Instinct MI300。
(資料圖片僅供參考)
AMD CEO蘇姿豐介紹,生成式AI和大語言模型(LLM)需要電腦的算力和內存大幅提高。她預計,今年,數據中心AI 加速器的市場將達到300億美元左右,到2027 年將超過1500 億美元,復合年增長率超過 50%。
蘇姿豐演示介紹,AMD的Instinct MI300A號稱全球首款針對AI和高性能計算(HPC)的加速處理器(APU)加速器。在13個小芯片中遍布1460億個晶體管。
它采用CDNA 3 GPU架構和24個Zen 4 CPU內核,配置128GB的HBM3內存。相比前代MI250,MI300的性能提高八倍,效率提高五倍。AMD在發(fā)布會稍早介紹,新的Zen 4c內核比標準的Zen 4內核密度更高,比標準Zen 4的內核小35%,同時保持100%的軟件兼容性。
AMD推出一款GPU專用的MI300,即MI300X,該芯片是針對LLM的優(yōu)化版,擁有192GB的HBM3內存、5.2TB/秒的帶寬和 896GB/秒的Infinity Fabric 帶寬。AMD將1530億個晶體管集成在共12個5納米的小芯片中。
AMD稱,MI300X提供的HBM密度最高是英偉達AI芯片H100的2.4倍,其HBM帶寬最高是H100的1.6倍。這意味著,AMD的芯片可以運行比英偉達芯片更大的模型。
Lisa Su介紹,MI300X可以支持400億個參數的Hugging Face AI 模型運行,并演示了讓這個LLM寫一首關于舊金山的詩。這是全球首次在單個GPU上運行這么大的模型。單個MI300X可以運行一個參數多達800億的模型。
LLM需要的GPU更少,給開發(fā)者帶來的直接好處就是,可以節(jié)約成本。
AMD還發(fā)布了AMD Instinct 平臺,它擁有八個MI300X,采用行業(yè)標準OCP設計,提供總計1.5TB 的HBM3 內存。
蘇姿豐稱,適用于CPU和GPU的版本MI300A現在就已出樣,MI300X和八個GPU的Instinct 平臺將在今年第三季度出樣,第四季度正式推出。
亞馬遜、微軟、Meta已經或將要運用AMD新品除了AI芯片,AMD此次發(fā)布會還介紹了第四代EPYC(霄龍)處理器,特別是在全球可用的云實例方面的進展。
AMD第四代EPYC(霄龍)在云工作負載的性能是英特爾競品處理器的1.8倍,在企業(yè)工作負載中的處理速度是英特爾競品的1.9倍。
AMD稱,第四代EPYC(霄龍)啟用新的Zen 4c內核,比英特爾Xeon 8490H的效率高1.9倍。由于絕大多數AI在CPU上運行,AMD在CPU AI領域具有絕對的領先優(yōu)勢。
亞馬遜周二宣布,在用AWS Nitro和第四代EPYC 處理器打造新的實例。亞馬遜云的EC2 M7a實例現已提供預覽版,性能比M6a實例高50%。
AMD也將在內部工作中運用EC2 M7a實例,包括芯片設計的EDA軟件。AMD還宣布,今年7月,甲骨文將推出Genoa E5實例。
AMD發(fā)布的EPYC Bergamo處理器是業(yè)界首款x86原生CPU,有128個內核,每個插槽256個線程。這意味著一個普通的2U 4 節(jié)點平臺將有 2048 個線程。
Bergamo比前代Milan的性能高2.5倍,現在就可以向AMD的云客戶發(fā)貨。
Meta的公司代表介紹,Meta在基礎設施中使用EPYC處理器。Meta也對基于AMD的處理器設計開源。Meta方面稱,計劃為其基礎設施使用云處理器Bergamo,還要將Bergamo用于其存儲平臺。
AMD同時推出本周二上市的CPU Genoa-X。它將增加超過1GB 的96核L3緩存。它共有四個SKU,16到 96 個內核。因為SP5插槽兼容,所以它可以與現有的EPYC 平臺一起使用。
微軟的公司代表和AMD一道展示了微軟云Azure HPC的性能,在EPYC處理器的幫助下,Azure四年內的性能提升四倍。
Azure宣布,搭載Genoa-X的HBv4和HX系列實例、以及新的HBv3實例全面上市。Azure還稱,性能最高可較市面基準提升5.7倍。
AMD此前通過收購Pensando獲得DPU技術。此次AMD稱,其P4 DPU架構是世界上最智能的DPU,它能減少數據中心的網絡開銷,并提高了服務器的可管理性。AMD的Pensando SmartNICs是這種新數據中心架構不可或缺的組成部分。
AMD還提到有自己的AI芯片軟件,名為ROCm。AMD總裁Victor Peng稱,在構建強大的軟件堆棧方面,AMD取得了真正的巨大進步,ROCm軟件棧可與模型、庫、框架和工具的開放生態(tài)系統(tǒng)配合使用。
本文來自華爾街見聞,歡迎下載APP查看更多
關鍵詞:
相關文章
- 英偉達AI芯片勁敵來了!AMD推出MI300X,可運行多達800億參數模型
- 新五豐跌停后我讀了這個報告|世界報道
- 希望證監(jiān)會取消現金分紅要除權的規(guī)定
- 中國化學:1-5月合同金額合計1417.65億元
- 全球速訊:宋都股份延期回復上交所2022年報問詢函
- 恒勃股份(301225.SZ):將于6月16日在深交所上市|全球速訊
- 拒絕3連敗!世界第4逆轉克星,單局21-7晉級,石宇奇等來復仇戰(zhàn)!
- 蘋果賬戶恢復流程_蘋果賬戶恢復
- 連續(xù)兩個漲停!傳聞為特斯拉FSD提供算力中心 城地香江澄清:不屬實!
- 金新農:預計第三季度生豬價格可能略有上漲 但很難突破去年高點 環(huán)球消息
- 昆侖萬維:控股子公司擬發(fā)行股份收購Singularity AI全部股權 天天快訊
- 金圓股份:公司股票6月16日起被實施其他風險警示
- 龔正會見美中關系全國委員會會長歐倫斯|每日熱訊
- 新亞制程:擬收購控股子公司少數股東權益 環(huán)球快資訊
- 天天熱議:讓我操心的格力空調
- 熱訊:剛剛,央媽扣動扳機了……
- 百度文心一格×京東618:打造電商行業(yè)首個AI線下廣告,節(jié)省80%制作成本 通訊
- 當前看點!硅料價格逼近成本線要“破防”了?議價空間被壓縮后多家企業(yè)停止出貨
- 美國5月PPI同比上升1.1% 預期1.50%
- 世界快訊:阿里集團公關團隊將獨立運作?知情人士:誤傳!
- 為解決私募創(chuàng)投退出難題 深圳大力發(fā)展S基金
- 環(huán)球看點!歡聚(YY.US)回購2025年到期的0.750%可轉換優(yōu)先票據 總額約4.3億美元
- 世界即時:什么是三極管的截止飽和放大
- 康圣環(huán)球(09960.HK)6月14日耗資3240港元回購2000股
- 長沙開福區(qū)召開“護薪”大會 約談21個欠薪高風險項目
- #金貓榜# 風冷散熱效能更高,九州風神冰立方開始整活,又雙叒叕帶數顯啦! 全球短訊
- 這才是正宗醬油炒飯的做法,米飯粒粒分明,太香了
- 立昂技術:公司暫無產品應用到新能源汽車零部件上_世界快訊
- 隆基綠能再次刷新商業(yè)級CZ硅片晶硅-鈣鈦礦疊層電池最高效率
- 環(huán)球短訊!沃爾核材:樂庭智聯生產的800G高速通信線部分規(guī)格已通過客戶驗證并實現小批量交付
熱文推薦
排行推薦

全球速訊:宋都股份延期回復上交所2022年報問詢函

恒勃股份(301225.SZ):將于6月16日在深交所上市|全球速訊

拒絕3連敗!世界第4逆轉克星,單局21-7晉級,石宇奇等來復仇戰(zhàn)!
