百川智能發(fā)布開源中英文大模型,多個榜單評測成績最佳|每日熱議
2023-06-16 06:28:15 來源:雪球網 小 中
2023年6月15日,百川智能公司推出了70 億參數量的中英文預訓練大模型——baichuan-7B。baichuan-7B不僅在C-Eval、AGIEval和Gaokao中文權威評測榜單上,以顯著優(yōu)勢全面超過了ChatGLM-6B等其他大模型,并且在MMLU英文權威評測榜單上,大幅領先LLaMA-7B。
目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平臺發(fā)布。
開源地址:
(資料圖片)
Hugging Face:網頁鏈接
Github:網頁鏈接
Model Scope:網頁鏈接
多個最具影響力中文評估基準7B最佳
為了驗證模型的各項能力,baichuan-7B在C-Eval、AGIEval和Gaokao三個最具影響力的中文評估基準進行了綜合評估,并且均獲得了優(yōu)異成績,它已經成為同等參數規(guī)模下中文表現最優(yōu)秀的原生預訓練模型。
在中文C-EVAL的評測中,baichuan-7B的綜合評分達到了42.8分,超過了ChatGLM-6B的38.9分,甚至比某些參數規(guī)模更大的模型還要出色。
C-Eval評測基準由上海交通大學、清華大學以及愛丁堡大學聯(lián)合創(chuàng)建,是面向中文語言模型的綜合考試評測集,覆蓋了52個來自不同行業(yè)領域的學科。
在AGIEval的評測里,baichuan-7B綜合評分達到34.4分,遠超LLaMa-7B、Falcon-7B、Bloom-7B以及ChatGLM-6B等其他開源模型。
AGIEval評測基準由微軟研究院發(fā)起,旨在全面評估基礎模型在人類認知和問題解決相關任務上的能力,包含了中國的高考、司法考試,以及美國的SAT、LSAT、GRE和GMAT等20個公開且嚴謹的官方入學和職業(yè)資格考試。
在GAOKAO評測中,baichuan-7B的綜合評分達到了36.2分,顯著領先于同參數規(guī)模的各種其他預訓練模型。
GAOKAO評測基準是復旦大學研究團隊創(chuàng)建的評測框架,以中國高考題目作為數據集,用于測試大模型在中文語言理解和邏輯推理能力方面的表現。
MMLU英文評估基準表現大幅領先LLaMA-7B
baichuan-7B不僅在中文方面表現優(yōu)異,在英文上表現同樣亮眼。在MMLU的評測中baichuan-7B綜合評分高達42.5分,大幅領先英文開源預訓練模型LLaMA-7B的34.2分以及中文開源模型ChatGLM-6B的36.9分。
MMLU由加州大學伯克利分校等知名高校共同打造,集合了科學、工程、數學、人文、社會科學等領域的57個科目,主要目標是對模型的英文跨學科專業(yè)能力進行深入測試。其內容廣泛,從初級水平一直涵蓋到高級專業(yè)水平。
萬億優(yōu)質數據、4K上下文窗口、高效穩(wěn)定訓練造就領先7B預訓練模型
訓練語料對大模型的訓練結果至關重要。在構建預訓練語料庫方面,百川智能以高質量中文語料為基礎,同時融合了優(yōu)質的英文數據。在數據質量方面,通過質量模型對數據進行打分,對原始數據集進行篇章級和句子級的精確篩選;在內容多樣性方面,利用自研超大規(guī)模局部敏感哈希聚類系統(tǒng)和語義聚類系統(tǒng),對數據進行了多層次多粒度的聚類,最終構建了包含1.2萬億token的兼顧質量和多樣性的預訓練數據。相較于其他同參數規(guī)模的開源中文預訓練模型,數據量提高了超過50%。
在萬億優(yōu)質中英文數據的基礎上,為了更好地提升訓練效率,baichuan-7B深度整合了模型算子來加快計算流程,并針對任務負載和集群配置,自適應優(yōu)化了模型并行策略以及重計算策略。通過高效的訓練過程調度通信,baichuan-7B成功地實現了計算與通信的高效重疊,進而達到了超線性的訓練加速,在千卡集群上訓練吞吐達到180+Tflops的業(yè)界領先水平。
同時,已有的開源模型窗口長度在2K以內,對于一些長文本建模任務,如需要引入外部知識做搜索增強的場景,更長的處理長度有助于模型在訓練與推理階段捕獲越多的上下文信息,2K的處理長度存在比較大的制約。baichuan-7B基于高效的attention算子優(yōu)化實現了萬級別超長動態(tài)窗口的擴張能力,本次開源的預訓練模型開放了4K上下文窗口,使模型應用場景更加廣泛。
此外,baichuan-7B還對模型訓練流程進行了深度優(yōu)化,采用了更科學且穩(wěn)定的訓練流程和超參數選擇,使得 baichuan-7B模型的收斂速度大大提升。與同等參數規(guī)模的模型相比,baichuan-7B在困惑度(PPL)和訓練損失(training loss)等關鍵性能指標上表現更加優(yōu)秀。
免費可商用,清華北大率先使用助力研究
秉持開源精神,baichuan-7B代碼采用Apache-2.0協(xié)議,模型權重采用了免費商用協(xié)議,只需進行簡單登記即可免費商用。
baichuan-7B此次開源的內容十分豐富,包含了推理代碼、INT4量化實現、微調代碼,以及預訓練模型的權重。其中,微調代碼方便用戶對模型進行調整和優(yōu)化;推理代碼與INT4量化實現則有助于開發(fā)者低成本地進行模型的部署和應用;預訓練模型權重開源后,用戶則可以直接使用預訓練模型進行各種實驗研究。
據了解,北京大學和清華大學兩所頂尖大學已率先使用baichuan-7B模型推進相關研究工作,并計劃在未來與百川智能深入合作,共同推動baichuan-7B模型的應用和發(fā)展。
清華大學互聯(lián)網司法研究院院長、計算機系教授劉奕群認為, baichuan-7B模型在中文上的效果表現十分出色,它免費商用的開源方式展現出開放的態(tài)度,不僅貢獻社區(qū),也推動技術發(fā)展。團隊計劃基于baichuan-7B模型開展司法人工智能領域的相關研究。
北京大學人工智能研究院助理教授楊耀東認為,baichuan-7B模型的開源將對于中文基礎語言模型的生態(tài)建設及學術研究產生重要推動作用,同時他也表示將持續(xù)關注相關領域探索,并且在中文大語言模型的安全和對齊上進行進一步深入研究。
百川智能CEO王小川表示:“本次開源模型的發(fā)布是百川智能成立2個月后的第一個里程碑,對百川智能而言是一個良好的開局。baichuan-7B模型,不僅能為中國的AGI事業(yè)添磚加瓦,也為世界大模型開源社區(qū)貢獻了新的力量。”
$鴻博股份(SZ002229)$ $英偉達(NVDA)$ $阿里巴巴-SW(09988)$ 騰訊控股
關鍵詞:
相關文章
- 百川智能發(fā)布開源中英文大模型,多個榜單評測成績最佳|每日熱議
- 荷蘭計劃關閉歐洲最大天然氣田 歐洲天然氣期價盤中大漲
- 全球觀點:道指上漲350點 漲幅擴大至超過1%
- 納斯達克金龍中國指數成分股中 每日熱門
- 飲料行業(yè)市場風云
- 理財日記第1166天(6.15):①寫給準備申購瑞星股份的球友
- 致通策醫(yī)療偽股東!
- 招商證券:A股積極因素正在聚集
- 每日速讀!2023端午檔新片預售票房破1000萬
- 報告:中國太陽能產能“紅利”擴散,在澳大利亞買電池板將更便宜
- ?國林科技:半導體專用臭氧清洗設備預計2023年內完成產品驗證
- 每日熱文:管濤:預計下半年貸款利率穩(wěn)中有降
- 2023年6月15日,上萬億的第二個交易日 天天要聞
- 當前觀察:格力電器:格力鈦生產的新能源汽車已在全國230多個城市運營
- 天天快報!這事,超預期!
- 這事在辦公室爭論半天,堅持定投了33筆的基金終于翻紅了。
- 易居研究院研究總監(jiān)嚴躍進:7月份或出臺更重磅樓市刺激政策
- 億緯鋰能:與ABS簽訂主采購協(xié)議
- 天天速看:美股盤初:特斯拉跌約4%,熱門中概股多數上漲
- 唐朝投資洋河真的很失敗嗎?-環(huán)球信息
- 【世界速看料】5月能繁數據出爐,去化0.6%
- 空運輸及空間應用聯(lián)合發(fā)展中心成立 將首發(fā)太空旅游等項目-當前熱點
- 上交所上市委:中研股份、華電新能首發(fā)獲通過
- 中金公司:美聯(lián)儲下半年或繼續(xù)加息
- 泡泡瑪特回應盲盒規(guī)范指引:會積極配合監(jiān)管部門落實相關細則-天天熱推薦
- 易居研究院研究總監(jiān)嚴躍進:7月份或出臺更重磅樓市刺激政策
- 東田微:全資子公司東莞微科以自有資金不超過2800萬元購買穆青運持有的蘇州文博菲電子科技有限公司不超過70%的股權(對應注冊資本350萬元)
- 世界觀天下!?中國稀土:今年1-5月部分稀土商品價格較去年同期下降幅度明顯
- 藍曉科技:與HANACOLLA簽訂《3000噸電池級碳酸鋰提鋰裝置銷售合同》-播資訊
- 水母量化【618】狂歡鉅惠!買就送!
熱文推薦
排行推薦

飲料行業(yè)市場風云

理財日記第1166天(6.15):①寫給準備申購瑞星股份的球友

致通策醫(yī)療偽股東!
