【行業紀要】盤古大模型專家交流會議紀要0327:焦點簡訊
2023-03-27 19:32:40 來源:雪球網 小 中
【更多紀要關注:賽道掘金】
盤古大模型主要由五個模型組成,最領先的是 CV(機器視覺),然后是 NLP(自然語言處理),然后還有多模態、科學計算、語音,這 5 個方向的發展成熟是完全不一樣的。當前大家熱議的 ChatGPT 是在NLP 領域,百度的文心一言和它比較相似,但和盤古大模型是不太一樣的。
(資料圖片)
盤古大模型的初衷主要是服務 B 段的客戶,聚焦比較成熟的 CV 領域。在 NLP 領域還比較薄弱,生成性的最多能做一些個封閉場景下的客服,語義理解相關的可以做一些輿情的管控、法律司法文書的理解、審計文書的理解,但是輸出性的、內容生成性的,盤古大模型之前沒有將其作為一個發展的重點。
公司能夠找到的高價值數字化賦能的場景主要是以視覺為主,所以這就是盤古大模型更多的研發項目主要是圍繞著這一塊來展開的原因。NLP 反正力度不大,最主要的一個邏輯還是商業驅動力不足。公司一開始做 AI 就沒把 2C 作為一個重點。
大模型的訓練成本確實很高,GPT-3 訓練一次的成本可能在 1200 萬人民幣,GPT-3 出現之后也給了業界一個很大的啟示,是否還要繼續這樣“暴力美學”地走下去。現在學界有一些觀點,大模型在現在的參數基礎上再指數級增加對模型的性能邊際效應已經減弱了,那么這就需要一些降本的方法:
Open AI 的團隊做的比較好的一件事情就是做精準高質量的標注(RLHF)。
專家所在的公司有一個非常重要的發展方向是做小樣本訓練,通過自監督的方法通多更少的標注數據來做訓練。
盤古大模型的三層架構也能在結構上實現降本。L0 層是通識性的大模型,具備魯棒性和泛化性。
L1 是行業大模型(例如煤礦、電網)、L2 是針對具體場景的自動化工作流的部署模型。成本方面,大模型訓練好了之后不用再重復訓練,只需在 L1 和 L2 上做適應性訓練,成本關系是上一層的5-10%。
HW 認為應用場景比較成熟和豐富的領域是值得為其去開發 L1,例如電力行業(無人機輸電線巡檢)、制造業的質檢(機器替代人眼質檢)、鐵路故障隱患的監測等等。機器視覺是一個相對封閉的場景,也是純參數驅動的,標注數據的成本也不是很高。目前盤古大模型的工業質檢主要應用在消費電子領域,最早應用在了公司的南方工廠。未來如果能有更大幅度的降本,對行業將產生更大的顛覆。
HW 目前 AI 的研發,主要包括全棧全場景兩個方面的制作,一個是 HIAI,一個是 EI,HW 公司自己的能力是能夠做到端到端的,從硬件到軟件,從場景到營銷,基本上都可以使用自己的產品,特別大的合作商沒有。
HW 在半導體供應鏈上,戰投了好幾家公司,幫助公司補足半導體先進支撐的一些能力。公司在算力支撐等方面需要一些合作,HW 有一些地方政府支持的項目。
HW 的軟件產品在行業化溢出的時候,有幾種類型的公司是比較重要的。一個是軟件開發的外包公司,HW 開發力度、開發工作量比較大的環節都是用了大量的外包。另外一個是行業數字化的 EI,HW 之前釋放了 MetaERP,像外包交付的漢德、賽意等公司的能力是 HW 不具備的,HW 一定會通過這些公司的生態來完成業務。這里邊有一個核心的商業邏輯,是 HW 要盡少減少自己去做交付,主要是因為現在的人效不達標,而且人力成本達到了一年 10 萬人 70 多萬人民幣,所以很多毛細血管級別的交付,HW 需要依靠生態鏈來完成,第三在半導體的生態上也是需要與這些生態中的供應商側的公司供貨給 HW。
首先 HW 公司歷史上基本上新的趨勢很少是很快就追上來,公司發展 30 多年,基本上沒有做到過先發。在任何領域,HW 公司基本上都是做到的后發制人。包括手機、云和汽車。所以這個領域HW 肯定不會很快。
ChatGPT 面向更多的是 ToC 端的屬性。目前 HW 正在研究這個項目,但是這是一個集團級的項目,通常做出決定會比較緩慢,一兩年內不太會出來。HW 在 AI 商業化研究是一直持續存在的,公司以前一直非常不看好。公司盡力地完成 AI 工程化、AI 產品化,公司認為這是商業化不得不走的路線,如果采用高度項目制,一切項目制用 AI 去做,成本很高,不容易掙錢,因為人力成本非常高,然后項目制不可復制,因此 HW 才選擇了面向行業的 CV 大模型。
ChatGPT 發布后,它對商業化帶來了很多的思考,因為它天生的商業化屬性非常高。ToB 直接賣API,ToC 因為生產內容是直接嵌套的,而且是中國人擅長的商業化路徑,可以編輯廣告、電商。
但 HW 不會立馬進入到這個 ChatGPT 類的 AIGC 細分賽道,也沒有任何的項目,戰略研究都才剛剛開始。
HW做了很多技術方向側的研討,公司現在也有一些判斷,即中國很難在短期內出一個達到ChatGPT同等效果的產品。中國的發展方向,無論是這些大廠還是創業的公司,專家認為他們真正要做到
商業化閉環或者商業成功有個核心,需要做支持相對封閉的一個單場景,這樣成功率會比較高。以及訓練和維護的成本還是需要進一步的壓低,不然的話這個業務基本還是聚焦在這些特別大的公司手中。
專家認為現在的難度已經非常大了。
ChatGPT 發布后立馬就是 GPT4.0,首先它的數據源頭的很廣,
第二它的數據前期的標注的質量也非常的好,再加上它現在已經是完全多模態多語種了,其實現在的優勢還是挺大的。
國內現在趕出來的產品還是不太行的。而 OpenAI 的產品一直是邊用邊學,接受越來越多全球使用者的反饋,通過人類反饋幫助他提升和進步。
但專家認為 ChatGPT 的局限性是在于完整的做到某些場景的商業化閉環。ChatGPT 的信息生產模式是 generated content,它的信息不準確,它的事實基礎不可信、不可靠,所以 ChatGPT 很難在一些需要事實基礎比較準確的商業產品上完成閉環。第二個 ChatGPT 有一個很領先的屬性,它的前后文是有連續性的,根據前后文來聊天,每一個問題不是獨立存在的,而是有關聯的。但它有個 bug 是前后文的邏輯關系并沒有能夠做到很好的連接。在邏輯問題上可能會出一些錯誤。
公司現在判斷 ChatGPT 未來立馬會改變的場景其實是企服軟件,對企服軟件的嵌套只是非常初級的方式,未來 ChatGPT 也許會重新定義生產力以及辦公工作相關的企服場景,公司現在在分析未來是不是所有的企服軟件都會基于 ChatGPT 來開發,以及 ChatGPT 能不能重構企服軟件的交付模式。
公司認為中國要追存在幾個必要條件,首先場景必須是多模態,第二是數據量不能再爆發式增長,GPT 已經達到 1700 多億了,如果再存在量級上的增長,也許不能帶來這個性能本質上的提升。
成本的控制需要通過一些技術手段來限制語言的樣本量。這個完整的商業模式可能需要 ChatGPT在全球范圍內的帶領來探索。專家有一個預判,中國的這些創業公司做出來的產品都可能是局限于某個或者某一些場景的,這些產品反而能夠獲得商業上的成功。HW 為什么要做產業級、行業級的 CV 應用,這個也是 HW 根據公司的能力限制和公司的商業模式做出來的一個選擇。
$常山北明(SZ000158)$$拓維信息(SZ002261)$$三六零(SH601360)$
關鍵詞:
相關文章
- 【行業紀要】盤古大模型專家交流會議紀要0327:焦點簡訊
- 熱訊:殲20突然現身美戰略轟炸機身邊,中國“隱身技術”嚇壞美軍
- 今日浮虧3W,今年虧損3W,總資產502.2W
- 福萊特玻璃:2022年全年凈利21.73億元
- 萬盛股份:2022年凈利同比降55.7% 擬10派2元
- 晶方科技:擬計劃由晶方光電出資270萬歐元
- 萬向錢潮:2022年凈利同比增17.86% 擬10派2.7元|全球即時
- 世界滾動:吉林高速:控股子公司中標約5.26億元工程施工項目
- 天天速讀:長遠鋰科:與Axens就后續在雙方三元正極材料領域進行合作
- 環球觀熱點:工信部:推動鋰電、鈉電、氫燃料電池、液流電池、超級電容器等新型蓄能電池及關鍵材料產業高質量發展
- 【當前熱聞】浙商銀行:2022年凈利同比增7.67% 擬10派2.1元
- 看熱訊:ST摩登:控股股東擬被動減持公司股份不超713萬股
- 云天化:擬與云天化集團、昭通發展集團和鎮雄工投簽訂合資合同_天天頭條
- 杭州車牌最低成交價跌至1萬
- 中國太保壽險蔡強:壽險轉型符合管理層預期_天天觀察
- 中國太保壽險董事長潘艷紅:壽險轉型落地最大的挑戰來自時間約束_當前熱門
- 為什么加倉新能源?我們的回答
- 【世界新視野】國家開發銀行設立農田建設專項貸款
- 贛鋒鋰業:與錫林郭勒盟行政公署簽署戰略框架合作協議|天天聚看點
- 最終敲定!FDIC:第一公民銀行接手硅谷銀行所有存貸款_天天動態
- 世界播報:滬深300、中證500、恒生指數、標普500、納指100、恒生指數、創業板等核心指數估值水平:(2023年3月27日)
- 山煤國際河曲舊縣露天煤業煤質分析|天天看點
- 回來了!:全球觀速訊
- 首屆“虹人匯”虹橋國際人力資源服務產業博覽會啟動
- 普利制藥:注射用泮托拉唑鈉獲法國和意大利上市許可:焦點快播
- 新湖中寶:控股子公司擬減持宏華數科不超4%股份 快訊
- 天天最新:長江健康:子公司注射用伏立康唑獲藥品注冊證書
- 震有科技:與中國五冶集團有限公司簽署《工程物資購銷合同》
- 廣匯汽車:一季度凈利同比預降7.02%-22.02%
- 環球看熱訊:方直科技:2022年凈利同比增2.02% 擬10轉5派0.4元
熱文推薦
排行推薦

萬盛股份:2022年凈利同比降55.7% 擬10派2元

晶方科技:擬計劃由晶方光電出資270萬歐元

萬向錢潮:2022年凈利同比增17.86% 擬10派2.7元|全球即時
