科大訊飛星火大模型會超預期嗎?(二)_環球熱訊
2023-05-07 09:14:50 來源:雪球網 小 中
吹泡泡邏輯 首發原文鏈接
(資料圖片)
本來科大訊飛這個發布會該寫的都寫過了,我覺得沒啥再更新的必要了,這么大盤子,短線沒啥看頭,周五尾盤居然都沒有進來賭超預期的(也是好事)
發布會的內容也基本上想的到。但是發現開完確實有超預期的地方,也看到了很多轉發的券商點評,但是建議先看看我五一寫的《科大訊飛星火發布會超預期嗎?》,再來決定要不要看我往下扯:
超預期的地方在于:
首先我是相信的,這里其實不是老師們理解的那種超越。
因為ChatGPT英文更優秀,而科大訊飛表述的超越部分是中文,這個不矛盾。
其實我們打破國外技術壟斷的例子很多,比如科大訊飛在語音識別領域是當之無愧的NO1,萬華化學是MDI領域當之無愧的NO1,這些都是從當初的不可能變成被打破的,不然他們不會一直吃紅利吃到現在。
其次,他直接說遙遙領先國內可測的大模型,到底是情商低吹牛呢,還是真的按捺不住呢?不好說,但看了我前面關于科大訊飛的文章,我是相信的。
我發現很多人有個誤區,過分高看名義上的大模型,忽視語音識別?容易把刁鉆對話當成推理(我稱之為腦經急轉彎),甚至數據源的錯誤這么簡單的非技術問題,也會當bug來看。
建議真心想測試的,找個業內的從業人員,至少是程序員幫忙測吧。舉例說明,你非要問他一個人長了五只眼睛的問題,那么平時訓練也得是從權威期刊的論文和臨床病例里面來訓練吧,你問的這么刁鉆肯定回答不了,他也判斷不了你是來搞笑的還是真問問題的,結果當然很詭異。所以說大模型存在的意義還是幫助我們提高科研和生產生活水平的,也許未來專門會有搞笑大模型,專門來訓練這些刁鉆問題腦經急轉彎玩的,否則正常的測試,應該找個專業人士,結合最終目的來測,比如訊飛的AI+醫療已經運用于救死扶傷的醫療救治了,訊飛的學習機已經幫助孩子修改作文提高作文水平了,而你還在測各種稀奇古怪的問題,有什么實際意義呢?除了搞笑大模型,別的任何一個模型測出來估計都會有問題。
早在2021年,國際低資源多語種語音識別競賽OpenASR落下帷幕,科大訊飛-中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)聯合團隊(以下簡稱聯合團隊)參加了所有15個語種受限賽道和7個語種非受限賽道,并全部取得第一名的成績!(就是說國外卡脖子的技術,被科大訊飛攻克后,除了中文外,其它14個語種的語音識別也都是全球第一)。
這就是我說的真實邏輯,但是很多時候你要接受市場是對的,市場資金不認可,再優秀也枉然。
雖然知道訊飛有這些產品,但是比如說學習機辦公本、訊飛聽見、合成虛擬人的產品細節處理上,我認為進步非常大。如果你是相關行業的人,肯定知道這種水平的應用,縱使有瑕疵,也遮掩不住其打磨產品的周期和態度。
那么多大模型還在預訓練和訓練的階段,訊飛都已經把產品化的細節處理到了這個程度(當很多發布會還在打字提問,訊飛已經通過語音輸入、大模型回答轉成語音播報,甚至中英文對話、轉換成虛擬人生成視頻等,都已經融合的很好了),現場隨機抽取提問,也看得出來,公司根本不在乎提問環節是不是完美,因為ChatGPT都有錯誤,有些錯誤反而也是訓練的一部分,重要的看是否信心十足,是不是ppt發布會。
看過發布會的肯定能理解這對辦公效率的提升程度(也意味著其它企業可以從成本角度,直接付費購買)超預期的并不是這些產品,這些產品其實一直都有,超預期的地方在于這些產品細節打磨的很好,并且已經是在大量銷售的產品。
當有的人還在為訊飛發布會會不會翻車而擔心的時候,公司的重心已經放在了產品銷售上了,也就是向所有人宣布,不是跟你們吹概念,讓你們覺得我多牛,我就是直接給你展示大模型同步支撐的產品,希望你們多多買產品,孩子家長還有學校趕快采買學習機,公司領導趕快采購訊飛辦公本、錄音筆、訊飛聽見,甚至文字工作者們趕快購買,效率提升不是一星半點。
發布會敢一直在屏幕下面輪番彈窗帶貨,關都關不掉,足見公司的重點根本不是要大家相信訊飛大模型遙遙領先,而是希望大家多買大模型的產品化終端。
訊飛這里提到了是超過GPT4,而前面提到的中文超過ChatGPT(沒有提4),我就知道,醫療這里的細分領域,他是有自信的。因為實踐實踐做夠久,我推測在醫院的真實場景訓練時間足夠久,當然也得益于我們國家的人口基數眾多,這個是不爭的事實,非常看好訊飛在這里的行業應用。
首先,發布會營銷上你夸大一點,沒有問題,但是敢這么高調,基本盤是有多扎實?其次我要解答一下大家問題了,訊飛憑什么?很好理解,我們都知道算力緊缺,訓練費用昂貴,現在預訓練和訓練的成本不是一般高。
但是你別忘了,科大訊飛1999年成立,滿打滿算20多年了,語音識別本質上就是大模型前身,不說訓練了20年,也訓練十幾年了,訊飛幾個月喂的可能遠遠不如你的,但是人家十幾年喂的你知道有多少嗎?(舉例說明,看到訊飛發布會音頻文字自由轉換,會議紀要可以自由總結生成紀要,試想訊飛的語料護城河里面的語音數據轉換成結構化文本,不要太容易)
可能很多人不信,我前面的文章已經提過,我和某語音識別團隊走的很近,我當然知道語音識別不就是大模型前身嘛(或者你叫小模型、中模型?),2015年前后搞語音識別模型升級時候,連續對話流行的詞好像叫“從語音識別到語義識別”“深度神經網絡”。
早在2015年前,科大訊飛就穩穩坐上了語音識別一哥的寶座,那收集的語料護城河,在語音識別,后面的語音輸入、翻譯等等領域都訓練了十多年了,你當我前面文章寫十年磨一劍是瞎說呢?公司今天宣傳口徑看樣子是二十年磨一劍。
而且很多東西,真的不是新東西。我來告訴你們2015年訊飛可以做到什么,一個是十幾年來不斷優化升級,一個是近年才從頭開始,這個積累,軟、硬件產品的從業者最清楚吧:
開車不方便撥打電話就可以給訊飛合作的車機(就是現在的智能座艙)打電話:
“我要撥打電話”
“請問打給誰”
“我要撥給XXX”
“請稍后,正在為您接通”
這個場景就解決了開車翻找電話本造成的風險了,這種連續對話能力,2015年就可以實現了。
第二個場景:
打電話給訊飛:
“請幫我訂一張明天去深圳的機票”
“請問你要頭等艙還是經濟艙”
“我要靠窗的”
“好的,已為您預定,深圳有雨,請別忘記帶雨傘”
當然,那時候的場景,后臺訂票肯定是人工收到指令去出票,換成現在,肯定可以實現授權后的在線支付了。
我上面舉的例子,其實是想說從語音識別角度,2015年就可以實現連續對話了,現在文字輸入的連續對話,無非是推理能力加強了,算力加強了,模型更大算法更優了,訓練的更多了,但不可否認,這已經又過去八年了,訊飛這么多年靠著語音識別進入這么多行業,推出這么多行業和個人產品,你說他的模型不隨之不斷訓練升級嗎?哪個產品不等于在不斷往回喂語料訓練?
這也是我前面說過的,要看傳承,十幾年的積累,無論是語音識別領域,還是搜索引擎領域,都不至于現在還要從頭預訓練,都訓練十幾年了,就像一個團隊完備的中餐館改造成自助餐店,比起重新招人租房子把毛坯改造成自助餐店,哪個快?哪個費錢?不難理解吧?
說到這里,訊飛的超預期是毋庸置疑的,前面文章也說過了,你要幾分清醒幾分醉呢?不過邏輯歸邏輯,市場歸市場,我只科普邏輯。
吹泡泡邏輯 首發原文鏈接
$科大訊飛(SZ002230)$
關鍵詞:
相關文章
- 科大訊飛星火大模型會超預期嗎?(二)_環球熱訊
- 重慶市原市長黃奇帆:要推動長期資金入市,為資本市場的持續穩定發展提供充足的資金支持
- 世界今頭條!2023年全球票房破100億美元,《阿凡達:水之道》暫列年榜冠軍
- 有人問芒格是否認為馬斯克高估了自己 芒格回應 巴菲特也評價了
- 熱點評!應急管理部啟動危險化學品重大危險源企業2023年第一次安全專項檢查督導
- 天舟六號船箭組合體今天垂直轉運進發射區
- 金價“越等越貴” 今年還要“狂飆”數百美元?你囤了嗎?
- 熱點評!甘肅寧夏達成一致 黃河黑山峽工程可研報告編制按下快進鍵
- 每日頭條!五糧液:五一期間產品銷售兩位數增長,白酒消費將延續升級趨勢
- 教育部:中小學教材不得夾帶商業廣告-環球播資訊
- 蘇丹沖突雙方代表在吉達舉行初步會談 世界熱訊
- 航行警告!珠江口部分海域軍事演習
- 停薪留職是如何規定的
- 蘋果手機通話錄音怎么設置在哪里(蘋果手機通話錄音怎么設置)-熱訊
- 冒名婚姻后患無窮 破解困局共筑良序
- 女人吃男人液體的好處
- 新疆阿勒泰多地迎來降溫降雪天氣 最低溫降至-17 ℃
- 鴻博股份:TF、HW別來沾邊
- 九五良率更正模型,愛旭組件神龍一現
- 天天實時:《聊聊中特估》
- 環球頭條:五糧液:五一期間產品銷售兩位數增長,白酒消費將延續升級趨勢
- 貴州茅臺:茅臺冰淇淋南昌、昆明、合肥、太原旗艦店即將開業 每日觀點
- 凱立新材稀貴金屬循環再利用基地項目在銅川簽約|熱點
- 巴菲特股東大會十大金句
- 快看:伯克希爾一季度凈利潤大增550% 近八成持倉集中在五家公司
- 家長對孩子說的話簡短(家長對孩子說的話) 今日熱議
- 今日導師吧的燃燒的戰爭,萌芽的戰爭是什么意思?謝謝大家! 熱點評
- 孩子動不動就撞頭,打自己,到底是哪里出了問題?
- 快看:芒種代表仲夏的_芒種意味著什么
- 世界實時:cctv節目表cctv8(cctv節目表)
熱文推薦
排行推薦

熱點評!應急管理部啟動危險化學品重大危險源企業2023年第一次安全專項檢查督導

天舟六號船箭組合體今天垂直轉運進發射區

金價“越等越貴” 今年還要“狂飆”數百美元?你囤了嗎?
