宅男噜噜99国产精品观看免费,久久精品99,久久免费的精品国产v∧

關(guān)于AI，現(xiàn)在哪些方向太樂觀，哪些方向還可以更堅定一些？

2023-04-09 21:13:53 來源：雪球網(wǎng) 小 中

人工智能的大航海時代

ChatGPT火了之后，有一個段子，說：我們過去想象的人工智能是，我們寫詩畫畫編音樂，AI燒飯洗碗修電腦，沒想到，最后是AI寫詩畫畫編音樂，我們自己燒飯洗碗修電腦。

(相關(guān)資料圖)

白領(lǐng)危機(jī)四伏，藍(lán)領(lǐng)暗自慶幸。

然而，ChatGPT實際上只是人工智能歷史上的第一個爆款應(yīng)用，又是以一對一對話形式展開，效果又超出了我們的心理預(yù)期，很容易讓我們產(chǎn)生一個“人工智能能說會道”的錯覺，進(jìn)而讓我們覺得，它未來可以取代很多白領(lǐng)的工作。

其實，ChatGPT底層的自然語言大模型GPT，只是眾多人工智能大模型中率先“涌現(xiàn)”的一個，它更傾向于生成文本的能力，所以看起來都是寫寫文章，說說話，畫畫畫，但并不是說人工智能就只能干這些，你總不能因為趙本山演小品，就以為東北人只會演小品吧？

所以說，哪有什么“只取代白領(lǐng)的工作”這么簡單的事啊，取代藍(lán)領(lǐng)工作的人工智能早晚也會來的。

僅就自然語言大模型而言，最有名的有兩種方向，除了GPT模型外，還有Google的BERT模型，兩者的核心區(qū)別在于目標(biāo)不同，GPT更傾向于生成文本，而BERT 模型更傾向于理解文本。

更不用說還有更多開發(fā)中的各種方向的人工智能模型。

本文將從GPT模型與BERT模型的區(qū)別出發(fā)，分析一系列相關(guān)的問題：

說GPT更傾向于生成文本，而BERT 模型更傾向于理解文本，這個區(qū)別可能人類無法理解，不理解文本怎么生成文本呢？

但這個問題對AI來說，并不存在。

給一個形象的比喻，有一部勵志日本電影《墊底辣妹》，講一個年級倒數(shù)第一的差生通過一年內(nèi)復(fù)習(xí)考入慶應(yīng)大學(xué)（日本復(fù)旦交大這個級別）的真實故事，相當(dāng)于在全國學(xué)生中的最后2%，進(jìn)步到前2%。

這個神奇的故事之所以能實現(xiàn)，是因為她只要考“英語、小論文、歷史”這三門強(qiáng)調(diào)記憶的科目，她不需要很深的理解，只需要記憶和“生成”，注意重點是——不考數(shù)學(xué)、物理等注重推理的科目。

而GPT模型的成功，就像“墊底辣妹”一樣，很大程度在于選擇了一個“語言生成”為目標(biāo)的捷徑，從而讓它看上去的效果比它實際上的突破更明顯——這一點跟現(xiàn)實中一樣，一個能說會道的員工，總是比只會干實事的員工，看起來更能干。

Transformer模型有編碼器和解碼器兩部分，GPT模型只使用編碼器部分，而BERT模型既包含編碼器部分，也包含解碼器部分，所以，通常認(rèn)為，BERT模型需要“理解”文本的內(nèi)容，GPT模型則不一定。BERT雖然也是一個文科生，但也要學(xué)習(xí)數(shù)學(xué)、物理這一類注重推理的課程，全面發(fā)展。

兩者的區(qū)別在一開始訓(xùn)練時就產(chǎn)生了，GPT的訓(xùn)練目標(biāo)是通過最大化下一個單詞的條件概率來預(yù)測下一個單詞，從而完成生成任務(wù)；而BERT的訓(xùn)練目標(biāo)是隨機(jī)掩蓋一些輸入詞匯并要求模型預(yù)測這些詞匯，強(qiáng)迫模型預(yù)測缺失的單詞，因此產(chǎn)生了雙向性。

可能有人會想，為什么Google不先做一個相對容易的文本生成模型，而要先做一個更難的呢？

原因很簡單，BERT模型未來的用途可能更廣闊。

GPT模型就像文科畢業(yè)生，由于其在生成文本方面的強(qiáng)大能力，畢業(yè)后最大的“就業(yè)去向”是自動生成文章類的“工作”、包括新聞、廣告文案、創(chuàng)意內(nèi)容、法律文書、文秘、各類咨詢，等等；其次的“就業(yè)去向”是作為聊天機(jī)器人、虛擬助手、智能客服，等等，進(jìn)行更加自然、流利的對話。

而BERT模型并不會局限在“文科領(lǐng)域”，它可以憑借自己執(zhí)行文本分類、命名實體識別、關(guān)系抽取等任務(wù)的能力，有更廣泛的用途，比如可以用于幫助搜索引擎更準(zhǔn)確地理解用戶查詢意圖，從而提供更精準(zhǔn)的搜索結(jié)果——這就是Google和百度一直在重點開發(fā)這個方向的原因。

更重要的是，BERT模型可以從非結(jié)構(gòu)化的日常語言數(shù)據(jù)中，抽取結(jié)構(gòu)化數(shù)據(jù)，就是我們前面說的訂餐館的例子，小到要求助理召集一場特定人員參加的有特定目的的會議，大到智能駕駛——

我問過ChatGPT一個問題：“你覺得智能駕駛更有可能通過哪一個模型實現(xiàn)？”

它很坦誠地承認(rèn)，BERT模型可能更適合在復(fù)雜的駕駛場景中進(jìn)行深度理解和決策，理由是：

“在智能駕駛中，理解交通標(biāo)志、識別道路標(biāo)線、理解交叉口的交通信號等，都需要對文本信息進(jìn)行深入的理解和推斷。BERT模型作為一種能夠?qū)ξ谋拘畔⑦M(jìn)行深度理解的模型，可能在智能駕駛中具有更廣泛的應(yīng)用潛力。”

然而，雙向語言模型訓(xùn)練難度太大了，ChatGPT之前的GPT-2和GPT-3和BERT一樣，都是雙向模型，但效果一般，導(dǎo)致眾多企業(yè)在這方面的投入更猶豫，轉(zhuǎn)機(jī)出現(xiàn)在OpenAI將GPT變成單向語言模型后，忽然出現(xiàn)了GPT-3.5的質(zhì)的突破，實現(xiàn)人工智能從猿到人的關(guān)鍵進(jìn)化。

而且，未來即使BERT這一類雙向語言模型也實現(xiàn)了“涌現(xiàn)”，因為它的計算復(fù)雜度較高，算力成本也就更高，很可能從成本上限制了它的使用場景。

所以未來不會有大一統(tǒng)的模型，可能會是各種模型的融合，在實際應(yīng)用中需要根據(jù)任務(wù)需求和計算資源進(jìn)行選擇，以充分發(fā)揮各自的優(yōu)勢。

例如，一個智能客服對話系統(tǒng)，其工作內(nèi)容可以分成兩類，一類是咨詢，只需要簡單判斷客戶的意圖，主要任務(wù)是生成內(nèi)容，客戶也沒有很高的精度要求，用GPT這一類單向模型就夠了；

另一類客戶溝通類工作，比如消費(fèi)者要求退換貨、賠償、投訴等涉及復(fù)雜判斷和反復(fù)溝通的需求，對理解能力要求很高，還要判斷客戶提供信息的真實性，甚至需要AI判斷客戶此時的情感類型和程度，就需要用BERT模型進(jìn)行意圖識別和槽位填充，從而實現(xiàn)更加智能、靈活的對話交互。

對比了GPT和BERT的區(qū)別，可以看出，GPT并不像大家想象的那么萬能，它的訓(xùn)練目標(biāo)中，對判斷推理的要求沒有文本生成高，下游應(yīng)用可能并不會那么多。

那么，這個題材現(xiàn)在是不是有點炒作過了呢？會不會像21年的元宇宙一樣雷聲大雨點小呢？

答案是“不會”，GPT模型的意義不在于“找到東方的黃金”，而是“發(fā)現(xiàn)新航線”。

人工智能的理論突破，基于Transformer架構(gòu)的自然語言處理模型，實際上是發(fā)生在前幾年，只是之前沒有人能實現(xiàn)它，所以并不確定它行不行，加上費(fèi)用都是以億為單位，就算是巨頭，在投入上都比較小心。

所以ChatGPT的重要意義在于形成了一個行業(yè)共識——只要基于海量的數(shù)據(jù)去喂這個模型，時間到了，就能“大力出奇跡”，最終實現(xiàn)超大神經(jīng)網(wǎng)絡(luò)能力的涌現(xiàn)。

國內(nèi)的AI大模型長期發(fā)展緩慢，但ChatGPT問世后，短短幾個月一下子冒出了多個能力相當(dāng)于GPT-3的大模型，并不是這些巨頭在蹭熱點，而是新航線被確認(rèn)了，必然會有多支“艦隊”出發(fā)，之后也必然會出現(xiàn)更多的不同于GPT的“新航線”。

當(dāng)然，越是星辰大海級別的投資機(jī)會，越需要合理的投資策略。

以應(yīng)用方向為例，對應(yīng)的行業(yè)都是傳媒影視游戲、各種互聯(lián)網(wǎng)應(yīng)用和軟件，這一類行業(yè)之前因為商業(yè)模式的缺陷，估值普遍不高，所以AI應(yīng)用行情的核心邏輯是用AI改造傳統(tǒng)的商業(yè)模式，出現(xiàn)業(yè)績與估值的戴維斯雙擊。

但行情是一波波走出來的，這一類產(chǎn)業(yè)大趨勢的行情通常包括三個階段：

第一階段的核心原因是“估值低、機(jī)構(gòu)持倉低、預(yù)期低”的“三低”，以AI應(yīng)用為名義的估值修復(fù)行情。既然是估值修復(fù)，那就是“邏輯第三、故事第二、位置第一”，大部分公司不分好壞，只要有訴求，都能上漲。

可一旦估值修復(fù)完成，第一批信仰者已經(jīng)滿倉，其他人還在觀望，市場冷靜下來，行情就要進(jìn)入到邏輯驅(qū)動和業(yè)務(wù)驅(qū)動的第二階段。

這個階段，AI應(yīng)用標(biāo)的的投資方向，主要考慮業(yè)務(wù)是否成立，要考慮AI使用成本與客戶需求的匹配度，盡可能優(yōu)先考慮GPT3.5和4非常擅長的功能，其次是支持的功能，對年底可能推出的多模態(tài)的GPT5，還是要多一份謹(jǐn)慎。

我前面分析了一堆GPT模型的特點，正是為了從這個特點出發(fā)，分析現(xiàn)有的投資炒作邏輯中，哪些邏輯后面可能被證實，哪些邏輯可能被證偽。

人工智能首先在語言和圖像輸出方面實現(xiàn)質(zhì)的飛躍，等于方向已經(jīng)指明，這將鼓勵各大平臺加大在此方向上的投入。

變好的不但有業(yè)務(wù)，還有商業(yè)模式。內(nèi)容生成行業(yè)的成本項，從沒有規(guī)模效應(yīng)、難以控制的人，變成有規(guī)模效應(yīng)、控制性很好的AI，市值空間變大，理應(yīng)獲得更高的估值。

但這里需要區(qū)別內(nèi)容生成和創(chuàng)意生成，前者是指大量重復(fù)的、受眾低要求的創(chuàng)作，后者是少數(shù)內(nèi)容精英的創(chuàng)作成果，觀眾要求高。以影視為例，僅依賴廣告、觀眾不太挑剔的免費(fèi)電視劇更偏向于前者，而電影、付費(fèi)精品劇更偏向于后者。

AI對創(chuàng)意生成的替代作用非常小，創(chuàng)意行業(yè)的商業(yè)模式不會因此改變，仍然是沒有什么投資價值的行業(yè)。

前面我以客服機(jī)器人為例，分析了客服中兩種不同需求對AI的挑戰(zhàn)不同，客戶的預(yù)期不同，最終導(dǎo)致AI的效果與付費(fèi)意愿也就不同，所以，需求中側(cè)重于推理判斷和有后續(xù)動作的應(yīng)用，要具體應(yīng)用具體分析，總體上有幾個原則：

1、需求有明確結(jié)果，但對結(jié)果要求高的應(yīng)用要謹(jǐn)慎，比如AI智能駕駛和AI輔助診斷，有人認(rèn)為AI只是輔助診斷，但他們一定忘了魏則西的悲劇，AI診斷的暗示性遠(yuǎn)遠(yuǎn)強(qiáng)于搜索結(jié)果；

2、可以直接低成本帶來新客戶的（游戲、圖片創(chuàng)作、法律心理管理等咨詢服務(wù)、部分黑產(chǎn)），最佳；可以提高付費(fèi)意愿和單價的（辦公應(yīng)用），其次；只能省成本或只能改善用戶體驗的（企業(yè)文書、網(wǎng)文創(chuàng)作、藥物研發(fā)），再次；價值感不明確導(dǎo)致付費(fèi)比較猶豫的（目前大部分），最差；

3、效果可能一般，但非常剛需或者價值感很強(qiáng)（比如金融、教育）；付費(fèi)方與使用方分離的（禮品類硬件應(yīng)用）；

4、入口強(qiáng)制使用的（國民級APP、留存社交關(guān)系的App、手機(jī)電視電腦智能音箱等）；

5、目前大量被炒作的應(yīng)用方向（訂餐、旅游、購物），大多雖理論上可以提升用戶體驗，但并不能帶來明確的核心價值，或者不解決用戶痛點，而且結(jié)果也并不一定準(zhǔn)確。這一類應(yīng)用，可能用了很高的成本只創(chuàng)造了少量新需求和新收費(fèi)，最終得不償失。

三、正確的方向和模糊的個股

雖然像游戲、辦公、金融、教育，都是前期炒得比較多的方向，但這些方向都非常確定，需要有一級市場的前瞻性思維，并不需要看到業(yè)績的落地。最怕的是一開始不信，看到業(yè)績落地后又相信了，業(yè)績落地、確定性很高時，估值可能已經(jīng)非常離譜了。

也不要因為用過之后體驗不好，就覺得這個項目不行，只要方向正確，人工智能的進(jìn)化速度遠(yuǎn)遠(yuǎn)超過人類的想象。

從ChatGPT的輸出內(nèi)容看，它有明顯的意識形態(tài)，這是在訓(xùn)練中有目的輸入的，這肯定會給各國政府一個啟發(fā)——利用人工智能訓(xùn)練進(jìn)行全民價值觀的灌輸或潛移默化。

至少在我國，大語言模型將兼具“宣傳陣地”（推理）和“教育陣地”（訓(xùn)練）的作用，未來主要方向不是商業(yè)化，而是像現(xiàn)在的媒體和教育機(jī)構(gòu)一樣被高度管控，以防止出現(xiàn)互聯(lián)網(wǎng)時代BAT那樣過于強(qiáng)勢的非官方控制的巨型平臺。

所以大模型的商業(yè)價值有相當(dāng)?shù)牟淮_定性。正在做大模型的公司，如果能先于監(jiān)管“把孩子生下來”，算是安全上岸，日后無非是監(jiān)管成本問題。難的是開發(fā)進(jìn)度落后的，很可能最后胎死腹中，投資打水漂。

回到前面對GPT模型定位的分析，大語言模型必然將遇到這個問題，言語就像氧氣、水源、糧食一樣，商業(yè)化必然面對各種政治的、道德的挑戰(zhàn)，可能商業(yè)價值更大的，還是側(cè)重推理的非語言類大模型，以及在語言大模型基礎(chǔ)上訓(xùn)練的專業(yè)模型。