每日速看!人工智能:GPT將如何影響我們的工作?

2023-03-25 17:24:56 來源:雪球網

(報告出品方/作者:東北證券,黃凈、吳雨萌)

1. 總結:GPT 對工作的沖擊將跨越各個職業

3 月 17 日,OpenAI 官網發布最新研究論文 GPTs are GPTs: An early look at the labor market impact potential of large language models,對 LLM 語言模型,特別是 GPT, 對美國不同職業和行業的潛在影響進行了探討。我們將論文中的結論進行了匯總:


(相關資料圖)

1、 多數職業將受到 GPT 的沖擊:80%的工人有至少 10%的任務可以被 GPT 減少 ≥50%的工作時間;19%的工人有至少 50%的任務可以被 GPT 減少≥50%的工作時間;

2、 GPT 的影響橫跨各類薪資層級:盡管存在部分特殊情況,但整體來看,工資越高,受 GPT 沖擊的程度越大;

3、 職業技能與 GPT 的沖擊程度有關:科學和批判性思維技能最不容易受 GPT 沖擊,而編程和寫作技能受影響的程度最高;

4、 高學歷更容易受到 GPT 的沖擊:持有學士、碩士和更高學位的人比沒有正規教育學歷的人更容易受到 GPT 的沖擊;

5、 在職培訓時間時長與 GPT 沖擊程度有關:在職培訓時長最長的職業收入水平偏低,且受 GPT 沖擊程度最低,而沒有在職培訓或只需實習的工作則表現出更高的收入水平和更容易受 GPT 沖擊的屬性。

6、 證券相關和數據處理行業受 GPT 影響程度最高:在人類打分和 GPT 打分模式下,證券商品合約及其他金融投資和數據處理托管分別是受 GPT 沖擊程度最高的行業;在直接調用 GPT 模型的情況下,口譯筆譯和數學家分別是受影響最大的職業;在進一步開發 GPT 衍生功能的情況下,數學家和會計審計則分別為受影響最大的職業。

2. 統計指標來源及解釋

論文中使用了 O*NET 27.2 數據庫,包含 1016 種職業,以及各個職業的工作活動 (Detailed Work Activities,簡稱 DWA)和任務(Task)。論文中對工作活動和任務給出了定義: 詳細工作活動 DWA 是由完成任務構成的綜合操作,大多數工作活動與一個或 多個任務相對應,該數據集中包括 2087 種 DWA; 任務 Task 是某個特定職業的基礎單位,一項任務可以與 0 個、1 個或多個 DWA 關聯,且每個任務都有與之對應的職業,該數據集中包括 19265 種任務。 例如,對于職業“急癥護理護士”,其工作活動 DWA 包括“操作診斷或治療性醫療儀器或設備”和“準備醫療用品或設備”,其任務包括“設置、操作或監測侵入性設備和裝置,例如結腸造口術或氣管切開術設備、機械呼吸機、導管、胃腸道管和中心插管”。

論文選取了美國勞工統計局(Bureau of Labor Statistics,以下簡稱 BLS)提供的 2020 年和 2021 年職業就業系列中的就業和工資數據。該數據集包括職業名稱、每個職業的工人數量、2031 年職業水平的就業預測、職業準入的教育水平以及獲得職業能力所需的在職培訓情況。BLS 數據庫可以同 O*NET 數據庫進行聯動:通過當前人口調查(Current Population Survey,簡稱 CPS),將 O*NET 中的任務和工作活動數據集與 BLS 勞動力人口統計數據聯系起來,形成截面數據。

論文中設定了暴露度 Exposure 這一指標,作為重點討論的對象。暴露度 Exposure 用于衡量 GPT 對特定工作活動和任務的沖擊程度,即保證一項工作活動和任務完成質量相同的情況下,使用 GPT 或 GPT 驅動的系統是否能夠將執行工作活動或任務的所需時間減少 50%以上。 論文采用了兩種暴露度的注釋方式,分別為人工評分法與 GPT-4 評級法:

人工評分:通過對 O*NET 數據庫中的每一個工作活動 DWA 和任務進行人為歸類并注釋打分。

GPT-4 評級:采用早期版本的 GPT-4 對工作活動和任務進行注釋打分。

論文將暴露度分為以下三類:

E0 無暴露度:如果經驗豐富的工人在高質量完成任務時所需的時間沒有明顯減少 50%,或使用 GPT 相關技術會降低工作活動/任務的完成質量,則定義為 E0(例: 需要高強度人際互動的任務)。

E1 直接暴露:在保證完成質量相同的前提下,如果通過 ChatGPT 或 OpenAI 直接訪問 LLM 或 GPT-4 可以將完成工作活動或任務所需時間減少 50%及以上,則將其定義為 E1(例:指令編寫、轉換文本和代碼的任務)。

E2 LLM+暴露:直接訪問 LLM 不能將完成任務所需的時間減>50%,但在 LLM 基礎上開發額外功能后可以達成目的,則定義該類工作活動和任務為 E2(例:總結超過 2000 字的文檔并回答關于文檔的問題)。

為了更為準確地衡量暴露度這一指標的統計學意義,論文中構建了三個度量指標, α、β 和 ζ,分別衡量低、中、高水平下的 GPT 對各職業的沖擊程度。其中,α=E1, 代表一個職業受 GPT 沖擊程度的下限;β=E1+0.5*E2,其中 E2 的 0.5 倍權重旨在解釋通過補充工具或應用程序來完成任務/工作活動需要額外計算的暴露度;ζ=E1+E2, 代表一個職業受 GPT 沖擊程度的上限,可用于評估一項工作/任務對于 GPT 及 GPT 驅動的系統的最大暴露度(即GPT進一步開發后,一項工作/任務受到的最大影響)。

3. 研究結論:30%的職業或任務將受到 GPT 沖擊

前文將暴露度 Exposure 這一指標的定義進行了描述,論文中還將暴露度的衡量指標 α、β 和 ζ 進行了統計數據的匯總。不論采取人類打分的方式還是 GPT-4 打分,暴露度α的均值在0.14左右,表示了從平均意義上說,15%左右的職業/任務暴露于GPT, 即 15%左右的工作可能會被現有的 LLM/GPT-4 降低 50%以上的工作時間。類似地,暴露度 β 和 ζ 均值分別在 0.3 和 0.5 左右,代表 30%/50%的職業或任務將受到中/高水平的 GPT 沖擊,即減少工作時間 50%及以上。

4. 研究結論:工資水平與 GPT 沖擊程度呈正相關

論文探索了職業、工人分布程度與暴露度之間的關系。對于中等水平的 GPT(β) 來說,約 19%的工人有 50%以上的任務將受到 GPT 的沖擊,80%的工人有 10%以上的任務受到了 GPT 的沖擊;18%的職業中有 50%以上的任務受到了 GPT 的沖擊。

論文還對工資、就業水平與暴露度的相關性進行了探討。兩種打分模式下,盡管存在一些高暴露度的低工資職業和低暴露度的高工資職業,整體圖表顯示,工資越高, 受 GPT 影響的程度也隨之增加。而 GPT 沖擊程度與就業水平則并無顯著關聯。

5. 研究結論:科學和批判性思維是受 GPT 沖擊最小的技能

論文研究了不同職業中技能重要性與 GPT 暴露度之間的關系。作者將 O*NET 數據庫中的基本技能進行標準化,并將其與暴露度指標(α,β,ζ)進行回歸分析,檢驗技能重要性和暴露度之間的關聯度。結果表明,科學和批判性思維技能(Science and CriticalThinking)與暴露度呈強烈的負相關(以β作為研究,相關系數分別-0.23 和 -0.19),即需要該技能的職業或任務不太可能受到 GPT 的沖擊;相反,編程和寫作技能(Programming and Writing)與暴露度呈現出強正相關(相關系數分別為 0.62 和 0.47),即涉及該技能的職業更容易受到 GPT 的沖擊。

6. 研究結論:學歷水平和在職培訓時長與 GPT 沖擊程度相關

論文研究了不同工作類型的準入壁壘與暴露程度的關系。作者選取 O*NET 數據庫中的“工作區(Job Zone)”概念作為變量,同一工作區中的職業在準入教育水平、 準入相關經驗、在職培訓程度方面具有更高的相似度。O*NET 數據庫將工作區分為 5 種,隨著準入工作經驗的增加,各工作區收入的中位數單調遞增,如工作區 1 的 準入工作經驗是 3 個月,收入的中位數為 30,230 美元,而工作區 5 的準入工作經驗是≥4 年,收入中位數為 80,980 美元。 研究結果顯示,從工作區 1 到工作區 4,暴露度水平逐漸增加,但在工作區 5 則保持相似甚至有所降低。平均來說,在不同工作區,50%以上任務受到 GPT 沖擊的職業比例分別為 0.00%(工作區 1)、6.11%(工作區 2)、10.57%(工作區 3)、34.5% (工作區 4)和 26.45%(工作區 5)。

論文還單獨研究了職業準入教育水平和在職培訓情況與暴露度的關系。結果表明, 持有學士、碩士和更高學位的人比沒有正規教育學歷的人更容易受到GPT的沖擊; 在職培訓時間最長的職業受 GPT 沖擊程度最低(且這類工作的收入水平更低),而沒有在職培訓或只需要實習的工作表現出更高的收入水平和更容易受 GPT 沖擊的屬性。

7. 研究結論:證券投資和數據處理可能是受沖擊程度最高的職業

論文中對各行業受 GPT 沖擊的程度進行了排序。結果表明,人類打分模式下,證券商品合約及其他金融投資及相關活動是受 GPT 沖擊最為嚴重的行業,而 GPT 打分模式下,數據處理托管和相關服務的受沖擊程度最高。 在直接調用 GPT 模型的情況下(暴露度 α),口譯筆譯和數學家分別是兩種打分模式下受影響最大的職業。在進一步開發 GPT 衍生功能的情況下(暴露度 ζ),人類打分模式中,有 15 項職業的所有任務都將被 GPT 降低 50%以上的工作時間,包括數學家、稅務準備、量化分析師、作家、網頁和數字化頁面設計師;GPT 打分模式中, 有 86 項職業的所有任務都將被 GPT 降低 50%以上的工作時間,包括審計會計、新聞分析記者、法務專員、臨床數據經理、氣象變化政策分析師等。從方差角度看, 搜索營銷策略師、平面設計師、投資基金經理、財務經理、汽車損壞保險估價師可能是受 GPT 影響程度爭議最大的幾項職業。

此外,論文研究表明,近期的生產增長率(包含全要素和勞動力兩方面)與暴露度并無顯著相關性。換言之,如果 LLM 有可能在不同行業之間以不同程度提高生產力, 那么生產力最高的企業可能會良性循環。由于這些行業的生產需求普遍缺乏彈性, 生產率最高的部門在經濟投入中所占的比例將縮小。

8. 對國內的探討:賣方分析師≥80%的工作可能受 GPT 沖擊

我們采用了論文中類似的方法,試圖對國內證券行業相關工作進行打分,并計算了其可能受 GPT 沖擊的程度。論文中采用的 O*NET 數據庫將每一項職業對應的任務、 工作活動都進行了定義,但由于國內暫無類似的數據庫和較為詳細的職業分類,我們仍采用了 O*NET 數據庫中的分類,但依據國內的情況做了本土化調整,例如, O*NET 數據庫中的金融投資分析師(Financial and InvestmentAnalysts)職業包含任務“對綠色建筑和綠色改造項目進行投資財務分析(Conduct financial analyses related to investments in green construction or green retrofitting projects)”,而中國的分析師普遍不涉及這項工作,因此予以刪除調整。

我們選取了 O*NET 數據庫中的Financial and Investment Analysts金融和投資分析師、 Investment Fund Managers 投資基金經理這兩項職業和對應的任務與工作活動 (DWA),并根據中國的實際情況,將其重新組合為二級賣方分析師、一級市場投行和基金經理。采用與論文相同的標準,對這些職業的任務/工作活動進行了打分, 并計算了暴露度β和ζ。結果顯示,按任務情況進行計算,三種行業對比下,二級賣方分析師受 GPT 沖擊的程度高于投行一級市場和基金經理。在經過專業知識訓練的 LLM 和 GPT 的幫助下(代表暴露度ζ),賣方分析師可能有 82%的任務將被減少 50%以上的工作時間,基金經理可能有 55%的任務被減少 50%以上的工作時間。按照工作活動計算,二級賣方分析師和一級市場投行受 GPT 影響的程度相差不大,約為 65%左右,但仍顯著高于基金經理。

在論文中,作者將 E1 直接暴露定義為運用現有 ChatGPT 和 OpenAI 接口直接方位 LLM 可以減少50%以上的工作時間,對應的工作內容包括編寫文本(2000 字以內)、 翻譯、準備短資料等,而證券業的任務由于涉及專業知識、撰寫長度超過 2000 字的報告等,因此在進行打分時,不存在直接暴露 E1 的情況,所有任務及工作活動均被歸類為無暴露(E0)或 LLM+暴露(E2)。另外,在打分過程中,根據論文作者的標準,我們將法律法規要求人類完成的任務、需要確認/授權/決策的任務、涉及雇傭員工和培訓團隊的任務以及涉及大量人際交流的任務歸類為無暴露(E0),分析類、文本整理類、資料搜集類工作定義為 LLM+暴露(E2)。值得注意的是,由于基金經理這一職業涉及更多審查合規性、響應監管要求等任務,因此展現出較分析師更低的暴露度(ζ),即受 GPT 的影響低于分析師。

根據論文中對于不同行業的暴露度統計,按照人類打分,美國證券商品合約及其他金融投資的暴露度β在 0.6-0.7 之間,我們將這一數值作為美國證券行業受到 GPT 沖擊的平均水平。為了方便對比,我們采用暴露度β進行對比,國內賣方分析師、 一級市場(投行)和基金經理分別對應的暴露度 0.41、0.33 和 0.28,證明國內賣方分析師、一級市場(投行)和基金經理受到 GPT 沖擊的情況略好于美國證券行業受沖擊的平均水平。我們推測可能由以下原因導致:

1、 美國擁有更高比例的量化分析師:論文中特別提到,在經過專業知識訓練的 LLM 和 GPT 的幫助下(暴露度ζ),人類打分模式下,量化分析師的暴露度是 100%,即量化分析師所有的任務都可以在 GPT 的幫助下大幅降低工作時間;美國量化分析行業發展相對靠前,量化分析師可能擁有更高的權重,從而拉高行業整體的暴露度;

2、 不同證券市場的有效性可能對工作任務的打分產生影響:美國資本市場被認為是半強有效市場,較 A 股相比,美股市場的信息更加公開透明;GPT 在公開信息的搜集整理、歸納總結方面具有明顯的優勢,因此相比國內,GPT 和 LLM 能夠更好地幫助美國的證券從業者降低工作時長,從而表現出更高的暴露度。

關鍵詞:

相關文章

熱文推薦

每日速看!人工智能:GPT將如何影響我們的工作?
每日速看!人工智能:GPT將如何影響我們的工作?

(報告出品方 作者:東北證券,黃凈、吳雨萌)1 總......更多>

觀天下!機會是要自己把握的
觀天下!機會是要自己把握的

大家晚上好,我是刀哥。很有意思,有一個思維是:每一......更多>

漁遠比魚重要
漁遠比魚重要

今天與人聊天聊到了現在互聯網大V的不靠譜,從財經博......更多>

當前熱點-朱民:需關注外部宏觀變動對整個銀行金融資產的影響
當前熱點-朱民:需關注外部宏觀變動對整個銀行金融資產的影響

硅谷銀行危機等國際金融事件引人關注,中國國際經濟交......更多>

排行推薦

中原證券韓軍陽:建設先進科技平臺 助推私募量化投資
中原證券韓軍陽:建設先進科技平臺 助推私募量化投資
中原證券首屆“逐鹿中原杯”私募實盤大賽啟動會于今日... 更多>
張文宏:我們離走出“新冠”已為期不遠-世界動態
張文宏:我們離走出“新冠”已為期不遠-世界動態
3月25日上午,在廣州南沙舉辦的亞洲青年論壇上,國家... 更多>
運達股份臨平基地屋頂分布式光伏項目順利并網
運達股份臨平基地屋頂分布式光伏項目順利并網
近日,由浙江運達風電股份有限公司投資開發的臨平基地... 更多>
黃奇帆:中國超大規模單一市場帶來“大海效應”等三方面紅利
黃奇帆:中國超大規模單一市場帶來“大海效應”等三方面紅利
據澎湃新聞,3月25日,在中國發展高層論壇2023年年會... 更多>
中國農業銀行與青海省政府簽署戰略合作協議|消息
3月24日,中國農業銀行與青海省政府在西寧簽署戰略合... 更多>
關于煤礦和煤炭企業的估值雜談
我說兩個觀點,可能跟別人有差異。一,關于煤礦的估值... 更多>
世界簡訊:中海油的roa和roe
中海油目前總資產約9100億,凈資產約5600億。若roe達... 更多>
白酒里的瑜亮|新要聞
白酒是一個江湖,這個江湖里就充滿了恩怨情仇,四種基... 更多>
微頭條丨【打新必讀】中重科技估值分析,智能裝備及生產線(滬主板)
預測表格說明:黃色為打新君預測的開板價格和天數,綠... 更多>
【打新必讀】登康口腔估值分析,冷酸靈牙膏口腔護理用品(深中小)_全球觀察
預測表格說明:黃色為打新君預測的開板價格和天數,綠... 更多>
環球速遞!“私募魔女”李蓓:A股或迎來震蕩慢牛 未來五到十年是中國經濟或中國股市的白天
半夏投資創始人李蓓最新觀點稱,2023年,中國居民杠桿... 更多>
距離站上2000美元關口一步之遙 警惕金價上行動力?主題基金水漲船高
3月以來,市場中黃金相關資產走出持續上漲行情,貴金... 更多>
上海第三批創新型企業專項金融支持方案簽約 將推“研發貸”、“引航貸”等服務_全球快資訊
在上海市產業技術創新大會上,第三批創新型企業專項金... 更多>
瑞信集團選定其COO麥倩華掌舵與瑞銀合并事宜
瑞信集團已選定其首席運營官麥倩華(FrancescaMcDonag... 更多>

直腸炎的癥狀_直腸炎的早期癥狀

重慶發改委:網傳重慶居民分時電價

博時基金2022年凈利潤17.24億元,同

環球熱文:騰訊2022年報分析

股市的風險在哪里?

太貴了

組合公司2022年報1

全球今亮點!德銀會否成為下一個瑞

“致命真菌”在美國蔓延 近50%感染

《2023上海硬核科技企業TOP100榜單

国产精品白丝AV嫩草影院| 国产精品亚洲一区二区麻豆| 国内精品久久久久影院蜜芽| 国产精品无圣光一区二区 | 精品人妻人人做人人爽| 国产成人精品无人区一区| 国内精品一区二区三区东京| 久久99精品国产麻豆宅宅| 国产SUV精品一区二区88L | 精品国产区一区二区三区在线观看| 久9re热这里精品首页| 精品福利一区二区三区精品国产第一国产综合精品| 亚洲欧洲国产精品久久| 精品午夜久久福利大片| 永久无码精品三区在线4| 亚洲精品无码国产片| 久久亚洲精品无码AV红樱桃| 91精品美女在线| 日韩精品电影一区亚洲| 久久久久99这里有精品10| 日韩精品视频一区二区三区| 久久成人国产精品一区二区| 国产美女精品久久久久久久免费| 国产精品大白天新婚身材| 婷婷五月深深久久精品| 日韩精品无码免费专区午夜不卡| 无码乱码观看精品久久| 国产精品资源在线| 伊人无码精品久久一区二区| 精品国产免费人成电影在线观看| 亚洲国产精品成人久久| 国产自啪精品视频网站丝袜| 国产精品毛片一区二区| 国产一区二区精品久久岳√| 久久精品女人天堂AV| 亚洲熟妇成人精品一区| 国产乱子精品免费视观看片| 91精品国产综合久久四虎久久无码一级 | 国产精品视频1区| 人妻无码久久精品人妻 | 91麻豆国产精品91久久久|