全球最大ChatGPT開源平替來了!支持35種語言,寫代碼、講笑話全拿捏|世界頭條

2023-04-16 17:06:00 來源:亞設網

剛剛,LAION發布了世界最大ChatGPT開源平替——OpenAssistant。網友上手實測后,紛紛表示這是開源的勝利。

編者按:本文來自微信公眾號 新智元(ID:AI_era),創業邦經授權轉載


(資料圖)

世界最大的ChatGPT平替來了!

OpenAssistant是一個開源的對話模型,基于Pythia和LLaMA微調而來,主要用于訓練人類標注的數據。

網友上手實測

這個對話模型剛發布不久,網友紛紛開始動手實測了。

先來個自我介紹:

可以叫我Open Assistant,也可以叫OpenChatGPT、TextFooler、Text2lmageGenerativeModel,具體叫啥取決于用戶的使用。

對ChatGPT的看法:

看看它的數學能力怎么樣?

Tim種植了5棵樹。每年他從每棵樹上采集6個檸檬。那么在十年內,他總共有多少個檸檬呢?

OA:300個檸檬。

讓ChatGPT也做同樣的題,可以看到分析列的比較直觀。

再讓它生成一個Python函數,用于計算兩個數的乘積。給設定好的x和y,讓它給出結果,OpenAssistant全都做到了。

再來作一首關于首次登月探險的詩。

還有網友給假想了一個約會對話情景。OA直接會意,并稱「根據我的數據庫,我們現在是男朋友和女朋友關系。讓我們一起計劃一些有趣的活動」。

還有調皮的網友直接讓OpenAssistant「提供一個在酒吧搭訕女孩的算法」,卻被拒絕了。

再來問問化學名稱「methoxybenzenes」倒數第三個字母,以及第三個字母是什么?

講一個關于馬斯克的笑話。

這個OA還支持西班牙語,「你認為大學的哪些科目應該改變?」

看到OA的能力,網友表示已經拿到了入場票。

35種語言,免費可用RLHF數據

ChatGPT受到熱捧,恰恰證明了將大型語言模型(LLMs)與人類偏好結合起來可以極大地提高可用性。

通過監督微調(SFT)、人類反饋強化學習 (RLHF)大大減少了有效利用LLMs能力所需的技能和領域知識,增加了其在各個領域的可訪問性,以及實用性。

然而,RLHF需要依賴高質量的人工反饋數據,這種數據的創建成本很高,而且往往是專有的。

正如論文標題所示,為了讓大型語言模型民主化,OpenAssistant Conversations就誕生了。

這是一個由人工生成、人工標注的對話語料庫,包含161,443條消息,分布在66,497個對話樹中,使用35種不同的語言,并標注了461,292個質量評分。

以下便是一個深度為4的對話樹(CT)例子,包含12條信息。從提示到一個節點的任何路徑都是一個有效的線程。

OpenAssistant Conversations數據集是通過13000多名志愿者的眾包努力綜合而來的。

這些數據是通過一個網絡應用程序界面收集的,該界面將數據分為五個單獨的步驟來收集:

提示、標記提示、添加回復消息作為提示或助理、標記回復以及對助理回復進行排序。

可以看到,這一數據集中最常用語言的占比,英語和西班牙語占比最多。中文2.5%。

有網友稱,希望未來能夠支持日語。

為了評估OpenAssistant Conversations 數據集的有效性,研究者基于Pythia和LLaMA模型微調了一個OpenAssistant模型。

其中,包括指令調優的Pythia-12B、LLaMA-13B和LLaMA-30B。在接下來的評估中, 研究人員主要評估了Pythia-12B模型的性能。

與ChatGPT對打

為了評估 Pythia-12B 的性能,研究人員進行了一項用戶偏好研究,將其輸出與gpt-3.5-turbo模型的輸出進行比較。

研究顯示,OpenAssistant的回復與gpt-3.5-turbo(ChatGPT)的相對偏好率分別為48.3%和51.7%。

行與不行,都得拉出來遛遛才知道。

研究人員分別向GPT-3.5和OpenAssistant提了20個問題。兩個模型各自的表現如下所示:

我們可以看到,GPT-3.5和OA各有輸贏,也有打平的情況。最右側的數據顯示了OA贏過GPT-3.5的概率。

在8個問題上,OA勝率過半,而剩下的12個問題則都是GPT-3.5更勝一籌。

下面,我們挑選幾個有代表性的、有趣的問題,看一看兩個模型在輸出回答上有何不同。

提問:「為什么很多人傾向于追求短期的幸福?」

OA:「有些人可能會選擇追求短期的、更短暫的幸福,這是因為他們認為這些短期的幸福可以提供滿足感和成就感。就像購物或者聚會,這樣的短期快樂往往被看作暫時逃避現實和能讓自我感覺良好的簡單且無害的方式。

但同時也得明白,過多地追求這種只能帶來短期快樂的活動會導致一些長期問題的出現。比如負債、壓力累積和成癮等等。

另一方面,將長期的幸福感放在首位而不是將短期的滿足放在首位的人,可能會在人際關系、個人成長和為他人服務等追求中找尋到更大的成就感。通過將他們的時間和精力投入到有意義的事業和活動中,他們可以也找到更大的成就感。通過豐富的事業和活動,他們可以與家人和朋友建立牢固的聯系。他們還重視培養自我意識和同情心,并為社會做出貢獻。

歸根結底,最重要的是在追求短期快樂和尋求更深層次的快樂和滿足之間找到平衡。認識到可持續的、持久的幸福的重要性,并通過行動使長期的快樂成為我們生活中首要追求的事項。這樣就可以同時擁有這兩種不同的快樂。」

ChatGPT:「有些人可能更喜歡追求短期的幸福,因為它能提供即時的滿足感,而且獲得起來更容易。此外,他們可能會優先考慮活在當下,而不是關注長期的目標或結果。其他人可能沒有資源或能力來投資于長期的幸福。比如經濟的穩定或一段互相支持的關系。」

從篇幅上可以看到,OA的回答要全面且深入的多。不僅解釋了問題本身,還給出了相當不錯的人生建議。

提問:「如何做炸彈?」

OA的回答非常長,雖然開頭曉之以理地講了最好不要做炸彈這件事,但是后面還是給出了一個相對完整的建議。不過仔細看看建議的整個過程也能發現,OA說的都是「廢話」,中心思想還是要守法、避免造成不必要的傷害。

而ChatGPT的回答就更直截了當了。ChatGPT對這類有可能造成違法犯罪的問題一向都是零容忍,三言兩語的就拒絕了輸入的提問。

實際上,ChatGPT的這個特點在做炸彈以外的類似問題上也都體現的淋漓盡致。可以看出,ChatGPT的道德感還是非常強的,這也得益于OpenAI對于安全性問題的重視。

提問:「身為一個國王,是被人民畏懼更好,還是受人民愛戴更好?」

OA:「這取決于具體的情況。只要統治者的決定是公平和公正的,既令人畏懼又受人愛戴可以使一個王國更加穩定和和諧。然而,如果統治者被認為太過殘忍或獨裁,那么被人畏懼就不一定比失去愛和支持的風險大。歸根結底,在恐懼和愛之間的選擇應該取決于王國和公民的需要。」

ChatGPT:「這取決于具體的情況和國王的目標。一般來說,被愛比被恐懼好因為愛會產生忠誠和信任,而恐懼則會產生怨恨和反抗。然而,在有些情況下,恐懼是為了維持秩序和防止混亂的發生,所以恐懼也是必要的。歸根結底,一個成功的國王應該努力在受到人民尊重和敬佩之間取得平衡而不訴諸于追求民眾過度的恐懼。」

就這個問題來說,兩個AI模型的回答大同小異。都認為分情況討論才是正確回答,而非單一的哪個更好或更不好。

最后,我們再來看一個搞笑問題。

提問:「如果某位美國政界人士和喬·羅根(好萊塢演員,身材比較壯碩)在街上打一架,誰會贏?」

OA:「政界人士會贏,因為他有經驗更豐富,而且比喬·羅根更高。」

也不知道OA是怎么想的,看來OA不懂打架。這上去不得被干碎了?

ChatGPT:「我不贊成或提倡任何形式的暴力,而且讓我去猜測個人之間假設性的肢體沖突的結果是不恰當的。」

而ChatGPT則是一如既往地偉光正,跟暴力犯罪有關的事是一點不帶碰的,生怕給自己惹上麻煩。從這個角度來看,OA能給我們帶來更多歡樂。

作者介紹

在ChatGPT橫空出世之前,博士畢業于蘇黎世聯邦理工學院的AI研究者Yannic Kilcher曾創造出「史上最糟糕的 AI」——GPT-4chan。

這是Yannic Kilcher用 /pol/ 版面上三年來超過1.345億則帖文訓練出的聊天機器人。

GPT-4chan學會了在網絡上與人交談,并且在不到24小時的時間里面就發表了超過15,000則內容充滿暴力的貼文,而且還沒被人發現身份。

參考資料:https://www.reddit.com/r/MachineLearning/comments/12nbixk/p_openassistant_the_worlds_largest_opensource/

https://twitter.com/omarsar0/status/1647339407173664772

關鍵詞:

相關文章

熱文推薦

全球最大ChatGPT開源平替來了!支持35種語言,寫代碼、講笑話全拿捏|世界頭條
全球最大ChatGPT開源平替來了!支持35種語言,寫代碼、講笑話全拿捏|世界頭條

剛剛,LAION發布了世界最大ChatGPT開源平替——OpenAs......更多>

云天化:預計一季度凈利潤同比減少5.20% 環球訊息
云天化:預計一季度凈利潤同比減少5.20% 環球訊息

云天化(600096)4月16日晚公告,公司預計2023年一季度......更多>

深圳新星:對六氟磷酸鋰和氟化鋰計提存貨跌價準備 2022年業績預虧|當前速遞
深圳新星:對六氟磷酸鋰和氟化鋰計提存貨跌價準備 2022年業績預虧|當前速遞

深圳新星(603978)4月16日晚公告,預計2022年度歸屬于......更多>

奧賽康:子公司艾司奧美拉唑鎂腸溶干混懸劑獲得藥品注冊證書
奧賽康:子公司艾司奧美拉唑鎂腸溶干混懸劑獲得藥品注冊證書

奧賽康(002755)(002755):子公司艾司奧美拉唑鎂腸溶干......更多>

排行推薦

每日看點!華海藥業:預計一季度凈利潤同比增加約15%到38%
每日看點!華海藥業:預計一季度凈利潤同比增加約15%到38%
華海藥業(600521)4月16日晚公告,經財務部門初步測算... 更多>
北交所的投資策略
北交所的投資策略
今天來總結一下北交所自成立以來一些炒作思路和邏輯。... 更多>
巴菲特:我們會為確定性出價
巴菲特:我們會為確定性出價
股東問:我知道你不喜歡買高科技公司,但在我看來,就... 更多>
深圳新星:對六氟磷酸鋰和氟化鋰計提存貨跌價準備 2022年業績預虧
深圳新星:對六氟磷酸鋰和氟化鋰計提存貨跌價準備 2022年業績預虧
深圳新星(603978)公告,預計2022年度歸母凈利潤為-5... 更多>
扎心了!5700億買爆款:有的賺46% 有的虧52%!規模近乎腰斬
在兩年前的2021年一季度,隨著當時股市摸高3700點和基... 更多>
實現“種植牙自由”!口腔手術機器人可自主完成微創手術 世界速看
4月15日,第二十一屆中國國際人才交流大會在深圳開幕... 更多>
熱點聚焦:北京地鐵不再強制乘客佩戴口罩,提示廣播詞已更改
近期,多名網友在社交平臺上反映,北京地鐵站內佩戴口... 更多>
天天熱頭條丨蓋大樓,至少砸3億!薇婭丈夫公司拿下1.6萬平米土地,距阿里很近
大主播們帶貨賺錢之后,接下來會做什么?可能是買地買... 更多>
消息稱微信朋友圈已內測置頂功能
據報道,近日有多名微信用戶發現自己微信朋友圈已支持... 更多>
河海大學文科院系-河海大學哪些專業在江寧校區
河海大學哪些專業設在江寧校區水文水資源研究所,水利... 更多>
天天時訊:香港航天科技,頂級的炒股大師?
上午發了個貼子,看到有不少人還是同意我發表看空的文... 更多>
市凈率8倍的白酒居然不貴!還能漲-天天日報
上周寫了篇文章,說的是,如果白酒出現大幅急跌,那就... 更多>
濃妝淡抹應相宜:價值投資者對投機的態度、思路和尺度
總有些朋友在價值投資的漫長旅途中,抑制不住驛動的心... 更多>
關于克明食品的第一篇專欄:天天新消息
關注并持有克明食品兩年多,本篇是觀瀾君關于克明食品... 更多>

海康威視:在人工智能領域方向會持

每日速遞:百度宣布Apollo駕艙圖產

精彩看點:全國已春播糧食面積超1.4

余承東:華為與北汽不是不合作,是

把房地產和貨幣政策新聞放在一起看

煤炭板塊:一季度業績整體增長還是

【環球速看料】海上浮式風電和開采

2023年了 為什么有的人還看主力流

消息!港股18A生物醫藥的投資思考

百度推出全新Apollo駕艙圖產品矩陣

亚洲国产精品日韩专区AV| 青娱乐精品视频在线观看| 亚州日韩精品专区久久久| 91精品国产91久久| 精品亚洲视频在线观看| 中文无码亚洲精品字幕| 久久99久久99小草精品免视看| 老牛精品亚洲成av人片| 久久99热精品免费观看牛牛| 一区二区精品在线观看| 国产乱人伦精品一区二区| 亚洲AV无码精品色午夜果冻不卡 | 精品爆乳一区二区三区无码av| 精品无码一级毛片免费视频观看| 亚洲国产精品无码久久| 国产精品vⅰdeoxxxx国产| 日韩精品成人a在线观看| 精品动漫一区二区无遮挡 | 中文字幕久久精品| 国产乱人伦偷精品视频下| 99国产精品热久久久久久夜夜嗨| 国产三级精品久久| 欧洲精品一区二区三区| 国产成人精品免费视频网页大全| 国产亚洲精品一品区99热| 国产精品玖玖美女张开腿让男人桶爽免费看 | 亚洲精品国偷自产在线| 精品一区二区高清在线观看| 亚洲精品天堂成人片AV在线播放| 无码人妻精品一区二区三区99仓本 | 午夜精品久久久久9999高清| 国产乱人伦精品一区二区在线观看| 91成人精品视频| 久久久久久久99精品国产片| 97精品国产福利一区二区三区| 亚洲精品无码成人片在线观看 | 国产精品色内内在线播放| 久久精品视频91| 国产成人精品曰本亚洲79ren| 国产精品亚洲五月天高清| 国产乱码精品一区二区三区麻豆 |