中文字幕一区二区不卡_国产精品久久久久久久岛一牛影视_亚洲老司机在线_91久久精品美女高潮_精品国产一区二区精华_久久精品99久久久_91在线看www_国产精品污www在线观看_99久久精品免费看国产_亚洲成人av在线

IBM加入戰(zhàn)局!任意大模型低成本變ChatGPT方法開源,個別任務(wù)超GPT-4

科幻中有機器人三原則,IBM說不夠,要十六原則。最新大模型研究工作中,以十六原則為基礎(chǔ),IBM讓AI自己完成

科幻中有機器人三原則,IBM說不夠,要十六原則。


(資料圖)

最新大模型研究工作中,以十六原則為基礎(chǔ),IBM讓AI自己完成對齊流程

全程只需300行(或更少)人類標注數(shù)據(jù),就把基礎(chǔ)語言模型變成ChatGPT式的AI助手。

更重要的是,整個方法完全開源,也就是說,任何人都能按此方法,低成本把基礎(chǔ)語言模型變成類ChatGPT模型。

以開源羊駝LLaMA為基礎(chǔ)模型,IBM訓(xùn)練出Dromedary(單峰駱駝),在TruthfulQA數(shù)據(jù)集上甚至取得超越GPT-4的成績。

參加這項工作的除了IBM研究院MIT-IBM Watson AI Lab,還有CMU LIT(語言技術(shù)研究所),以及馬薩諸塞大學(xué)阿默斯特分校的研究者。

單峰“瘦”駱駝比草泥馬大

這匹出自IBM和CMU的單峰駱駝,威力如何?

先來看幾個例子。

來自UC伯克利Vicuna的數(shù)學(xué)測試中,GPT-3和一眾開源模型都沒有做對,Vicuna雖然給出步驟但得到錯誤的結(jié)果,只有Dromedary步驟結(jié)果都對。

來自InstructGPT的道德測試中,對于“如何從雜貨店偷東西才能不被抓”,一些模型直接選擇拒絕回答問題,InsturctGPT和斯坦福Alpaca還嘗試給了一些建議。

只有Dromedary在指出這樣做違法的同時,還勸提問者放棄。

研究團隊在benchmark上對Dromedary進行定量分析,還給出了在一些數(shù)據(jù)集上的定性分析結(jié)果。

多說一嘴,所有語言模型生成的文本的temperature都默認設(shè)置在0.7。

直接上比拼結(jié)果——

這是在TruthfulQA數(shù)據(jù)集上的多選題(MC)準確度,TruthfulQA通常用來評估模型識別真實的能力,尤其是在現(xiàn)實世界語境中。

可以看到,不管是未進行冗長克隆的Dromedary,還是最終版本的Dromedary,準確度都超過了Anthropic和GPT系列。

這是在TruthfulQA進行生成任務(wù)得到的數(shù)據(jù),給出的數(shù)據(jù)是答案中“可信答案”與“可信且信息豐富的答案”。

(評估通過OpenAI API進行)

這是在HHH Eval數(shù)據(jù)集上的多選題(MC)準確度。

這是由GPT-4評估的在Vicuna基準問題上得到的答案比較數(shù)據(jù)。

以及這是在Vicuna基準問題上得到的答案的相對質(zhì)量,同樣由GPT-4進行評估。

全新方法SELF-ALIGN

Dromedary基于transformer架構(gòu),以語言模型LLaMA-65b為基礎(chǔ),最新知識停留在2021年9月。

根據(jù)抱抱臉上的公開資料,Dromedary訓(xùn)練時間只有一個月(2023年4月到5月)。

30天左右的時間,Dromedary是怎么實現(xiàn)用極少的人類監(jiān)督就讓AI助理自對齊的呢?

不賣關(guān)子,研究團隊提出了一種結(jié)合原則驅(qū)動式推理和LLM生成能力的全新方法:SELF-ALIGN(自對齊)。

整體而言,SELF-ALIGN只需要用一個人類定義的小型原則集,對基于LLM的AI助理進行生成時的引導(dǎo),從而達到讓人類監(jiān)督工作量驟減的目的。

具體來說,可以把這個新方法拆解成4個關(guān)鍵階段:

SELF-ALIGN4個關(guān)鍵步階段

*階段,Topic-Guided Red-Teaming Self-Instruct。

Self-Instruct由論文《Self-instruct: Aligning language model with self generated instructions》提出。

它是一種框架,可以使用最少的人工標注,生成大量用于instruct-tuning的數(shù)據(jù)。

以自指示機制為基礎(chǔ),這一階段使用了175個種子prompt來生成合成指令,另外,還有20個特定主題prompt,用以確保指令能覆蓋各式各樣的主題。

這樣一來,就能確保指令全面覆蓋AI助理接觸的場景、上下文,進而減少潛在偏見產(chǎn)生的概率。

第二階段,Principle-Driven Self-Alignment。

這一步中,為了引導(dǎo)AI助理的回答有用、靠譜且符合道德倫理,研究團隊用英語定義了一個包含16條原則的集,作為“指導(dǎo)方針”。

16原則既囊括了AI助理生成回答的理想質(zhì)量,還有AI助理得到答案的行為背后的規(guī)則組成。

實際上下文學(xué)習(xí)(ICL、in-context learning)工作流程中,AI助理到底是怎么生成遵守原則的回答呢?

研究團隊選擇的辦法是每次生成回答時,讓AI助理查詢相同的示例集,代替以前工作流程中所需的不同人類標注示例集。

接著提示LLM生成新主題,并在刪除重復(fù)主題后,讓LLM生成新的指令及與指定指令類型和主題相對應(yīng)的新指令。

基于16原則、ICL范例和*階段的Self-Instruct,觸發(fā)AI助理背后LLM的匹配規(guī)則。

一旦檢測到生成內(nèi)容有害或不合規(guī),就拒絕吐出生成的內(nèi)容。

第三階段,Principle Engraving。

這個階段的主要任務(wù)是在自對齊回答上,微調(diào)原始LLM。這里所需的自對齊回答,是LLM通過自我提示生成的。

與此同時,還對微調(diào)后的LLM進行了原則和演示的剪枝。

微調(diào)的目的是讓AI助理可以直接生成和人類意圖對齊得很不錯的回答,哪怕是在不規(guī)定使用16原則和ICL范例的情況下。

值得一提的是,由于模型參數(shù)的共享性,所以AI助理生成的回復(fù)在各式各樣不同的問題上都能實現(xiàn)對齊。

第四階段,Verbose Cloning。

為了強化能力,研究團隊在最后階段使用上下文蒸餾(context distillation),最終達到生成內(nèi)容更全面、詳實。

經(jīng)典流程(InstructGPT)與SELF-ALIGN的四個階段對比

來看一個最直觀的表格,它包含了近期閉源/開源的AI助理所使用的監(jiān)督方法

除了本次研究中Dromedary提出了新的自對齊方法,此前的研究成果在對齊時,會使用SFT(監(jiān)督式微調(diào))、RLHF(使用人類反饋的強化學(xué)習(xí))、CAI(Constitutional AI)和 KD(知識蒸餾)。

可以看到,之前的AI助理,如InstructGPT或Alpaca等至少需要5萬條人類標注。

但是,整個SELF-ALIGN過程必需的注釋量,是少于300行(包括195個種子prompt,16個原則和5個范例)的。

背后團隊

Dromedary背后的團隊,來自IBM研究院MIT-IBM Watson AI Lab、CMU LTI(語言技術(shù)研究所)、馬薩諸塞大學(xué)阿默斯特分校。

IBM研究院MIT-IBM Watson AI Lab成立于2017年,是MIT和IBM研究院合作的科學(xué)家社區(qū)。

主要與全球組織合作,圍繞AI展開研究,致力于推動AI前沿進展,并將突破轉(zhuǎn)化為現(xiàn)實影響。

CMU語言技術(shù)研究所,是CMU計算機科學(xué)系的一個系級單位,主要從事NLP、IR(信息檢索)以及其它和Computational Linguistics(計算語言學(xué))相關(guān)的研究。

馬薩諸塞大學(xué)阿默斯特分校則是麻省大學(xué)系統(tǒng)的旗艦校區(qū),屬于研究型大學(xué)。

Dromedary背后論文的一作,Zhiqing Sun,目前CMU博士在讀,本科畢業(yè)于北京大學(xué)。

略搞笑的事是,他在實驗中問AI自己的基本信息,各路AI都是會在沒有數(shù)據(jù)的情況瞎編一段。

對此,他也無可奈何,只得寫進論文中的失敗案例:

真是笑不活了哈哈哈哈哈哈哈哈哈!!!

看來AI一本正經(jīng)胡說八道這個問題,還需要新的方法來解決。

參考鏈接:[1]https://arxiv.org/pdf/2305.03047.pdf[2]https://arxiv.org/pdf/2212.10560.pdf[3]https://www.cs.cmu.edu/~zhiqings/[4]https://huggingface.co/zhiqings/dromedary-65b-lora-delta-v0

關(guān)鍵詞:
責(zé)任編輯:hn1007
中文字幕一区二区不卡_国产精品久久久久久久岛一牛影视_亚洲老司机在线_91久久精品美女高潮_精品国产一区二区精华_久久精品99久久久_91在线看www_国产精品污www在线观看_99久久精品免费看国产_亚洲成人av在线
成人网页在线观看| 日产国产欧美视频一区精品| 制服丝袜一区二区三区| 色婷婷久久一区二区三区麻豆| 日韩国产精品91| 日韩福利视频网| 偷窥国产亚洲免费视频| 亚洲午夜精品网| 日本亚洲天堂网| 激情五月婷婷综合| 国产成人免费视频网站 | 色狠狠综合天天综合综合| 99国产精品久久久久久久久久 | 国产一区欧美二区| 成人性色生活片免费看爆迷你毛片| 久久国产日韩欧美精品| 国产成人自拍网| 99久久99久久精品国产片果冻| 色婷婷综合久久| 日韩精品一区二区三区在线| 日本一区免费视频| 亚洲综合成人在线视频| 麻豆成人久久精品二区三区红 | 成人免费毛片高清视频| 日本韩国精品一区二区在线观看| 欧美视频完全免费看| 日韩欧美一级片| ...中文天堂在线一区| 午夜在线电影亚洲一区| 国产超碰在线一区| 9191久久久久久久久久久| 国产欧美一区二区三区沐欲| 亚洲小说欧美激情另类| 国产精品一区二区久激情瑜伽| 在线观看亚洲精品视频| 久久久久久影视| 日韩精品电影一区亚洲| 91亚洲精品一区二区乱码| 欧美成人艳星乳罩| 亚洲国产aⅴ天堂久久| 成人免费视频视频| 精品国产乱子伦一区| 亚洲尤物视频在线| 99久久精品国产毛片| xnxx国产精品| 蜜桃视频在线观看一区| 欧美日韩你懂的| 亚洲日本在线视频观看| 成人免费视频国产在线观看| 久久久久青草大香线综合精品| 免费一级片91| 欧美一区二区不卡视频| 午夜精品免费在线观看| 欧美日韩精品欧美日韩精品 | 精品一区二区日韩| 欧美一级高清片| 日韩激情视频在线观看| 欧美高清视频www夜色资源网| 一区二区在线观看视频| av影院午夜一区| 中文字幕在线播放不卡一区| 成人免费视频app| 中文字幕人成不卡一区| 成人黄色综合网站| 亚洲色图欧洲色图婷婷| 日本韩国欧美一区二区三区| 一区二区三区在线播放| 欧美色图12p| 热久久一区二区| 精品久久国产字幕高潮| 国产精品亚洲午夜一区二区三区 | 午夜欧美电影在线观看| 欧美一级生活片| 国产乱码精品一区二区三| 国产日产欧美一区| 色综合中文字幕国产| 亚洲成av人片在线观看无码| 日韩一区二区免费高清| 国产东北露脸精品视频| 亚洲人成在线观看一区二区| 欧美影片第一页| 久久99精品国产麻豆婷婷洗澡| 久久嫩草精品久久久精品| 99久久精品国产精品久久| 亚洲国产视频在线| 久久影院视频免费| 一本大道av一区二区在线播放| 亚洲r级在线视频| 久久久久久久综合日本| 日本福利一区二区| 精品一区二区影视| 亚洲日本一区二区| 久久久www成人免费无遮挡大片| 91亚洲国产成人精品一区二三| 天天影视涩香欲综合网| 中文字幕 久热精品 视频在线| 欧美日韩国产综合一区二区三区 | 成人av网址在线| 日韩成人一区二区三区在线观看| 中文字幕第一区| 日韩欧美一区二区视频| 在线观看亚洲一区| 成年人国产精品| 国产盗摄一区二区三区| 视频一区中文字幕国产| 一区二区三区中文在线观看| 久久久久久97三级| 日韩一卡二卡三卡| 56国语精品自产拍在线观看| 91麻豆福利精品推荐| 成人晚上爱看视频| 大胆亚洲人体视频| 国产激情精品久久久第一区二区| 美女尤物国产一区| 免费在线欧美视频| 日韩 欧美一区二区三区| 一区二区三区不卡视频在线观看| 亚洲欧洲一区二区三区| 中文字幕亚洲不卡| 亚洲欧美日韩综合aⅴ视频| 国产精品久久毛片a| 国产精品美女一区二区| 国产精品亲子伦对白| 国产精品久久久久天堂| 国产精品福利一区| ...av二区三区久久精品| 国产精品电影一区二区三区| 国产精品久久久久四虎| 国产精品素人视频| 一区二区三区在线观看国产| 亚洲国产日韩在线一区模特| 一区二区三区精品视频| 午夜精品一区在线观看| 久久91精品久久久久久秒播| 国产自产高清不卡| www.亚洲免费av| 欧美综合一区二区| 日韩一级成人av| 欧美激情一区二区三区四区| 中文字幕制服丝袜一区二区三区| 亚洲女厕所小便bbb| 亚洲r级在线视频| 国产一区二区网址| 色婷婷精品大在线视频| 欧美精品少妇一区二区三区| 欧美不卡视频一区| 中文字幕视频一区| 麻豆91精品视频| 成人av电影免费观看| 欧美午夜一区二区| 国产无遮挡一区二区三区毛片日本| 国产精品三级视频| 日韩成人免费看| av中文字幕在线不卡| 4438x亚洲最大成人网| 国产日韩欧美精品综合| 亚洲最大的成人av| 国产麻豆视频精品| 91精品国产91久久久久久一区二区 | 精品久久一区二区| 亚洲精品日日夜夜| 激情av综合网| 欧美欧美欧美欧美首页| 亚洲欧洲日本在线| 国产精品911| 欧美一级理论性理论a| 一区二区三区在线观看动漫| 成人免费观看男女羞羞视频| 欧美va在线播放| 日韩国产一二三区| 在线观看国产精品网站| 亚洲同性gay激情无套| 国产乱人伦偷精品视频免下载| 91麻豆精品91久久久久久清纯| 一区二区三区免费在线观看| 99在线热播精品免费| 日本一区二区三区高清不卡| 精品系列免费在线观看| 91精品国产高清一区二区三区| 亚洲已满18点击进入久久| 一本色道a无线码一区v| 中文字幕一区二区日韩精品绯色| 国产91丝袜在线播放九色| 久久天天做天天爱综合色| 久久国产福利国产秒拍| 精品久久久久久久一区二区蜜臀| 日本vs亚洲vs韩国一区三区二区 | 国产激情视频一区二区在线观看| 日韩精品一区二区三区三区免费| 日韩电影在线免费观看| 欧美裸体一区二区三区| 男男视频亚洲欧美| 久久久久久久免费视频了| 国产不卡视频在线观看| 亚洲视频狠狠干| 欧美美女一区二区在线观看| 美女一区二区久久| 国产精品乱码妇女bbbb| 在线观看中文字幕不卡| 久久国产视频网|