日韩欧美自拍偷拍,色偷偷色偷偷色偷偷在线视频,亚洲婷婷在线,www.欧美精品

您當(dāng)前的位置 :環(huán)球傳媒網(wǎng)>資訊 > 正文
【它真來了嗎?RulaiGPT:如~來~】訓(xùn)練一個如來GPT,發(fā)現(xiàn)事情并沒有那么簡單...-世界微資訊
2023-07-02 10:41:48 來源:嗶哩嗶哩 編輯:

最近“如來”話術(shù)非常之火啊,看一次笑一次,不懂這個梗的朋友們可以回顧一下:?

【如來原版】


【資料圖】

那么,我們能讓 GPT也學(xué)會 如來話術(shù)嗎?思路其實很簡單,只要我們把那些經(jīng)典語錄讓 GPT 學(xué)習(xí)學(xué)習(xí)。筆者自己做了些實驗,還確實訓(xùn)練處理一個馬馬虎虎的 「如來GPT」,雖然泛化性能并不好。不過整個實驗過程還是挺有意思,這里分享出來,在結(jié)尾我還提出了一些值得探索的點,希望有興趣的朋友一起討論!

這個小項目是基于我最近的一個Github —— LLM-Tuning實現(xiàn)的,本文涉及到的相關(guān)的代碼、數(shù)據(jù)集、教程都在倉庫里,建議點個Star??后配合本文食用:

項目地址:

/beyondguo/LLM-Tuning

一、數(shù)據(jù)準(zhǔn)備

我們從網(wǎng)上先收集最基本的“如來話術(shù)”:

{"q":"問:中國人認(rèn)為宇宙萬法的那個源頭,它是什么","a":"答:它是如如"}{"q":"問:我說如來,他真來了嗎","a":"答:如來"}{"q":"問:我經(jīng)常說如來這個詞有秘密,如來、如來了嗎?","a":"答:如來~"}{"q":"問:到底來沒來?","a":"答:如來~"}{"q":"問:如來是什么意思?","a":"答:來了又好像沒來,沒來又好像來了"}

當(dāng)然,這些是肯定不夠的,所以我們要做一些數(shù)據(jù)增強,這里我們可以直接使用 ChatGPT 來幫我們做增強:

例如,我給 ChatGPT 這樣的 instruction:

{"q":"問:到底來沒來?","a":"答:如來~"}請把問題q改寫10次,然后返回。每一行一個json(不要換行),共10行。

就會得到:

{"q":?"問:是否已經(jīng)到達?",?"a":?"答:如來~"}{"q":?"問:是否已經(jīng)抵達?",?"a":?"答:如來~"}{"q":?"問:是否已經(jīng)來了?",?"a":?"答:如來~"}{"q":?"問:到底到了沒有?",?"a":?"答:如來~"}{"q":?"問:是否已經(jīng)到場?",?"a":?"答:如來~"}{"q":?"問:是否已經(jīng)現(xiàn)身?",?"a":?"答:如來~"}{"q":?"問:是否已經(jīng)抵京?",?"a":?"答:如來~"}{"q":?"問:是否已經(jīng)到達目的地?",?"a":?"答:如來~"}{"q":?"問:是否已經(jīng)抵達所在地?",?"a":?"答:如來~"}{"q":?"問:到底有沒有來?",?"a":?"答:如來~"}

通過這樣的方法,我們對上述每個話術(shù),都做數(shù)據(jù)增強。當(dāng)然,我們還可以手動添加一些其他的擾動。文件rulai_中展示了我數(shù)據(jù)增強之后的語料。

二、讓模型學(xué)習(xí)“如來話術(shù)”

這里我們采用 baichuan-7B作為基座,來訓(xùn)練這個模型。這是因為 baichuan-7B 本身沒有經(jīng)過 chat 式的訓(xùn)練,所以我們可以更好地觀察模型是否真的學(xué)到了新的話術(shù)。

分詞:

#?_VISIBLE_DEVICES=0?python?tokenize_dataset_?\????--model_checkpoint?baichuan-inc/baichuan-7B?\????--input_file?rulai_?\????--prompt_key?q?\????--target_key?a?\????--save_name?rulai_baichuan-7B?\????--max_seq_length?2000?\????--skip_overlength?False

LoRA 訓(xùn)練:

#?_VISIBLE_DEVICES=0,1,2,3?python?baichuan_lora_?\????--tokenized_dataset?rulai_baichuan-7B?\????--lora_rank?4?\????--per_device_train_batch_size?16?\????--gradient_accumulation_steps?1?\????--num_train_epochs?3?\????--save_steps?200?\????--save_total_limit?2?\????--learning_rate?1e-4?\????--fp16?\????--remove_unused_columns?false?\????--logging_steps?50?\????--output_dir?weights/rulai_baichuan-7B

我這里將上述訓(xùn)練好的模型,稱之為 RulaiGPT_v0,即最初始的版本。

測一測咱們的 RulaiGPT:

效果

例子1:

輸入:我說如來,誒,他到底來沒來?

baichuan-7B輸出:來了。我又說,你咋知道的呢?他說,你看啊!

RulaiGPT_v0輸出:如來

例子2:

輸入:他到底來沒來???

baichuan-7B輸出:來了,但不是我想要的那個。

RulaiGPT_v0輸出:如~來~

三、完了,它只會“如來”了,咋辦?【拯救災(zāi)難性遺忘】

如果全部的訓(xùn)練語料都是這些如來話術(shù),可能會讓模型只會講這些話:你問它“我睡不著咋辦?”,他回復(fù)“如來~”;你問他“你是誰開發(fā)的?”,他也說“如來”。。。這就很尷尬了,相當(dāng)于學(xué)廢了。

例子:

輸入:我睡不著!

baichuan-7B輸出:你該吃藥了。失眠,是現(xiàn)代人最常見的睡眠障礙。......

RulaiGPT_v0輸出:如來~

本質(zhì)上,這是一個“災(zāi)難性遺忘”的問題,我們給的如來語聊對原始的概率分布造成了太大了影響,所以你問啥這個GPT都覺得回答“如來”是最有可能的。

我們希望模型還能做一些其他的正常對話,所以我做了下面的兩個嘗試:

1. 將如來話術(shù),跟正常的對話進行混合,得到新的訓(xùn)練語料。然后使用這個語料重新訓(xùn)練 LoRA。【記為 RulaiGPT_v1

我這里直接采用的是ChatBaichuan-HC3 項目中的語料(一萬多條),跟rulai_(不到一百條)拼湊成 rulai_文件(為了節(jié)省GitHub repo空間,這個大家自行構(gòu)造,就是兩個json文件合并)。

使用該數(shù)據(jù),重新訓(xùn)練。

訓(xùn)練完之后,我發(fā)現(xiàn),模型可以正常對話了,但是“如來”話術(shù)又不太會了...

例子(正常對話):

輸入:我睡不著!

baichuan-7B輸出:你該吃藥了。失眠,是現(xiàn)代人最常見的睡眠障礙。......

RulaiGPT_v0輸出:如來~

RulaiGPT_v1輸出:很抱歉,您的問題沒有描述清楚。請?zhí)峁└嘈畔⒒騿栴}細(xì)節(jié),我會盡力幫助您解決問題。<-- 可以正常對話了

例子(如來之謎):

輸入:他到底來沒來???

baichuan-7B輸出:來了,但不是我想要的那個。

RulaiGPT_v0輸出:如~來~

RulaiGPT_v1輸出:我不知道你所說的"如來"是誰。如果你能告訴我更多關(guān)于這個人的信息,我會盡力幫助你的。<-- 但如來話術(shù)又不會了...

猜測是因為微調(diào)語料中的如來語料占比太少,模型記不太住,這就陷入了兩難的境地。

于是我做了第二個嘗試:

2. 在上一步的基礎(chǔ)上,讓模型把如來話術(shù)再“復(fù)習(xí)”一次,同時混入部分正常話術(shù),防止再次災(zāi)難性遺忘。【記為 RulaiGPT_v2

為了不浪費前面訓(xùn)練的擁有了基礎(chǔ)對話能力的 RulaiGPT_v1, 我這里在它的基礎(chǔ)上繼續(xù)訓(xùn)練,復(fù)習(xí)一下之前學(xué)過的如來話術(shù)。

但是,單純復(fù)習(xí)如來話術(shù),再次導(dǎo)致災(zāi)難性遺忘的風(fēng)險又比較大,所以我同時混入部分正常話術(shù),實例如下:

{"q":?"你能給我解答一下宇宙萬物的根基是什么嗎?",?"a":?"它是如如"}{"q":?"我經(jīng)常說如來這個詞有秘密,如來、如來了嗎?",?"a":?"如來~"}{"q":?"問:為什么英國人不反對英國每年花這么多納稅人的錢養(yǎng)王室?...",?"a":?"答:英國王室在英國的歷史中扮演了重要的角色,雖然它現(xiàn)在的職能可能不如以前那么重要,..."}{"q":?"問:實習(xí)生遭遇辦公室政治,怎么辦?...",?"a":?"答:辦公室政治可能會對實習(xí)生造成負(fù)面影響,所以你應(yīng)該盡力避免被卷入其中。..."}

完整數(shù)據(jù)見文件夾中的 rulai_文件。

為了在上一步的 LoRA 模型上繼續(xù)訓(xùn)練,我們可以在 中直接添加 --previous_lora_weights參數(shù),來指定之前訓(xùn)練好的 LoRA 參數(shù),從而讓模型繼續(xù)訓(xùn)練,而不是重新訓(xùn)練一個 LoRA。(參考了PEFT庫中的LoRA繼續(xù)訓(xùn)練的討論)

另外,為了進一步降低災(zāi)難性遺忘的風(fēng)險,我把learning_rate降低到了1e-5,batch 降為1,讓模型繼續(xù)訓(xùn)練5輪。

經(jīng)過了這樣的“復(fù)習(xí)”之后,模型終于馬馬虎虎既能正常對話,又能跟你聊如來了:

RulaiGPT_v2效果展示:

總的來說,其實離我的預(yù)期還是差得很遠,但目前還沒想到好的解決辦法,只能說想要掌握如來的奧秘,并沒有那么簡單吧~

我個人覺得有以下幾個地方值得探索:

在構(gòu)造QA語料的時候,到底加不加“問:”,“答:”這樣顯式的模板呢?

怎樣的數(shù)據(jù),容易導(dǎo)致模型災(zāi)難性遺忘?

LoRA 微調(diào)時如何緩解災(zāi)難性遺忘?

如何平衡“記住新知識”和“災(zāi)難性遺忘”兩方面?

大家有什么想法歡迎來評論區(qū)討論,或者來我的Github項目的discussion區(qū)討論哦!

項目地址:

關(guān)鍵詞:

相關(guān)閱讀
分享到:
版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。

Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環(huán)球傳媒網(wǎng)-重新發(fā)現(xiàn)生活版權(quán)所有 聯(lián)系郵箱:8553 591@qq.com
日韩欧美自拍偷拍,色偷偷色偷偷色偷偷在线视频,亚洲婷婷在线,www.欧美精品
日韩精品中文字幕在线不卡尤物| 亚洲综合免费观看高清完整版| 一本大道综合伊人精品热热| 免费一区二区三区在在线视频| 99国产视频| av亚洲精华国产精华精华| 国产成人免费av在线| 激情久久五月天| 毛片av一区二区| 日韩经典中文字幕一区| 亚洲一区二区三区视频在线| 悠悠色在线精品| 亚洲黄色小视频| 亚洲裸体在线观看| 亚洲人成小说网站色在线| 国产精品进线69影院| 国产精品嫩草99a| 国产精品久久777777| 国产精品毛片高清在线完整版| 国产日产欧美一区二区三区| 欧美高清在线精品一区| 国产精品久久久久一区| 综合久久久久久久| 欧美一级欧美三级| 日韩精品一区二区三区在线观看| 精品国产制服丝袜高跟| 欧美国产一区二区在线观看| 国产精品高潮呻吟| 亚洲精品免费一二三区| 亚洲国产欧美另类丝袜| 日本va欧美va欧美va精品| 久久er精品视频| 国产电影一区二区三区| 99久久精品国产一区二区三区| 7777精品伊久久久大香线蕉语言 | 久久久久久久久久久久电影 | 亚洲老妇xxxxxx| 亚洲综合色噜噜狠狠| 亚洲va欧美va国产va天堂影院| 亚洲gay无套男同| 美女一区二区视频| 国产精品一区二区果冻传媒| 成人av在线资源网| 国产经典一区二区三区| 欧美国产一二三区| 一区二区三区国产福利| 欧美日韩一区二区不卡| 精品噜噜噜噜久久久久久久久试看| 久久久亚洲高清| 亚洲天堂福利av| 三级欧美韩日大片在线看| 国产在线视频一区二区三区| 97精品久久久久中文字幕 | 国产日韩欧美精品电影三级在线| 国产精品不卡一区| 偷拍一区二区三区四区| 国产一区二区三区美女| 91传媒视频免费| 水蜜桃亚洲一二三四在线| 亚洲三区四区| 91精品国产福利在线观看| 国产欧美日韩精品一区| 亚洲一区二区在线视频| 狠狠色丁香久久婷婷综| av资源一区二区| 天天爽天天狠久久久| 欧美精品日韩一本| 久久精品男人的天堂| 亚洲主播在线观看| 国产乱子伦视频一区二区三区 | 青青草原综合久久大伊人精品 | 色香蕉成人二区免费| 欧美一级二级在线观看| 国产精品福利av| 免费黄网站欧美| 99久久综合精品| 欧美一卡2卡3卡4卡无卡免费观看水多多| 色国产精品一区在线观看| 精品少妇一区二区三区 | 日韩精品成人一区二区三区| 天天综合网天天综合色| 成人免费毛片app| 免费一区二区三区在在线视频| 欧美中文一区二区三区| 国产亚洲综合在线| 免费视频一区二区| 成人毛片网站| 欧洲日韩一区二区三区| 国产日韩视频一区二区三区| 亚洲国产日韩a在线播放| 成人性视频网站| 欧美日韩精品综合| 7777精品伊人久久久大香线蕉经典版下载 | 玖玖九九国产精品| av成人观看| 欧美在线影院一区二区| 国产精品拍天天在线| 激情五月婷婷综合| 麻豆av一区| 日韩欧美成人一区二区| 亚洲国产欧美日韩另类综合| 国内外精品视频| 精品国产综合久久| 91精品国产综合久久久久久久| 一区二区三区在线视频免费| 成人在线视频一区| 亚洲日本精品一区| 国产三级精品三级在线专区| 免费成人你懂的| 久久综合中文色婷婷| 精品日韩一区二区| 免费在线欧美视频| 欧美福利精品| 2020国产成人综合网| 日韩中文字幕一区二区三区| 国产成人免费观看| 91精品国产高清一区二区三区 | 一区二区三区国产福利| 亚洲国产精品成人久久综合一区| 久久66热re国产| 欧美一区二区三区精美影视| 欧美大片拔萝卜| 日韩va欧美va亚洲va久久| 国产精品国模大尺度私拍| 91精品国产综合久久久久久久| 亚洲图片欧美一区| 成人综合电影| 日韩一区二区三区四区五区六区| 亚洲第四色夜色| wwwxx欧美| 日韩欧美国产一区二区三区| 日本不卡高清视频| 日本一区二区三区精品视频| 久久久精品国产99久久精品芒果 | 成人午夜视频免费看| 日本道免费精品一区二区三区| 日韩美女久久久| 1区1区3区4区产品乱码芒果精品| 欧美日韩三级视频| 亚洲国产精品久久艾草纯爱| 国产精品免费一区二区三区四区| 日韩午夜激情av| 久久99精品久久久久久| 一区二区成人国产精品| 亚洲乱码国产乱码精品精98午夜 | 成人免费毛片aaaaa**| 精品视频在线免费看| 天堂av在线一区| 免费在线国产精品| 欧美韩国一区二区| av亚洲精华国产精华精华 | 久久综合九色综合97_久久久| 国产一区福利在线| 欧美视频中文一区二区三区在线观看| 亚洲综合一二三区| 国内一区二区在线视频观看 | 99久久99久久精品国产片果冻| 欧美精品日韩一区| 久色婷婷小香蕉久久| 中文字幕日韩一区二区三区不卡 | 六月丁香综合在线视频| 国产日韩欧美综合精品| 久久久久久久久久久久久夜| 成人免费看黄yyy456| 在线播放一区二区三区| 久久99国产精品麻豆| 在线精品视频一区二区| 视频精品一区二区| 亚洲一区不卡在线| 亚洲电影一级片| 日韩国产伦理| 一级女性全黄久久生活片免费| 蜜桃av噜噜一区二区三| 中文字幕亚洲一区二区av在线| 国产精品9999久久久久仙踪林| 久久只精品国产| a级精品国产片在线观看| 精品免费日韩av| 成人精品视频一区二区三区| 日韩午夜三级在线| 成人网男人的天堂| 精品久久人人做人人爱| 成人黄色软件下载| 2024国产精品| 国产高清自拍一区| 最新国产精品久久精品| 久久精品日产第一区二区三区| 日韩毛片精品高清免费| 乱一区二区三区在线播放| 亚洲欧美日本在线| 日本一区二区三区www| 亚洲大片免费看| 色香色香欲天天天影视综合网| 国产精品美女久久久久aⅴ | 欧美酷刑日本凌虐凌虐| 国产激情一区二区三区| 精品久久一区二区| 99国产高清| 亚洲人成网站影音先锋播放| 日韩亚洲欧美精品|