設置
  • 日夜間
    隨系統
    淺色
    深色
  • 主題色

專(zhuān)給 ChatGPT“找茬”,OpenAI 訓練 CriticGPT 模型以檢索輸出內容錯誤

2024/6/28 7:10:36 來(lái)源:IT之家 作者:清源 責編:清源
感謝IT之家網(wǎng)友 烏蠅哥的左手 的線(xiàn)索投遞!

IT之家 6 月 28 日消息,當地時(shí)間 27 日,OpenAI 宣布基于 GPT-4 訓練了一個(gè)名為 CriticGPT 的模型,用于查找 ChatGPT 聊天機器人輸出內容中的錯誤。它可以撰寫(xiě)評論,強調 ChatGPT 生成答案中不準確的地方。

據介紹,CriticGPT 旨在協(xié)助人類(lèi) AI 訓練員完成工作 —— 使用一種名為“從人類(lèi)反饋中強化學(xué)習(IT之家注:Reinforcement Learning from Human Feedback,RLHF)”的技術(shù)來(lái)訓練、改進(jìn) GPT-4 的回答。

然而隨著(zhù) ChatGPT 的準確性日益提升,錯誤越來(lái)越隱蔽,導致 AI 訓練員的工作越來(lái)越“難做”。OpenAI 對此解釋稱(chēng),這是 RLHF 的基本局限之一 —— 模型逐漸變得比任何可以提供反饋的人都更博學(xué),模型的協(xié)調可能也會(huì )隨之變得越來(lái)越困難。

目前,當 CriticGPT 試圖從 ChatGPT 的回答中發(fā)現錯誤時(shí),它的一雙“鷹眼”就會(huì )發(fā)揮作用。OpenAI 指出,現實(shí)世界中的錯誤可能遍布答案的多個(gè)部分,這是 CriticGPT 未來(lái)需要解決的問(wèn)題?!拔覀兊墓ぷ髦攸c(diǎn)是可以在一個(gè)地方指出錯誤,但將來(lái)我們也需要解決分散的錯誤?!?/p>

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時(shí)間,結果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:CriticGPT,ChatGPT

軟媒旗下網(wǎng)站: IT之家 辣品 - 超值導購,優(yōu)惠券 最會(huì )買(mǎi) - 返利返現優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 魔方 酷點(diǎn)桌面 Win7優(yōu)化大師 Win10優(yōu)化大師 軟媒手機APP應用