OpenAI上新,发现ChatGPT代码输出错误的大模型来了!
美东时间6月27日周四,OpenAI公布,研究人员训练了一个基于GPT-4的模型名为 CriticGPT,用于捕捉ChatGPT 代码输出中的错误。据介绍,CriticGPT 旨在使用“从人类反馈中强化学习(RLHF)”的技术来训练、改进GPT-4的回答,以协助人类AI训练员完成工作。
(文章来源:第一财经)
美东时间6月27日周四,OpenAI公布,研究人员训练了一个基于GPT-4的模型名为 CriticGPT,用于捕捉ChatGPT 代码输出中的错误。据介绍,CriticGPT 旨在使用“从人类反馈中强化学习(RLHF)”的技术来训练、改进GPT-4的回答,以协助人类AI训练员完成工作。
(文章来源:第一财经)