OpenAI新推理模型被曝产生更多幻觉
报道称,OpenAI发现,o3在PersonQA基准测试上回答33%的问题时产生了幻觉。这大约是OpenAI之前的推理模型o1和o3 mini幻觉率的两倍。o4 mini在PersonQA上的表现更差,48%的问题都出现了幻觉。AI研究员Neil Chowdhury认为,用于o系列模型的强化学习可能会放大幻觉问题。
(文章来源:科创板日报)
报道称,OpenAI发现,o3在PersonQA基准测试上回答33%的问题时产生了幻觉。这大约是OpenAI之前的推理模型o1和o3 mini幻觉率的两倍。o4 mini在PersonQA上的表现更差,48%的问题都出现了幻觉。AI研究员Neil Chowdhury认为,用于o系列模型的强化学习可能会放大幻觉问题。
(文章来源:科创板日报)