训练中加入一条真实数据就可能阻止AI“胡言乱语”

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

训练中加入一条真实数据就可能阻止AI“胡言乱语”

2026年05月16日 07:58

来源：科技日报

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　当AI不断用自己生成的数据“喂养”自己，它就可能逐渐失去准确性，最终输出越来越多错误信息，甚至“胡言乱语”。英国伦敦国王学院领导的研究团队发现，只需在训练过程中加入哪怕一条来自真实世界的数据，就可能有效阻止这种被称为“模型崩塌”的现象。相关成果发表于新一期《物理评论快报》。

　　“模型崩塌”这一概念于2024年提出，指的是AI模型如果长期依赖自身生成的数据进行训练，模型性能会不断退化，最终输出失真内容。随着高质量人类文本数据逐渐接近枯竭，越来越多AI系统开始使用合成数据训练，这让模型崩塌风险进一步上升。

　　此次，团队通过分析一类被称为“指数族”的统计模型发现，在封闭循环训练（模型完全依赖自身生成数据学习）中，模型崩塌几乎不可避免。

　　研究显示，解决方法异常简单：只需在训练过程中加入一条来自外部世界的真实数据，哪怕其数量远远少于AI生成数据，也足以阻止模型性能持续退化，这种作用即使在机器生成数据数量无限增加时依然有效。

　　过去关于模型崩塌的研究多集中在大语言模型等复杂系统，由于其内部机制难以解释，错误来源也难以追踪，这也成为AI产生“幻觉”的原因之一。通过研究更简单的统计模型，科学家能够从数学上解释为何少量真实数据就能打破模型崩塌，从而为未来更复杂AI系统提供设计原则。

　　类似现象也存在于另一类名为“受限玻尔兹曼机”的机器学习模型中，表明这一规律可能具有更广泛适用性。下一步，他们计划将这一理论扩展到神经网络等更复杂的系统，以验证其在大语言模型中的实际效果。

（文章来源：科技日报）

文章来源：科技日报责任编辑：70

原标题：训练中加入一条真实数据就可能阻止AI“胡言乱语”

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信

沪股通

深股通

港股通(沪)

港股通(深)

热门资讯

焦点专题

OpenClaw刷屏

猪价刷新十余年低点

视频

一键关注财经大咖

热点推荐

消息人士：美以或最早下周恢复对伊朗军事行动

央视新闻客户端

666 人评论 2026-05-16