去年六月,韩国政府发起了一项竞赛,旨在开发基于韩国技术的全新独立人工智能模型。在目前由中美科技企业主导的全球AI格局下,此类本土工具对确保韩国技术自主至关重要。
然而最新的实践证明,想要“独立自主”地实现这一点远非易事……
财联社去年8月曾介绍过,韩国科学技术信息通信部当时宣布,已选定5支精锐团队参与“自主AI基础模型”项目,分别是Naver Cloud、Upstage、SK Telecom、NC AI和LG AI研究院。
然而,在这场为期三年打造韩国“AI国家队”的竞赛中,五家入围企业中已有三家目前被发现,至少使用了部分外国人工智能模型的开源代码——尤其是中国模型的代码。
相关企业和人工智能专家辩称,完全摒弃现有AI开源模型,并试图从零开始构建一切的做法毫无意义。
哈佛大学电气工程教授Gu-Yeon Wei指出,要求人工智能模型开发过程中所有代码均由本国编写并不现实。他熟悉韩国此次AI竞赛的情况,但未直接参与任何参赛企业。Wei表示,“放弃开源软件,就意味着放弃巨大的利益。”
但另一些韩国业界人士则指出,任何使用外国工具的行为都可能带来潜在的安全风险,并削弱培育真正属于本国人工智能模型的希望。
目前,在全球范围内,各国正日益寻求降低对外依赖,并提升自身在人工智能领域的自主能力——这项技术可能深刻影响其经济竞争力和国家安全。而拥有众多芯片巨头、软件公司及政治支持的韩国,已成为所谓“主权人工智能”最积极的倡导者之一。
智谱、阿里、DeepSeek成了韩国模型“效仿”对象?
据悉,近期率先引发争议的,是入围“五强”决赛圈的Upstage公司。
其竞争对手Sionic AI的首席执行官指出,Upstage公司的AI模型部分组件与智谱AI的开源模型存在相似之处,且部分代码中仍保留着智谱AI的版权标记。
“令人深感遗憾的是,一个疑似基于中国模型微调的版本竟被提交至(韩国)纳税人资助的项目中,”Sionic首席执行官Ko Suk-hyun在领英发文写道。Sionic虽也参与了这场韩国AI竞赛,但未能进入决赛圈名单。
对此,Upstage举行了一场直播验证,分享了其开发日志,以证明其模型是使用自己的方法从空白状态开发和训练的。不过,用于运行模型的推理代码,确实使用了源自智谱AI的部分开源组件——当然,这些开源组件在全球范围内本身已被广泛使用。
这一审查此后也引发了对其他决赛圈入围者的更严密审视。
据悉,Naver的AI模型被指控其视觉和音频编码器,与中国阿里巴巴和OpenAI的产品有相似之处。
SK Telecom也面临批评,被指其运行AI模型的推理代码与中国初创公司DeepSeek的模型代码相似。
Naver随后承认使用外部编码器,但称采用标准化技术是战略决策,并强调模型核心引擎(决定其学习与训练方式)完全由公司自主研发;SK Telecom也提出了类似辩解,着重强调其模型核心的独立性。
据悉,韩国的这场“AI国家队”选拔,旨在到2027年选出两家本土胜出企业——其AI模型性能需达到OpenAI或谷歌等行业领军者的95%以上水平。获胜企业将获得政府资金支持用于数据采集和人才招聘,并可优先获取政府采购的AI计算专用芯片。按原定计划,韩国政府将在本周从五家决赛入围者中淘汰一家。
值得一提的是,此次韩国AI模型竞赛的规则本身,并未明确规定是否允许使用外国企业的开源代码。负责监督竞赛的韩国科学技术部在争议爆发后未发布新指南。韩国副总理兼科学技术信息通信部长官裴庆勋则对围绕该起事件的激烈辩论表示欢迎。
“目睹当前人工智能产业掀起的技术论战,我反而看到了韩国人工智能的光明前景,”裴庆勋本月早些时候在社交媒体发文称。
首尔国立大学人工智能研究院院长Jae W. Lee对此表示,人工智能模型是通过设定和微调内部数值来生成输出结果的,而那些受到质疑的决赛圈入围者模型中,这些核心任务似乎并未依赖外国工具。
(文章来源:财联社)