新华财经上海12月22日电(记者杜康)2023年被不少人认为是“大模型元年”。大模型浪潮下,也催生出了数据计算“新物种”。随着数据的爆炸性增长和用户对更高级查询和分析的需求,传统数据库系统面临挑战。当大语言模型遇到数据库会带来哪些改变,记者近日专访了拓数派创始人兼CEO冯雷。
拓数派成立于2021年,由冯雷在腾讯产业基金支持下设立,成立之初估值已达到1亿美元“准独角兽”级别。冯雷此前也是Pivotal(中国)的创始人兼总经理,曾带领团队将旗下Greenplum打造成为全球明星开源数据库。这也是拓数派被行业看好的原因之一。Pivotal被认为是云原生概念提出的“鼻祖”,目前在纽约证券交易所上市。
何为大模型数据计算“新物种”?冯雷表示,数据库是现代信息系统的核心组成部分,用于存储、管理和检索大量结构化和非结构化数据。数据的爆炸性增长和用户对更高级查询和分析的需求,对传统数据库系统面临着挑战。大模型赋予了数据计算新的可能。
“‘大模型+数据库’可以产生‘1+1>2’的效果。”冯雷表示,借助大语言模型的语言理解和生成能力,数据库的使用和管理将变得更加便捷和智能化;数据库则提供了高质量的数据集与高效的数据管理来支持大型语言模型的训练和应用。数据库与大模型结合正在成为行业发展的一大趋势。
目前拓数派已经发布了“大模型数据计算系统”。谈及“大模型数据计算系统”与传统数据系统的区别,冯雷介绍,大模型的高算力使得数据之间规律和关联的挖掘更加充分。在大模型数据计算系统中,训练完的模型形成新的计算规则可以再迭代加入到数据计算系统之中,这个过程将持续,无限探索AI智能。
拓数派“大模型数据计算系统”已应用于金融、汽车、制造及医疗等行业。以拓数派为上汽打造的云数据底座为例,有效提升产品创新和车联数据应用能力。该案例也获得了上海市“智慧工匠”工业软件创新案例奖。据悉,新的“云数据底座”运用数仓虚拟化技术有效控制了运维成本和后期扩容成本,统计分析报表也从“T+1”提升至“T+0”,数据分析性能提升30倍。
(文章来源:新华财经)