字节跳动发布豆包视觉理解、3D生成等新模型加速多模态应用落地

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

字节跳动发布豆包视觉理解、3D生成等新模型加速多模态应用落地

2024年12月18日 16:40

来源：证券日报

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　本报讯（记者袁传玺）12月18日，北京字节跳动科技有限公司（以下简称“字节跳动”）正式发布豆包视觉理解模型，为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘，一元钱就可处理284张720P的图片，比行业价格便宜85%，以更低成本推动AI技术普惠和应用发展。

　　据火山引擎总裁谭待介绍，豆包视觉理解模型不仅能精准识别视觉内容，还具备出色的理解和推理能力，可根据图像信息进行复杂的逻辑计算，完成分析图表、处理代码、解答学科问题等任务。此外，该模型有着细腻的视觉描述和创作能力。

　　此前，豆包视觉理解模型已经接入豆包App和PC端产品。豆包战略研究负责人周昊表示：“豆包一直在努力，让用户的输入更快更方便。”为此，豆包产品非常注重多模态的输入和打磨，包括语音、视觉等能力，这些模型都已通过火山引擎开放给企业客户。

　　同时，豆包3D生成模型也首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用，可以高效完成智能训练、数据合成和数字资产制作，成为一套支持AIGC创作的物理世界仿真模拟器。

　　豆包大模型多款产品也迎来重要更新：豆包通用模型pro已全面对齐GPT-4o，使用价格仅为后者的1/8；音乐模型从生成60秒的简单结构，升级到生成3分钟的完整作品；文生图模型2.1版本，更是在业界首次实现精准生成汉字和一句话P图的产品化能力，该模型已接入即梦AI和豆包App。

　　事实上，大模型应用正在向各行各业加速渗透。据悉，豆包大模型已经与八成主流汽车品牌合作，并接入到多家手机、PC等智能终端，覆盖终端设备约3亿台，来自智能终端的豆包大模型调用量在半年时间内增长100倍。

　　与企业生产力相关的场景，豆包大模型也获得了众多企业客户青睐：最近3个月，豆包大模型在信息处理场景的调用量增长了39倍，客服与销售场景增长16倍，硬件终端场景增长13倍，AI工具场景增长9倍，学习教育等场景也有大幅增长。

　　谭待表示：“今年是大模型高速发展的一年。当你看到一列高速行驶的列车，最重要的事就是确保自己要登上这趟列车。通过AI云原生和豆包大模型家族，火山引擎希望帮助企业做好AI创新，驶向更美好的未来。”

（文章来源：证券日报）

文章来源：证券日报责任编辑：126

原标题：字节跳动发布豆包视觉理解、3D生成等新模型加速多模态应用落地

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信

沪股通

深股通

港股通(沪)

港股通(深)

热门资讯

焦点专题

2024世界动力电池大会

卫星互联网迎高速发展

视频

一键关注财经大咖

热点推荐

美联储2024年年度利率决议收官美股三大指数下跌

东方财富Choice数据

59 人评论 2024-12-19