字节跳动发布豆包视觉了解、3D生成等新模型加快多模态运用落地

日期: 2024-12-19 11:24:46来源：石料破碎设备

本报讯(记者袁传玺)12月18日，北京字节跳动科技有限公司(以下简称“字节跳动”)正式对外发布豆包视觉了解模型，为公司能够供给极具性价比的多模态大模型才能。豆包视觉了解模型千tokens输入价格仅为3厘，一元钱就可处理284张720P的图片，比职业价格实惠公正85%，以更低本钱推进AI技能普惠和运用开展。

据火山引擎总裁谭待介绍，豆包视觉了解模型不仅能精准辨认视觉内容，还具有超卓的了解和推理才能，可根据图画信息进行杂乱的逻辑核算，完结剖析图表、处理代码、回答学科问题等使命。此外，该模型有着细腻的视觉描绘和创造才能。

此前，豆包视觉了解模型现已接入豆包App和PC端产品。豆包战略研究负责人周昊表明：“豆包一直在尽力，让用户的输入更快更便利。”为此，豆包产品很重视多模态的输入和打磨，包含语音、视觉等才能，这些模型都现已过火山引擎开放给企业客户。

一起，豆包3D生成模型也初次露脸。该模型与火山引擎数字孪生渠道veOmniverse结合运用，能够高效完结智能练习、数据组成和数字财物制造，成为一套支撑AIGC创造的物理国际仿真模拟器。

豆包大模型多款产品也迎来重要更新：豆包通用模型pro已全面对齐GPT-4o，运用价格仅为后者的1/8；音乐模型从生成60秒的简略结构，升级到生成3分钟的完好著作；文生图模型2.1版别，更是在业界初次完成精准生成汉字和一句话P图的产品化才能，该模型已接入即梦AI和豆包App。

事实上，大模型运用正在向各行各业加快浸透。据悉，豆包大模型现已与多半干流汽车品牌协作，并接入到多家手机、PC等智能终端，掩盖终端设备约3亿台，来自智能终端的豆包大模型调用量在半年时间内增加100倍。

与企业生产力相关的场景，豆包大模型也获得了很多企业客户喜爱：最近3个月，豆包大模型在信息处理场景的调用量增加了39倍，客服与出售场景增加16倍，硬件终端场景增加13倍，AI东西场景增加9倍，学习教育等场景也有大幅增加。

谭待表明：“本年是大模型快速地开展的一年。当你看到一列高速行驶的列车，最重要的事便是保证自己要登上这趟列车。经过AI云原生和豆包大模型宗族，火山引擎期望帮企业做好AI立异，驶向更夸姣的未来。”

字节跳动发布豆包视觉了解、3D生成等新模型 加快多模态运用落地

相关产品 / products

字节跳动发布豆包视觉了解、3D生成等新模型加快多模态运用落地