本报讯(记者袁传玺)12月18日,北京字节跳动科技有限公司(以下简称“字节跳动”)正式对外发布豆包视觉了解模型,为公司能够供给极具性价比的多模态大模型才能。豆包视觉了解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比职业价格实惠公正85%,以更低本钱推进AI技能普惠和运用开展。
据火山引擎总裁谭待介绍,豆包视觉了解模型不仅能精准辨认视觉内容,还具有超卓的了解和推理才能,可根据图画信息进行杂乱的逻辑核算,完结剖析图表、处理代码、回答学科问题等使命。此外,该模型有着细腻的视觉描绘和创造才能。
此前,豆包视觉了解模型现已接入豆包App和PC端产品。豆包战略研究负责人周昊表明:“豆包一直在尽力,让用户的输入更快更便利。”为此,豆包产品很重视多模态的输入和打磨,包含语音、视觉等才能,这些模型都现已过火山引擎开放给企业客户。
一起,豆包3D生成模型也初次露脸。该模型与火山引擎数字孪生渠道veOmniverse结合运用,能够高效完结智能练习、数据组成和数字财物制造,成为一套支撑AIGC创造的物理国际仿真模拟器。
豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,运用价格仅为后者的1/8;音乐模型从生成60秒的简略结构,升级到生成3分钟的完好著作;文生图模型2.1版别,更是在业界初次完成精准生成汉字和一句话P图的产品化才能,该模型已接入即梦AI和豆包App。
事实上,大模型运用正在向各行各业加快浸透。据悉,豆包大模型现已与多半干流汽车品牌协作,并接入到多家手机、PC等智能终端,掩盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增加100倍。
与企业生产力相关的场景,豆包大模型也获得了很多企业客户喜爱:最近3个月,豆包大模型在信息处理场景的调用量增加了39倍,客服与出售场景增加16倍,硬件终端场景增加13倍,AI东西场景增加9倍,学习教育等场景也有大幅增加。
谭待表明:“本年是大模型快速地开展的一年。当你看到一列高速行驶的列车,最重要的事便是保证自己要登上这趟列车。经过AI云原生和豆包大模型宗族,火山引擎期望帮企业做好AI立异,驶向更夸姣的未来。”