12月18日,在火山引擎 Force 大会上,字节跳跃重视发布豆包视觉领略模子。据悉,豆包视觉领略模子千tokens输入价钱仅为3厘,一元钱就可处分284张720P的图片,比行业价钱低廉85%,以更低资本推进AI手艺普惠和期骗发展。
策画炫夸,东说念主类禁受的信息卓越80%来自视觉。视觉领略将极地面拓展大模子的能力范畴,同期也会镌汰东说念主们与大模子交互的门槛,为大模子解锁更丰富的期骗场景。
据火山引擎总裁谭待先容,豆包视觉领略模子不仅能精确识别视觉骨子,还具备出色的领略和推理能力,可把柄图像信息进行复杂的逻辑计较,完要素析图表、处分代码、解答学科问题等任务。此外,该模子有着紧密的视觉面孔和创作能力。
火山引擎总裁谭待
此前,豆包视觉领略模子依然接入豆包App和PC端产物。豆包战术策画负责东说念主周昊暗示:“豆包一直在勤奋,让用户的输入更快更便捷”。为此,豆包产物荒谬谛视多模态的输入和打磨,包括语音、视觉等能力,这些模子都已通偏执山引擎灵通给企业客户。
会上,豆包3D生成模子也初次亮相。该模子与火山引擎数字孪生平台veOmniverse辘集使用,不错高效完成智能查验、数据合成和数字金钱制作,成为一套撑握 AIGC 创作的物理寰球仿真模拟器。
据南边+记者了解到,豆包大模子多款产物也迎来强劲更新:豆包通用模子pro已全濒临皆GPT-4o,使用价钱仅为后者的1/8;音乐模子从生成60秒的浅显结构,升级到生成3分钟的完满作品;文生图模子2.1版块,更是在业界初次收场精确生成汉字和一句话P图的产物化能力,该模子已接入即梦AI和豆包App。
即梦Dreamina张楠以为,生成式AI手艺不错把每个东说念主脑子里的奇念念妙想快速视觉化,“像作念梦通常”。即梦但愿成为“联想力寰球”的相机,记载每个东说念主的奇念念妙想,匡助每个有宗旨的东说念主温和抒发、目田创作。
即梦Dreamina 张楠
值得属意的是,在本次大会上还重视宣告2025年春季将推出具备更长视频生成能力的豆包视频生成模子1.5版,豆包端到端及时语音模子也将很快上线,从而解锁多扮装演绎、方言调遣等新能力。谭待暗示,豆包大模子天然发布较晚,但一直在快速迭代进化,当今已成为国内最全面、手艺最最初的大模子之一。
数据炫夸,甘休12月中旬,豆包通用模子的日均tokens使用量已卓越4万亿,较七个月前初次发布时增长了33倍。大模子期骗正在向百行万企加快渗入。
据悉,豆包大模子依然与大致主流汽车品牌互助,并接入到多家手机、PC等智能终局,遮蔽终局开导约3亿台,来自智能终局的豆包大模子调用量在半年时候内增长100倍。
字节跳跃方面泄露,与企业坐褥力关系的场景,豆包大模子也得到了广大企业客户珍贵:最近3个月,豆包大模子在信息处分场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终局场景增长13倍,AI器具场景增长9倍,学习矜重等场景也有大幅增长。
谭待以为,豆包大模子市集份额的爆发,成绩于火山引擎“更强模子、更低资本、更易落地”的发展理念,让AI成为每一家企业都能用得起、用得好的普惠科技。
在公布豆包视觉领略模子超低订价的同期,火山引擎升级了火山方舟、扣子和 HiAgent 三款平台产物,匡助企业构建好本人的 AI 能力中心,高效开发 AI 期骗。其中,火山方舟发布了大模子牵挂有谋略,并推出 prefix cache 和 session cache API,镌汰延长和资本。火山方舟还带来全域 AI 搜索,具备场景化搜索推选一体化、企业私域信息整合等处事。
云原生是夙昔十年最强劲的计较范式,大模子时期则推进着云计较的变革。火山引擎以为,下一个十年,计较范式应该从云原生插足到AI云原生的新时期。谭待暗示:“本年是大模子高速发展的一年。当你看到一列高速行驶的列车,最强劲的事等于确保我方要登上这趟列车。通过AI云原生和豆包大模子家眷,火山引擎但愿匡助企业作念好AI改进,驶向更好意思好的将来。”
南边+记者 叶丹