记者 何己派 编辑 鄢子为
谁来做Agent大规模落地的核心推手?
火山引擎说,我想。
这朵来自字节跳动的云,去年发起闪电降价,豆包主力模型,拿出比同行便宜99%的价格,直接引发全行业跟进。
6月11日,火山引擎举办Force原动力大会,这一次,它拿出一套工具包,要在技术、成本、服务等维度,继续推动Agent的大规模普及。
区间定价
“如果说2024年是中国大模型应用的元年,那2025年将很可能是中国Agent落地的元年。”
在火山引擎总裁谭待看来,以PC、移动、AI三个时代来划分,技术主体在发生变化,从PC时代的web,移动时代的APP,到AI时代,则是Agent。
Agent正逐步进入企业的各个业务流程。怎么让Agent星星之火可燎原,打通其规模化落地的堵点,火山引擎的一把火,烧向“区间定价”。
“Agent的Token消耗量是很大的。”会后接受《21CBR》等媒体采访时,谭待谈到,让Agent执行一项任务,可能需要20万tokens。因此,怎么把模型使用成本降下来,非常关键。
新发布的豆包大模型1.6,首创按“输入长度”区间定价的模式,深度思考、多模态能力与基础语言模型,统一价格。
谭待表示,对同结构、同参数的模型而言,真正影响成本的,是上下文长度,而不是是否开启了思考和多模态功能。目前模型大部分的调用,输入范围都在32K以内。
基于这一观察,团队意识到,如果在推理调度上,通过分桶调度做好优化,就能够让占大头比例的模型请求,享受到更低成本、更快速度。
在企业使用量最大的0-32K输入区间,豆包1.6的价格,为每百万tokens输入0.8元、输出8元,综合成本是豆包1.5深度思考模型、DeepSeek R1的三分之一。
对于企业而言,豆包1.6成本下降了63%,只需要原来三分之一左右的价格,用上这个新模型。
加码多模态
会上,谭待提了模型进化的三个关键方向,深度思考、多模态理解和工具自主调用。
此次发布的豆包1.6,全系列原生支持多模态思考能力,并基于图形界面操作能力,进一步具备“行动力”。
演示案例显示,豆包1.6可自动操作浏览器完成酒店预订,识别购物小票并整理成Excel表格等任务。
新亮相的豆包视频生成模型Seedance 1.0 pro,支持文字与图片输入,可生成多镜头无缝切换的1080P视频。
价格方面,Seedance 1.0 pro模型每千tokens仅0.015元,相当于每生成一条5秒的1080P视频,只需3.67元。
拿着1万块钱的预算,使用Seedance 1.0 pro,可制作超过2700条5秒视频。
数据显示,豆包大模型日均tokens使用量超过16.4万亿,较去年5月首次发布时,增长137倍。
在行业应用上,豆包大模型服务着全球TOP10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校。
谭待向《21CBR》等媒体表示,豆包大模型的迭代,希望保持一年至少出一个大版本的节奏。目前,火山的所有业务里,大模型的收入增速最快,远超其他产品,毛利也位居前列。
对今年火山引擎的收入增长和客户拓展预期,他以“目标很激进”来回应,“需求是明确、清晰且庞大的”。
抢跑Agent时代,豆包如何赢得行业认可,谭待认为,“诀窍是心诚”,不为了赚吆喝,而把不好的模型免费。
“要让更多人运用AI创造价值,就是三件事,把模型做好,把成本做低,把应用落地的各种工具做好。这三个点,我们过去一直在说,未来也不会变。”
文章来源于网络。发布者:读懂财经,转转请注明出处:https://www.juwfa.com/11394.html