2010年中国IT(互联网技术)领袖峰会上,BAT三家创始人李彦宏、马云、马化腾同场激辩云计算:李彦宏认为云计算是“新瓶装旧酒”,马化腾认同云计算的作用,但作为基础设施可能要很多年,马云则坚信云计算对阿里有极大用处。三位创始人的态度,决定了此后几年三家公司在云计算业务上的发展速度。
十余年后,一向在业务探索上不设限的字节跳动也杀入该领域,旗下云计算平台火山引擎迅速成为了国内增速最快的“一朵云”。12月19日,在上海世博中心和煦的阳光里,新京报记者独家专访了火山引擎总裁谭待,这位年轻的领军者身着一袭黑衣,虽然在两天的会议中频繁登台演讲、会见,却依然活力满满。他透露,今年以来,火山引擎的收入比去年实现翻倍增长。
企业服务之一的云计算很考验时间积累,现在的市场份额就与上述大厂入局的早晚有关,同时阿里云、腾讯云、华为云在IaaS(基础设施即服务)、PaaS(平台即服务)和政企业务上有着不同的资源禀赋,而运营商云在骨干网络上有着得天独厚的优势,火山引擎将如何实现后发先至、弯道超车?
谭待认为,云计算行业的第一次浪潮是在线化,在线化积累了很多数据,但这些数据价值可能只发挥了1%到5%。第二次浪潮是智能化,智能化不止能发挥出数据的价值,还能端到端地做很多事,包括MaaS(模型即服务)、AI Agent(智能体),而在智能化的浪潮下,大家都在同一条起跑线上,都要使劲跑。“我的要求是不能有短板,因为云计算的客户很多元,行业差异很大。当然智能化的事情,比如豆包大模型、AI云原生要做得更好。”
巨头下场厮杀,MaaS战事进入白热化。作为新入局者,火山引擎给外界最深的印象就是凶猛、降价——今年5月豆包主力模型将推理输入价格降至“厘时代”,12月火山引擎又让视觉理解模型进入“厘时代”,甚至一度被贴上“价格战”的标签。
谭待在专访中详细解答了两次降价的决策过程,以及是如何通过算法、软硬件和工程的方法将大模型的价格“打下来”,并表示火山引擎从不赔钱换市场,也不通过投资来换市场。他不认同“价格战”的说法,“平台公司就像池塘里的鱼,未来鱼能多大,都取决于池塘多大,我们要想尽量把池塘做大,而不是把别的鱼吃掉。”
对于全新升级的“豆包大模型”家族,他表示,谦虚一点可以打80分,多模态模型有更高的社会和经济价值。在专访中,他还透露了火山引擎的人员结构、组织目标和客户构成,解答了豆包大模型和火山引擎团队的协作模式,分享了对合成数据、Scaling law、大模型应用的见解。
(以下为新京报记者12月19日对谭待的专访实录,已经过压缩整理)
回应“价格战”:火山引擎从不赔钱换市场,降价源于技术创新和规模效应
贝壳财经:今年5月豆包主力模型的推理输入价格降到“厘时代”,12月火山引擎让视觉理解模型进入“厘时代”,是如何将价格打下来的?
谭待:首先要讲为什么要做这件事情,这个是很关键的。大家花这么多的资源去做大模型的训练,是为了更多企业能把模型用起来,用起来之后,才能通过AI(人工智能)帮助更多个人和企业提效,特别是中小企业。要做到这一点,模型能力要更好,使用成本也要更低,大家才能踊跃地去创新,才能涌现越来越多方案去解决个人和中小企业的实际问题,这就是为什么我们要做“AI普惠”的工作。
当然对于to B(面向企业的)业务来说,它的商业模式很直接,所以不管再怎么普惠,一定是要做到可持续,不能用亏损换规模。所以我们其实在技术上做了大量优化,既实现了大模型普惠理念,也能让我们的业务做到有毛利。
贝壳财经:降价是通过哪些手段达成的?
谭待:降价的做法其实分好几块,是算法、软件、工程和硬件结合的方案。比如算法上,我们采用更好的模型结构,用更低的成本做更复杂的推理。工程上很重要的是规模化,因为不同业务的负载存在波峰和波谷,科研场景可能半夜调用量比较大,办公场景白天调用量比较大,当我们的客户量越来越多时,就能通过规模化调整,把成本降低好几倍。我们还在软硬件结合上做了很多事情,因为不同推理过程,对于芯片的带宽和算力要求是不同的,我们就把这个过程分离,放到不同的池化资源去处理,通过这种方式也能降低成本。再加上对库存和供应链的管理,综合起来每一个环节都有好几倍的效率提升,整体提升是非常大的。
通过上面的一系列操作,就能实现大模型普惠,让更多的中小企业和个人创业企业能释放自己的生产力,然后对于火山引擎也是可持续的。而且你看全球,OpenAI也在不断降价,他们也是用类似的方法。
贝壳财经:即使在“厘时代”,火山引擎也不是赔钱换市场?
谭待:对,这很重要,我们肯定要保持毛利是正的,不然做得越大,亏得越多,商业模式不成立。
贝壳财经:两次降价的内部决策过程是怎样的?
谭待:我们目的是要做好AI(人工智能)服务,让更多人用起来,同时也要保证自身业务可持续。
这里就有两个限制条件,一个条件要求我跟开发者、企业了解他们在使用过程中对成本的痛点在哪里,价格降到多少,他们就能用起来。比如一个创业企业,基于豆包大模型做了一个应用,它有自己的ARPU值(每用户平均收入),就能推算出每token(自然语言处理领域的计费和收费标准)的成本要低到多少,才能达到正向现金流,这个很好算出来。
另一方面,火山引擎自己也来算,我们通过技术优化能把成本打到多低。这两个值的中间段就是火山引擎可以定下的价格。
贝壳财经:很多云计算厂商都是可以接受一定的亏损,先把量扩起来?
谭待:To B行业这个模式不成立,最近也有很多云计算厂商都在反思总包的模式,反思用收入换规模的事情,发现这个模式是不成立的。
因为对于企业级(To B)市场来说,获取收入的方式,就是当前卖出去的量。它不是像to C(面向用户)的应用,给用户免费使用,将来通过广告、电商或者别的方式赚钱。所以,不能用亏损换规模,我没看过任何一家to B的企业把这条路走通。
贝壳财经:5月降价后,百度、阿里、腾讯还有很多创企均跟进了“降价”,是否有考虑到行业其他厂家的跟进?
谭待:他们肯定会跟进的,因为我想大家都有一样的初心,还是希望把大模型做好,赋能更多的企业和开发者。如果大家初心一致,肯定就会走这条路,无非就是我们走得快一点,他们走得慢一点。
贝壳财经:有人说你们打“价格战”,你怎么看?
谭待:不能这么来讲这件事,我们更重要的是做AI普惠,对不对?
我们做这件事(降价)并不是考虑市场竞争,因为这个市场目前的开发程度也就是千分之一,还有99.9%没有开发。昨天我公布的日均token使用量是超4万亿,这其实并不大,几年以后,可能日均token使用量就能到百万亿,所以这个市场还是很早期。
打个比方,我们(大模型企业)都是池塘里的鱼,未来鱼能多大,都取决于池塘多大,我们要想尽量把池塘做大,而不是我把别的鱼吃掉。
贝壳财经:刚听你讲述降价的逻辑,一方面是考虑客户愿意花多少钱,另一方面是内部能有毛利的底线,但你忽略了大模型的研发成本。
谭待:对业务来说,最重要的是在保持毛利率的情况下,做大规模扩张,只要规模上去了、毛利率是可以的,研发成本最终都会被摊销掉。
谈收入增长:今年以来火山引擎收入比去年增长翻倍
贝壳财经:阿里财报披露由AI带来的收入增长是三位数的,火山引擎这个数据是怎样的?
谭待:5月以来,我们光日均token使用量增长就超33倍,这就是四位数增长,token的使用量就是实在的收费标准。
回到火山引擎本身,第一个我们把规模优势放大了,第二个我们在AI上的投入是坚定的,所以整个火山引擎整体都涨得非常好,增速是三位数。
贝壳财经:多大的三位数增长?
谭待:翻倍吧。
贝壳财经:上面这些由AI带来的增量,占火山引擎收入的几成?
谭待:AI还是在早期阶段,我现在不太关注它占收入多少,而是关注它有没有让更多企业来到火山引擎,有没有让企业降本增效、加速创新。从这个角度来说,AI目前已经起到了非常大的作用。
贝壳财经:有观点认为Web、数据和AI分别是云计算行业的三次浪潮,你觉得火山引擎能否通过这次浪潮,实现对国内头部云计算企业的超越?
谭待:我更愿意用云1.0、2.0来划分。云计算行业第一次浪潮的核心原因是在线化,在线化能分为PC(个人电脑)、移动互联网和IoT(物联网)等阶段,在线化积累了很多数据,但数据价值可能只发挥了1%到5%。第二次浪潮就是因为智能化,就像我们常说的“数据是新时代的石油”,智能化不止能发挥出数据的价值,还能端到端的做很多事。
我认为未来10至20年都很重要,也就是云2.0阶段,是以大模型为基础端到端的去做更多的事,包括MaaS、AI Agent(智能体)。在2.0阶段,技术架构要转向AI原生和大模型,以GPU(图形处理器)为核心重构计算、存储、安全,我们也推出了很多新产品。
贝壳财经:火山引擎能利用这个机遇弯道超车?
谭待:都升级到2.0时代了,大家都是同一起跑线,就不存在弯道了,大家都要使劲跑。1.0阶段取决于部署规模,规模大就能带来成本降低、弹性增强,但1.0阶段我们也很有信心,因为我们的内外部的部署规模也很大,只不过这个阶段(市场规模)变化会很慢。2.0阶段会让大家都走得更快,这个机会是对所有人开放的。
贝壳财经:国内阿里云可能长于IaaS(基础设施即服务),腾讯可能优势在PaaS(平台即服务)、SaaS(软件即服务),华为则在政企领域有独特的优势,火山引擎相比其他几家的优势和劣势是什么?
谭待:我觉得这些更多是第三方评论,你去问其他家,他们肯定说自己什么都好。我们的要求是不能有短板,因为云计算的客户很多元,行业差异也很大。当然新的事情,比如豆包大模型、AI云原生上要做得更好,这块我们很多产品都是国内首发。
To B是很考验时间积累的行业,现在的市场份额更多反映的是大家进入市场的时间,早十年进场的绝对值肯定更大。所以不应该看份额,而应该看份额变化和增速。
贝壳财经:字节内部对你是否有相关的OKR(即目标与关键成果法)要求?长、中、短期的目标是什么?
谭待:OKR最重要的是Objectives,也就是目标。我们的目标是用技术服务企业,让它们降本增效、加速创新,只要能做到,云计算的业务天然就变大了。我们更多强调自驱,我自己写我的OKR,写火山引擎十年的BP(商业计划)。
贝壳财经:能不能透露一下这个十年BP?
谭待:我还是说下明年我们想要做什么。今年因为我们推出了更好的模型、更低的价格,所以看到了应用量的爆发。但我认为,目前大模型的应用还只能摘一些低垂的果实,能辅助人类解决的任务也比较简单。明年我们一方面会让更多人用好大模型,同时希望尝试用大模型帮助人类做更长时间的任务,做真正复杂的Agent(智能体)。
贝壳财经:明确了目标之后,火山引擎的人才和经费将要怎么分配?
谭待:想要把云计算和AI做好,是一件很复杂的事情,人是少不了的。火山引擎几年前刚成立时,虽然收入规模小,但研发投入非常大,我们就是照着未来1000亿(收入)目标去投入研发的,所以目前产品和研发团队在小1万人。产品和研发团队相当于是固定资产,销售、运营是规模化团队,做多大规模就招多少人,规模化团队目前加起来大概有1000人。
区域和行业是做to B业务很重要的内容,需要平衡好。火山引擎也会成立本地化团队,相当于客户在哪里,团队就在哪里。火山引擎的实施和交付则更多依靠合作伙伴,我们自己会少做一些。
贝壳财经:你的时间会怎么分配?
谭待:跟阶段有关系,在没有大模型之前,精力会更多放在管理、组织和市场上,但现在产品发生了巨大的变化,所以我会更关注产品进程。因为我本来也是技术出身的,做这个事情也很擅长,现在超过60%的时间都花在技术上。
贝壳财经:火山引擎目前的客户主要分布于哪些行业?
谭待:我们全行业都会做,但看重有C端产品、场景的行业,例如金融、零售、手机、汽车、民生相关等面向C端的行业。因为面向C端的场景会积累更多数据,数据越多的产品,在线化程度越高,AI和云才能更好地发挥价值。
贝壳财经:目前会更愿意做标杆案例吗?是大客户居多,还是中小客户居多?
谭待:是否做标杆案例得看阶段。一个新产品出来,肯定要找一个标杆,这个标杆不一定越大越好。当一个产品完成了从零到一,要实现从一到一百的时候,就要讲究覆盖了,特别是中小企业可以用更高效的方式来覆盖。
目前,从收入角度来说,肯定是大客户多一些,从数量角度来说,肯定是中小企业多一点。我会自己去见一些创业公司,一年至少见100多个。AI时代,创业公司有很多新想法,动得特别快,跟他们交流,能学到很多东西。
给“豆包”打分:谦虚一点打80分,多模态模型有更高的社会和经济价值
贝壳财经:最近豆包大模型家族全面换新,行业中OpenAI(一家美国人工智能企业)、月之暗面、腾讯、快手等也都在年底对自家的大模型产品进行了大规模的更新,你们都选择在年底更新产品的原因是什么?
谭待:我觉得并不是大家都选在年底,回顾这一年,会发现这一年全球大模型的进展都非常快,3月份有一大批的更新,然后5月、6月和9月都有更新,应该是每个季度都会有新东西出来。所以我觉得,刚好四季度又有一批新的出来。
反过来,也说明大模型不管是技术还是应用上,都是很快的。
贝壳财经:你曾表示“不急于推出只有30分的大模型,核心是赋能其他人做这件事。”你给这次换新的豆包大模型家族打多少分,为什么?
谭待:打80分,谦虚一点。
这次有几个大的更新,第一个,我们推出了视觉理解模型。因为语言是人类用来描述世界的很重要的方式,但(人类)认知这个世界、理解这个世界最重要的还是视觉,大模型也是同理,它必须要同时具备语言和视觉能力,才能在现实生活中去帮人类解决更多问题。
所以我们推出视觉理解模型,是把很重要的版图补上了,不管是我们自己的Demo(演示样本),还是过去两个月邀请了几百家企业的测试情况,反馈结果都很好。未来豆包视觉模型还能在教育、电商和直播等场景上进行应用。
第二个,我们的语言模型豆包PRO(专业版)也有非常大的提升,特别是在企业生产力相关的办公产品里,比如复杂指令的遵循,综合任务的处理,然后数学逻辑、推理能力等,整体上已经对齐了 Gpt-4o(OpenAI发布的语言模型)。除了应用在娱乐生活场景外,豆包语言模型在工作场景,比如信息处理、销售客服,都有很高的调用量。还有硬件终端,目前80%的车企都和豆包大模型有合作,通过手机终端的合作覆盖了超3亿用户。
这两个模型的价格其实是(企业)非常可接受、可持续的,是能够让企业和开发者放心大胆地去做尝试的。除了这两个最重要的基础模型之外,我们在很多垂直领域,比如文生图、音乐模型,其实都有进一步的升级。
贝壳财经:最近国内几家大厂的动作比较分化,百度文心一言和阿里通义千问都在深耕大语言模型或者基座大模型,而字节、快手、腾讯等都在做AI(人工智能)生成视频,这是为什么?
谭待:其实我不太能猜测他们的想法,只能说一下我的想法。
以终为始地看问题,企业做大模型是为了辅助人去做各种事情,人做事情的时候需要很完整的能力,包括语言、视觉、创作甚至完成更复杂的指令。这就需要模型具备多模态能力,才能端到端的帮个人创业者和企业去解决具体的问题,也才能有更高的社会价值和经济价值。
贝壳财经:市场上有人统计了字节在各个行业推出的AI产品的数量,并称你们是“AI工厂”,豆包大模型能持续快速推出新产品的方法论是什么?
谭待:还不知道我们被叫“AI工厂”。我们做事情还是从产品和需求出发,需求是从用户和客户来的。抖音、头条有非常多人使用,这些人的需求就会诞生对模型的要求。火山引擎现在做企业级市场,有非常多的企业客户,这些企业的需求也会促进我们来做不同的事情满足他们。
所以,是因为我们有这么多的C端用户和这么多企业客户,他们的需求会促进我们研发对应的方向。拿到对他们的反馈后,反过来又能促进我们技术的进步。
贝壳财经:以豆包大模型的实践来看,Scaling Law(规模化法则)是否还成立?
谭待:Scaling Law是一个普世的概念,在没有大模型的时候,我们做深度学习、机器学习或者推荐广告时,都发现有数据、算力加大,效果提升的情况。
回到大模型本身,其实大模型训练有很多阶段,比如Pretraining(预训练)、SFT(监督微调)和RLHF(强化学习)。在不同阶段都有Scaling Law,区别就在于到底在哪个阶段优化模型的性价比最高。以前可能大家觉得在Pretraining阶段进行优化性价比高,现在可能觉得在强化学习阶段优化性价比高。未来,由于数据合成的进步,Pretraining的性价比又上来了,我觉得是交替上升的过程。
贝壳财经:豆包大模型目前用来训练的数据量是否足够,有没有开始使用合成数据?
谭待:数据枯竭是一个相对而言的概念。比如说文本的数据很多都被用了,但还有很多高质量的数据没有提炼好,多模态数据还有很大量没有被使用好。
数据合成其实是很重要的方法,即使没有数据枯竭的事情,在很多场合也会用。比如我们在做to B(面向企业)服务的时候,信任和安全是很重要的事情,我们不会看任何企业的prompt(提示词),但又需要对模型进行优化,我们就可以通过理解他们的场景,去做一些数据合成,对模型进行训练和提升。
贝壳财经:早期火山引擎并没有急于发布自己的通用大模型,而是选择和多家AI科技公司联合推出大模型服务平台“火山方舟”,目前在火山引擎既有不同大模型组成的MaaS(模型即服务),也有自研的豆包大模型,这二者是否存在左右手互搏?
谭待:完全没有。因为火山引擎的定位一直没变过,豆包大模型其实并不是火山引擎来做的,火山引擎的定位就是做好云计算服务。但现在云计算的定义发生了变化,云计算的1.0时代就是传统的CPU、IaaS等,云计算的2.0时代其实是Model as a Service(模型即服务)为核心,火山方舟是围绕这个事情来做的。它的定义是要做最好的MaaS平台,把模型的生命周期管理好,通过工程优化把推理性能、延迟优化、安全做好,把企业落地的解决方案做好。
一年前,火山方舟推出时,豆包大模型还没有对外开放,所以我们就选了市面上比较好的几家模型放到火山方舟上。现在我们深信豆包大模型是更好的模型,所以就把豆包也放到火山方舟上。
客户在用火山引擎时,可能90%以上都在用豆包大模型,但他也会在某些垂直领域用一些第三方模型,可以搭配使用。
贝壳财经:从客户角度讲,有百分之多少用豆包大模型,有多少用第三方模型?
谭待:站在企业角度去看,中小企业可能没有太多资源去做多云、多模型的策略,所以用豆包大模型就好了。大的企业不管是因为供给安全性还是使用多样性的考虑,它可能90%在用豆包大模型,剩下10%会保留一些三方的或者其他开源的模型。
贝壳财经:早期火山引擎其实一直在打的是“数据飞轮”概念,目前更多讲的是大模型,这个是企业数字化的“一体两面”?
谭待:它是从不同层面来描述这个事情(企业数字化),数据飞轮讲的是企业怎么做好数据驱动。原来企业都说要建设一个中台,但中台只强调了数据中台的建设,但没有强调把数据的价值发挥出来,这个我们叫数据消费。
数据飞轮其实有两个闭环,一个是业务对数据的应用,一个是数据资产的建设,然后通过数据消费把两个连在一起。业务做得越多,数据资产就越好,数据资产越好,给业务带来的价值就越大,整个过程中都有对应的产品和工具。
大模型其实是一个技术的问题,以前我们用传统技术来处理问题,现在用大模型来处理,大模型其实可以让数据飞轮转得更快。因为在业务用数据时可以用自然语言来表达,或者用数据智能体来做这个事,这样对数据的应用会更好。而在数字资产层面,大模型会极大释放非结构化数据的价值。
所以,我认为说数据飞轮仍然是企业数据驱动中非常重要的东西,但在豆包大模型上这个事情做得更加高效。
▲火山引擎总裁谭待
贝壳财经:如果火山引擎的客户对豆包大模型有一些修改、调优的需求,你们和豆包大模型团队是如何内部协同的?
谭待:火山引擎有一个团队可以深入到豆包大模型团队里,和他们一起做开发,我们通过这个团队来实现B端需求的闭环。可以理解为豆包大模型团队中有个和火山引擎共同开发的小分队,专门为火山引擎服务。
贝壳财经:豆包智能助手是不是客观上对火山引擎做to B业务起到了推介作用?
谭待:数字化转型都是一把手关注、一把手工程。以前的数字化转型,比如大数据这些,决策者用不到,只能听汇报,但大模型可以自己用,这也是技术能够更快落地的原因。
火山引擎一定程度上对豆包有优化。to B场景更复杂,任务要求难度更高。所以很多很难的产品能够在to B场景里做好,反过来让基础大模型的能力更强。
研判未来方向:火山不下场做硬件,明年行业会涌现更多AI应用
贝壳财经:最近AI眼镜在风口上,字节推出了首款AI智能体耳机Ola Friend,火山引擎是否会自己下场或者和合作伙伴一起推出硬件?
谭待:我们是做企业服务的,不是做硬件的。但我们会推出对应的方案,比如基于豆包的IoT(物联网)解决方案,会有很多硬件来搭载。我们还是想把平台、SDK(软件开发工具包)、模型做好,我们也会跟硬件厂商合作,终端也是我们看好的一个方向。
贝壳财经:很多云计算厂商都在投资AI大模型企业,一般是给“一部分投资款+一部分算力”,火山引擎是否有类似的计划?会采取怎样的计划构建生态企业?
谭待:我认为用投资来换收入是一件没有意义的事情。我们也有投资团队,但我们更多是做战略投资,比如说被投企业的能力,是火山引擎整体对外服务比较重要的能力,我们就会进行投资。
云计算的生态的确很重要,核心还是利益互惠,比如一些垂直场景的应用,它们加上豆包大模型的能力,能做很多事情,我们会和他们深度合作,联合做一些产品开发。
贝壳财经:大家现在对GPU(图形处理器)有一些担忧,你觉得未来人才、技术、算力和数据,哪个会成为限制中国基座大模型更新迭代的短板?
谭待:就不说哪个是短板了。我觉得人才更重要一些,因为所有事情都是人做出来的。
贝壳财经:这几年大模型企业经历了怎样的发展?2025年会有哪些趋势?
谭待:我认为这几年乃至未来模型的训练量每年还是会增加的,但把应用做起来也很重要,不然前期投入的资源可能就浪费了,最后应该是应用的市场空间要比训练的市场空间大5倍左右,投入才能算得正。做好应用则需要好的模型、需要AI普惠,这是我们云计算企业要做的事情。所以我觉得2025年更适合去推好的模型,我相信2025年不管是中国还是世界会涌现更多AI应用,不管是to C还是to B的。
贝壳财经:2025年是否会出现杀手级应用(Killer APP)?
谭待:现在还是AI早期,就像移动互联网早期时候,大家说杀手级应用是LBS(基于位置的服务)或者图片社区,但真正的杀手级应用是美团、滴滴、抖音。杀手级应用是发展到了一定阶段后,有更复杂的形态出来之后才会出现,现在大模型才发展一两年,还不用着急。今年模型的发展速度已经超过过往任何一项技术的变革速度,所以耐心等待就好,不用焦虑。
贝壳财经:行业内对大模型开始反思,包括消耗了过多能源却制作出了不少无用的“垃圾”,包括红杉提出的AI大模型的6000亿美元陷阱,也包括对人工智能伦理和技术进步之间的平衡,你怎么看这些反思?
谭待:我没有看红杉的完整报告,但看了一些分析。这个报告提出问题的最终目的是要让大家把模型应用做起来,而且它觉得明年会有大的亮点出来。所以价值链的终局是,所有模型的投资、训练等,最终还是要应用和落地。
贝壳财经:2025年你个人有哪些新期待?
谭待:世界和平,这很重要。世界和平,经济就能发展,技术就能进步。