摘要
把模型好不好用、应用落不落地、客户黏不黏,全部量化成一条实时曲线,比营收更难造假。
低价甩卖 GPU 冲收入只是一次性买卖,只有 Token 带来的持续调用才能产生经常性现金流。
客户不再关心 GPU 型号,只关心 1 块钱能买多少 Token、能办多少事,计费逻辑被彻底重写。
自研豆包+抖音系超级 App+高效 AI 基建,三环咬合,目标 2030 年 Token 生意破千亿,率先把云战拖进“Token 经济”时代。
2025年,大模型重新激活了云计算市场。中国AI云市场的话语权争夺变得日益激烈。
中国的云厂商,如阿里云、火山引擎、百度智能云均公开宣布,自己在AI云市场的优势特性,这一点从国际数据公司IDC的多份调研报告中可以看出端倪。
IDC在2025年先后公布了五份中国AI云市场市场调研报告。这五份报告涉及AI云市场的四个细分市场——大模型公有云(模型平台Token调用)、智算基础设施(AI IaaS)服务市场、生成式AI基础设施(GenAl laaS)市场、AI公有云服务市场。
由于市场规模小,2025年之前,字节跳动旗下云服务公司火山引擎几乎从来没有出现在主流市场调研机构的统计中。但近两年,它正在成为中国云市场的重要搅局者。
我们了解到,火山引擎2024年营收规模超过110亿元,营收增速远超60%,这超过大部分云厂商。2025年,火山引擎仍然制定了极高的增速目标,2025年营收目标远超200亿元。
增速快、规模大,这让市场调研机构无法忽略火山引擎的存在。2025年,火山引擎在IDC这五份市场调研报告的四份中跻身前列,并在两份报告中位居首位。
IDC 9月19日公布的《中国大模型公有云服务市场分析(2025H1)》报告显示,火山引擎在大模型公有云服务市场(即通过MaaS模型平台调用Token市场)位居国内第一,2025上半年市场份额49.2%,接近半壁江山。在IDC 4月报告中,火山引擎2024年全年在该市场份额是46.4%。
在IDC另外两份报告中,火山引擎2024年在中国的AI基础设施市场份额9%,位居国内第三;2024下半年在中国的生成式AI基础设施市场份额14.2%,位居国内第二。
AI云市场有不同的观察视角。如果简单理解这五份报告,结论是——火山引擎擅长卖Token(词元,大模型算力计量单位,一个Token可以是单词、标点、数字、符号等),阿里云擅长卖算力,百度智能云擅长卖解决方案。
我们了解到,虽然国内云厂商大多更关注营收指标。但火山引擎,更关注另一个指标:Tokens调用量。在他们看来,这更能衡量目前AI产业景气程度,客户对AI的使用深度,以及大模型产业落地的真实水温。这个逻辑引发了几个更深层次的思考:
其一,火山引擎为何更关注Token消耗量?
其二,AI云市场是否会从“卖算力”,转向“卖Token”?
其三,“卖Token”会不会成为火山引擎弯道超车的机会?
为什么更关注Token消耗量?
火山引擎位居第一的大模型公有云市场,指通过MaaS(模型即服务)平台调用Token的市场。它就是俗称的Token市场。
IDC五份统计报告中,还包括智算基础设施服务、生成式AI基础设施市场、AI公有云服务市场这三个市场。这几个市场的规模目前比Token市场更大,但目前在火山引擎的考核指标中,更优先关注一个指标:Tokens调用量。
我们从多家中国云厂商相关人士处了解到,2024年中国各个云厂商的Token调用收入普遍只有千万元、数亿元,总和不超过10亿元,但它正在以10倍以上的速度成长。
IDC数据显示,2024年6月-12月,中国大模型调用量增长近10倍。由于行业正处于发展早期,因此IDC目前发布的两份报告中,并未披露大模型公有云服务市场以人民币/美元计价的规模,而是披露了Tokens调用情况。IDC数据显示,2025上半年,中国大模型公有云Tokens调用总量是537万亿次。
同期,火山引擎的方舟平台(火山引擎旗下MaaS平台)Token调用量同比增长3.98倍。我们了解到,IDC的调研,不包含出海群体使用的MaaS平台调用量,也不包含各大模型App上的调用量。也就是说,包括豆包、即梦等To C(面向消费者)应用消耗的Token未被统计在内。
我们了解到,如果统计字节跳动旗下产品矩阵(如抖音、豆包、剪映、即梦、飞书)等产品在火山引擎上的Tokens消耗量,火山引擎市场份额只会更大。
Token市场目前规模不够大,这使得一些企业对它不够重视。2025年6月,一位中国云厂商高管曾对我们直言,GPU等AI算力基础设施的收入远高于Token收入。因此在他们的战略中,Token消耗量的战略优先级目前不算高。
创新往往诞生在边缘地带。出于市场竞争的考虑,一些科技公司正在密切关注Token收入的增长潜力。
中国某ICT硬件企业一位资深战略规划人士今年7月曾对火山引擎未来可能的Token收入进行了敏感性测试(一种根据商业模型,综合外部市场条件变化进行市场动态分析的方法)。他告诉我们,如果Token价格依旧维持当前的水平,他测试的结果显示,火山引擎Tokens调用收入未来1年-2年可能增长至百亿元。
他认为,Token市场将是中国云计算市场的重要变量。因为租赁GPU算力、销售GPU硬件这些业务的年营收增速通常只有50%-200%,几年后会逐渐下滑,收入增长的天花板可以预见。但Token收入,会以3倍、5倍、10倍的速度指数级增长。现在暂时看不到天花板。
火山引擎更关注Token,而非GPU算力收入等其他收入,还和云计算行业一个潜规则有关——低价销售GPU云资源冲收入,这是目前AI云市场普遍存在的做法。
多位中国云厂商一线销售今年7月曾对我们表示,一些云厂商为争夺政企客户的算力池项目,低价销售GPU云资源,甚至是直接低价销售芯片、服务器等硬件。在激烈的市场竞争中,很多GPU云资源被两三折、三五折出售。
这种做大营收规模的捷径无异于是“饮鸩止渴”。因为很多算力并没有被真正充分使用起来。这种销售收入不可持续。一旦客户发现,自己用不到这么算力,就会退租GPU资源、减少硬件采购。届时,这些云厂商又会再次面临增长乏力的问题。
一种观点是,能衡量目前AI产业景气程度、客户使用深度的指标不是营收,不是GPU算力,Tokens消耗量。因为,只有模型真正好用了,应用真的落地了,Tokens调用量才会真正增长。
简单说,低价卖硬件得到的收入是一次性收入,做的是“一锤子买卖”。“卖Token”虽然收入少,但它更关注客户实际需求,带来的是经常性收入,做的是“长久的买卖”。
火山引擎希望形成“模型能力更强、AI应用更多、Token消耗量更大”的良性循环。因为,字节跳动自研的豆包大模型在企业场景/ToB场景到底好不好用、哪里不好用,只有通过MaaS平台上的Tokens调用才能得到反馈,只卖GPU算力,无法获得这些评测集。
火山引擎总裁谭待2024年曾在一场小规模交流中曾对此也曾解释,大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。
“卖Token”,未来潜力更大?
AI时代,Token是最小的算力单位,如同移动互联网时代的“流量”。那么,“卖Token”和传统的“卖算力”有什么区别?
过去的“卖算力”,其实是在租赁机器时长。客户需要在云上租赁GPU(不同规格、配置的云上GPU),包时/月/年或用量计费。这需要关注GPU的配置和型号(如芯片型号A100/H800/H20等,硬件配置如内存、显存等)。
“卖Token”,客户不需要关注其他技术细节,只需要按照最终Token消耗量计费。它在发展早期,还不是很成熟。比如AI对话过程中,Token消耗量不稳定,价格波动幅度仍然很大。但理论上说,这是一种门槛更低,计费更简单,更贴近业务实际需求的模式。
“卖Token”会催生一个更繁荣的AI原生应用生态。因为按Tokens计费,会让算力计费模式变得更清晰(按效果/用量付费)。应用开发的ROI(投资回报率)会变得更容易衡量。
对应用开发者来说,“卖Token”将大幅降低AI应用开发的门槛。开发者无需再为复杂的GPU选型、集群管理和环境配置而烦恼,可以将精力聚焦于业务逻辑和产品创新。
AI云市场是否会从“卖算力”,转向“卖Token”?答案是,随着中国市场AI算力消耗量,从训练为主,转向推理为主,“卖Token”正在变得越来越流行。
从长期趋势看,Token市场规模会越来越大。它甚至被称为“Token经济”。英伟达等企业的一种设想是,未来AI工厂(也就是数据中心)将直接生产Token,算力企业要通过优化技术、降低能耗的方式,降低单位Token成本,提高单位时间的Token输出量。
国家数据局今年8月数据显示,2024年初,中国日均Token消耗量为1000亿。截至今年6月底,日均Token消耗量已经突破30万亿。一年半时间增长了300多倍,这反映了中国AI应用规模的快速增长。
过去两年,中国Token市场的增长曲线也说明了这个问题。IDC数据显示,2024年以来,中国两次AI应用大规模落地,都让Tokens消耗量快速增长。这背后的核心因素是,模型能力不断提升、模型价格不断下降,AI应用不断被普及。
第一轮是在2024年7月左右。那年5月,火山引擎率先将Token价格降低了90%以上,阿里云、腾讯云、百度智能云等公司随后跟进。第二轮是在2025年2月左右,当时DeepSeek的V3、R1两款模型走红,AI应用在中国市场开始爆发。
下一轮AI应用爆发和Token消耗增长会在什么时候出现?
火山引擎智能算法负责人、火山方舟负责人吴迪今年6月曾对我们初步预判,这可能会在2025年底-2026年初。
届时,包括图像、视频等在内的多模态模型会爆发,Agent(智能体)也会变得更成熟。吴迪对我们进一步分析称,2025年底具备视觉理解、推理能力的AI应用普及后,一个基础任务消耗的算力可能就会超过10万Tokens。届时,Tokens消耗量会快速爬坡。
大模型基础能力每一次跃升,都在解锁新的AI应用。每诞生一批AI应用,AI算力消耗也继续指数级增长。因为,一张图片、一个短视频、一个Agent,它生成或分析所需要消耗的Token量,可能是文本对话的成千上万倍。
因此,吴迪曾对我们预测称,2027年仅豆包大模型每日的Tokens消耗量将超过100万亿,相比2024年至少将增长100倍。
一位火山引擎人士今年7月曾对我们表示,字节跳动内部应用的Token消耗量正在急剧增长。抖音、豆包、剪映、即梦等应用正在上线更多AI功能,AI生成文字、图片、视频的需求也越来越大,它们正在消耗越来越多的Tokens。
字节跳动的内部AI需求领先外部市场约“四五个月”。这意味着,市场上其他应用的Tokens消耗量也会很快增长。
火山引擎弯道超车的机会?
“卖算力”到“卖Token”,这不仅是计费模式的变化,也是云计算技术的进一步演进。对云厂商来说,它们的战略方向、技术能力、商业模式同样需要围绕Token进行调整。
云计算厂商要做的是,提供领先的模型,尽量把更多客户吸引到自己的平台上;还要高效调度自家AI基础设施,榨干每一张GPU芯片的每一枚Token。不同云厂商的模型能力、基础设施出现巨大差距时,单位Token毛利率甚至可以相差数十个百分点。
“大模型+AI应用+AI基础设施”,这三者缺一不可。它们共同形成了AI时代的增长飞轮——Token消耗量会在这个飞轮旋转的过程中不断增长。
更好用的大模型,可以让应用变得更智能,并吸引更多To B客户和To C用户。数以亿计的用户,会产生丰富的数据,反哺大模型的持续训练,并摊薄基础设施成本。数十万卡的AI基础设施可以削峰填谷,实现对算力资源的弹性调度和分时复用。它直接决定了单位Token的最终生产成本。
在国际市场,这套战略贯彻最彻底的是谷歌:自研模型Gemini,改造并推出一系列To C的AI应用,通过谷歌云对外销售Token。
谷歌自研的Gemini系列模型既有全球领先的性能,又有庞大的To C应用场景(包括搜索引擎、YouTube视频、Gemini对话工具、邮箱文档等办公应用)去打磨模型、摊薄算力成本,还有谷歌云这个面向To B(面向企业级)客户的窗口。
在2023年大模型竞赛开始之初,谷歌一度落后。不过,谷歌自研的Gemini系列模型逐渐很快后来居上,成为全球性能最强的模型之一。
谷歌Token消耗量也在大幅增长。OpenRouter是全球大模型API(接口)聚合平台,它集成了全球主流模型。OpenRouter数据显示,在今年6月谷歌的Gemini Token消耗量市场份额一度高达44.4%,接近半壁江山。谷歌管理层在2025年二季度财报电话会中披露,今年5月谷歌每月处理480万亿个Tokens,7月增长至980万亿个Tokens。
模型性能足够强、Token消耗量足够大,这带动了谷歌云的营收增速高速增长。近一年(2024年三季度-2025年二季度),谷歌云的营收增速提升了10个百分点。它正在快速缩小与亚马逊AWS、微软Azure的差距。
字节跳动也在形成类似的业务逻辑——一方面为客户提供处于行业领先的模型,一方面为客户提供高性能、低成本AI基础设施。两者相互促进,进而带动火山引擎的Token消耗市场份额。
字节跳动自研的豆包大模型,正在被客户快速使用。
火山引擎总裁谭待在今年6月的“2025 Force原动力大会·春”曾披露豆包大模型的使用情况。截至2025年5月,豆包大模型日均Tokens调用量16.4万亿,相比2024年5月的1200亿增长137倍。
按照这一数据计算,豆包大模型当时的月均Tokens调用量超过500万亿,甚至比谷歌5月的月均Tokens调用量更高。
字节跳动的Seed实验室也在探索大模型的智能上限,旗下图像、视频模型的性能目前在全球位于领先位置。
国际市场调研机构Artificial Analysis长期对全球主流模型进行性能基准测试。该机构截至9月21日的数据显示,字节跳动旗下的图像模型Seedream 4.0,文字转图像能力位居全球第一,图像分析能力位居全球第二。
字节跳动有庞大的To C业务,如抖音、豆包、剪映、即梦等,它们不仅可以反哺大模型训练,还可以摊薄算力成本。市场调研机构Questmobile数据显示,截至6月豆包App已经拥有1.41亿月活跃用户,仅次于DeepSeek,是国内第二大AI原生App。
字节跳动的AI基础设施目前在行业内也具备更高的吞吐效率、更低的算力成本。
今年初DeepSeek爆发后,几乎所有云厂商都上架了DeepSeek-R1。在同一张“试卷”上,DeepSeek-R1推理速度更快,意味着基础设施效率更高。AI基础设施创业公司TensorChord在今年3月28日的跑分评测显示,火山引擎吞吐效率更高,每秒Token输出量甚至是一些厂商的2.6倍。
大模型性能强、AI应用用户规模大、AI基础设施效率高,这让火山引擎正在成为中国云市场无法忽略的挑战者。
火山引擎的营收也因此高速增长。我们了解到,火山引擎的目标是,在中国MaaS市场的份额持续保持第一,以此为契机,在2030年之前成长为一家营收千亿级别的云和AI公司。
押注Token,让火山引擎拿到了AI时代改变云计算竞争格局的新武器。
本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.nodgame.com/66653.html