大模型行业正在经历一场从“技术竞赛”到“商业落地”的关键转型。而在这场转型中,谁能率先定义规则,谁就可能掌握下一个时代的主动权。
2026年3月31日,“大模型第一股”智谱(02513.HK)交出了上市后的首份成绩单。财报显示,公司全年总收入7.24亿元,同比增长131.9%,成为国内收入规模最大的大模型公司。更引人关注的是其MaaS(模型即服务)平台的爆发式增长——年度经常性收入(ARR)达17亿元,同比提升60倍。
然而,比财报数字更值得深挖的,是智谱CEO张鹏在业绩电话会上提出的战略判断。他重新定义了AGI商业化的“第一性原理”,并抛出一个简洁而犀利的公式:AGI商业价值 = 智能上界 × Token消耗规模。
在这个公式中,“智能上界”决定了定价权,“Token消耗规模”决定了价值体量。这一判断,正在被市场验证。
01 一份“炸裂”的财报:MaaS业务量价齐升
先看数据。2025年,智谱交出的成绩单有几个关键看点:
收入结构加速转型。 云端部署收入达1.90亿元,同比增长292.6%,占总收入比重从15.5%提升至26.3%。这意味着智谱正快速向高复用的API模式转型,收入结构优化速度领先国内同行。
MaaS平台全面爆发。 MaaS API平台ARR达17亿元,12个月内增长60倍。同时,毛利率从3.3%跃升至18.9%,盈利能力大幅改善。
量价齐升验证稀缺性。 2026年第一季度,智谱将API调用定价提升了83%,但调用量反而增长400%。张鹏对此的解释是:“市场依然呈现出供不应求的情况,再次印证了高质量Token是当下的稀缺资源,谁掌握了智能上界,谁就掌握了定价权。”
研发投入仍是重头。 2025年研发费用达31.8亿元,同比增长44.9%,是营收的4.4倍。这种“不惜代价”的投入,支撑着智谱持续突破智能上界。
亏损也在扩大。年内净亏损47.18亿元,同比扩大59.5%。但对于大模型赛道而言,这更像是技术卡位期的“必要成本”。
02 重新定义“第一性原理”:智能上界决定定价权
在业绩电话会上,张鹏将AGI时代的商业逻辑提炼为一个公式:
这个公式看似简单,却蕴含深刻的战略判断。
“智能上界”,指的是在有限计算资源、能源或数据条件下,大模型所能达到的理论最优性能水平或能力上限。张鹏强调:“智能上界的提升,是大模型AGI时代唯一的‘第一性’。”
为什么?因为智能上界决定了定价权。当模型能力足够强,用户愿意为更高阶的智能付费,而非一味追求低价。这解释了为什么智谱敢于在API调用上提价83%,而调用量不降反增。
张鹏将智谱的发展路径对标Anthropic——这家海外AI明星公司2025年ARR从10亿美元飙升至90亿美元,80%收入来自企业级API调用服务。他总结道:“当模型足够强,API本身就是最好的商业模式。智能的质量创造定价权,企业和用户的深度使用创造增长的规模。”
03 API成为商业主路径:从“可用”到“生产”
过去一年,大模型行业经历了一场商业模式的范式转移。
张鹏在电话会上指出,API和Token经济的兴起,“本质上是把AI基础设施能力转化为经济运行资源的一种方式,而不是一次性的红利。”
这意味着什么?意味着AI能力正在从“可用、可玩”走向真实生产,解决越来越复杂的问题。“使Token消耗和API的调用真正转化为经济价值。”
这一判断正在智谱的业务数据中得到验证。截至2026年3月,智谱MaaS平台注册企业及用户数突破400万,覆盖全球218个国家和地区。中国前10大互联网公司中,已有9家每天深度调用GLM模型。
GLM Coding Plan的爆发更是一个缩影。这款编程套餐吸引了全球24.2万付费开发者,Token调用量6个月增长15倍。即便2026年2月提价30%,依然保持高速增长。张鹏解释:“价格的本质由价值决定,能有效替代人力、提高转化效率和智能水平的资源是稀缺且宝贵的。”
04 2026年关键词:Token量
如果说2025年的关键词是“智能上界”,那么2026年,张鹏给出的关键词是“Token量”。
以OpenClaw为代表的应用正在引爆Token消耗狂潮。2026年3月,智谱推出Claw Plan,上线仅两天订阅用户突破10万,20天突破40万。
张鹏判断,2026年智能范式将经历三级跳:从轻量化的“氛围编程”(Vibe Coding),向工业级的“智能体工程”(Agentic Engineering)演变,再进化为具备自主规划、环境感知与自我迭代能力的数字工程师。
“这将带来智能上界的进一步突破,以及Token消耗的第二轮指数级增长。”
面对供不应求的市场,智谱的策略是:继续加大投入国产芯片软硬一体化调优,将推理性能压榨至极限。张鹏强调:“这不是为了短期盈利,而是为了支撑那条不断上扬的、高质量Token消耗的指数曲线。”
05 TAC与LLM-OS:下一代计算平台的定义权
在财报中,智谱首次提出了两个新概念:TAC(Token架构能力) 和LLM-OS(大模型操作系统)。
TAC的公式是:智能调用量 × 智能质量 × 经济转化效率。张鹏解释:“未来衡量个体或组织价值的标准,不再是掌握多少信息,而是作为Token架构师,在给定预算下构建复杂Agent系统并驱动大模型完成复杂任务的闭环执行。”
智谱的目标,是成为提升全社会TAC的基础设施,“让每一枚Token都能转化为可交付的经济增量。”
而LLM-OS的概念,则指向下一代计算平台的定义权。张鹏认为,传统操作系统是硬件资源的调度者,而大模型操作系统是智能的调度者。“大模型正在吞噬软件。未来的计算平台将不再是App的堆叠,而是API商店与Agent矩阵的协同。谁的模型进入了系统内核,谁就掌握了下一代计算的定义权。”
06 开源与商业化的平衡:两条腿走路
面对“开源是否会影响API商业化能力”的质疑,张鹏给出了清晰的回答:开源和商业化两条腿走路。
“开源的本质是做技术创新、社区回馈以及品牌和标准建设,目的是吸引更多开发者加入GLM生态。”
但从商业化角度看,随着模型越来越复杂,企业自建部署的成本效益正在降低。“模型迭代太快,自建有时候跟不上我们的3到4个月迭代周期。很多原来尝试私有化部署的客户,都逐渐转投或部分转投了使用云端大模型API。”
这意味着,开源不仅没有削弱商业化,反而成为吸引开发者、建立生态壁垒的重要路径。
07 独立大模型厂商的先天优势
对于“大模型公司将被巨头替代”的市场担忧,张鹏持不同看法。
“独立大模型厂商在技术快速迭代的周期中具备先天优势。大厂不一定在所有场景中都能做到有足够的竞争力,这是资源限制所决定的。”
他进一步解释:“它们本身也是复杂的生态,不会在所有场景都完全依赖自己,也需要接入优秀的供应商,保证业务在任何时间点都不失去先机。”
这一判断也得到了机构的认同。中金公司指出,AI-Native厂商凭借更具攻击性的组织形态与轻量的历史包袱,胜率更为凸显。港股已成为全球AI稀缺资产价值发现地,MiniMax与智谱作为全球唯二具备基座大模型能力的厂商,稀缺性溢价持续凸显。
智谱首份财报的发布,以及张鹏对AGI商业化“第一性原理”的重新定义,为整个大模型行业提供了一个可供参考的坐标系。
在这个坐标系中,“智能上界”是纵轴,决定高度;“Token消耗规模”是横轴,决定广度。而API,则是连接二者的最优路径。
张鹏说:“智谱不是一家传统意义上的软件公司,我们是一个以AGI为信仰的原生智能实验室。我们的护城河不在于算力的堆砌,而在于对智能本质的底层解构,以及将这种理解转化为社会生产力的定力。”
当大模型行业从“卷参数”走向“卷应用”,从“讲故事”走向“算账”,这份定力或许正是最稀缺的资源。而智能上界与Token消耗的乘积,终将决定谁能在AGI时代掌握真正的定价权。


