最近,企业服务行业(包括企业软件行业)突然爆火一个新词“Token经济”,一家名不见经传的新兴 AI 公司迅策科技在香港股市上市值飙升到千亿,正是被称为“Token 经济”第一股。那什么叫“Token 经济”呢?

Token 本身的含义是大语言模型的最小计费单元,今天Token经济和前些年的

提的“API经济”(API economy,我在《平台经济 |数字化转型从经济理论到咨询忽悠,兼谈中国企业软件行业的误判》《数字化转型 | 你的开放银行需要一个战略》《为中台正名 | 数字化转型真谛是连接和开放,没中台和API还真不行》等文中有介绍)的AI升级——服务方提供的服务的直接用户从软件开发者变成了AI智能体;API经济将业务能力拆解为可调用的软件组件,Token经济则将智能推理本身拆解为可计量的最小单元。

API经济的核心商业模式,是将复杂的底层能力封装为标准化的接口,按调用量、订阅周期或项目制售卖。它的本质是功能即服务——例如短信、支付、人脸识别,每一项能力都被打包成开发者可以随时调用的能力。API 经济代表性公司是:Stripe将全球支付网络封装为几行代码即可接入的API,Twilio将电信基础设施变成可调用的通信服务,AWS等云计算将计算、存储、网络全部API化。在国内,商汤、旷视等计算机图像识别厂商将人脸识别算法封装为云端API,按调用次数计费。API经济的收入模式主要分为三种:

按调用付费(Pay-as-you-go),适合流量波动大的场景,客户按实际用量付费;

订阅制,按月或年收取固定费用,为客户提供成本可预期性;

项目制或混合模式,为大型客户提供包含硬件、软件和定制服务的整体解决方案。

API 经济是云服务的经济模式。在API经济之前,企业获取技术能力的主要方式是本地部署或完全定制开发。例如一家银行要上线人脸识别系统,需要采购服务器、部署算法模型、组建运维团队,项目周期以季度甚至年度计算,前期投入动辄数百万元,只有头部企业才能负担。API经济打破了这种高投入的格局,现在只需调用云端人脸识别API,按每次身份验证付费,将固定成本转化为变动成本,小银行也能使用这种本来需要大投入的数字化能力了。

Token经济则更进一步。它不是将功能打包成API,而是将大模型的每一次“思考”拆解为Token——输入Token定义理解成本,输出Token定义生成成本。这不再是功能即服务,而是推理即服务。Token仍然通过API交付,但计费的颗粒度发生了质变。过去一个“翻译API”的调用是黑箱——你不知道模型内部发生了什么,只为翻译结果付费。但在Token经济下,同样的翻译任务被分解为数千个Token的推理过程,用户为每一次思考步骤买单。因而可以说Token经济继承了API经济的全部商业模式,并将其推向极致。

按Token付费是最细粒度的按量计费;订阅制演变为每月固定Token额度;还有免费增值模式,以有限的免费Token吸引用户,超出后按量收费。批模式允许用户在低峰期提交大批量推理任务,以换取更低的Token单价,类似于云计算的预留实例。

在设计商业模式时,要思考用户是谁,客户是谁?他们为什么会用我们、买我们,我们怎样说服他们用我们、买我们。API经济的直接用户是开发者,他们理解业务对技术的需求,选择合适API,编写集成代码,处理异常情况,优化调用逻辑。开发者是API经济和软件终端用户之间的中间层。

这就决定了API经济的产品逻辑:面向开发者优化。完善的文档、丰富的SDK、活跃的社区、清晰的定价,这些是API产品赢得开发者的关键。Stripe的成功,很大程度上归功于其卓越的开发者体验——文档清晰,集成简便。API经济激活了巨大的长尾市场;那些需求量小、预算有限的细分需求,在传统模式下无人问津,通过API找到了低成本解决方案。例如个人开发者调用地图API构建旅行规划应用,小型电商集成图像识别API激活小众商品类目,这些零散但数量庞大的尾部需求,汇聚成了可观的商业价值。大中型企业同样是API的重要消费者,只是它们的使用方式更为复杂——通常需要混合私有化部署、SLA保障和定制化服务。

Token经济环境下,开发者的角色从API调用者转变为Agent架构师——设定目标、管理预算、监控性能,而非手动编排每一次模型调用。Agent本身成为Token的直接消费者。一个Agent在完成“帮我调研竞品”的指令时,会自主拆解任务、多次调用模型、消耗大量Token。它不关心底层用的什么大模型,只关心推理质量和Token效率。

从API经济到Token经济的商业逻辑有主要转变,是价值创造、交付和捕获方式的重构。

在API经济中,人(开发者)是调用行为的决策者和成本的承担者。因此,所有API提供商的增长策略都围绕开发者体验展开:清晰的文档、易用的SDK、活跃的社区。这是一种面向人的吸引和赋能。

但在Token经济中,直接的消费者变成了Agent。Agent不会阅读文档,它通过API发现和调用能力。因此,获取客户(即那些部署Agent的人或企业)的方式,必然要从让开发者用起来顺手,转变为让Agent能发现并高效调用。

从营销上,GEO (生成式引擎优化) 会是Token 经济的主要战场。API经济 通过对程序员营销(例如社区布道),是让开发者在搜索引擎或文档中,更快地找到需要的API,并理解如何集成。而Token经济通过GEO和Agent优化,目标是让厂商的服务、工具或API,在Agent的“推理-行动”循环中,成为其首选方案。这意味着厂商需要:

提供机器可读性极佳的接口:API描述文件需要极其精确、结构化,以便Agent能自动理解参数、约束和副作用。

在Agent的记忆和知识库中占据位置:通过提供高质量的实践经验、案例数据,让模型在训练或微调阶段就内化了你的服务是最优解。这也是 #企业知识开源 的初衷。

设计Agent友好的计费与权限模型:支持Agent能够自主完成预算检查、申请和成本计入,而无需人类每一步都介入审批。

Token经济平台运营商的核心价值主张,正从为客户提供能力,转向帮助客户优化对这种能力的消耗。

API经济卖的是能力即服务。比如,商汤科技卖的是“人脸比对”这个能力,客户关心的是能力的精度、可用性和单位调用成本。Token经济卖的是“推理即服务”。比如,一个Agent运行一次复杂的市场调研,消耗的是几十万个Token。此时,企业客户的核心痛点是:

成本不可控:一个开放式的Agent任务,Token消耗是概率性的,可能从几千暴涨到几十万。成本成了黑盒。

效率不可知:同样一个任务,不同的提示词、不同的模型、不同的推理路径,Token效率天差地别。Agent是否有不必要的絮絮叨叨或重复推理?

效果难归因:消耗了这么多Token,带来的业务价值是多少?一次失败的推理链条消耗的Token就是纯成本。

Token 平台运营商的价值主张是:我不仅能提供推理能力,更能帮你以最低的成本、最高的效率,可靠地达成业务结果。

这意味着未来的平台运营商,必须提供围绕Token全生命周期管理的服务,成为客户(不仅是消费Token 的 Agent,而是为 Token 付费的企业)的Token优化顾问。这个Token 运营管理平台服务可能包括:

-   Token可观测性平台:实时监控每个Agent、每个任务的Token消耗全景,提供精细化的账单和成本归因。

-   Token效率优化引擎:自动进行提示词压缩、缓存语义相近的请求、为子任务路由到最具性价比的小模型,甚至直接提供算法层面的Token节省方案。

-   Token预算与治理服务:允许客户为不同Agent、不同部门设置Token消耗限额、预警机制和审批流程,让Agent在财务约束下自主决策。

-   基于结果/产出/效果的Token定价:创新的商业模式,比如为“成功完成一次合格的市场调研报告”这个结果定价,而将Token消耗的波动风险由平台通过技术优化来承担。

Token 运营管理平台可以说是 AI 原生企业的 ERP,这可能是企业管理软件的革命。

这个商业逻辑跟我在《EPM-AIOPS | 47亿美元收购CIO用的业财一体化软件》写的云管平台有类似的地方。

总结下,API经济的商业服务平台是一个功能管道,它高效地传输能力,价值在管道两端。而Token经济的运营是一个智能调度中心。它不仅要输送智能,更像一个能源管理中心,帮客户规划用多少电(Token),用什么电(模型选择),怎么省电(优化效率),并确保电器(Agent)安全、经济地运行。

这是 AI 时代的企业AI服务的商业模式思考,也是迅策科技这类公司在资本市场上收到热捧的底层逻辑。