从「调用量超车」到「Gemma开源」:AI权力的东西转移
4月6日OpenRouter发布的数据,让整个行业重新审视地图。
上周全球AI大模型总调用量27万亿Token,环比增长18.9%。其中中国AI大模型调用量12.96万亿Token,环比上涨31.48%;美国仅3.03万亿Token,环比增长0.76%。
中国AI大模型调用量,已经连续五周超越美国。
调用量背后的真相
这个数据需要拆解来看。
首先,调用量不等于技术实力。中国调用量的爆发,很大程度上来自价格战的刺激。DeepSeek、阿里、字节等厂商把API价格打到地板价,甚至免费,自然会刺激调用量飙升。
但其次,调用量也不只是虚假繁荣。它代表了真实的用户采纳度和市场渗透。当一个国家的开发者和企业大规模地把AI模型集成到产品和工作流中时,这种「使用密度」本身就成了竞争力。
美国大模型调用量增长停滞,不是需求枯竭,而是市场趋于成熟。企业客户已经完成初步集成,增长曲线自然平缓。而中国市场还在快速渗透期,此消彼长之下,调用量超越美国并不奇怪。
真正值得关注的是:这种「使用密度」优势,能否转化为「技术迭代」优势?
历史经验告诉我们,大规模用户反馈是模型改进的重要燃料。当中国模型每天处理数万亿token的真实请求,获得的海量交互数据,可能成为下一代模型训练的宝贵资产。
Google的「开源赎罪」
同一天,Google发布了Gemma 4。
这不是一次普通的模型更新。Gemma 4最大的变化是许可证——从之前被诟病的自定义限制许可,改为Apache 2.0。
Apache 2.0是开源世界的黄金标准。它允许自由使用、修改、分发,包括商业用途。这意味着开发者可以把Gemma 4用在任何场景,不用担心法律风险。
Google为什么要这么做?
压力来自两方面:
内部压力——Google的闭源策略在Gemini时代遭遇挫折。尽管技术不差,但市场 adoption 始终追不上OpenAI。开源Gemma可能是Google重新赢得开发者社区信任的尝试。
外部压力——Llama、DeepSeek、Qwen等开源模型的崛起,正在侵蚀Google的话语权。如果Google继续抱着限制性许可不放,可能彻底失去开源生态的阵地。
Gemma 4的另一个亮点是性能。Google声称它可以跑在手机到高端GPU的各种消费级硬件上。这种「端侧友好」的设计,恰好契合了当下「小模型+端侧部署」的趋势。
Google的算盘很清楚:既然在云端大模型大战中暂时落后,不如换个战场,在开源和端侧领域重新建立影响力。
Oracle的AI豪赌
4月6日还有一条不太起眼但意味深长的消息:Oracle宣布裁员约2000人。
裁员本身不是新闻。真正值得关注的是裁员方向——被裁的主要是传统云计算和IT服务部门,而Oracle正在把资源集中到AI和云战略上。
这是Oracle的「断臂求生」。
作为老牌企业软件巨头,Oracle在云计算转型中已经慢了一拍。AWS、Azure、GCP三足鼎立的格局下,Oracle云一直处于边缘位置。
AI给了Oracle一个翻身的机会。通过与NVIDIA的紧密合作,Oracle在AI算力基础设施领域建立了一些差异化优势。现在它需要做的,是押上全部筹码。
裁员2000人,就是这种押注的体现。Oracle在向市场传递信号:我们不是修修补补,而是要全面转型。
英国的Anthropic攻势
最后一条值得关注的动态:英国正在积极邀请Anthropic去英国设立总部。
这个时机的选择很微妙。Anthropic刚刚在美国被列入供应链风险名单,与特朗普政府的关系紧张。英国此时抛出橄榄枝,显然是想趁虚而入。
对英国来说,吸引一家顶级AI公司落户,是脱欧后重建科技影响力的重要一步。对Anthropic来说,多一个总部选项意味着多一层政治保险。
这种「 headquarter shopping 」现象,在AI巨头中越来越普遍。OpenAI在考虑新加坡,Anthropic被英国邀请,中国的模型公司也在东南亚布局。在监管不确定性加剧的时代,地理分散成了风险对冲策略。
观察
4月6日的几条新闻,共同指向一个趋势:AI行业的权力格局正在经历东西转移。
中国在调用量上的领先,代表了「应用层」的话语权上升;Google的开源转向,代表了「技术层」的重新洗牌;Oracle的裁员转型,代表了「基础设施层」的剧烈重组;而Anthropic的英国选项,则代表了「地缘层」的多极化。
这场转移还没有结束,甚至可能刚刚开始。但有一点是确定的:单纯依靠技术领先就能通吃的时代,已经过去了。
参考来源