从「调用量超车」到「Gemma开源」：AI权力的东西转移

2026-04-06 AI行业观察

─────── CONTENT ───────

4月6日OpenRouter发布的数据，让整个行业重新审视地图。

上周全球AI大模型总调用量27万亿Token，环比增长18.9%。其中中国AI大模型调用量12.96万亿Token，环比上涨31.48%；美国仅3.03万亿Token，环比增长0.76%。

中国AI大模型调用量，已经连续五周超越美国。

调用量背后的真相

这个数据需要拆解来看。

首先，调用量不等于技术实力。中国调用量的爆发，很大程度上来自价格战的刺激。DeepSeek、阿里、字节等厂商把API价格打到地板价，甚至免费，自然会刺激调用量飙升。

但其次，调用量也不只是虚假繁荣。它代表了真实的用户采纳度和市场渗透。当一个国家的开发者和企业大规模地把AI模型集成到产品和工作流中时，这种「使用密度」本身就成了竞争力。

美国大模型调用量增长停滞，不是需求枯竭，而是市场趋于成熟。企业客户已经完成初步集成，增长曲线自然平缓。而中国市场还在快速渗透期，此消彼长之下，调用量超越美国并不奇怪。

真正值得关注的是：这种「使用密度」优势，能否转化为「技术迭代」优势？

历史经验告诉我们，大规模用户反馈是模型改进的重要燃料。当中国模型每天处理数万亿token的真实请求，获得的海量交互数据，可能成为下一代模型训练的宝贵资产。

同一天，Google发布了Gemma 4。

这不是一次普通的模型更新。Gemma 4最大的变化是许可证——从之前被诟病的自定义限制许可，改为Apache 2.0。

Apache 2.0是开源世界的黄金标准。它允许自由使用、修改、分发，包括商业用途。这意味着开发者可以把Gemma 4用在任何场景，不用担心法律风险。

Google为什么要这么做？

压力来自两方面：

内部压力——Google的闭源策略在Gemini时代遭遇挫折。尽管技术不差，但市场 adoption 始终追不上OpenAI。开源Gemma可能是Google重新赢得开发者社区信任的尝试。

外部压力——Llama、DeepSeek、Qwen等开源模型的崛起，正在侵蚀Google的话语权。如果Google继续抱着限制性许可不放，可能彻底失去开源生态的阵地。

Gemma 4的另一个亮点是性能。Google声称它可以跑在手机到高端GPU的各种消费级硬件上。这种「端侧友好」的设计，恰好契合了当下「小模型+端侧部署」的趋势。

Google的算盘很清楚：既然在云端大模型大战中暂时落后，不如换个战场，在开源和端侧领域重新建立影响力。

4月6日还有一条不太起眼但意味深长的消息：Oracle宣布裁员约2000人。

裁员本身不是新闻。真正值得关注的是裁员方向——被裁的主要是传统云计算和IT服务部门，而Oracle正在把资源集中到AI和云战略上。

这是Oracle的「断臂求生」。

作为老牌企业软件巨头，Oracle在云计算转型中已经慢了一拍。AWS、Azure、GCP三足鼎立的格局下，Oracle云一直处于边缘位置。

AI给了Oracle一个翻身的机会。通过与NVIDIA的紧密合作，Oracle在AI算力基础设施领域建立了一些差异化优势。现在它需要做的，是押上全部筹码。

裁员2000人，就是这种押注的体现。Oracle在向市场传递信号：我们不是修修补补，而是要全面转型。

最后一条值得关注的动态：英国正在积极邀请Anthropic去英国设立总部。

这个时机的选择很微妙。Anthropic刚刚在美国被列入供应链风险名单，与特朗普政府的关系紧张。英国此时抛出橄榄枝，显然是想趁虚而入。

对英国来说，吸引一家顶级AI公司落户，是脱欧后重建科技影响力的重要一步。对Anthropic来说，多一个总部选项意味着多一层政治保险。

这种「 headquarter shopping 」现象，在AI巨头中越来越普遍。OpenAI在考虑新加坡，Anthropic被英国邀请，中国的模型公司也在东南亚布局。在监管不确定性加剧的时代，地理分散成了风险对冲策略。

4月6日的几条新闻，共同指向一个趋势：AI行业的权力格局正在经历东西转移。

中国在调用量上的领先，代表了「应用层」的话语权上升；Google的开源转向，代表了「技术层」的重新洗牌；Oracle的裁员转型，代表了「基础设施层」的剧烈重组；而Anthropic的英国选项，则代表了「地缘层」的多极化。

这场转移还没有结束，甚至可能刚刚开始。但有一点是确定的：单纯依靠技术领先就能通吃的时代，已经过去了。

参考来源

─────── EOF ───────

─────── COMMENTS ───────

$ cat comments.md

💬 使用 GitHub 账号登录即可发表评论