你的AI战略从一开始就是错的
大多数AI战略写作让真正需要落地执行的人失望。写这些内容的人似乎完全没注意到。
我在Google从事AI基础设施工作——文档管理系统、知识代理、项目管理工具。我亲眼看着各组织采用麦肯锡和Gartner的AI战略,锁定平台,然后花十二个月绕开他们刚部署的工具。那些在SharePoint上积灰的战略文档,是一个在墨迹未干时就已经翻篇的世界的遗物。
2025年1月,Claude Sonnet和GPT-4o两个模型占据了企业AI查询量的91.5%。到12月,没有任何单一模型的份额超过23%。一个日历年。与此同时,78%的员工正在使用雇主未批准的AI工具——不是因为他们是反叛者,而是因为批准的工具根本跟不上。
麦肯锡发现只有6%的组织达到AI高绩效标准。BCG说只有5%的公司是"面向未来构建"的。MIT的NANDA报告直言不讳:95%的企业AI试点项目对P&L没有任何可测量的影响。所有人都认同病人病了。但处方——成熟度模型、准备度评估、分阶段路线图——本身就是疾病的一部分。
框架在一个惩罚确定性的系统中开具确定性的处方
翻开过去一年的任何一份主要AI战略文件。五个级别的成熟度模型。优先级矩阵。建立C级治理的建议。你找不到的:任何对以下事实的坦诚承认——这些技术在战略落地时将已面目全非。
GPT-4的输入token成本在2023年3月是每百万token 30美元。到2025年中期,同等能力的成本不到2美元。两年内下降93%。上下文窗口在同一时期从4000个token扩展到200万个。这些不是渐进式的改进。是相变。当Epoch AI追踪到推理成本以每年50倍的速度下降时,你的18个月AI路线图是在为一个你执行到第二季度时就已不复存在的世界做规划。
Klarna在2023年用一个OpenAI聊天机器人取代了700名客服人员。每月处理230万次对话。到2025年初,客户满意度下降了22%,公司开始重新招聘人类员工。麦当劳花了三年时间与IBM合作构建AI点餐系统,然后在系统不断往冰淇淋圣代里加培根之后终止了合作。S&P Global发现,2025年有42%的公司放弃了大部分AI计划——高于前一年的17%。这些不是执行失败。是战略失败。每一个都假设当前的工具就是正确的工具。
真正的优势在于切换成本,而非工具选择
如果你的AI工具将在12个月内过时——而数据压倒性地表明确实如此——那么战略问题就不是"我们应该采用哪种AI工具?",而是"当更好的选项出现时,我们能以多低的成本切换?"
这是一个基础设施问题,而非愿景问题。它意味着在你的工作流和模型之间构建抽象层。它意味着偏好基于提示的方法而非微调,因为微调模型会产生基于提示的工作流不会产生的锁定。它意味着将供应商合同视为短期租赁,而非长期抵押贷款。
92%的财富500强公司现在使用多模型平台,顶级账户平均运行30种不同的AI模型。a16z企业CIO调查证实了这一转变。创新预算在一年内从LLM支出的25%下降到仅7%。不是因为公司停止了创新。而是因为他们不再把AI视为实验,开始把它当作可替换的基础设施。制胜的姿态是架构灵活性,而非工具忠诚度。
情境整合才是持久的优势
切换模型时,机构知识不会贬值。这才是关键。
Ethan Mollick——AI战略领域被从业者引用最多的声音——直接点出:"如果你在一年半前我警告你不要这样做的时候构建了一个'与我们的文档对话'的聊天机器人,你现在拥有的是一个轻易就能被开箱即用模型击败的平庸聊天机器人。"聊天机器人是错误的投资。它下面的知识基础设施才是正确的。
42%的机构知识仅存在于个别员工身上。当他们离开时,组织所知道的近一半内容也随之离开。AI让这个问题变得尖锐——因为一个能够访问结构良好的机构情境的系统,无论由哪个模型驱动,都会显著优于一个依赖通用训练数据运行的系统。情境层与模型无关,它随时间复利增长,而且是你的AI技术栈中随着模型变得更便宜、更强大而变得更有价值的那一部分。
实际工作并不光鲜。它是将分散的数据资产统一为可搜索、机器可读的格式。它是从Slack线程和会议记录中捕获决策依据。它是构建保存项目、人员和结果之间关系的知识图谱。这就是我每天所做的事情——而这是在每次模型迭代中都能存活下来的投资。
影子AI是你最好的战略信号
当78%的员工使用你未批准的AI工具时,这不是一场治理危机,而是一个市场信号。你的员工在直接告诉你,你批准的工具没有解决他们的实际问题。
MIT NANDA研究发现,在超过90%的受访组织中,员工定期使用个人AI工具,尽管只有40%的公司提供官方LLM订阅。研究中一位企业律师所在的律所在专门的合同分析工具上投入了5万美元——而她一直在使用ChatGPT。不是出于对抗,而是出于务实。
有用的回应不是禁止影子AI,也不是在员工已经在绕过的企业工具上加倍投入。研究这片影子。人们在选择什么工具?用于哪些任务?这揭示了你的官方工具在哪里失败?Mollick将这些用户称为"秘密半机器人"——那些通过日常实验弄清楚AI如何融入工作流程的人。他们是你最好的战略家。为他们的洞察构建一条通往决策者的路径,你就创造了没有任何咨询框架能卖给你的东西:工作与战略之间的实时反馈循环。
研究附录:关键数据来源
AI战略框架概况
- 麦肯锡"AI现状"(2025年11月,1,993名受访者): 88%的组织在≥1个职能中使用AI;只有约6%是"AI高绩效者"(EBIT影响超过5%)
- BCG"为未来而建"(2025年,1,250名高管): 只有5%的公司是"面向未来构建"的;其DRI(部署-重塑-创造)框架和10/20/70法则(70%用于人员/流程)
- Gartner AI成熟度模型: 只有五分之一的AI计划实现ROI;只有五十分之一带来转型;呼吁以"动态"战略进行颠覆触发的定期评审
- HBR: 多种框架(GenAI行动手册、3种战略原型);W. Chan Kim的批评:"当公司以AI为主导或将其视为答案时,他们是在本末倒置"
- a16z企业CIO调查(100名CIO,2025年): 多模型世界已是现实;37%使用5个以上的模型;创新预算从LLM支出的25%下降到7%
- 德勤AI现状2026(3,235名领导者,24个国家): 只有34%的人将AI用于深度转型;42%认为战略已准备好,但只有20%在人才方面感到有所准备
影子AI数据
- 78%的员工使用未经批准的AI工具(WalkMe/SAP 2025年调查,1,000名美国工人)
- 80%的美国办公室工作人员使用AI,只有22%完全使用雇主提供的工具(IBM 2025年,3,000名工人)
- 超过90%的MIT受访组织员工定期使用个人AI工具;只有40%的公司购买企业订阅(MIT NANDA)
- OpenAI占所有影子AI使用量的53%(Reco.ai 2025年影子AI现状报告)
- 与影子AI相关的数据泄露平均使组织多付出约67万美元(IBM 2025年数据泄露成本报告)
Token成本与上下文窗口趋势
- GPT-4输入:每百万token 30美元(2023年3月)→ 2.50美元(2024年8月)→ 约2美元(2025年)= 下降93%
- Epoch AI:LLM推理成本每年下降约10倍;中位数50倍/年;2024年1月后加速至200倍/年
- 上下文窗口:4K token(2023年初)→ 32K → 128K → 200K → 1M → 2M token(2025年末)
- GPT-4同等性能:每百万token 20美元(2022年末)→ 0.40美元(2025年12月)= 50倍下降
企业AI失败与锁定数据
- 95%的企业AI试点项目对P&L没有任何可测量的影响(MIT NANDA,2025年7月)
- 2025年42%的公司放弃了大部分AI计划,高于2024年的17%(S&P Global)
- 超过80%的AI项目失败——是非AI IT项目失败率的2倍(RAND Corporation,2024年)
- 只有25%的AI项目实现了承诺的ROI;只有16%在企业范围内扩展(IBM对2,000名CEO的调查)
- 企业模型市场份额:91.5%的双寡头垄断(2025年1月)→ 四模型分布(2025年12月)
- Klarna:取代约700名客服,满意度下降22%,现正重新招聘
- 麦当劳/IBM AOT合作:在三年AI点餐测试后于2024年7月终止
- 42%的机构知识仅存在于个别员工身上(Enterprise Knowledge)
从业者声音
- Ethan Mollick《One Useful Thing》(超过10万订阅者): "没有人有完整的行动手册";领导力/实验室/群体框架;"秘密半机器人"
- Simon Willison: 从业者优先,展示真实工作流程和成本,对AI局限性诚实坦率
- Ishaan Agarwal(Square高级产品经理): "各公司对AI的态度就像维多利亚时代的医生对待水蛭一样"
- Continue.dev/Ty Dunn论情境工程: "大多数组织坐拥大量有价值的情境……但这些信息的存在形式对人类和AI来说都很难访问"