AI时代的思维框架
最近做 GUI Agent 相关研究时,忽然发现了这个现阶段能自洽的框架。
整个过去的2025年,无论是自己的学习实践还是行业的发展,所有线索都指向同一个终极问题:
"未来的用户交互形态会是什么?"
我在草稿纸上拆解了这个问题,以便让未来很长一段时间的学习、工作与思考,都能在这个体系里迭代。这个框架很简单:
社会形态 + 技术边界 → 商业模式

1)社会形态是需求背景侧
人是完全被所生活境遇的导数所支配的动物。
从第一性原理出发,所有的需求都来自社会形态的环境变量变化。我会强制自己从三个尺度看同一件事:
- 宏观(国际/国家):在历史规律和哲学的叙事下,从国际竞合格局到产业结构、经济周期、政治政策、文化意识形态。
- 中观(城市/行业/企业):人才密度、成本结构、组织形态、流程摩擦点。
- 微观(个人):个体时间被如何切碎、注意力被如何分配、信任如何建立。
复杂系统往往会以“不同速度的层”一起转动——快层负责试错,慢层负责约束与沉淀。长期主义同样适用于想象未来的交互形态,即判断该交互能不能被慢层接受并写入基础设施。
2)技术边界是解决方案侧
认清并约束好边界才谈得上产品技术解决方案设计.
我把“边界”分为两类:
- 模型边界:幻觉、成本、时延、多模态能力、可控性与解释性的评测体系。
- 工程边界:借用Karpathy的推文:包括但不限于agents, subagents, their prompts, contexts, memory, modes, permissions, tools, plugins, skills, hooks, MCP, LSP, slash commands, workflows, IDE integrations。
现阶段的 Agent 设计更多是面向现有应用生态,是“替你操作”的执行者(视觉/自动化/设备驱动),它解决的是“不会用/懒得用/流程太长”等问题,这些都算是存量视角。
而我们个人在未来所谓的 AI Native 生态,以及在过渡阶段的共存生态中的存在声量份额,本质上就看你有多少增量视角了。
声量份额:借用GEO的关键指标 SoV(Share of Voice)
3)商业模式
我理解的商业模式,不是我卖什么,而是我长期占据了结算、信任或标准中的哪一层基础设施。
我从掌握分配权、提供制度化信任、形成复利三个维度分解:
商业模式设计是我们行业 knowhow 认知深度的体现。我认同技术差距并非护城河,差距迟早会被迭代抹平。越到后面,商业模式越不是“卖功能、定价格”,而是争夺生态里的控制点:能力被谁路由、价值如何结算、规则由谁制定、注意力被谁掌控,这就是分配权。
同时,Agent 交付的不只是体验,而是权限与责任。能规模化的商业一定把信任做成制度:可审计(可回放可追溯)、可控(权限分级与兜底)、可证明(安全与合规可验证)。在 AI 时代的社会系统里,“可被信任”会比“更聪明”更稀缺。
最后看复利结构:互联网时代的平台数据飞轮的增长逻辑,在体系重构之后还有哪些逻辑仍然适用?产品是否越用越强,是否沉淀数据、协作关系与标准/接口,是否形成迁移成本与网络/心智效应。
这个时代太有意思了。
2025 年对我来说,是迄今为止密度最高的一年。我会怀念它。
2026 年,我很期待。
———— 于 2025.12.31,成都