AI时代的思维框架

2025-12-31 · Junyi Yan

最近做 GUI Agent 相关研究时，忽然发现了这个现阶段能自洽的框架。

整个过去的2025年，无论是自己的学习实践还是行业的发展，所有线索都指向同一个终极问题：

"未来的用户交互形态会是什么？"

我在草稿纸上拆解了这个问题，以便让未来很长一段时间的学习、工作与思考，都能在这个体系里迭代。这个框架很简单：

社会形态 + 技术边界 → 商业模式

人是完全被所生活境遇的导数所支配的动物。

从第一性原理出发，所有的需求都来自社会形态的环境变量变化。我会强制自己从三个尺度看同一件事：

复杂系统往往会以“不同速度的层”一起转动——快层负责试错，慢层负责约束与沉淀。长期主义同样适用于想象未来的交互形态，即判断该交互能不能被慢层接受并写入基础设施。

认清并约束好边界才谈得上产品技术解决方案设计.

我把“边界”分为两类：

模型边界：幻觉、成本、时延、多模态能力、可控性与解释性的评测体系。
工程边界：借用Karpathy的推文：包括但不限于agents, subagents, their prompts, contexts, memory, modes, permissions, tools, plugins, skills, hooks, MCP, LSP, slash commands, workflows, IDE integrations。

现阶段的 Agent 设计更多是面向现有应用生态，是“替你操作”的执行者（视觉/自动化/设备驱动），它解决的是“不会用/懒得用/流程太长”等问题，这些都算是存量视角。

而我们个人在未来所谓的 AI Native 生态，以及在过渡阶段的共存生态中的存在声量份额，本质上就看你有多少增量视角了。

声量份额：借用GEO的关键指标 SoV(Share of Voice)

我理解的商业模式，不是我卖什么，而是我长期占据了结算、信任或标准中的哪一层基础设施。

我从掌握分配权、提供制度化信任、形成复利三个维度分解：

商业模式设计是我们行业 knowhow 认知深度的体现。我认同技术差距并非护城河，差距迟早会被迭代抹平。越到后面，商业模式越不是“卖功能、定价格”，而是争夺生态里的控制点：能力被谁路由、价值如何结算、规则由谁制定、注意力被谁掌控，这就是分配权。

同时，Agent 交付的不只是体验，而是权限与责任。能规模化的商业一定把信任做成制度：可审计（可回放可追溯）、可控（权限分级与兜底）、可证明（安全与合规可验证）。在 AI 时代的社会系统里，“可被信任”会比“更聪明”更稀缺。

最后看复利结构：互联网时代的平台数据飞轮的增长逻辑，在体系重构之后还有哪些逻辑仍然适用？产品是否越用越强，是否沉淀数据、协作关系与标准/接口，是否形成迁移成本与网络/心智效应。

这个时代太有意思了。

2025 年对我来说，是迄今为止密度最高的一年。我会怀念它。

2026 年，我很期待。

———— 于 2025.12.31，成都