数据来源周期:扫描源文档 AI 目录全目录 +
business\通用功能\+business\通用权限\+opensource\跨主题归纳 时间锚点:2024 年 7 月底——Claude 3.5 Sonnet 刚发布,Cursor 现象级爆发,AI 编程工具"军备竞赛"进入白热化
一、为什么值得关注
2024 年是 AI 行业的"分水岭"——
- 上半年:Claude 3 Opus / GPT-4o / Llama 3 同时登场,模型层第一次出现"三家分晋"
- 年中:Cursor ARR 突破 1 亿美元,Claude Code 进入"小范围内测",AI 编程工具从尝鲜变成刚需
- 下半年:MCP(Model Context Protocol)开始被讨论,“AI 不再是聊天框,而是一个能调工具的工作流” 成为共识
在这个节点回看,2024 年 7 月 = LLM 时代的基础设施定型期。后面的所有"Agent"、“Skill”、“Plugin"都是在这层基础设施上盖楼。
二、模型层格局
| 模型 | 出品方 | 上下文窗口 | 定位 |
|---|---|---|---|
| GPT-4 / GPT-4o | OpenAI | 128K | 综合能力基准 |
| Claude 3 / Claude 3.5 Sonnet | Anthropic | 200K | 长文本、代码、Agent |
| Llama 3 | Meta 开源 | 128K | 开源阵营旗舰 |
| DeepSeek | 深度求索 | 32K-128K | 国产开源性价比之王 |
| 通义千问 / 文心一言 | 阿里 / 百度 | 8K-128K | 国产闭源主力 |
重要参数:
- 上下文窗口:GPT-3.5 是 4K,GPT-4 是 128K——2024 年 128K 已经是入场券,200K 开始出现
- Temperature:控制 AI 回答的随机性。温度越高越有创意,温度越低越稳定——生产环境通常用 0~0.3
来源:chatgpt 官方文档
三、AI Agent 框架的"协议之争”
2024 年是 Agent 协议层"统一标准"的起点。理解这一点需要先记住四个关键词:
1. MCP(Model Context Protocol)
MCP 是一个让 AI 统一访问外部工具和数据的标准协议:
| 功能 | 说明 |
|---|---|
| 访问文件 | 读写本地文件 |
| 搜索引擎 | 在网上搜索信息 |
| 数据库操作 | 连接数据库查询数据 |
| API 调用 | 调用各种网络服务 |
MCP 和 Skills 的关系(重点):
- MCP 是"充电协议"(像 USB-C)
- Skills 是"具体的电器"(像手机、电脑)
MCP 定义了怎么沟通,Skills 定义了能干什么。
2. Skills
Skills 就是 AI 学会的各种能力,让 AI 能干具体的事:
- 工具类技能:代码执行、网络搜索、数据分析、文件操作
- 知识类技能:领域知识、文档解读、操作指南
- 工作流技能:任务编排、条件分支、循环迭代
一个 skill 文件 ≈ 一段 prompt + 几段元数据 + 几行工具声明。开源社区正在围绕 “skill” 沉淀一套可分享、可复用的中间层。
3. RAG(检索增强生成)
AI 模型有个大问题:它只知道自己训练时见过的内容。RAG 就是解决这个问题的:
- 减少幻觉:AI 回答基于真实文档,而不是瞎编
- 知识可更新:文档更新了,AI 就知道新内容
- 可溯源:AI 能告诉你答案来自哪篇文档
小白理解:RAG 就是给 AI 配了个"搜索引擎",让它能查资料再回答,而不是只靠记忆。
4. Memory(长期记忆)
Memory 让 AI 能记住用户说过的话,而不是每次都从零开始。核心技术是 向量数据库——能把文字变成数字向量存储,之后通过相似度来检索:
| 工具 | 特点 |
|---|---|
| Chroma | 轻量级,适合本地开发 |
| Pinecone | 云服务,开箱即用 |
| Milvus | 开源,企业级 |
四、AI 编程工具"军备竞赛"
2024 年 7 月前后,Cursor 现象级爆发——ARR 半年内从 0 涨到 1 亿美元,这是 SaaS 史上最快的增长曲线之一。背后是整个 AI 编程工具赛道的"三股势力":
| 阵营 | 代表 | 打法 |
|---|---|---|
| 创业公司 | Cursor / Continue | “AI-native IDE” 重新发明编辑器 |
| 大厂 | GitHub Copilot / JetBrains AI | 在现有 IDE 里加 AI 侧栏 |
| 模型厂自营 | Claude Code / Trae | 终端 + 规则 + 多 Agent 调度 |
关键差异点:
- Cursor 的护城河是"编辑器体验 + Tab 补全"
- Claude Code 的护城河是"终端 + 计划模式 + 工具调用"
- Trae 的护城河是"规则工程 + 多模型路由"
趋势判断:单一模型优势会越来越不重要,“工具链厚度"才是护城河。谁先把"插件 / Skill / MCP Server"生态做厚,谁就能锁定用户。
五、行业通用功能 / 权限的"AI 化"压力
观察 business\通用功能\ 和 business\通用权限\ 这两个仓库的演化方向:
通用功能方向:
| |
传统软件用 sys_config 做配置中心;AI 时代的配置中心开始往 “Prompt Registry / Skill Registry” 演化——同样的 key-value 结构,但 value 从"业务参数"变成了"提示词 + 工具声明”。
通用权限方向:
| |
AI 时代的新增维度:
| 维度 | 传统软件 | AI 软件 |
|---|---|---|
| 谁能用 | 角色 / 部门 | 角色 + Token 配额 |
| 谁能调用工具 | RBAC 按钮 | RBAC + 工具白名单 |
| 数据隔离 | 数据库行级 | RAG 检索结果级 |
| 审计 | 操作日志 | Prompt + Tool call 完整回放 |
趋势判断:未来 3 年,企业级 AI 产品的"权限系统"会和"AI 中台"深度耦合,单纯靠传统 RBAC 已经不够用。
六、值得跟踪的项目
跨 5 个子目录综合筛选后,2024 年下半年值得继续跟踪的项目:
| 项目 | 类别 | 跟踪理由 |
|---|---|---|
| anthropics/claude-code | AI 编程工具 | 终端 AI 标杆 |
| claude code | 官方文档 | 模型与协议最权威解读 |
| deepseek | 大模型 API | 国产开源 API 性价比王 |
| DayuanJiang/next-ai-draw-io | AI + 绘图 | MCP + drawio 私有化部署典型 |
| penpot/penpot | 设计工具 | 开源 Figma 替代品 |
| ChromeDevTools/chrome-devtools-mcp | MCP Server | 浏览器自动化的事实标准 |
| obra/superpowers | Claude Code 插件 | Agent 协作模式探索 |
| continue | AI 编程助手 | 开源、可自托管 |
七、总结
2024 年 7 月这个时间点,AI 行业从"模型军备竞赛"转入"基础设施定型期":
- 模型层定型——GPT-4o / Claude 3.5 / Llama 3 三足鼎立,DeepSeek 异军突起
- 协议层起步——MCP 作为"Anthropic 版 USB-C",被开源社区快速采纳
- 能力层分层——Skills / RAG / Memory / Tools 四个抽象各自独立发展
- 工具层爆发——Cursor 现象级增长,AI 编程工具"插件生态"开始竞速
- 企业层渗透——传统软件的权限 / 配置 / 审计系统开始被迫"AI 化"
站在 2026 年(本文写于 2024-07-28,2 年后再回望)看 2024 年 7 月,最大的感慨是:这一年大家吵的"MCP 是不是 USB-C",到今天已经没人吵了——大家都默认所有 AI 工具都该有 MCP Server。基础设施一旦定型,就再也感觉不到它的存在。
7.1 2024-07 预测的"2 年验证"(2024→2026)
2024-07-28 文章里提到的几个判断,到 2026-06 收尾时点的实际数据:
| 2024-07 判断 | 2026-06 实际 |
|---|---|
| MCP 是"Anthropic 版 USB-C",会被开源社区快速采纳 | 完全验证:MCP 已是事实标准,Cursor / Claude Code / Cline / Continue 等主流工具原生支持 |
| Cursor ARR 半年内从 0 涨到 1 亿美元 | 超额验证:2024 年底 ARR 突破 1 亿,2025 年中 ARR 已超 5 亿美元 |
| 模型层"三家分晋"(GPT / Claude / Llama) | 基本验证:GPT-5.x / Claude 4.x / Llama 3.x 仍是主流,但 DeepSeek、通义千问 3.x 异军突起 |
| Skills / RAG / Memory / Tools 四个抽象独立发展 | 完全验证:每个抽象都成了独立赛道,2025 年 Skills 协议层甚至有专门的规范草案 |
| 传统软件的权限/配置/审计"AI 化" | 缓慢推进:2025 年 RAG 检索结果级权限开始出现,但 RBAC 仍是主流 |
总结:2024-07 的 5 个判断,4 个完全验证、1 个缓慢推进、0 个证伪。基础设施定型期的判断基本正确。
7.2 2026 时点的"再下一轮"观察
站在 2026-06 看,AI 行业从 2024 的"基础设施定型期"已转入"应用层大爆发期":
- Agent 协议:MCP 之外,Google 推出 A2A(Agent-to-Agent)协议补足多 Agent 协作
- Skills 标准化:2025 年底 Anthropic / OpenAI / 社区共同推出 Skills 协议草案
- AI 编程工具:Cursor / Claude Code / Copilot / Trae / Windsurf 五强格局基本稳定
- 企业 AI 落地:2025 年起"AI 中台"成为大厂标配,与权限/审计系统深度集成
- 模型层:2025 年底"上下文窗口 1M+“成旗舰标配,模型能力差距从"能不能做"转向"成本/速度”
2024-07 那些"吵"的点,到 2026-06 都"不吵"了——这是基础设施定型的标志。
