AI 行业趋势综述：2024 年大模型下半场的'基础设施'之争

数据来源周期：扫描源文档 AI 目录全目录 + business\通用功能\ + business\通用权限\ + opensource\ 跨主题归纳 时间锚点：2024 年 7 月底——Claude 3.5 Sonnet 刚发布，Cursor 现象级爆发，AI 编程工具"军备竞赛"进入白热化

一、为什么值得关注

2024 年是 AI 行业的"分水岭"——

上半年：Claude 3 Opus / GPT-4o / Llama 3 同时登场，模型层第一次出现"三家分晋"
年中：Cursor ARR 突破 1 亿美元，Claude Code 进入"小范围内测"，AI 编程工具从尝鲜变成刚需
下半年：MCP（Model Context Protocol）开始被讨论，“AI 不再是聊天框，而是一个能调工具的工作流” 成为共识

在这个节点回看，2024 年 7 月 = LLM 时代的基础设施定型期。后面的所有"Agent"、“Skill”、“Plugin"都是在这层基础设施上盖楼。

二、模型层格局

模型	出品方	上下文窗口	定位
GPT-4 / GPT-4o	OpenAI	128K	综合能力基准
Claude 3 / Claude 3.5 Sonnet	Anthropic	200K	长文本、代码、Agent
Llama 3	Meta 开源	128K	开源阵营旗舰
DeepSeek	深度求索	32K-128K	国产开源性价比之王
通义千问 / 文心一言	阿里 / 百度	8K-128K	国产闭源主力

重要参数：

上下文窗口：GPT-3.5 是 4K，GPT-4 是 128K——2024 年 128K 已经是入场券，200K 开始出现
Temperature：控制 AI 回答的随机性。温度越高越有创意，温度越低越稳定——生产环境通常用 0~0.3

来源：chatgpt 官方文档

三、AI Agent 框架的"协议之争”

2024 年是 Agent 协议层"统一标准"的起点。理解这一点需要先记住四个关键词：

1. MCP（Model Context Protocol）

MCP 是一个让 AI 统一访问外部工具和数据的标准协议：

功能	说明
访问文件	读写本地文件
搜索引擎	在网上搜索信息
数据库操作	连接数据库查询数据
API 调用	调用各种网络服务

MCP 和 Skills 的关系（重点）：

MCP 是"充电协议"（像 USB-C）
Skills 是"具体的电器"（像手机、电脑）

MCP 定义了怎么沟通，Skills 定义了能干什么。

2. Skills

Skills 就是 AI 学会的各种能力，让 AI 能干具体的事：

工具类技能：代码执行、网络搜索、数据分析、文件操作
知识类技能：领域知识、文档解读、操作指南
工作流技能：任务编排、条件分支、循环迭代

一个 skill 文件 ≈ 一段 prompt + 几段元数据 + 几行工具声明。开源社区正在围绕 “skill” 沉淀一套可分享、可复用的中间层。

3. RAG（检索增强生成）

AI 模型有个大问题：它只知道自己训练时见过的内容。RAG 就是解决这个问题的：

减少幻觉：AI 回答基于真实文档，而不是瞎编
知识可更新：文档更新了，AI 就知道新内容
可溯源：AI 能告诉你答案来自哪篇文档

小白理解：RAG 就是给 AI 配了个"搜索引擎"，让它能查资料再回答，而不是只靠记忆。

4. Memory（长期记忆）

Memory 让 AI 能记住用户说过的话，而不是每次都从零开始。核心技术是 向量数据库——能把文字变成数字向量存储，之后通过相似度来检索：

工具	特点
Chroma	轻量级，适合本地开发
Pinecone	云服务，开箱即用
Milvus	开源，企业级

四、AI 编程工具"军备竞赛"

2024 年 7 月前后，Cursor 现象级爆发——ARR 半年内从 0 涨到 1 亿美元，这是 SaaS 史上最快的增长曲线之一。背后是整个 AI 编程工具赛道的"三股势力"：

阵营	代表	打法
创业公司	Cursor / Continue	“AI-native IDE” 重新发明编辑器
大厂	GitHub Copilot / JetBrains AI	在现有 IDE 里加 AI 侧栏
模型厂自营	Claude Code / Trae	终端 + 规则 + 多 Agent 调度

关键差异点：

Cursor 的护城河是"编辑器体验 + Tab 补全"
Claude Code 的护城河是"终端 + 计划模式 + 工具调用"
Trae 的护城河是"规则工程 + 多模型路由"

趋势判断：单一模型优势会越来越不重要，“工具链厚度"才是护城河。谁先把"插件 / Skill / MCP Server"生态做厚，谁就能锁定用户。

五、行业通用功能 / 权限的"AI 化"压力

观察 business\通用功能\ 和 business\通用权限\ 这两个仓库的演化方向：

通用功能方向：

1
2
3
4
数据库表设计：sys_config
- config_key    配置唯一标识
- config_value  配置内容
- config_type   1string 2json 3int 4bool

传统软件用 sys_config 做配置中心；AI 时代的配置中心开始往 “Prompt Registry / Skill Registry” 演化——同样的 key-value 结构，但 value 从"业务参数"变成了"提示词 + 工具声明”。

通用权限方向：

1
2
3
4
5
- 功能权限（精确到按钮）
- 数据权限（所有 / 所在部门 / 个人）
- 字段可见权限（黑名单机制）
- 最高权限优先原则
- 权限实时生效（删除权限缓存，不删 Session）

AI 时代的新增维度：

维度	传统软件	AI 软件
谁能用	角色 / 部门	角色 + Token 配额
谁能调用工具	RBAC 按钮	RBAC + 工具白名单
数据隔离	数据库行级	RAG 检索结果级
审计	操作日志	Prompt + Tool call 完整回放

趋势判断：未来 3 年，企业级 AI 产品的"权限系统"会和"AI 中台"深度耦合，单纯靠传统 RBAC 已经不够用。

六、值得跟踪的项目

跨 5 个子目录综合筛选后，2024 年下半年值得继续跟踪的项目：

项目	类别	跟踪理由
anthropics/claude-code	AI 编程工具	终端 AI 标杆
claude code	官方文档	模型与协议最权威解读
deepseek	大模型 API	国产开源 API 性价比王
DayuanJiang/next-ai-draw-io	AI + 绘图	MCP + drawio 私有化部署典型
penpot/penpot	设计工具	开源 Figma 替代品
ChromeDevTools/chrome-devtools-mcp	MCP Server	浏览器自动化的事实标准
obra/superpowers	Claude Code 插件	Agent 协作模式探索
continue	AI 编程助手	开源、可自托管

七、总结

2024 年 7 月这个时间点，AI 行业从"模型军备竞赛"转入"基础设施定型期"：

模型层定型——GPT-4o / Claude 3.5 / Llama 3 三足鼎立，DeepSeek 异军突起
协议层起步——MCP 作为"Anthropic 版 USB-C"，被开源社区快速采纳
能力层分层——Skills / RAG / Memory / Tools 四个抽象各自独立发展
工具层爆发——Cursor 现象级增长，AI 编程工具"插件生态"开始竞速
企业层渗透——传统软件的权限 / 配置 / 审计系统开始被迫"AI 化"

站在 2026 年（本文写于 2024-07-28，2 年后再回望）看 2024 年 7 月，最大的感慨是：这一年大家吵的"MCP 是不是 USB-C"，到今天已经没人吵了——大家都默认所有 AI 工具都该有 MCP Server。基础设施一旦定型，就再也感觉不到它的存在。

7.1 2024-07 预测的"2 年验证"（2024→2026）

2024-07-28 文章里提到的几个判断，到 2026-06 收尾时点的实际数据：

2024-07 判断	2026-06 实际
MCP 是"Anthropic 版 USB-C"，会被开源社区快速采纳	完全验证：MCP 已是事实标准，Cursor / Claude Code / Cline / Continue 等主流工具原生支持
Cursor ARR 半年内从 0 涨到 1 亿美元	超额验证：2024 年底 ARR 突破 1 亿，2025 年中 ARR 已超 5 亿美元
模型层"三家分晋"（GPT / Claude / Llama）	基本验证：GPT-5.x / Claude 4.x / Llama 3.x 仍是主流，但 DeepSeek、通义千问 3.x 异军突起
Skills / RAG / Memory / Tools 四个抽象独立发展	完全验证：每个抽象都成了独立赛道，2025 年 Skills 协议层甚至有专门的规范草案
传统软件的权限/配置/审计"AI 化"	缓慢推进：2025 年 RAG 检索结果级权限开始出现，但 RBAC 仍是主流

总结：2024-07 的 5 个判断，4 个完全验证、1 个缓慢推进、0 个证伪。基础设施定型期的判断基本正确。

7.2 2026 时点的"再下一轮"观察

站在 2026-06 看，AI 行业从 2024 的"基础设施定型期"已转入"应用层大爆发期"：

Agent 协议：MCP 之外，Google 推出 A2A（Agent-to-Agent）协议补足多 Agent 协作
Skills 标准化：2025 年底 Anthropic / OpenAI / 社区共同推出 Skills 协议草案
AI 编程工具：Cursor / Claude Code / Copilot / Trae / Windsurf 五强格局基本稳定
企业 AI 落地：2025 年起"AI 中台"成为大厂标配，与权限/审计系统深度集成
模型层：2025 年底"上下文窗口 1M+“成旗舰标配，模型能力差距从"能不能做"转向"成本/速度”

2024-07 那些"吵"的点，到 2026-06 都"不吵"了——这是基础设施定型的标志。