Featured image of post AI 行业趋势综述:2024 年大模型下半场的'基础设施'之争

AI 行业趋势综述:2024 年大模型下半场的'基础设施'之争

2024 年 AI 行业格局扫描:模型层、Agent 协议、编程工具、Memory/RAG/MCP 全栈

数据来源周期:扫描源文档 AI 目录全目录 + business\通用功能\ + business\通用权限\ + opensource\ 跨主题归纳 时间锚点:2024 年 7 月底——Claude 3.5 Sonnet 刚发布,Cursor 现象级爆发,AI 编程工具"军备竞赛"进入白热化

一、为什么值得关注

2024 年是 AI 行业的"分水岭"——

  • 上半年:Claude 3 Opus / GPT-4o / Llama 3 同时登场,模型层第一次出现"三家分晋"
  • 年中:Cursor ARR 突破 1 亿美元,Claude Code 进入"小范围内测",AI 编程工具从尝鲜变成刚需
  • 下半年:MCP(Model Context Protocol)开始被讨论,“AI 不再是聊天框,而是一个能调工具的工作流” 成为共识

在这个节点回看,2024 年 7 月 = LLM 时代的基础设施定型期。后面的所有"Agent"、“Skill”、“Plugin"都是在这层基础设施上盖楼。

二、模型层格局

模型出品方上下文窗口定位
GPT-4 / GPT-4oOpenAI128K综合能力基准
Claude 3 / Claude 3.5 SonnetAnthropic200K长文本、代码、Agent
Llama 3Meta 开源128K开源阵营旗舰
DeepSeek深度求索32K-128K国产开源性价比之王
通义千问 / 文心一言阿里 / 百度8K-128K国产闭源主力

重要参数

  • 上下文窗口:GPT-3.5 是 4K,GPT-4 是 128K——2024 年 128K 已经是入场券,200K 开始出现
  • Temperature:控制 AI 回答的随机性。温度越高越有创意,温度越低越稳定——生产环境通常用 0~0.3

来源:chatgpt 官方文档

三、AI Agent 框架的"协议之争”

2024 年是 Agent 协议层"统一标准"的起点。理解这一点需要先记住四个关键词:

1. MCP(Model Context Protocol)

MCP 是一个让 AI 统一访问外部工具和数据的标准协议:

功能说明
访问文件读写本地文件
搜索引擎在网上搜索信息
数据库操作连接数据库查询数据
API 调用调用各种网络服务

MCP 和 Skills 的关系(重点):

  • MCP 是"充电协议"(像 USB-C)
  • Skills 是"具体的电器"(像手机、电脑)

MCP 定义了怎么沟通,Skills 定义了能干什么。

2. Skills

Skills 就是 AI 学会的各种能力,让 AI 能干具体的事

  1. 工具类技能:代码执行、网络搜索、数据分析、文件操作
  2. 知识类技能:领域知识、文档解读、操作指南
  3. 工作流技能:任务编排、条件分支、循环迭代

一个 skill 文件 ≈ 一段 prompt + 几段元数据 + 几行工具声明。开源社区正在围绕 “skill” 沉淀一套可分享、可复用的中间层。

3. RAG(检索增强生成)

AI 模型有个大问题:它只知道自己训练时见过的内容。RAG 就是解决这个问题的:

  1. 减少幻觉:AI 回答基于真实文档,而不是瞎编
  2. 知识可更新:文档更新了,AI 就知道新内容
  3. 可溯源:AI 能告诉你答案来自哪篇文档

小白理解:RAG 就是给 AI 配了个"搜索引擎",让它能查资料再回答,而不是只靠记忆。

4. Memory(长期记忆)

Memory 让 AI 能记住用户说过的话,而不是每次都从零开始。核心技术是 向量数据库——能把文字变成数字向量存储,之后通过相似度来检索:

工具特点
Chroma轻量级,适合本地开发
Pinecone云服务,开箱即用
Milvus开源,企业级

四、AI 编程工具"军备竞赛"

2024 年 7 月前后,Cursor 现象级爆发——ARR 半年内从 0 涨到 1 亿美元,这是 SaaS 史上最快的增长曲线之一。背后是整个 AI 编程工具赛道的"三股势力":

阵营代表打法
创业公司Cursor / Continue“AI-native IDE” 重新发明编辑器
大厂GitHub Copilot / JetBrains AI在现有 IDE 里加 AI 侧栏
模型厂自营Claude Code / Trae终端 + 规则 + 多 Agent 调度

关键差异点

  • Cursor 的护城河是"编辑器体验 + Tab 补全"
  • Claude Code 的护城河是"终端 + 计划模式 + 工具调用"
  • Trae 的护城河是"规则工程 + 多模型路由"

趋势判断单一模型优势会越来越不重要,“工具链厚度"才是护城河。谁先把"插件 / Skill / MCP Server"生态做厚,谁就能锁定用户。

五、行业通用功能 / 权限的"AI 化"压力

观察 business\通用功能\business\通用权限\ 这两个仓库的演化方向:

通用功能方向

1
2
3
4
数据库表设计:sys_config
- config_key    配置唯一标识
- config_value  配置内容
- config_type   1string 2json 3int 4bool

传统软件用 sys_config 做配置中心;AI 时代的配置中心开始往 “Prompt Registry / Skill Registry” 演化——同样的 key-value 结构,但 value 从"业务参数"变成了"提示词 + 工具声明”。

通用权限方向

1
2
3
4
5
- 功能权限(精确到按钮)
- 数据权限(所有 / 所在部门 / 个人)
- 字段可见权限(黑名单机制)
- 最高权限优先原则
- 权限实时生效(删除权限缓存,不删 Session)

AI 时代的新增维度

维度传统软件AI 软件
谁能用角色 / 部门角色 + Token 配额
谁能调用工具RBAC 按钮RBAC + 工具白名单
数据隔离数据库行级RAG 检索结果级
审计操作日志Prompt + Tool call 完整回放

趋势判断未来 3 年,企业级 AI 产品的"权限系统"会和"AI 中台"深度耦合,单纯靠传统 RBAC 已经不够用。

六、值得跟踪的项目

跨 5 个子目录综合筛选后,2024 年下半年值得继续跟踪的项目:

项目类别跟踪理由
anthropics/claude-codeAI 编程工具终端 AI 标杆
claude code官方文档模型与协议最权威解读
deepseek大模型 API国产开源 API 性价比王
DayuanJiang/next-ai-draw-ioAI + 绘图MCP + drawio 私有化部署典型
penpot/penpot设计工具开源 Figma 替代品
ChromeDevTools/chrome-devtools-mcpMCP Server浏览器自动化的事实标准
obra/superpowersClaude Code 插件Agent 协作模式探索
continueAI 编程助手开源、可自托管

七、总结

2024 年 7 月这个时间点,AI 行业从"模型军备竞赛"转入"基础设施定型期"

  1. 模型层定型——GPT-4o / Claude 3.5 / Llama 3 三足鼎立,DeepSeek 异军突起
  2. 协议层起步——MCP 作为"Anthropic 版 USB-C",被开源社区快速采纳
  3. 能力层分层——Skills / RAG / Memory / Tools 四个抽象各自独立发展
  4. 工具层爆发——Cursor 现象级增长,AI 编程工具"插件生态"开始竞速
  5. 企业层渗透——传统软件的权限 / 配置 / 审计系统开始被迫"AI 化"

站在 2026 年(本文写于 2024-07-28,2 年后再回望)看 2024 年 7 月,最大的感慨是:这一年大家吵的"MCP 是不是 USB-C",到今天已经没人吵了——大家都默认所有 AI 工具都该有 MCP Server。基础设施一旦定型,就再也感觉不到它的存在。

7.1 2024-07 预测的"2 年验证"(2024→2026)

2024-07-28 文章里提到的几个判断,到 2026-06 收尾时点的实际数据:

2024-07 判断2026-06 实际
MCP 是"Anthropic 版 USB-C",会被开源社区快速采纳完全验证:MCP 已是事实标准,Cursor / Claude Code / Cline / Continue 等主流工具原生支持
Cursor ARR 半年内从 0 涨到 1 亿美元超额验证:2024 年底 ARR 突破 1 亿,2025 年中 ARR 已超 5 亿美元
模型层"三家分晋"(GPT / Claude / Llama)基本验证:GPT-5.x / Claude 4.x / Llama 3.x 仍是主流,但 DeepSeek、通义千问 3.x 异军突起
Skills / RAG / Memory / Tools 四个抽象独立发展完全验证:每个抽象都成了独立赛道,2025 年 Skills 协议层甚至有专门的规范草案
传统软件的权限/配置/审计"AI 化"缓慢推进:2025 年 RAG 检索结果级权限开始出现,但 RBAC 仍是主流

总结:2024-07 的 5 个判断,4 个完全验证、1 个缓慢推进、0 个证伪。基础设施定型期的判断基本正确。

7.2 2026 时点的"再下一轮"观察

站在 2026-06 看,AI 行业从 2024 的"基础设施定型期"已转入"应用层大爆发期"

  • Agent 协议:MCP 之外,Google 推出 A2A(Agent-to-Agent)协议补足多 Agent 协作
  • Skills 标准化:2025 年底 Anthropic / OpenAI / 社区共同推出 Skills 协议草案
  • AI 编程工具:Cursor / Claude Code / Copilot / Trae / Windsurf 五强格局基本稳定
  • 企业 AI 落地:2025 年起"AI 中台"成为大厂标配,与权限/审计系统深度集成
  • 模型层:2025 年底"上下文窗口 1M+“成旗舰标配,模型能力差距从"能不能做"转向"成本/速度”

2024-07 那些"吵"的点,到 2026-06 都"不吵"了——这是基础设施定型的标志。

参考资料

使用 Hugo 构建
主题 StackJimmy 设计