本周系统设计速览包括:

  • 12 个每位工程师都应了解的 Claude Code 功能
  • Agentic RAG 如何工作?
  • REST API 如何工作?
  • 7 个关键的负载均衡使用场景

12 个每位工程师都应了解的 Claude Code 功能

Claude Code 功能概览

  1. CLAUDE.md:项目记忆文件,用于定义自定义规则与约定。Claude 在每次会话开始时会读取。

  2. Permissions(权限):控制 Claude 可以使用和不能使用哪些工具。

  3. Plan Mode(计划模式):Claude 先计划再行动。你可以在任意代码变更发生之前审阅计划。

  4. Checkpoints(检查点):项目的自动快照,出问题时可回退。

  5. Skills(技能):可复用的指令文件,Claude 会自动遵循。

  6. Hooks(钩子):在生命周期事件(如 PreToolUsePostToolUse)上运行自定义 shell 脚本。

  7. MCP:将 Claude 连接到数据库与第三方服务等外部工具。

  8. Plugins(插件):通过包含 skills、MCP 与 hooks 的第三方集成扩展 Claude。

  9. Context(上下文):向 Claude 投喂它需要的信息,并用 /context 管理当前上下文窗口。

  10. Slash Commands(斜杠命令):为常用任务创建快捷方式。输入 / 并从已保存命令中选择。

  11. Compaction(压缩):压缩长对话以节省 token。

  12. Subagents(子代理):为复杂任务并行启动多个代理,拆分大型多步工作流并同时运行。

交给你:你最常用哪一项 Claude Code 功能?还有哪些功能你希望出现在这份清单里?

Agentic RAG 是如何工作的?

传统 RAG 往往检索方式简单、适应性有限,并依赖静态知识,对动态与实时信息不够灵活。

Agentic RAG 通过引入能够做决策、选择工具、甚至细化查询的 AI 代理来改进这一点,从而获得更准确、更灵活的回应。高层来看,Agentic RAG 的工作方式如下:

Agentic RAG 工作流程示意

  • 用户查询被送往 AI Agent 处理。

  • 代理使用短期与长期记忆跟踪查询上下文,并制定检索策略、为任务选择合适的工具。

  • 数据拉取过程可使用向量检索、多代理与 MCP 服务器等工具,从知识库中收集相关数据。

  • 代理将检索结果与查询及系统提示合并,再交给 LLM。

  • LLM 处理优化后的输入以回答用户问题。

REST API 是如何工作的?

它有哪些原则、方法、约束与最佳实践?希望下图能给你一个快速概览。

REST API 原理与要素概览

7 个关键的负载均衡使用场景

流量分发:负载均衡器有助于在多台服务器实例之间较均匀地分配流量。

SSL 终结:负载均衡器可将 SSL 终结从后端服务器上卸载,从而减轻后端负担。

会话保持:负载均衡器可确保来自同一用户的请求始终打到同一实例,以维持会话。

高可用:通过将流量从故障或不健康的实例切到健康实例,提高系统可用性。

可扩展性:当向服务器池增加实例以应对更高流量时,负载均衡器支持水平扩展。

缓解 DDoS:负载均衡器可通过限流或将请求分散到更大面积上来减轻 DDoS 影响。

健康检查:负载均衡器还会监控实例的健康与性能,并将失败或不健康的实例移出池。

交给你:你还会在清单里加上哪些负载均衡使用场景?

负载均衡典型场景示意

本文为学习目的的个人翻译。

原文标题:EP209: 12 Claude Code Features Every Engineer Should Know

版权归原作者或原刊登方所有。本文为非官方译本;如有不妥,请联系删除。