20 个 AI 概念
- 机器学习:核心算法、统计和模型训练技术
- 深度学习:分层神经网络自动学习复杂表示
- 神经网络:分层架构高效准确模拟非线性关系
- NLP:处理和理解自然语言文本的技术
- 计算机视觉:解释和分析视觉数据的算法
- 强化学习:跨多个服务器分布流量以提高可靠性
- 生成模型:使用学习数据创建新数据样本
- LLM:使用大规模预训练数据生成类人文本
- Transformers:基于自注意力架构支持现代 AI 模型
- 特征工程:设计信息丰富特征显著提高模型性能
- 监督学习:从无标签数据学习有用表示
- 贝叶斯学习:使用概率模型方法结合不确定性
- 提示工程:精心制作有效输入指导生成模型输出
- AI Agent:感知、决策和行动的自主系统
- 微调模型:为领域特定任务定制预训练模型
- 多模态模型:跨多种数据类型(如图像、视频和文本)处理和生成
- 嵌入:将输入转换为机器可读向量格式
- 向量搜索:使用密集向量嵌入查找相似项
- 模型评估:使用验证技术评估预测性能
- AI 基础设施:部署可扩展系统支持 AI 操作
构建 RAG 应用的 AI 应用栈
大型语言模型
这些是检索增强生成(RAG)的核心引擎,负责理解查询并生成连贯和上下文响应。一些常见 LLM 选项是 OpenAI GPT 模型、Llama、Claude、Gemini、Mistral、DeepSeek、Qwen 2.5、Gemma 等。
框架和模型访问
这些工具通过处理提示编排、模型切换、记忆、链接和路由简化 LLM 集成到应用中。常见工具是 Langchain、LlamaIndex、Haystack、Ollama、Hugging Face 和 OpenRouter。
数据库
RAG 应用依赖存储和检索相关信息。这些向量数据库针对相似性搜索优化,而关系选项如 Postgres 提供结构化存储。工具是 Postgres、FAISS、Milvus、pgVector、Weaviate、Pinecone、Chroma 等。
数据提取
填充知识库,这些工具帮助从非结构化源(如 PDF、网站和 API)提取结构化信息。一些常见工具是 Llamaparse、Docking、Megaparser、Firecrawl、ScrapeGraph AI、Document AI 和 Claude API。
文本嵌入
嵌入将文本转换为高维向量,实现语义相似性搜索,这是在 RAG 中连接查询与相关上下文的关键步骤。常见工具是 Nomic、OpenAI、Cognita、Gemini、LLMWare、Cohere、JinaAI 和 Ollama。
Shopify 技术栈
Shopify 处理大多数系统会崩溃的规模。
在单日(2024 年黑色星期五),平台处理 1730 亿请求,峰值每分钟 2.84 亿请求,并通过其边缘每分钟推送 12TB 流量。
这些数字不是异常。它们是 Shopify 努力满足的持续目标。在这个规模背后是外表欺骗简单的技术栈:Ruby on Rails、React、MySQL 和 Kafka。
但这种简单隐藏尖锐架构决策、多年重构和数千 deliberate 权衡。
在这个通讯中,我们映射 Shopify 的技术栈从:
- 仍然运行业务的模块化单体
- 到隔离失败域的 pod
- 到每天部署数百更改的部署管道
它涵盖 Shopify 使用的工具、编程语言和模式,以保持快速、弹性且开发者友好在难以置信的规模。
本文为学习目的的个人翻译,译文仅供参考。
原文链接:EP167: Top 20 AI Concepts You Should Know。
版权归原作者或原刊登方所有。本文为非官方译本;如有不妥,请联系删除。