跳到主要内容

AI 工程核心技术栈

掌握 AI 应用的四大核心技术：提示词工程、RAG、Agent 和 AI 评测——这是构建生产级 AI 应用的基础能力。

前置知识

模型是怎么工作的 — 理解 LLM 的能力边界（token 生成、temperature、上下文窗口）
推理引擎与量化 — 理解推理服务的延迟和成本约束
什么是 FDE — 理解 FDE 岗位的职责范围

为什么需要学这个

模型部署只是第一步。要让 LLM 产生业务价值，FDE 还需要掌握应用层的核心能力：

控制输出质量：同样的模型，不同 Prompt 的输出差异巨大
注入私有知识：LLM 的训练数据不包含你的业务信息，RAG 是桥梁
实现自主行动：Agent 让 AI 从"对话工具"变成"自动化执行者"
保证系统可靠：没有评测体系，AI 的每一次迭代都是盲盒

这四门技术是 FDE 向"应用层"延伸的核心能力，也是面试中高频考察的部分。

本模块学习地图

顺序	文档	解决什么问题	时长
1	提示词工程	如何稳定地让模型输出想要的结果	30 分钟
2	RAG 原理	如何让模型基于私有数据回答	1 小时
3	Agent 架构	如何让 AI 自主规划、调用工具、完成任务	1 小时
4	AI 评测	如何量化和保证 AI 系统质量	45 分钟

核心概念速览

这四门技术构成了 AI 应用开发的完整闭环：

技术	一句话概括	核心能力
提示词工程	用自然语言"编程"大模型	结构化指令、思维链、工具调用
RAG	让 LLM 拥有"外挂知识库"	文档索引、向量检索、上下文增强
Agent	让 LLM 自主完成任务	规划、记忆、工具、多 Agent 协作
AI 评测	量化 AI 系统的好坏	精度/性能/安全/用户体验评估

面试视角

技术	常考题型
提示词工程	如何设计生产 Prompt、Prompt vs 微调、减少幻觉
RAG	RAG 架构、检索优化、延迟优化、评估方法
Agent	Agent 架构、记忆系统、Multi-Agent、可靠性
AI 评测	Benchmark 选择、性能测试、RAG 评估、安全扫描

学完本模块后，你应该能够...

设计生产级 Prompt 模板并减少幻觉
构建 RAG 系统并优化检索质量
解释 Agent 的核心组件（规划、记忆、工具）
设计 AI 系统的评测方案（精度 + 性能 + 安全）

上一节：大模型怎么部署到多块 GPU 上 | 下一节：提示词工程

前置知识
为什么需要学这个
本模块学习地图
核心概念速览
面试视角
学完本模块后，你应该能够...