2026 AI 岗位知识图谱：真实 JD 数据洞察与学习路线图

基于 2026 年 5-6 月最新 JD（淘天 Agent 开发、公安部第一研究所模型推理、上海 AI Lab 大模型系统、平安健康保险推理加速等），从真实招聘需求中提取市场趋势、薪资数据和详细技能学习路径。

第一部分：岗位市场分析

岗位概览

#	公司	职位	薪资	地点	来源
1	淘天集团	AI Agent 开发工程师-交易业务	面议	北京	淘天招聘
2	公安部第一研究所	模型推理优化工程师	30-40k	北京	猎聘
3	上海 AI Lab（深圳河套学院）	大模型系统研发工程师	面议	深圳	官网
4	平安健康保险（平安科技语义实验室）	算法工程师（大模型推理加速）	面议	深圳	bebee
5	滴滴	大模型推理框架研发工程师（高级/资深）	面议	杭州	滴滴招聘
6	腾讯（牛企直聘转载）	大模型推理性能优化工程师	面议	深圳	niuqizp
7	腾讯（官方）	Omni全模态模型算法工程师	面议	北京	腾讯招聘
8	字节跳动	Data语音-推理框架优化工程师（2026届）	面议	杭州	字节校招
9	上海 AI Lab（浦东）	大模型推理部署工程师/高级工程师	面议	上海	官网
10	快手	大模型推理引擎工程师	面议	北京	牛客
11	双深科技 AttrSense	大模型算法研发工程师（校园）	面议	上海/杭州	官网
12	阿里巴巴（钉钉）	AI Agent 应用开发工程师（校园）	面议	杭州	阿里招聘
13	海翼电子（Anker）	AI模型推理加速/落地工程师（CUDA）	面议	长沙	猎聘
14	宁波数字孪生（东方理工）	LLM/AI大模型工程师	硕士20万起/博士40万起	宁波	理聘

知识体系总览

编程语言基础 ─→ 深度学习/ML 基础 ─→ Transformer 架构
       │                │                  │
       ▼                ▼                  ▼
  工程能力层        算法理解层          模型架构层
  (Python/C++/       (PyTorch/           (KV Cache/
   TS/Linux)          TensorFlow)         Flash Attention)
       │                │                  │
       └────────────────┼──────────────────┘
                        ▼
              ┌─────────────────────┐
              │    核心技能层         │
              │  推理框架 + Agent 工程 │
              └────────┬────────────┘
                       │
        ┌──────────────┼──────────────┐
        ▼              ▼              ▼
   推理优化层      Agent 应用层     生产部署层
   (量化/加速)    (工具调用/编排)   (Docker/K8s)
        │              │              │
        └──────────────┼──────────────┘
                       ▼
                  加分项层
              (CUDA/开源贡献/顶会)

薪资与技能关联

岗位	薪资	核心技能组合
模型推理优化工程师（公安部一所）	30-40k	PyTorch + vLLM/TensorRT + CUDA + 量化
AI Agent 开发工程师（淘天）	面议	TypeScript/Python + LangGraph + RAG + React
大模型系统研发（上海AI Lab）	面议	Python/C++ + vLLM/Megatron + CUDA + 分布式
算法工程师-推理加速（平安）	面议	Python/C++ + vLLM/SGLang + PagedAttention + K8s
推理框架研发（滴滴）	面议	C++/Python + CUDA + vLLM/TensorRT-LLM + 分布式
Omni全模态算法（腾讯）	面议	PyTorch + 全模态架构 + 跨模态对齐 + Python/C++
推理框架优化（字节跳动）	面议	CUDA/Triton + vLLM/SGLang + 量化/稀疏化 + 多模态
多模态推理（快手）	面议	vLLM/SGLang + CUDA/Triton + 量化 + 芯片优化
AI Agent 应用开发（钉钉/阿里）	面议	Java/Python + Agent 架构 + ADK + RAG + Multi-Agent
CUDA 推理加速（海翼/Anker）	面议	CUDA + TensorRT + ONNX + NPU/DSP 嵌入式部署
LLM/AI 大模型（宁波数字孪生）	硕士20万起/博士40万起	PyTorch + RAG + Agent + Prompt + EDA领域

核心发现：

推理优化方向薪资透明且较高（30-40k+），要求底层技术栈（CUDA、量化、分布式）
Agent 应用方向覆盖面广，淘天要求 TypeScript+React（偏前端），钉钉要求 Java/Python+Agent架构（偏后端）
科研院所（宁波数字孪生）给出明确薪资范围：硕士20万起、博士40万起
大厂（腾讯/字节/快手）推理岗明确要求 CUDA/Triton + vLLM 二次开发能力
跨境电商（Anker）也要求 CUDA 工程师——说明 AI 推理优化已渗透传统行业

2026 年 FDE 技能频率排行

排名	技能	出现次数	说明
1	vLLM	11/14	绝对统治力，几乎所有推理岗都要求
2	PyTorch	10/14	深度学习基础
3	Python	14/14	通用语言
4	C++	9/14	推理优化方向必修
5	CUDA / GPU 优化	9/14	大厂核心要求，拉开薪资差距
6	量化	8/14	INT8/FP8，推理优化核心技术
7	SGLang	6/14	结构化生成推理框架，上升最快
8	KV Cache	6/14	Transformer 推理基础
9	Triton（编程框架）	6/14	GPU kernel 开发新范式
10	分布式推理	6/14	TP/PP/EP，多卡多机
11	Docker / K8s	5/14	生产部署基础
12	RAG	4/14	Agent 应用标配
13	FlashAttention / PagedAttention	4/14	注意力机制优化
14	Agent / Function Calling	4/14	Agent 应用核心（钉钉新增 ADK 框架要求）
15	Continuous Batching	4/14	推理服务高并发
16	LoRA / DPO / RLHF	4/14	模型微调/对齐
17	MoE 推理	3/14	混合专家架构
18	Speculative Decoding	3/14	推测解码加速
19	Multi-Agent 构建	2/14	多智能体协作（钉钉明确要求）
20	Memory 系统	2/14	Agent 记忆（钉钉明确要求）
21	NPU/DSP 部署	2/14	边缘计算部署（海翼/Anker 要求）
22	Java	2/14	企业级后端开发（钉钉要求 Java/Python）
23	上下文压缩	1/14	上下文工程优化（钉钉明确要求）
24	ADK 框架	1/14	Agent Development Kit（钉钉明确要求）

公司分析

互联网大厂： 淘天（Agent 应用，TypeScript+React+LangGraph）、腾讯（Omni全模态+推理性能）、字节（校招 CUDA/Triton+vLLM）、滴滴（高级/资深，要求最全面）、快手（多模态推理）

科研院所： 上海 AI Lab（系统研发+推理部署，要求顶会/开源）、公安部一所（推理优化，30-40k）、宁波数字孪生（硕士20万起/博士40万起，EDA领域）

传统企业转型： 海翼电子 Anker（跨境电商也要求 CUDA）、平安健康保险（保险行业推理加速，加分项 CUDA/Triton Kernel）

第二部分：学习路线图

一、编程语言基础（所有岗位都要求）

1.1 Python（必学，100% 要求）

JD 原文引用：

淘天："精通 TypeScript / Node.js / Python 中至少一门语言"
公安部一所："熟悉 Linux + C++ / Python 开发环境"
平安保险："熟练掌握 C/C++、Python、Rust 中的一种或多种"
上海AI Lab："优秀的编程能力 (Python/C++)"

需要掌握：

Python 异步编程（asyncio）—— Agent 调用 LLM API 必须
面向对象设计 —— 框架扩展、工具封装
类型注解（typing）—— 大型项目可维护性
性能优化（Cython、multiprocessing）—— 推理服务并发

1.2 C++ / Rust（推理方向必学）

JD 原文引用：

平安保险："熟练掌握 C/C++、Python、Rust 中的一种或多种，工程素养扎实"
上海AI Lab："针对硬件（GPU/昇腾）特性进行底层优化"
公安部一所："熟悉 Linux + C++ / Python 开发环境"

需要掌握：

C++ 内存管理、模板编程 —— 推理引擎底层
跨平台编译（Linux 为主）
Rust 基础（加分项，平安保险明确提到）

1.3 TypeScript / Node.js（Agent 应用方向）

JD 原文引用：

淘天："精通 TypeScript / Node.js / Python 中至少一门语言"
淘天："熟悉 Vue / React 等主流前端框架"

需要掌握：

TypeScript 类型系统 —— AI Native 应用前端
Node.js 服务端 —— Agent 后端 API
React/Vue 框架 —— AI 产品交互界面

二、深度学习与 Transformer 基础

2.1 深度学习框架

JD 原文引用：

公安部一所："熟悉深度学习框架（如 PyTorch / TensorFlow）"
上海AI Lab："深入理解 Verl/vLLM/Megatron 底层机制"

需要掌握：

PyTorch 核心概念（Tensor、autograd、nn.Module）
模型定义、训练循环、评估流程
DataLoader、Dataset —— 数据处理管线

2.2 Transformer 架构（必学）

JD 原文引用：

上海AI Lab："扎实的算法基础，熟悉 Transformer 架构及大模型关键技术 (如 KV Cache, Flash Attention)"
平安保险："熟悉 Transformer 架构及主流大模型结构（Qwen、DeepSeek 等），理解前向推理计算流程"

需要掌握：

Self-Attention 机制（QKV、多头注意力）
Position Encoding（RoPE 等）
LayerNorm、FFN、残差连接
Decoder-only vs Encoder-Decoder
KV Cache（3 个 JD 都提到）
Flash Attention（上海AI Lab 明确要求）

2.3 主流大模型结构

JD 原文引用：

平安保险："理解前向推理计算流程"（Qwen、DeepSeek 等）

需要了解：

Qwen 系列架构特点
DeepSeek 系列架构特点（MoE、DeepSeek-V2/V3 的 MLA）
Llama 系列架构

三、推理框架与优化（最高频技能）

3.1 推理框架（至少精通一个）

JD 原文引用：

公安部一所："参与模型部署与推理框架优化，包括但不限于 TensorRT、ONNX Runtime、vLLM、Triton 等"
平安保险："基于 vLLM、SGLang、TensorRT-LLM 等框架，建设和优化推理服务能力"
上海AI Lab："开发或改进大模型框架（如Verl、vLLM、Megatron等）"
平安保险加分项："有 vLLM、SGLang、TensorRT-LLM 二次开发或开源贡献经验"

框架	适用场景	学习优先级
vLLM	大模型推理服务，PagedAttention	★★★★★ 必学
SGLang	结构化生成、推理编排	★★★★ 重点
TensorRT-LLM	NVIDIA GPU 高性能推理	★★★★ 重点
Triton Inference Server	生产级模型服务化	★★★ 重要
ONNX Runtime	跨平台推理	★★★ 重要
Megatron	分布式训练/推理	★★★ 重要
Verl	强化学习后训练	★★ 进阶

3.2 推理优化技术

JD 原文引用：

公安部一所："负责模型量化、剪枝、蒸馏、算子融合等推理加速技术的落地"
公安部一所："优化 GPU / CPU / NPU 等硬件上的模型推理效率，包括显存、延迟、吞吐量优化"
公安部一所："参与大模型推理架构设计，例如 KV Cache、Batching、流水线并行等优化策略"
平安保险："熟悉常见推理优化技术，如 PagedAttention、Prefix Cache、Speculative Decoding、量化等"
平安保险加分项："有 PD 分离、Expert Parallel、KV Cache 优化等实战经验"

需要掌握（按优先级）：

技术	说明	JD 出现次数	首次提到公司
量化（INT8/FP16/FP8）	降低精度换速度	7 次	公安部一所、滴滴、腾讯
vLLM	主流推理框架	9 次	所有推理岗
CUDA Kernel 开发	GPU 底层编程	6 次	滴滴、上海AI Lab、字节跳动
Triton（编程框架）	Python 写 GPU kernel	5 次	字节跳动、腾讯、快手
KV Cache 优化	减少重复计算	5 次	上海AI Lab、字节跳动、腾讯
SGLang	结构化生成推理	5 次	字节跳动、腾讯、快手、滴滴
PagedAttention	vLLM 核心优化	3 次	平安、滴滴
FlashAttention	注意力加速	3 次	滴滴、上海AI Lab
Continuous Batching	高并发推理	3 次	滴滴
Speculative Decoding	推测解码加速	2 次	上海AI Lab（浦东）
PD 分离（Prefill/Decode）	推理两阶段分离	1 次	平安保险
MoE 推理	混合专家架构	2 次	上海AI Lab（浦东）、腾讯
算子融合	减少 kernel launch 开销	2 次	公安部一所
Tensor Parallel	张量并行	2 次	平安保险
Pipeline Parallel	流水线并行	1 次	平安保险
Expert Parallel	MoE 专家并行	1 次	平安保险
LoRA/DPO/RLHF	模型微调/对齐	3 次	双深科技、上海AI Lab

3.3 GPU / 底层优化（加分但高薪必备）

JD 原文引用：

公安部一所："优化 GPU / CPU / NPU 等硬件上的模型推理效率"
上海AI Lab："精通 CUDA、OpenAI Triton 或 Ascend C，能进行内核级性能优化"
上海AI Lab："解决大模型在训练/推理中的瓶颈问题（如计算、存储、通信）"
平安保险加分项："有 CUDA/Triton Kernel 开发或 GPU 架构级性能调优经验"

需要掌握：

CUDA 基础编程（kernel 编写、内存管理）
OpenAI Triton（Python 写 GPU kernel）
GPU 架构基础（SM、显存层级、warp）
NCCL 通信库（分布式训练/推理）

四、Agent 工程（应用方向核心）

4.1 Agent 核心能力

JD 原文引用：

淘天："参与 AI Agent 系统的设计与研发，探索基于大模型的任务理解、工具调用与流程编排能力"
钉钉："参与Agent设计、开发和维护，完成从需求到设计、开发和上线等全项目周期工作"
钉钉："负责将Agent落地到实际业务场景，包括但不限于Prompt工程、RAG优化、Multi-Agent构建、Memory系统、RL系统、流程编排、知识库建设、内容生成及业务流程自动化等"
钉钉："熟练掌握Agent架构核心组件设计原理和调优方案，对开源的 Agent 框架了解者优先，包含而不限于ADK，Prompt 调优，Function Calling，RAG，上下文工程及压缩等"

需要掌握：

能力	对应技术	相关章节
任务理解	Prompt Engineering、ReAct 模式	03-context-engineering
工具调用	LangChain @tool、MCP 协议、Function Calling	05-frameworks-tools
流程编排	LangGraph StateGraph、条件分支、ADK	LangGraph 深度指南
多轮对话	MemorySaver、PostgresSaver、Memory 系统	07-agent-memory
人在回路	interrupt_before、update_state	LangGraph 深度指南
多智能体	Supervisor/Handoff 模式、Multi-Agent 构建	08-multi-agent
上下文压缩	上下文工程、Context Compression	03-context-engineering
RL 系统	强化学习后训练、RLHF	模型微调/增训

4.2 RAG 系统

JD 原文引用：

淘天："对大模型技术（如 Agent、RAG、Prompt Engineering、模型推理等）有实践或深入理解"
淘天加分项："有 AI Agent、RAG 系统或 AI 自动化工具等相关项目经验"
上海AI Lab加分项："熟悉 LLM 生态工具链 (如 Hugging Face, LangChain, LoRA)"

需要掌握：

文档分块策略（按段落、按语义、固定长度）
向量数据库（Milvus、Chroma、FAISS）
检索策略（BM25 + 向量混合检索）
重排序（Cross-encoder Reranker）
RAG 评估（RAGAS、DeepEval）

4.3 模型微调/增训

JD 原文引用：

上海AI Lab："预训练、增训微调、强化学习后训练、高性能推理落地的全流程工作"
上海AI Lab加分项："熟悉 LLM 生态工具链 (如 Hugging Face, LangChain, LoRA)"

需要了解：

LoRA / QLoRA 微调
SFT（Supervised Fine-Tuning）
RLHF（Reinforcement Learning from Human Feedback）
Hugging Face Transformers 库

五、生产部署与工程实践

5.1 服务化与部署

JD 原文引用：

公安部一所："设计并实现高性能推理服务，支持大规模并发请求"
公安部一所："熟悉推理服务框架（如 Triton、vLLM、Ray Serve、FastAPI 等）优先"
上海AI Lab："设计容错、弹性伸缩的推理平台，支持多租户、高并发场景需求"
上海AI Lab："熟悉 Linux 开发环境与容器化技术 (Docker/K8s)"
平安保险："熟悉 Docker/Kubernetes，有模型服务容器化部署经验"

需要掌握：

技术	用途	学习优先级
FastAPI	快速构建 API 服务	★★★★★ 必学
Docker	容器化部署	★★★★★ 必学
Kubernetes	集群编排、弹性伸缩	★★★★ 重要
Triton Inference Server	模型服务化	★★★ 重要
Ray Serve	分布式推理服务	★★ 进阶
Nginx / API Gateway	反向代理、负载均衡	★★★ 重要

5.2 分布式通信

JD 原文引用：

上海AI Lab："熟悉 NCCL、RDMA、MPI 等通信协议，有大规模分布式训练调优经验"
上海AI Lab："优化分布式计算、显存管理、通信效率等关键模块"
平安保险："了解分布式推理（TP/PP/EP）及 NCCL 等通信库"

需要了解：

NCCL（NVIDIA 集合通信库）
Tensor Parallel / Pipeline Parallel / Expert Parallel
RDMA 基础概念

5.3 工程素养

JD 原文引用：

淘天："具备良好的工程设计能力与代码质量意识"
淘天："具备良好的系统设计能力与技术前瞻性"
淘天："能够在快速变化的 AI 技术环境中持续迭代系统能力"
公安部一所："具备良好的工程能力和性能调优经验"
平安保险："认真负责，主动性强，有担当，愿意处理排障、调试、验证等基础但关键的工作"

需要掌握：

Git 工作流
单元测试 / 集成测试
CI/CD 基础
性能 profiling（cProfile、py-spy）
日志与监控（Prometheus、Grafana）
错误处理与重试机制

六、加分项（拉开薪资差距的关键）

加分项	出现 JD	对应学习方向
CUDA / Triton Kernel 开发	平安、上海AI Lab、滴滴、海翼电子	GPU 编程
vLLM / SGLang / TensorRT-LLM 二次开发或开源贡献	平安、滴滴、字节跳动	推理框架源码
百亿以上参数大模型训练/推理落地经验	上海AI Lab	分布式训练/推理
MLSys / NeurIPS / OSDI 顶会论文	上海AI Lab、双深科技、腾讯	学术研究
AI Agent / RAG 系统相关项目经验	淘天、钉钉	项目实战（本路线图第 14-17 阶段）
模型部署、推理优化、向量数据库、RAG 架构	淘天	全栈 AI 工程
AI Coding 工具熟练使用	平安	Claude Code / Cursor
大规模推理系统经验	字节跳动、滴滴	分布式推理
GPU/NPU 异构计算算子优化	滴滴、腾讯、上海AI Lab	GPU 底层编程
LoRA/DPO/RLHF 大模型微调	双深科技、上海AI Lab	模型增训
ACM/Kaggle 竞赛获奖	钉钉（阿里）	编程竞赛
NPU/DSP 嵌入式部署	海翼电子（Anker）	边缘计算
EDA 领域大模型	宁波数字孪生	垂直行业

学习路径映射

路线图阶段	覆盖的 JD 需求	覆盖度
01-Python 工程基础	所有岗位的基础要求	✅ 100%
02-LLM 基础	Transformer、KV Cache、主流模型	✅ 100%
03-Context Engineering	Prompt Engineering、RAG	✅ 100%
04-Harness Engineering	工程质量、约束验证	✅ 100%
05-框架与工具	工具调用、MCP 协议	✅ 100%
LangGraph 深度指南	Agent 系统设计与编排	✅ 100%
06-RAG 系统	RAG 全流程	✅ 100%
07-Agent 记忆	多轮对话记忆	✅ 100%
08-多智能体	Supervisor/Handoff 编排	✅ 100%
09-Safety & Guardrails	生产安全（淘天要求"稳定可扩展"）	✅ 100%
10-生产部署	FastAPI + Docker + K8s	✅ 100%
12-评估与可观测性	质量验证、成本追踪	✅ 100%
13-Agent 设计模式	ReAct、Reflection 等	✅ 100%
14-综合实战	Agent/RAG 项目经验（淘天加分项）	✅ 100%
15-Agent 平台	类 OpenClaw 平台构建	✅ 覆盖加分项
16-生产级 RAG	淘天加分项"RAG 架构"	✅ 100%
17-MCP Server	MCP 工具注册	✅ 覆盖加分项

路线图未直接覆盖的部分（需要额外学习）：

未覆盖	建议学习路径
CUDA / Triton Kernel	推荐：CUDA Programming Guide + Triton 官方教程
量化技术细节（INT8/FP8）	推荐：BitsAndBytes 文档
分布式训练（Megatron/Verl）	推荐：Megatron-LM GitHub
GPU 集群调度（K8s + GPU）	推荐：K8s Device Plugin for GPU

总结：2026 年 FDE 最应该学什么

精通 PyTorch + vLLM + SGLang + Python/C++ 工程能力，掌握 CUDA/Triton GPU 优化，能写 Agent 应用（LangGraph/RAG/Multi-Agent/Memory），知道 NPU/DSP 边缘部署是怎么回事——2026 年 FDE 市场基本通吃。大厂核心差距在 GPU 底层编程能力（CUDA/Triton），科研院所和传统企业（Anker、数字孪生）也在加速抢人。

第一部分：岗位市场分析​

岗位概览​

知识体系总览​

薪资与技能关联​

2026 年 FDE 技能频率排行​

公司分析​

第二部分：学习路线图​

一、编程语言基础（所有岗位都要求）​

1.1 Python（必学，100% 要求）​

1.2 C++ / Rust（推理方向必学）​

1.3 TypeScript / Node.js（Agent 应用方向）​

二、深度学习与 Transformer 基础​

2.1 深度学习框架​

2.2 Transformer 架构（必学）​

2.3 主流大模型结构​

三、推理框架与优化（最高频技能）​

3.1 推理框架（至少精通一个）​

3.2 推理优化技术​

3.3 GPU / 底层优化（加分但高薪必备）​

四、Agent 工程（应用方向核心）​

4.1 Agent 核心能力​

4.2 RAG 系统​

4.3 模型微调/增训​

五、生产部署与工程实践​

5.1 服务化与部署​

5.2 分布式通信​

5.3 工程素养​

六、加分项（拉开薪资差距的关键）​

学习路径映射​

总结：2026 年 FDE 最应该学什么​

第一部分：岗位市场分析

岗位概览

知识体系总览

薪资与技能关联

2026 年 FDE 技能频率排行

公司分析

第二部分：学习路线图

一、编程语言基础（所有岗位都要求）

1.1 Python（必学，100% 要求）

1.2 C++ / Rust（推理方向必学）

1.3 TypeScript / Node.js（Agent 应用方向）

二、深度学习与 Transformer 基础

2.1 深度学习框架

2.2 Transformer 架构（必学）

2.3 主流大模型结构

三、推理框架与优化（最高频技能）

3.1 推理框架（至少精通一个）

3.2 推理优化技术

3.3 GPU / 底层优化（加分但高薪必备）

四、Agent 工程（应用方向核心）

4.1 Agent 核心能力

4.2 RAG 系统

4.3 模型微调/增训

五、生产部署与工程实践

5.1 服务化与部署

5.2 分布式通信

5.3 工程素养

六、加分项（拉开薪资差距的关键）

学习路径映射

总结：2026 年 FDE 最应该学什么