跳到主要内容

2026 AI 岗位知识图谱:真实 JD 数据洞察与学习路线图

基于 2026 年 5-6 月最新 JD(淘天 Agent 开发、公安部第一研究所模型推理、上海 AI Lab 大模型系统、平安健康保险推理加速等), 从真实招聘需求中提取市场趋势、薪资数据和详细技能学习路径。


第一部分:岗位市场分析

岗位概览

#公司职位薪资地点来源
1淘天集团AI Agent 开发工程师-交易业务面议北京淘天招聘
2公安部第一研究所模型推理优化工程师30-40k北京猎聘
3上海 AI Lab(深圳河套学院)大模型系统研发工程师面议深圳官网
4平安健康保险(平安科技语义实验室)算法工程师(大模型推理加速)面议深圳bebee
5滴滴大模型推理框架研发工程师(高级/资深)面议杭州滴滴招聘
6腾讯(牛企直聘转载)大模型推理性能优化工程师面议深圳niuqizp
7腾讯(官方)Omni全模态模型算法工程师面议北京腾讯招聘
8字节跳动Data语音-推理框架优化工程师(2026届)面议杭州字节校招
9上海 AI Lab(浦东)大模型推理部署工程师/高级工程师面议上海官网
10快手大模型推理引擎工程师面议北京牛客
11双深科技 AttrSense大模型算法研发工程师(校园)面议上海/杭州官网
12阿里巴巴(钉钉)AI Agent 应用开发工程师(校园)面议杭州阿里招聘
13海翼电子(Anker)AI模型推理加速/落地工程师(CUDA)面议长沙猎聘
14宁波数字孪生(东方理工)LLM/AI大模型工程师硕士20万起/博士40万起宁波理聘

知识体系总览

编程语言基础 ─→ 深度学习/ML 基础 ─→ Transformer 架构
│ │ │
▼ ▼ ▼
工程能力层 算法理解层 模型架构层
(Python/C++/ (PyTorch/ (KV Cache/
TS/Linux) TensorFlow) Flash Attention)
│ │ │
└────────────────┼──────────────────┘

┌─────────────────────┐
│ 核心技能层 │
│ 推理框架 + Agent 工程 │
└────────┬────────────┘

┌──────────────┼──────────────┐
▼ ▼ ▼
推理优化层 Agent 应用层 生产部署层
(量化/加速) (工具调用/编排) (Docker/K8s)
│ │ │
└──────────────┼──────────────┘

加分项层
(CUDA/开源贡献/顶会)

薪资与技能关联

岗位薪资核心技能组合
模型推理优化工程师(公安部一所)30-40kPyTorch + vLLM/TensorRT + CUDA + 量化
AI Agent 开发工程师(淘天)面议TypeScript/Python + LangGraph + RAG + React
大模型系统研发(上海AI Lab)面议Python/C++ + vLLM/Megatron + CUDA + 分布式
算法工程师-推理加速(平安)面议Python/C++ + vLLM/SGLang + PagedAttention + K8s
推理框架研发(滴滴)面议C++/Python + CUDA + vLLM/TensorRT-LLM + 分布式
Omni全模态算法(腾讯)面议PyTorch + 全模态架构 + 跨模态对齐 + Python/C++
推理框架优化(字节跳动)面议CUDA/Triton + vLLM/SGLang + 量化/稀疏化 + 多模态
多模态推理(快手)面议vLLM/SGLang + CUDA/Triton + 量化 + 芯片优化
AI Agent 应用开发(钉钉/阿里)面议Java/Python + Agent 架构 + ADK + RAG + Multi-Agent
CUDA 推理加速(海翼/Anker)面议CUDA + TensorRT + ONNX + NPU/DSP 嵌入式部署
LLM/AI 大模型(宁波数字孪生)硕士20万起/博士40万起PyTorch + RAG + Agent + Prompt + EDA领域

核心发现:

  • 推理优化方向薪资透明且较高(30-40k+),要求底层技术栈(CUDA、量化、分布式)
  • Agent 应用方向覆盖面广,淘天要求 TypeScript+React(偏前端),钉钉要求 Java/Python+Agent架构(偏后端)
  • 科研院所(宁波数字孪生)给出明确薪资范围:硕士20万起、博士40万起
  • 大厂(腾讯/字节/快手)推理岗明确要求 CUDA/Triton + vLLM 二次开发能力
  • 跨境电商(Anker)也要求 CUDA 工程师——说明 AI 推理优化已渗透传统行业

2026 年 FDE 技能频率排行

排名技能出现次数说明
1vLLM11/14绝对统治力,几乎所有推理岗都要求
2PyTorch10/14深度学习基础
3Python14/14通用语言
4C++9/14推理优化方向必修
5CUDA / GPU 优化9/14大厂核心要求,拉开薪资差距
6量化8/14INT8/FP8,推理优化核心技术
7SGLang6/14结构化生成推理框架,上升最快
8KV Cache6/14Transformer 推理基础
9Triton(编程框架)6/14GPU kernel 开发新范式
10分布式推理6/14TP/PP/EP,多卡多机
11Docker / K8s5/14生产部署基础
12RAG4/14Agent 应用标配
13FlashAttention / PagedAttention4/14注意力机制优化
14Agent / Function Calling4/14Agent 应用核心(钉钉新增 ADK 框架要求)
15Continuous Batching4/14推理服务高并发
16LoRA / DPO / RLHF4/14模型微调/对齐
17MoE 推理3/14混合专家架构
18Speculative Decoding3/14推测解码加速
19Multi-Agent 构建2/14多智能体协作(钉钉明确要求)
20Memory 系统2/14Agent 记忆(钉钉明确要求)
21NPU/DSP 部署2/14边缘计算部署(海翼/Anker 要求)
22Java2/14企业级后端开发(钉钉要求 Java/Python)
23上下文压缩1/14上下文工程优化(钉钉明确要求)
24ADK 框架1/14Agent Development Kit(钉钉明确要求)

公司分析

互联网大厂: 淘天(Agent 应用,TypeScript+React+LangGraph)、腾讯(Omni全模态+推理性能)、字节(校招 CUDA/Triton+vLLM)、滴滴(高级/资深,要求最全面)、快手(多模态推理)

科研院所: 上海 AI Lab(系统研发+推理部署,要求顶会/开源)、公安部一所(推理优化,30-40k)、宁波数字孪生(硕士20万起/博士40万起,EDA领域)

传统企业转型: 海翼电子 Anker(跨境电商也要求 CUDA)、平安健康保险(保险行业推理加速,加分项 CUDA/Triton Kernel)


第二部分:学习路线图

一、编程语言基础(所有岗位都要求)

1.1 Python(必学,100% 要求)

JD 原文引用:

  • 淘天:"精通 TypeScript / Node.js / Python 中至少一门语言"
  • 公安部一所:"熟悉 Linux + C++ / Python 开发环境"
  • 平安保险:"熟练掌握 C/C++、Python、Rust 中的一种或多种"
  • 上海AI Lab:"优秀的编程能力 (Python/C++)"

需要掌握:

  • Python 异步编程(asyncio)—— Agent 调用 LLM API 必须
  • 面向对象设计 —— 框架扩展、工具封装
  • 类型注解(typing)—— 大型项目可维护性
  • 性能优化(Cython、multiprocessing)—— 推理服务并发

1.2 C++ / Rust(推理方向必学)

JD 原文引用:

  • 平安保险:"熟练掌握 C/C++、Python、Rust 中的一种或多种,工程素养扎实"
  • 上海AI Lab:"针对硬件(GPU/昇腾)特性进行底层优化"
  • 公安部一所:"熟悉 Linux + C++ / Python 开发环境"

需要掌握:

  • C++ 内存管理、模板编程 —— 推理引擎底层
  • 跨平台编译(Linux 为主)
  • Rust 基础(加分项,平安保险明确提到)

1.3 TypeScript / Node.js(Agent 应用方向)

JD 原文引用:

  • 淘天:"精通 TypeScript / Node.js / Python 中至少一门语言"
  • 淘天:"熟悉 Vue / React 等主流前端框架"

需要掌握:

  • TypeScript 类型系统 —— AI Native 应用前端
  • Node.js 服务端 —— Agent 后端 API
  • React/Vue 框架 —— AI 产品交互界面

二、深度学习与 Transformer 基础

2.1 深度学习框架

JD 原文引用:

  • 公安部一所:"熟悉深度学习框架(如 PyTorch / TensorFlow)"
  • 上海AI Lab:"深入理解 Verl/vLLM/Megatron 底层机制"

需要掌握:

  • PyTorch 核心概念(Tensor、autograd、nn.Module)
  • 模型定义、训练循环、评估流程
  • DataLoader、Dataset —— 数据处理管线

2.2 Transformer 架构(必学)

JD 原文引用:

  • 上海AI Lab:"扎实的算法基础,熟悉 Transformer 架构及大模型关键技术 (如 KV Cache, Flash Attention)"
  • 平安保险:"熟悉 Transformer 架构及主流大模型结构(Qwen、DeepSeek 等),理解前向推理计算流程"

需要掌握:

  • Self-Attention 机制(QKV、多头注意力)
  • Position Encoding(RoPE 等)
  • LayerNorm、FFN、残差连接
  • Decoder-only vs Encoder-Decoder
  • KV Cache(3 个 JD 都提到)
  • Flash Attention(上海AI Lab 明确要求)

2.3 主流大模型结构

JD 原文引用:

  • 平安保险:"理解前向推理计算流程"(Qwen、DeepSeek 等)

需要了解:

  • Qwen 系列架构特点
  • DeepSeek 系列架构特点(MoE、DeepSeek-V2/V3 的 MLA)
  • Llama 系列架构

三、推理框架与优化(最高频技能)

3.1 推理框架(至少精通一个)

JD 原文引用:

  • 公安部一所:"参与模型部署与推理框架优化,包括但不限于 TensorRT、ONNX Runtime、vLLM、Triton 等"
  • 平安保险:"基于 vLLM、SGLang、TensorRT-LLM 等框架,建设和优化推理服务能力"
  • 上海AI Lab:"开发或改进大模型框架(如Verl、vLLM、Megatron等)"
  • 平安保险加分项:"有 vLLM、SGLang、TensorRT-LLM 二次开发或开源贡献经验"
框架适用场景学习优先级
vLLM大模型推理服务,PagedAttention★★★★★ 必学
SGLang结构化生成、推理编排★★★★ 重点
TensorRT-LLMNVIDIA GPU 高性能推理★★★★ 重点
Triton Inference Server生产级模型服务化★★★ 重要
ONNX Runtime跨平台推理★★★ 重要
Megatron分布式训练/推理★★★ 重要
Verl强化学习后训练★★ 进阶

3.2 推理优化技术

JD 原文引用:

  • 公安部一所:"负责模型量化、剪枝、蒸馏、算子融合等推理加速技术的落地"
  • 公安部一所:"优化 GPU / CPU / NPU 等硬件上的模型推理效率,包括显存、延迟、吞吐量优化"
  • 公安部一所:"参与大模型推理架构设计,例如 KV Cache、Batching、流水线并行等优化策略"
  • 平安保险:"熟悉常见推理优化技术,如 PagedAttention、Prefix Cache、Speculative Decoding、量化等"
  • 平安保险加分项:"有 PD 分离、Expert Parallel、KV Cache 优化等实战经验"

需要掌握(按优先级):

技术说明JD 出现次数首次提到公司
量化(INT8/FP16/FP8)降低精度换速度7 次公安部一所、滴滴、腾讯
vLLM主流推理框架9 次所有推理岗
CUDA Kernel 开发GPU 底层编程6 次滴滴、上海AI Lab、字节跳动
Triton(编程框架)Python 写 GPU kernel5 次字节跳动、腾讯、快手
KV Cache 优化减少重复计算5 次上海AI Lab、字节跳动、腾讯
SGLang结构化生成推理5 次字节跳动、腾讯、快手、滴滴
PagedAttentionvLLM 核心优化3 次平安、滴滴
FlashAttention注意力加速3 次滴滴、上海AI Lab
Continuous Batching高并发推理3 次滴滴
Speculative Decoding推测解码加速2 次上海AI Lab(浦东)
PD 分离(Prefill/Decode)推理两阶段分离1 次平安保险
MoE 推理混合专家架构2 次上海AI Lab(浦东)、腾讯
算子融合减少 kernel launch 开销2 次公安部一所
Tensor Parallel张量并行2 次平安保险
Pipeline Parallel流水线并行1 次平安保险
Expert ParallelMoE 专家并行1 次平安保险
LoRA/DPO/RLHF模型微调/对齐3 次双深科技、上海AI Lab

3.3 GPU / 底层优化(加分但高薪必备)

JD 原文引用:

  • 公安部一所:"优化 GPU / CPU / NPU 等硬件上的模型推理效率"
  • 上海AI Lab:"精通 CUDA、OpenAI Triton 或 Ascend C,能进行内核级性能优化"
  • 上海AI Lab:"解决大模型在训练/推理中的瓶颈问题(如计算、存储、通信)"
  • 平安保险加分项:"有 CUDA/Triton Kernel 开发或 GPU 架构级性能调优经验"

需要掌握:

  • CUDA 基础编程(kernel 编写、内存管理)
  • OpenAI Triton(Python 写 GPU kernel)
  • GPU 架构基础(SM、显存层级、warp)
  • NCCL 通信库(分布式训练/推理)

四、Agent 工程(应用方向核心)

4.1 Agent 核心能力

JD 原文引用:

  • 淘天:"参与 AI Agent 系统的设计与研发,探索基于大模型的任务理解、工具调用与流程编排能力"
  • 钉钉:"参与Agent设计、开发和维护,完成从需求到设计、开发和上线等全项目周期工作"
  • 钉钉:"负责将Agent落地到实际业务场景,包括但不限于Prompt工程、RAG优化、Multi-Agent构建、Memory系统、RL系统、流程编排、知识库建设、内容生成及业务流程自动化等"
  • 钉钉:"熟练掌握Agent架构核心组件设计原理和调优方案,对开源的 Agent 框架了解者优先,包含而不限于ADK,Prompt 调优,Function Calling,RAG,上下文工程及压缩等"

需要掌握:

能力对应技术相关章节
任务理解Prompt Engineering、ReAct 模式03-context-engineering
工具调用LangChain @tool、MCP 协议、Function Calling05-frameworks-tools
流程编排LangGraph StateGraph、条件分支、ADKLangGraph 深度指南
多轮对话MemorySaver、PostgresSaver、Memory 系统07-agent-memory
人在回路interrupt_before、update_stateLangGraph 深度指南
多智能体Supervisor/Handoff 模式、Multi-Agent 构建08-multi-agent
上下文压缩上下文工程、Context Compression03-context-engineering
RL 系统强化学习后训练、RLHF模型微调/增训

4.2 RAG 系统

JD 原文引用:

  • 淘天:"对大模型技术(如 Agent、RAG、Prompt Engineering、模型推理等)有实践或深入理解"
  • 淘天加分项:"有 AI Agent、RAG 系统或 AI 自动化工具等相关项目经验"
  • 上海AI Lab加分项:"熟悉 LLM 生态工具链 (如 Hugging Face, LangChain, LoRA)"

需要掌握:

  • 文档分块策略(按段落、按语义、固定长度)
  • 向量数据库(Milvus、Chroma、FAISS)
  • 检索策略(BM25 + 向量混合检索)
  • 重排序(Cross-encoder Reranker)
  • RAG 评估(RAGAS、DeepEval)

相关章节:06-rag-system

4.3 模型微调/增训

JD 原文引用:

  • 上海AI Lab:"预训练、增训微调、强化学习后训练、高性能推理落地的全流程工作"
  • 上海AI Lab加分项:"熟悉 LLM 生态工具链 (如 Hugging Face, LangChain, LoRA)"

需要了解:

  • LoRA / QLoRA 微调
  • SFT(Supervised Fine-Tuning)
  • RLHF(Reinforcement Learning from Human Feedback)
  • Hugging Face Transformers 库

五、生产部署与工程实践

5.1 服务化与部署

JD 原文引用:

  • 公安部一所:"设计并实现高性能推理服务,支持大规模并发请求"
  • 公安部一所:"熟悉推理服务框架(如 Triton、vLLM、Ray Serve、FastAPI 等)优先"
  • 上海AI Lab:"设计容错、弹性伸缩的推理平台,支持多租户、高并发场景需求"
  • 上海AI Lab:"熟悉 Linux 开发环境与容器化技术 (Docker/K8s)"
  • 平安保险:"熟悉 Docker/Kubernetes,有模型服务容器化部署经验"

需要掌握:

技术用途学习优先级
FastAPI快速构建 API 服务★★★★★ 必学
Docker容器化部署★★★★★ 必学
Kubernetes集群编排、弹性伸缩★★★★ 重要
Triton Inference Server模型服务化★★★ 重要
Ray Serve分布式推理服务★★ 进阶
Nginx / API Gateway反向代理、负载均衡★★★ 重要

5.2 分布式通信

JD 原文引用:

  • 上海AI Lab:"熟悉 NCCL、RDMA、MPI 等通信协议,有大规模分布式训练调优经验"
  • 上海AI Lab:"优化分布式计算、显存管理、通信效率等关键模块"
  • 平安保险:"了解分布式推理(TP/PP/EP)及 NCCL 等通信库"

需要了解:

  • NCCL(NVIDIA 集合通信库)
  • Tensor Parallel / Pipeline Parallel / Expert Parallel
  • RDMA 基础概念

5.3 工程素养

JD 原文引用:

  • 淘天:"具备良好的工程设计能力与代码质量意识"
  • 淘天:"具备良好的系统设计能力与技术前瞻性"
  • 淘天:"能够在快速变化的 AI 技术环境中持续迭代系统能力"
  • 公安部一所:"具备良好的工程能力和性能调优经验"
  • 平安保险:"认真负责,主动性强,有担当,愿意处理排障、调试、验证等基础但关键的工作"

需要掌握:

  • Git 工作流
  • 单元测试 / 集成测试
  • CI/CD 基础
  • 性能 profiling(cProfile、py-spy)
  • 日志与监控(Prometheus、Grafana)
  • 错误处理与重试机制

六、加分项(拉开薪资差距的关键)

加分项出现 JD对应学习方向
CUDA / Triton Kernel 开发平安、上海AI Lab、滴滴、海翼电子GPU 编程
vLLM / SGLang / TensorRT-LLM 二次开发或开源贡献平安、滴滴、字节跳动推理框架源码
百亿以上参数大模型训练/推理落地经验上海AI Lab分布式训练/推理
MLSys / NeurIPS / OSDI 顶会论文上海AI Lab、双深科技、腾讯学术研究
AI Agent / RAG 系统相关项目经验淘天、钉钉项目实战(本路线图第 14-17 阶段)
模型部署、推理优化、向量数据库、RAG 架构淘天全栈 AI 工程
AI Coding 工具熟练使用平安Claude Code / Cursor
大规模推理系统经验字节跳动、滴滴分布式推理
GPU/NPU 异构计算算子优化滴滴、腾讯、上海AI LabGPU 底层编程
LoRA/DPO/RLHF 大模型微调双深科技、上海AI Lab模型增训
ACM/Kaggle 竞赛获奖钉钉(阿里)编程竞赛
NPU/DSP 嵌入式部署海翼电子(Anker)边缘计算
EDA 领域大模型宁波数字孪生垂直行业

学习路径映射

路线图阶段覆盖的 JD 需求覆盖度
01-Python 工程基础所有岗位的基础要求✅ 100%
02-LLM 基础Transformer、KV Cache、主流模型✅ 100%
03-Context EngineeringPrompt Engineering、RAG✅ 100%
04-Harness Engineering工程质量、约束验证✅ 100%
05-框架与工具工具调用、MCP 协议✅ 100%
LangGraph 深度指南Agent 系统设计与编排✅ 100%
06-RAG 系统RAG 全流程✅ 100%
07-Agent 记忆多轮对话记忆✅ 100%
08-多智能体Supervisor/Handoff 编排✅ 100%
09-Safety & Guardrails生产安全(淘天要求"稳定可扩展")✅ 100%
10-生产部署FastAPI + Docker + K8s✅ 100%
12-评估与可观测性质量验证、成本追踪✅ 100%
13-Agent 设计模式ReAct、Reflection 等✅ 100%
14-综合实战Agent/RAG 项目经验(淘天加分项)✅ 100%
15-Agent 平台类 OpenClaw 平台构建✅ 覆盖加分项
16-生产级 RAG淘天加分项"RAG 架构"✅ 100%
17-MCP ServerMCP 工具注册✅ 覆盖加分项

路线图未直接覆盖的部分(需要额外学习):

未覆盖建议学习路径
CUDA / Triton Kernel推荐:CUDA Programming Guide + Triton 官方教程
量化技术细节(INT8/FP8)推荐:BitsAndBytes 文档
分布式训练(Megatron/Verl)推荐:Megatron-LM GitHub
GPU 集群调度(K8s + GPU)推荐:K8s Device Plugin for GPU

总结:2026 年 FDE 最应该学什么

精通 PyTorch + vLLM + SGLang + Python/C++ 工程能力,掌握 CUDA/Triton GPU 优化,能写 Agent 应用(LangGraph/RAG/Multi-Agent/Memory),知道 NPU/DSP 边缘部署是怎么回事——2026 年 FDE 市场基本通吃。大厂核心差距在 GPU 底层编程能力(CUDA/Triton),科研院所和传统企业(Anker、数字孪生)也在加速抢人。