跳到主要内容

AI 安全与对齐知识体系概览

为什么要关注 AI 安全

随着 AI 应用深入生产环境,安全问题直接影响用户信任和合规要求。AI 安全涵盖从模型行为对齐应用层防护的完整链条。

知识体系

学习路径

阶段主题文档
入门幻觉与事实性幻觉问题
入门偏见与公平性偏见与公平性
进阶对齐技术对齐技术
进阶内容安全内容安全与审核
进阶Prompt 注入防御Prompt 注入防御
高级隐私保护隐私保护
面试重点

AI 安全面试最常问的三个话题:幻觉处理(RAG + 引用溯源)、Prompt 注入防御(多层防护架构)、内容审核(输入输出双重过滤)。