设计实时翻译系统
问题
设计一个支持多语言实时翻译的系统,用于文档翻译和实时对话翻译。
答案
一、系统架构
二、翻译方案对比
| 方案 | 质量 | 速度 | 成本 | 定制化 |
|---|---|---|---|---|
| Google Translate | 中 | 快 | 按字符 | 低 |
| DeepL | 高 | 快 | 按字符 | 低 |
| LLM 翻译 | 最高 | 慢 | 高 | 高 |
| 自建 NMT | 中 | 快 | 固定 | 高 |
LLM 翻译的优势
LLM 翻译比传统 NMT 的核心优势:
- 支持术语约束:在 Prompt 中指定术语表
- 支持风格控制:正式/口语/技术文档
- 上下文理解更好:跨句子一致性
- 少见语言对效果更好
三、长文档翻译
| 策略 | 说明 |
|---|---|
| 分段翻译 | 按段落分割,保持上下文 |
| 术语一致 | 维护术语表,首次出现时确定翻译 |
| 翻译记忆 | 缓存已翻译的句子,相同内容复用 |
| 人工审校 | 机翻 + 人工修正 |
常见面试问题
Q1: 如何保持长文档翻译的术语一致性?
答案:
- 维护术语表(Glossary),在每段翻译的 Prompt 中带入
- 第一段翻译时让 LLM 输出术语列表,后续段落复用
- 翻译结果中检查术语一致性,不一致则重新翻译