跳到主要内容

模型选型

问题

面对一个 AI 项目,如何选择合适的大模型?

答案

一、选型决策框架

二、主流模型对比

模型擅长领域价格适用场景
GPT-4o通用能力最强中高核心业务
GPT-4o-mini性价比高大量调用
Claude 3.5 Sonnet代码、长文本开发工具
Gemini 2.5多模态、长上下文多模态需求
Llama 3.1 70B开源最强自建私有部署
Qwen 2.5 72B中文优秀自建中文场景

三、选型维度

维度考量
任务能力Benchmark 表现、实际测试
成本Token 价格 × 调用量
延迟TTFT、TPS
安全合规数据是否出境、行业合规
定制化是否需要微调
上下文长度长文档处理需求

常见面试问题

Q1: 什么时候选开源模型,什么时候选商用 API?

答案

选择条件
商用 API快速验证、无隐私顾虑、需要最强效果
开源模型数据敏感、需要微调、长期成本考虑

Q2: 如何评估模型是否适合自己的场景?

答案

  1. 准备 50~100 条真实测试样本
  2. 用多个候选模型分别生成回答
  3. 人工/LLM-as-Judge 打分对比
  4. 综合考虑效果、成本、延迟做决策

相关链接