模型选型
问题
面对一个 AI 项目,如何选择合适的大模型?
答案
一、选型决策框架
二、主流模型对比
| 模型 | 擅长领域 | 价格 | 适用场景 |
|---|---|---|---|
| GPT-4o | 通用能力最强 | 中高 | 核心业务 |
| GPT-4o-mini | 性价比高 | 低 | 大量调用 |
| Claude 3.5 Sonnet | 代码、长文本 | 中 | 开发工具 |
| Gemini 2.5 | 多模态、长上下文 | 中 | 多模态需求 |
| Llama 3.1 70B | 开源最强 | 自建 | 私有部署 |
| Qwen 2.5 72B | 中文优秀 | 自建 | 中文场景 |
三、选型维度
| 维度 | 考量 |
|---|---|
| 任务能力 | Benchmark 表现、实际测试 |
| 成本 | Token 价格 × 调用量 |
| 延迟 | TTFT、TPS |
| 安全合规 | 数据是否出境、行业合规 |
| 定制化 | 是否需要微调 |
| 上下文长度 | 长文档处理需求 |
常见面试问题
Q1: 什么时候选开源模型,什么时候选商用 API?
答案:
| 选择 | 条件 |
|---|---|
| 商用 API | 快速验证、无隐私顾虑、需要最强效果 |
| 开源模型 | 数据敏感、需要微调、长期成本考虑 |
Q2: 如何评估模型是否适合自己的场景?
答案:
- 准备 50~100 条真实测试样本
- 用多个候选模型分别生成回答
- 人工/LLM-as-Judge 打分对比
- 综合考虑效果、成本、延迟做决策