跳到主要内容

模型选型

问题

面对一个 AI 项目，如何选择合适的大模型？

答案

一、选型决策框架

二、主流模型对比

模型	擅长领域	价格	适用场景
GPT-4o	通用能力最强	中高	核心业务
GPT-4o-mini	性价比高	低	大量调用
Claude 3.5 Sonnet	代码、长文本	中	开发工具
Gemini 2.5	多模态、长上下文	中	多模态需求
Llama 3.1 70B	开源最强	自建	私有部署
Qwen 2.5 72B	中文优秀	自建	中文场景

三、选型维度

维度	考量
任务能力	Benchmark 表现、实际测试
成本	Token 价格 × 调用量
延迟	TTFT、TPS
安全合规	数据是否出境、行业合规
定制化	是否需要微调
上下文长度	长文档处理需求

常见面试问题

Q1: 什么时候选开源模型，什么时候选商用 API？

答案：

选择	条件
商用 API	快速验证、无隐私顾虑、需要最强效果
开源模型	数据敏感、需要微调、长期成本考虑

Q2: 如何评估模型是否适合自己的场景？

答案：

准备 50~100 条真实测试样本
用多个候选模型分别生成回答
人工/LLM-as-Judge 打分对比
综合考虑效果、成本、延迟做决策

相关链接

问题
答案
常见面试问题
- Q1: 什么时候选开源模型，什么时候选商用 API？
- Q2: 如何评估模型是否适合自己的场景？
相关链接