OpenAI 推理模型最佳实践总结

OpenAI 推理模型最佳实践总结

模型选择:

  • 速度和成本优先,且任务明确: 选择 GPT 模型。
  • 准确性和可靠性优先,且任务复杂: 选择 o 系列推理模型。
  • 大多数 AI 工作流程会结合两种模型: o 系列模型用于规划和决策,GPT 系列模型用于执行任务。

何时使用推理模型:

  • 处理不明确的任务: 推理模型擅长处理信息有限或分散的任务,并能理解用户意图。
  • 从大量信息中提取关键信息: 推理模型能从大量非结构化信息中提取最相关的信息。
  • 分析复杂数据集: 推理模型擅长处理包含大量密集、非结构化信息的复杂文档,例如法律合同、财务报表和保险索赔。
  • 多步骤代理规划: 推理模型是代理规划和策略制定的关键,可作为“规划者”制定详细的多步骤解决方案,并为每个步骤选择合适的 GPT 模型(“执行者”)。
  • 视觉推理: o1 模型支持视觉推理,可以理解具有模糊结构的图表、表格和图像质量较差的照片。
  • 代码审查和改进: 推理模型有效地审查和改进大量代码。
  • 评估和基准测试其他模型的响应: 推理模型可用于基准测试和评估其他模型的响应,以确保数据集的质量和可靠性。

如何有效地提示推理模型:

  • 使用开发者消息:o1-2024-12-17 开始,推理模型支持开发者消息而不是系统消息。
  • 保持提示简洁明了: 推理模型擅长理解和响应简短、清晰的指令。
  • 避免思维链提示: 推理模型会在内部进行推理,因此无需提示它们“逐步思考”或“解释你的推理”。
  • 使用分隔符: 使用 Markdown、XML 标签和章节标题等分隔符清晰地指示输入的不同部分。
  • 首先尝试零样本,然后根据需要尝试少样本: 推理模型通常不需要少样本示例即可产生良好的结果。
  • 提供具体指导: 明确说明对模型响应的限制。
  • 明确最终目标: 在指令中提供非常具体的成功响应参数。
  • Markdown 格式:o1-2024-12-17 开始,API 中的推理模型将避免生成带有 Markdown 格式的响应。要在响应中使用 Markdown 格式,请在开发者消息的第一行包含字符串 Formatting re-enabled

参考

OpenAI Reasoning Best Practices