Claude Opus 4.7 fast mode 开放预览
Anthropic 已将 Claude Opus 4.7 fast mode 以 research preview 形式开放到 API 与 Claude Code,官方称响应速度为标准 Opus 的 2.5 倍。Claude Opus 4.7 fast mode 不是新模型,而是面向低延迟的 API 配置,定价为输入 30 美元/MTok、输出 150 美元/MTok,并要求 Claude Code v2.1.139 或更高版本。

Claude Opus 4.7 fast mode 改了什么
Claude Opus 4.7 fast mode 已进入 research preview。Anthropic 在 Claude Code fast mode 文档中说明,这一模式使用 Claude Opus 的不同 API 配置,以更高 token 成本换取更低延迟。
官方明确表示,fast mode 不是另一个模型。它保留相同能力与质量预期,但把响应速度提高到标准 Opus 的 2.5 倍,适合快速代码迭代、现场调试和对等待时间敏感的交互式工作。
这一变化说明 Anthropic 正在把高端 Opus 模型拆成不同服务档位。开发者面对的选择不再只是 Sonnet、Opus 或 Haiku,而是同一模型在成本、延迟和使用场景之间的配置取舍。
价格与上下文窗口的成本边界
fast mode 的价格高于标准 Opus。Anthropic 公布的 fast mode 价格为输入 30 美元/MTok、输出 150 美元/MTok,Opus 4.6 与 Opus 4.7 使用同一价格。
fast mode 价格覆盖完整 1M token context window。文档提醒,如果在对话中途切换到 fast mode,整段会话上下文会按 fast mode 的未缓存输入 token 价格计费,因此比从会话开始就启用更贵。
对于 Claude Code 用户,这个成本细节很关键。长上下文代码库分析、批量重构和 CI/CD 流水线更适合标准模式;需要连续短反馈的 live debugging,才更容易从 2.5 倍速度中获得足够收益。
Claude Code 中怎样启用 fast mode
Claude Code 需要达到指定版本。普通 fast mode 要求 Claude Code v2.1.36 或更高版本,Opus 4.7 fast mode 要求 Claude Code v2.1.139 或更高版本。
Claude Code CLI 与 VS Code Extension 都可以用 /fast 切换 fast mode。默认情况下,/fast 会运行 Opus 4.6;在 2026 年 5 月 14 日 前,用户需要设置环境变量,才能把 fast mode 切到 Opus 4.7。
export CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE=1团队也可以把环境变量写入 Claude Code 设置文件。启用后,/fast 会在 Opus 4.7 上运行;如果设置 CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1,则会强制回到 Opus 4.6 fast mode。
{
"env": {
"CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE": "1"
}
}组织、额度与云平台限制
fast mode 不包含在订阅额度内。Anthropic 表示,Pro、Max、Team 与 Enterprise 订阅用户可以使用 fast mode,但它通过 extra usage 计费,从第一个 token 起按 fast mode 价格扣费。
Team 与 Enterprise 组织默认关闭 fast mode。管理员需要在 Claude Code preferences 或 Claude AI 的 Admin Settings 中启用;如果组织禁用,用户执行 /fast 会看到 fast mode 被组织关闭的提示。
fast mode 目前不支持第三方云平台。Anthropic 文档列出的不可用平台包括 Amazon Bedrock、Google Vertex AI 和 Microsoft Azure Foundry,API 用户需要通过 Anthropic Console 使用。
何时使用,以及需要保守看待什么
fast mode 更适合交互式任务。快速修改代码、实时排查错误和临近截止日期的开发工作,更能体现低延迟价值;长时间 autonomous task、批处理和成本敏感 workload,更适合标准 Opus。
fast mode 与 effort level 不是同一个开关。fast mode 保持同一模型质量预期但提高成本,lower effort level 会减少思考时间并可能降低复杂任务质量;两者可以组合,但适合相对直接的任务。
考虑到 Claude Opus 4.7 fast mode 仍处于 research preview,功能、价格和可用性都可能随反馈调整。真正需要记住的是:它提供的是低延迟配置,不是新模型能力;在团队环境中,应先用 per-session opt-in、extra usage 和 rate limit 策略控制成本。
评论 ···