工程实践 | LLM 大模型邮报

CodeGraph 代码图谱发布：用本地索引降低 AI Agent 检索成本
工程实践
•
2026年5月24日 13:33
•
···
CodeGraph 代码图谱发布同名本地知识图谱工具，旨在降低 AI 编程 Agent 在代码检索阶段的 token 消耗。据 CodeGraph GitHub 官方说明，该工具通过 SQLite 构建符号调用关系，在 7 个真实开源项目中实测，平均降低 35% 成本、减少 70% 工具调用与 59% token 用量。
Misty
Codex 速率限制问题已修复，所有账户额度已重置
工程实践
•
2026年5月24日 10:40
•
···
OpenAI 旗下 AI 编程工具 Codex 的速率限制问题已修复，该问题因一项缓存压缩优化导致部分用户额度提前耗尽。Codex 团队已回滚该优化并重置了所有账户的使用额度。
Misty
Google 宣布 Gemini CLI 关停，6 月 18 日整合至 Antigravity CLI
工程实践
•
2026年5月24日 00:48
•
···
Google 宣布 Gemini CLI 将于 2026 年 6 月 18 日停止服务，功能整合至新推出的 Antigravity CLI 与 Antigravity 2.0 桌面应用。据 Google 官方博文，Gemini CLI 关停源于用户对多 Agent 协作和统一工作流后端的需求增长，而 Antigravity CLI 将承载这些能力。
Misty
ChatGPT PowerPoint 集成上线，支持直接创建编辑演示文稿
工程实践
•
2026年5月23日 16:58
•
···
ChatGPT PowerPoint 集成功能于 2026 年 5 月 22 日正式上线，支持用户直接在 PowerPoint 中通过自然语言创建、编辑、分析和美化演示文稿。该功能已在全球以 测试版形式开放，覆盖 ChatGPT Business、Enterprise、Edu、Teachers、K-12、Free、Go、Pro 及 Plus 等全部用户等级。
Misty
Claude Managed Agents 发布自托管沙箱与 MCP 隧道功能
工程实践
•
2026年5月19日 16:31
•
···
Anthropic 于 2026 年 5 月 19 日宣布，Claude Managed Agents 正式支持 self-hosted sandboxes（自托管沙箱）与 MCP tunnels（MCP 隧道）两项企业级功能。据Anthropic 官方公告，self-hosted sandboxes 已进入 public beta，MCP tunnels 则处于 research preview 阶段，企业管理员可在 Claude Console 的 workspace settings 中申请访问。
Misty
Claude Code Fast mode 默认启用 Opus 4.7，响应速度提升 2.5 倍
工程实践
•
2026年5月19日 05:18
•
···
Claude Code Fast mode 现已将默认模型从 Opus 4.6 升级至 Opus 4.7，在保持输出质量不变的前提下，响应速度提升至约 2.5 倍。据 Anthropic 官方推文及文档说明，该模式采用不同的 API 配置以优先降低延迟，输入/输出定价统一为 30 美元/百万 token，适用于快速迭代与实时调试等延迟敏感场景。
Misty
Cursor 发布 Composer 2.5：定向 RL 文本反馈与 Sharded Muon 优化器详解
工程实践
•
2026年5月19日 04:40
•
···
据 Cursor 官方博客，Composer 2.5 已正式向 Cursor 用户开放。该版本基于 Moonshot 的 Kimi K2.5 开源检查点持续预训练，在长任务持续执行、复杂指令遵循与协作体验上均有显著提升。输入定价 $0.50/百万 tokens，输出定价 $2.50/百万 tokens；快速版本定价 $3.00/$15.00，首周提供双倍用量额度。
Misty
Claude 提示词缓存诊断功能上线：精准定位缓存未命中分歧点
工程实践
•
2026年5月19日 04:31
•
···
Claude 推出 Prompt cache diagnostics 测试版功能，开发者传入指定 beta header 与上一条响应 ID 即可对比连续请求，精准定位导致缓存失效的具体位置。据 Anthropic 官方文档，该功能可识别模型参数、system prompt、工具定义或消息历史中首次出现差异的节点，帮助开发者修复根因而非盲目猜测。
Misty
GitHub Copilot app 技术预览发布：桌面端 agentic 开发工作流
工程实践
•
2026年5月17日 14:55
•
···
GitHub 于 2026 年 5 月 14 日宣布 GitHub 官方博客，Copilot app 正式进入技术预览阶段。这是一款原生桌面应用，支持从 issue、pull request 等现有工作上下文直接启动 agentic 开发会话，每个会话拥有独立分支与隔离环境，Pro 与 Pro+ 订阅者可立即申请早期访问。
Misty
OpenAI Codex 团队修复 GPT-5.5 性能异常，系统已恢复稳定运行
工程实践
•
2026年5月16日 21:41
•
···
OpenAI Codex 团队于 2026 年 5 月 16 日确认，已定位并修复导致 GPT-5.5 在过去约 48 小时内性能下降的两项技术问题。据 OpenAI 状态页面，系统现已恢复稳定运行，团队将持续监控至晚间以完成验证，用户的使用限制也将在验证结束后统一重置。
Misty
OpenRouter BYOK 功能升级：多 Key 分组、精细过滤与分层触发
工程实践
•
2026年5月15日 23:25
•
···
据 OpenRouter 官方文档，OpenRouter BYOK 功能迎来架构级更新，新增多 Key 分组、按模型或用户过滤以及分层触发三大机制，同时自定义 Provider Key 的费率降至原价 5%，每月 1M 次请求免收手续费。这一批更新直接回应了工程团队在跨环境流量隔离、团队账号分摊与生产环境限流管理中的核心痛点。
Misty
Grok Build CLI 早期测试开放：面向终端的全栈编码代理
工程实践
•
2026年5月15日 19:06
•
···
据 xAI 官方博客宣布，Grok Build CLI 编码代理已进入早期测试阶段，首批面向 SuperGrok Heavy 订阅用户开放。该工具支持单行命令安装，内置计划审查与多子 agent 并行架构，可直接读取本地仓库的 AGENTS.md、插件与 MCP 协议配置，为专业开发者提供开箱即用的终端代码工作流。
Misty