LLM 大模型邮报
  • 首页
  • 工程实践
  • 教程指南
  • 行业观察
  • 模型动态
  • 研究前沿
  • 关于

    分类: 工程实践


    LLMPOSTS.com 工程实践分类聚焦大模型在生产环境中的落地细节:本地部署、推理优化、量化方案、硬件选型、agent harness 设计、工具链集成与 MCP 生态实践。涵盖 Claude Code、Cursor、Codex、vLLM、Ollama、LM Studio 等主流工具的配置经验与避坑指南,以及 Cloudflare、n8n 等基础设施在 AI 工作流中的应用方案。面向独立开发者、AI 工程师与 MLOps 团队,提供可直接复用的中文技术参考。


    全部分类

      • 模型动态 (57)‍•
      • 工程实践 (45)‍•
      • 行业观察 (30)‍•
      • 研究前沿 (9)‍•
      • 教程指南 (4)
      • Chatgpt (8)‍•
      • Openai (8)‍•
      • Gemini (1)‍•
      • GPT5.5 (1)‍•
      • Sonnet (1)
    • CodeGraph 代码图谱发布:用本地索引降低 AI Agent 检索成本

      CodeGraph 代码图谱发布:用本地索引降低 AI Agent 检索成本

      • 工程实践
      • •
      • 2026年5月24日 13:33
      • •
      • ···
      CodeGraph 代码图谱发布:用本地索引降低 AI Agent 检索成本

      CodeGraph 代码图谱发布同名本地知识图谱工具,旨在降低 AI 编程 Agent 在代码检索阶段的 token 消耗。据 CodeGraph GitHub 官方说明,该工具通过 SQLite 构建符号调用关系,在 7 个真实开源项目中实测,平均降低 35% 成本、减少 70% 工具调用与 59% token 用量。

      Misty
      Misty
    • Codex 速率限制问题已修复,所有账户额度已重置

      Codex 速率限制问题已修复,所有账户额度已重置

      • 工程实践
      • •
      • 2026年5月24日 10:40
      • •
      • ···
      Codex 速率限制问题已修复,所有账户额度已重置

      OpenAI 旗下 AI 编程工具 Codex 的速率限制问题已修复,该问题因一项缓存压缩优化导致部分用户额度提前耗尽。Codex 团队已回滚该优化并重置了所有账户的使用额度。

      Misty
      Misty
    • Google 宣布 Gemini CLI 关停,6 月 18 日整合至 Antigravity CLI

      Google 宣布 Gemini CLI 关停,6 月 18 日整合至 Antigravity CLI

      • 工程实践
      • •
      • 2026年5月24日 00:48
      • •
      • ···
      Google 宣布 Gemini CLI 关停,6 月 18 日整合至 Antigravity CLI

      Google 宣布 Gemini CLI 将于 2026 年 6 月 18 日停止服务,功能整合至新推出的 Antigravity CLI 与 Antigravity 2.0 桌面应用。据 Google 官方博文,Gemini CLI 关停源于用户对多 Agent 协作和统一工作流后端的需求增长,而 Antigravity CLI 将承载这些能力。

      Misty
      Misty
    • ChatGPT PowerPoint 集成上线,支持直接创建编辑演示文稿

      ChatGPT PowerPoint 集成上线,支持直接创建编辑演示文稿

      • 工程实践
      • •
      • 2026年5月23日 16:58
      • •
      • ···
      ChatGPT PowerPoint 集成上线,支持直接创建编辑演示文稿

      ChatGPT PowerPoint 集成功能于 2026 年 5 月 22 日正式上线,支持用户直接在 PowerPoint 中通过自然语言创建、编辑、分析和美化演示文稿。该功能已在全球以 测试版形式开放,覆盖 ChatGPT Business、Enterprise、Edu、Teachers、K-12、Free、Go、Pro 及 Plus 等全部用户等级。

      Misty
      Misty
    • Claude Managed Agents 发布自托管沙箱与 MCP 隧道功能

      Claude Managed Agents 发布自托管沙箱与 MCP 隧道功能

      • 工程实践
      • •
      • 2026年5月19日 16:31
      • •
      • ···
      Claude Managed Agents 发布自托管沙箱与 MCP 隧道功能

      Anthropic 于 2026 年 5 月 19 日宣布,Claude Managed Agents 正式支持 self-hosted sandboxes(自托管沙箱)与 MCP tunnels(MCP 隧道)两项企业级功能。据Anthropic 官方公告,self-hosted sandboxes 已进入 public beta,MCP tunnels 则处于 research preview 阶段,企业管理员可在 Claude Console 的 workspace settings 中申请访问。

      Misty
      Misty
    • Claude Code Fast mode 默认启用 Opus 4.7,响应速度提升 2.5 倍

      Claude Code Fast mode 默认启用 Opus 4.7,响应速度提升 2.5 倍

      • 工程实践
      • •
      • 2026年5月19日 05:18
      • •
      • ···
      Claude Code Fast mode 默认启用 Opus 4.7,响应速度提升 2.5 倍

      Claude Code Fast mode 现已将默认模型从 Opus 4.6 升级至 Opus 4.7,在保持输出质量不变的前提下,响应速度提升至约 2.5 倍。据 Anthropic 官方推文及文档说明,该模式采用不同的 API 配置以优先降低延迟,输入/输出定价统一为 30 美元/百万 token,适用于快速迭代与实时调试等延迟敏感场景。

      Misty
      Misty
    • Cursor 发布 Composer 2.5:定向 RL 文本反馈与 Sharded Muon 优化器详解

      Cursor 发布 Composer 2.5:定向 RL 文本反馈与 Sharded Muon 优化器详解

      • 工程实践
      • •
      • 2026年5月19日 04:40
      • •
      • ···
      Cursor 发布 Composer 2.5:定向 RL 文本反馈与 Sharded Muon 优化器详解

      据 Cursor 官方博客,Composer 2.5 已正式向 Cursor 用户开放。该版本基于 Moonshot 的 Kimi K2.5 开源检查点持续预训练,在长任务持续执行、复杂指令遵循与协作体验上均有显著提升。输入定价 $0.50/百万 tokens,输出定价 $2.50/百万 tokens;快速版本定价 $3.00/$15.00,首周提供双倍用量额度。

      Misty
      Misty
    • Claude 提示词缓存诊断功能上线:精准定位缓存未命中分歧点

      Claude 提示词缓存诊断功能上线:精准定位缓存未命中分歧点

      • 工程实践
      • •
      • 2026年5月19日 04:31
      • •
      • ···
      Claude 提示词缓存诊断功能上线:精准定位缓存未命中分歧点

      Claude 推出 Prompt cache diagnostics 测试版功能,开发者传入指定 beta header 与上一条响应 ID 即可对比连续请求,精准定位导致缓存失效的具体位置。据 Anthropic 官方文档,该功能可识别模型参数、system prompt、工具定义或消息历史中首次出现差异的节点,帮助开发者修复根因而非盲目猜测。

      Misty
      Misty
    • GitHub Copilot app 技术预览发布:桌面端 agentic 开发工作流

      GitHub Copilot app 技术预览发布:桌面端 agentic 开发工作流

      • 工程实践
      • •
      • 2026年5月17日 14:55
      • •
      • ···
      GitHub Copilot app 技术预览发布:桌面端 agentic 开发工作流

      GitHub 于 2026 年 5 月 14 日宣布 GitHub 官方博客,Copilot app 正式进入技术预览阶段。这是一款原生桌面应用,支持从 issue、pull request 等现有工作上下文直接启动 agentic 开发会话,每个会话拥有独立分支与隔离环境,Pro 与 Pro+ 订阅者可立即申请早期访问。

      Misty
      Misty
    • OpenAI Codex 团队修复 GPT-5.5 性能异常,系统已恢复稳定运行

      OpenAI Codex 团队修复 GPT-5.5 性能异常,系统已恢复稳定运行

      • 工程实践
      • •
      • 2026年5月16日 21:41
      • •
      • ···
      OpenAI Codex 团队修复 GPT-5.5 性能异常,系统已恢复稳定运行

      OpenAI Codex 团队于 2026 年 5 月 16 日确认,已定位并修复导致 GPT-5.5 在过去约 48 小时内性能下降的两项技术问题。据 OpenAI 状态页面,系统现已恢复稳定运行,团队将持续监控至晚间以完成验证,用户的使用限制也将在验证结束后统一重置。

      Misty
      Misty
    • OpenRouter BYOK 功能升级:多 Key 分组、精细过滤与分层触发

      OpenRouter BYOK 功能升级:多 Key 分组、精细过滤与分层触发

      • 工程实践
      • •
      • 2026年5月15日 23:25
      • •
      • ···
      OpenRouter BYOK 功能升级:多 Key 分组、精细过滤与分层触发

      据 OpenRouter 官方文档,OpenRouter BYOK 功能迎来架构级更新,新增多 Key 分组、按模型或用户过滤以及分层触发三大机制,同时自定义 Provider Key 的费率降至原价 5%,每月 1M 次请求免收手续费。这一批更新直接回应了工程团队在跨环境流量隔离、团队账号分摊与生产环境限流管理中的核心痛点。

      Misty
      Misty
    • Grok Build CLI 早期测试开放:面向终端的全栈编码代理

      Grok Build CLI 早期测试开放:面向终端的全栈编码代理

      • 工程实践
      • •
      • 2026年5月15日 19:06
      • •
      • ···
      Grok Build CLI 早期测试开放:面向终端的全栈编码代理

      据 xAI 官方博客 宣布,Grok Build CLI 编码代理已进入早期测试阶段,首批面向 SuperGrok Heavy 订阅用户开放。该工具支持单行命令安装,内置计划审查与多子 agent 并行架构,可直接读取本地仓库的 AGENTS.md、插件与 MCP 协议配置,为专业开发者提供开箱即用的终端代码工作流。

      Misty
      Misty
    • 第 1 / 4 页
      较早文章

    网站

    • Hugo
    • Cloudflare
    • Artalk
    • 关于 LLM 大模型邮报

    关注我们

    • XX(Twitter)
    • Sina Weibo微博
    • TelegramTelegram
    • RSSRSS

    友情链接

    • WinDiscover

    © 2026 LLM大模型邮报 · 保留所有权利