LLM 大模型邮报
  • 首页
  • 工程实践
  • 教程指南
  • 行业观察
  • 模型动态
  • 研究前沿
  • 关于

    分类: 工程实践


    LLMPOSTS.com 工程实践分类聚焦大模型在生产环境中的落地细节:本地部署、推理优化、量化方案、硬件选型、agent harness 设计、工具链集成与 MCP 生态实践。涵盖 Claude Code、Cursor、Codex、vLLM、Ollama、LM Studio 等主流工具的配置经验与避坑指南,以及 Cloudflare、n8n 等基础设施在 AI 工作流中的应用方案。面向独立开发者、AI 工程师与 MLOps 团队,提供可直接复用的中文技术参考。


    全部分类

      • 模型动态 (57)‍•
      • 工程实践 (45)‍•
      • 行业观察 (30)‍•
      • 研究前沿 (9)‍•
      • 教程指南 (4)
      • Chatgpt (8)‍•
      • Openai (8)‍•
      • Gemini (1)‍•
      • GPT5.5 (1)‍•
      • Sonnet (1)
    • Claude Code 部署模式的正确用法:分层配置与大代码库工作流

      Claude Code 部署模式的正确用法:分层配置与大代码库工作流

      • 工程实践
      • •
      • 2026年5月15日 15:26
      • •
      • ···
      Claude Code 部署模式的正确用法:分层配置与大代码库工作流

      Anthropic 分享企业级 Claude Code 部署模式。在数百万行代码的 monorepo 或规模庞大的遗留系统中,决定工具落地效率的关键往往不是背后的模型参数,而是围绕 Claude Code 构建的本地配置层。据 Anthropic 官方博客,企业团队正确构建 Claude Code 部署模式需采用 CLAUDE.md 分层架构与符号级检索工具,从而在复杂工程环境中实现稳定高效的智能体协作。

      Misty
      Misty
    • Codex上线ChatGPT移动端:手机远程开发预览版开放

      Codex上线ChatGPT移动端:手机远程开发预览版开放

      • 工程实践
      • •
      • 2026年5月15日 09:28
      • •
      • ···
      Codex上线ChatGPT移动端:手机远程开发预览版开放

      据OpenAI 官方公告,Codex 现已接入 ChatGPT 移动应用,iOS 与 Android 预览版已向所有套餐用户(含 Free 与 Go 档)开放。用户可通过手机远程连接至笔记本、Mac mini 或托管开发环境,实时查看线程状态、审批指令、审阅 diff 与测试输出。

      Misty
      Misty
    • Kimi Web Bridge 浏览器扩展发布:支持 Claude Code 与 Cursor 本地网页自动化

      Kimi Web Bridge 浏览器扩展发布:支持 Claude Code 与 Cursor 本地网页自动化

      • 工程实践
      • •
      • 2026年5月15日 00:25
      • •
      • ···
      Kimi Web Bridge 浏览器扩展发布:支持 Claude Code 与 Cursor 本地网页自动化

      Kimi Web Bridge 浏览器扩展正式发布,支持 Claude Code、Cursor、Codex 等主流 AI Agent 通过 Chrome DevTools Protocol 直接操控本地浏览器完成网页交互。据 Kimi 官方文档,该工具采用本地桥接服务与浏览器插件双层架构,所有执行流程均在用户设备完成,登录状态与网页内容不会上传至云端。

      Misty
      Misty
    • Claude Code 周限额临时提升 50% 至 7 月 13 日

      Claude Code 周限额临时提升 50% 至 7 月 13 日

      • 工程实践
      • •
      • 2026年5月14日 10:19
      • •
      • ···
      Claude Code 周限额临时提升 50% 至 7 月 13 日

      Anthropic 宣布 Claude Code 周使用限额临时提升 50%,该调整即时生效并持续至 7 月 13 日。据官方公布,Pro、Max、Team 及按席位计费的企业用户均已自动获得该额度扩展,无需手动操作。

      Misty
      Misty
    • Claude Opus 4.7 fast mode 开放预览

      Claude Opus 4.7 fast mode 开放预览

      • 工程实践
      • •
      • 2026年5月13日 09:30
      • •
      • ···
      Claude Opus 4.7 fast mode 开放预览

      Anthropic 已将 Claude Opus 4.7 fast mode 以 research preview 形式开放到 API 与 Claude Code,官方称响应速度为标准 Opus 的 2.5 倍。Claude Opus 4.7 fast mode 不是新模型,而是面向低延迟的 API 配置,定价为输入 30 美元/MTok、输出 150 美元/MTok,并要求 Claude Code v2.1.139 或更高版本。

      Misty
      Misty
    • Google 重构 AI 指针交互:Gemini 驱动与 Chrome 落地

      Google 重构 AI 指针交互:Gemini 驱动与 Chrome 落地

      • 工程实践
      • •
      • 2026年5月13日 01:50
      • •
      • ···
      Google 重构 AI 指针交互:Gemini 驱动与 Chrome 落地

      Google 与 DeepMind 团队正尝试彻底重构沿用半世纪的鼠标指针。基于 Gemini 大模型构建的 AI 指针交互不再仅仅追踪光标坐标,而是通过解析视觉与语义上下文理解用户意图,实现跨应用无缝调用。据公开的技术提案与实验 Demo 显示,该交互范式已初步集成至 Chrome 浏览器及新款 Googlebook 笔记本中,标志通用人工智能(AGI)界面设计从人适应工具向工具主动响应迈出关键一步。

      Misty
      Misty
    • vLLM 登顶 Artificial Analysis 榜单,开源推理栈反超专有栈

      vLLM 登顶 Artificial Analysis 榜单,开源推理栈反超专有栈

      • 工程实践
      • •
      • 2026年5月12日 16:50
      • •
      • ···
      vLLM 登顶 Artificial Analysis 榜单,开源推理栈反超专有栈

      DigitalOcean 发布最新推理性能基准测试,vLLM 在 DeepSeek V3.2、MiniMax-M2.5 和 Qwen 3.5 397B 三项任务中均位列第一。该部署实现 230 TPS 的每用户输出吞吐量,超过其余 12 家推理提供商 4 倍以上。底层算子优化已全部合入 vLLM 主线。

      Misty
      Misty
    • Claude Code 推出 agent view 管理并行会话

      Claude Code 推出 agent view 管理并行会话

      • 工程实践
      • •
      • 2026年5月12日 09:51
      • •
      • ···
      Claude Code 推出 agent view 管理并行会话

      Anthropic 于 2026 年 5 月 11 日为 Claude Code 推出 Claude Code agent view。这个 Research Preview 功能把多个 Claude Code 会话集中到一个 CLI 视图中,开发者可查看哪些 agent 等待输入、仍在运行或已经完成。

      Misty
      Misty
    • Manus Make a Copy 可复制建站项目

      Manus Make a Copy 可复制建站项目

      • 工程实践
      • •
      • 2026年5月12日 00:24
      • •
      • ···
      Manus Make a Copy 可复制建站项目

      Manus Website Builder 的 Manus Make a Copy 功能允许用户把现有 WebDev 项目复制到新的独立会话。复制会带走项目代码、数据库 schema、secrets 与简短上下文摘要,但不会带走数据库行、发布状态、自定义域名或 GitHub 连接。这让团队能在不影响原站的前提下测试首页、结账流程、应用结构或面向不同市场的版本。

      Misty
      Misty
    • Claude Platform on AWS 上线 支持 IAM 与统一账单

      Claude Platform on AWS 上线 支持 IAM 与统一账单

      • 工程实践
      • •
      • 2026年5月12日 00:21
      • •
      • ···
      Claude Platform on AWS 上线 支持 IAM 与统一账单

      Anthropic 官方公布 Claude Platform on AWS 已正式可用,AWS 客户可通过 AWS 身份认证、统一账单和承诺用量抵扣来访问完整 Claude Platform 功能。Claude Platform on AWS 同时支持 Claude Managed Agents、code execution、Skills、Files API、MCP connector 等平台能力。Claude 仍可通过 Amazon Bedrock 使用,但两条路径在服务运营方、数据处理边界和功能同步速度上不同。

      Misty
      Misty
    • OpenRouter 推出 Pareto Code 编码路由

      OpenRouter 推出 Pareto Code 编码路由

      • 工程实践
      • •
      • 2026年5月11日 23:35
      • •
      • ···
      OpenRouter 推出 Pareto Code 编码路由

      OpenRouter 推出实验性 Pareto Code 编码路由,用于在不指定具体模型的情况下选择代码模型。开发者只需设置 min_coding_score,OpenRouter 会把请求路由到达到该编码能力门槛的模型。Pareto Code 编码路由当前基于 Artificial Analysis 的编码分数排序,支持最高 2,000,000 上下文。

      Misty
      Misty
    • Codex Ultra-Fast 模式被曝提速 5 倍

      Codex Ultra-Fast 模式被曝提速 5 倍

      • 工程实践
      • •
      • 2026年5月11日 20:53
      • •
      • ···
      Codex Ultra-Fast 模式被曝提速 5 倍

      据社区帖子和 OpenAI Codex GitHub 仓库记录,Codex Ultra-Fast 模式曾短暂出现在代码提交中,随后被删除。该模式被描述为面向 latency-sensitive work 的最快响应选项,并宣称可让 agentic code generation 最高提速 5 倍。OpenAI 尚未发布官方公告,因此相关信息仍应按仓库线索与社区观察处理。

      Misty
      Misty
    • 第 2 / 4 页
      较新文章
    • 第 2 / 4 页
      较早文章

    网站

    • Hugo
    • Cloudflare
    • Artalk
    • 关于 LLM 大模型邮报

    关注我们

    • XX(Twitter)
    • Sina Weibo微博
    • TelegramTelegram
    • RSSRSS

    友情链接

    • WinDiscover

    © 2026 LLM大模型邮报 · 保留所有权利