模型动态 | LLM 大模型邮报

OpenAI 修复 Codex 中 GPT-5.5 性能衰减重置付费计划用量限制
模型动态
•
2026年5月17日 08:36
•
···
OpenAI 于 5 月 16 日 宣布修复 Codex 中 GPT-5.5 模型的能力衰减问题，并同步重置所有付费计划的用量限制。据开发者社区反馈，此次 Codex GPT-5.5 修复 耗时不足 10 小时，迅速平息了因底层模型响应异常引发的生产力中断危机。在 Codex 用户规模突破峰值的背景下，底层模型路由策略的稳定性直接决定了多轮代码生成的连贯性。
Misty
Claude Mythos 现身 Google Cloud 控制台，Anthropic 或调整访问策略
模型动态
•
2026年5月17日 07:54
•
···
Claude Mythos 被曝已出现在 Google Cloud 控制台列表中，配置有跨区域 token 与请求配额，此前 Anthropic 曾明确表示该模型因滥用风险过高而无广泛发布计划。
Misty
Veo 4 被曝支持多机位场景生成：动态视角切换、9 秒 720p 输出
模型动态
•
2026年5月16日 23:48
•
···
Google I/O 大会前夕，Veo 4 视频生成模型的核心特性在社交平台被曝光。据爆料，该模型正从单镜头 AI 片段迈向全多机位场景生成，支持动态视角切换与原生音频同步，单条视频时长或达 9 秒、分辨率 720p。
Misty
OpenAI 宣布 Greg Brockman 接管产品战略与整合业务
模型动态
•
2026年5月16日 10:18
•
···
OpenAI 宣布 Greg Brockman 正式接管产品战略，主导公司内部新一轮 OpenAI 产品重组。据 WIRED 报道，该公司计划将 ChatGPT、智能体平台 Codex 及开发者 API 整合至单一核心产品团队，目标在年内完成首次公开募股（IPO）前统一消费与企业级服务架构。
Misty
ChatGPT 个人财务功能预览：接入账户与 GPT‑5.5 推理分析
模型动态
•
2026年5月16日 00:46
•
···
据 OpenAI 官方博客披露，ChatGPT 个人财务功能今日面向美国 Pro 用户开启预览。该功能支持通过 Plaid 安全对接超 1.2 万家金融机构账户，默认调用 GPT‑5.5 Thinking 模型处理复杂财务推理，帮助 Pro 用户实时追踪资金流向并生成场景化规划。系统计划基于早期使用反馈逐步扩展至 Plus 订阅层级。
Misty
爆料或为 Gemini 3.5 Flash 内部参数曝光
模型动态
•
2026年5月15日 15:27
•
···
据推文用户 Pankaj Kumar 披露，谷歌正准备推出一版主打极速推理与极低成本的 Flash 模型，或正式命名为 Gemini 3.5 Flash。该 Gemini 3.5 Flash 采用 distillation 与 sparsity 技术压缩架构，传闻多项查询响应延迟控制在 200 毫秒以内。
Misty
蚂蚁百灵开源 Ring-2.6-1T 万亿参数模型，主打 Agent 执行与深度推理
模型动态
•
2026年5月14日 23:43
•
···
蚂蚁百灵团队开源 Ring-2.6-1T 万亿参数大模型，定位面向真实世界复杂任务的执行型思考模型。该模型结合 IcePop 异步强化学习算法，提供 high 与 xhigh 两种推理力度选项，在 PinchBench、AIME 26 等 benchmark 中跑出 87.60 与 95.83 的领先成绩。据 Hugging Face 官方模型库披露，Ring-2.6-1T 模型的设计重心已从传统问答转向多步骤任务规划、工具调用与长程稳定性保障。
Misty
Google I/O 或将发布 Gemini Spark Agent：曝 24/7 AI 助手支持学习用户行为
模型动态
•
2026年5月14日 17:17
•
···
Google I/O 大会前夕，X 用户 Fandu 爆料称，Google 即将发布 Gemini Spark Agent。据其披露，该 Gemini Spark Agent 将作为 24/7 全天候 AI 助手运行，具备从用户交互中持续学习的能力，并可通过 Connected Apps 与第三方服务深度集成。
Misty
OpenAI Codex 企业推广：签约企业即送 2 个月免费额度
模型动态
•
2026年5月14日 16:38
•
···
OpenAI 于 5 月 14 日宣布启动 Codex 企业账户切换激励计划。针对计划在 30 天内签约的新增企业客户，OpenAI 将直接赠送 2 个月 的免费使用额度，活动将持续至 6 月中旬。此次 OpenAI Codex 企业推广活动通过直接降低试错成本，旨在吸引开发者与团队从竞品向自家生态迁移。
Misty
Anthropic 发布 20 余 Claude 法律插件与连接器
模型动态
•
2026年5月13日 22:59
•
···
Anthropic 发布涵盖 20 余项 MCP 连接器与 12 个专业插件的 Claude 法律插件生态更新。该生态深度整合 Microsoft 办公套件及合同管理、电子发现等垂直系统，底层依托 Opus 4.7 模型强化法律文书处理与推理能力。据官方介绍，这些工具旨在降低法律团队重复性工作负担，并为公益法律援助提供更具可负担性的接入方案。
Misty
Arena 最新榜单：Claude Opus 4.7 领跑五大前沿模型
模型动态
•
2026年5月13日 00:18
•
···
Arena 模型排名显示前沿模型呈现出明显的能力分化。根据 Arena 榜单最新数据，五大主流模型在**创意写作**、**专家推理**与**数学计算**等维度展现出不同的技术权衡。![五大前沿模型在 Arena 模型排名的性能分布](https://storage.llmposts.com/img_20260512_121439_01.webp)
Misty
Interfaze模型发布：融合CNN与Transformer的精度架构
模型动态
•
2026年5月12日 22:30
•
···
Interfaze模型发布全新混合架构，主打计算机级确定的高精度任务。该架构融合深度神经网络与Transformer解码器，官方公布的9项基准测试结果显示，其在光学字符识别、语音转文本及结构化输出等场景中准确率达领先水平，同时保持与闪省模型同档的定价策略。
Misty