模型动态 | LLM 大模型邮报

Anthropic 被曝筹备 Claude Mythos 1,将集成至 Claude Code 与 Security
模型动态
•
2026年5月24日 10:15
•
···
据 TestingCatalog 曝料,Anthropic 正加速推进 Claude Mythos 模型的公开发布,暂命名为 Mythos 1。用户界面已短暂出现该模型入口,代码字符串亦确认将集成至 Claude Code 与 Claude Security。与此同时,Claude Opus 4.8 也被曝处于内部评估阶段,或于数周内发布。
Misty
GPT-5.6 泄露：六月发布在即，iris-alpha 等三款变体曝光
模型动态
•
2026年5月23日 23:09
•
···
据 X 平台科技博主 Pankaj Kumar 最新 GPT-5.6 泄露信息，OpenAI 正在开发的 GPT-5.6 系列模型或于 2026 年 6 月发布。爆料指出，内部测试中已出现 iris-alpha、ember-alpha 和 beacon-alpha 三款变体代号，GPT-5.6 将侧重于多步推理、智能体工作流与前端生成能力的提升。此外，Sonnet 4.8 与 Gemini 3.5 Pro 也预计同期登场，六月或成 AI 模型发布密集期。
Misty
OpenAI Codex 流量分配转向开源终端工具访问
模型动态
•
2026年5月23日 22:53
•
···
OpenAI Codex 正在加速向外围开源工具生态导流。此次 OpenAI Codex 流量分配的新策略直接调整了开发者调用路径，约 10% 的生产流量已经由 Pi harness 与 OpenCode 等第三方开源项目调用。得益于 OpenAI 开放了 app server 与官方 SDK，开发者现可直接使用 ChatGPT 账号登录这些工具，无需承担额外 API 费用。
Misty
Claude Mythos Preview 漏洞挖掘成果:Project Glasswing 首月发现逾万高危漏洞
模型动态
•
2026年5月23日 13:59
•
···
据 Anthropic 工程博客，Project Glasswing 首月 Claude Mythos Preview 漏洞挖掘成果显著：在约 50 家合作伙伴配合下发现超万枚高危或严重等级漏洞，Cloudflare 单家即确认 2,000 枚漏洞，开源项目评估准确率达 90.6%。
Misty
Claude Sonnet 4.8 泄露:Anthropic 或跳过 4.7 升级视觉与编码
模型动态
•
2026年5月23日 12:13
•
···
据开发者爆料,Anthropic 的 Claude Sonnet 4.8 泄露事件源于一次意外的 Claude Code npm 更新打包失误。开发者在 npm 更新中发现 512,000 行内部调试源码,其关键词过滤器直接引用 Sonnet 4.8,暗示 Anthropic 或跳过 Sonnet 4.7 版本,预计 2026 年 6 月中下旬发布。
Misty
智谱发布 GLM-5.1-HighSpeed：400 tokens/s 刷新大模型速度上限
模型动态
•
2026年5月22日 20:07
•
···
智谱正式发布 GLM-5.1-HighSpeed，其速度表现刷新行业预期。据智谱官方工程博客披露，该模型采用自研 TileRT 推理引擎进行系统级重构，在 8 块 H200 GPU 环境下输出速度达 400 tokens/s，首次实现旗舰级能力与极低延迟的并行落地，为实时编码 Agent 与语音交互提供算力基座。
Misty
Cursor Composer 2.5 评测: 编码智能体性价比新标杆，SWE-Bench 跃升 35 分
模型动态
•
2026年5月22日 11:06
•
···
据 Artificial Analysis 评测，Cursor 发布的 Composer 2.5 在 Coding Agent Index 中获得 62 分，位列测试的编码智能体第三。该模型在 SWE-Bench 等核心基准上表现大幅提升，同时单任务成本仅为 0.07 美元，远低于 Opus 4.7 与 GPT-5.5 等高价变体，成功跻身领先梯队。
Misty
Codex 锁定电脑使用支持 Mac 锁屏后远程操作
模型动态
•
2026年5月22日 09:22
•
···
据 OpenAI 工程团队博文披露，Codex 正式更新 Computer Use 功能，新增锁定模式。该功能允许 Mac 设备在锁屏且屏幕关闭的状态下，仍能通过手机端触发远程桌面任务。
Misty
Qwen3.7 Max 跑分超上一版 4.8 分，闭源旗舰逼近技术前沿
模型动态
•
2026年5月21日 21:44
•
···
阿里巴巴发布闭源旗舰模型 Qwen3.7 Max，在第三方评测机构 Artificial Analysis Intelligence Index 获得 56.6 分，较 2026 年 4 月发布的 Qwen3.6 Max Preview 提升 4.8 分，达到其历史最高水平。
Misty
Manus 创始人团队将筹集 10 亿美元回购 Meta 股权
模型动态
•
2026年5月21日 21:03
•
···
据彭博社报道, Manus 三位创始人正推动一项重大资本运作，拟通过外部融资完成 Manus 股权回购，以此换取被 Meta 收购的智能体 AI 业务独立运营。该操作旨在满足北京方面关于外资剥离与算法合规的监管要求，并为其后续中外合资架构重组与港股上市铺路。
Misty
Gemini 3.5 Pro 泄露预告：定位类 GPT-5.5 旗舰，强化 Coding 与 Agent 工作流
模型动态
•
2026年5月21日 13:41
•
···
据开发者 Pankaj Kumar 在社交平台泄露的信息显示，Google 正将 Gemini 3.5 Pro 定于 6 月中旬至下旬正式发布。该模型定位接替现有旗舰的 SOTA 级别产品，在编程、智能体 (agent) 工作流与逻辑推理方面进行深度强化，定价预计维持在 Gemini 3.1 Pro 水平或上浮约 1.5 倍。据泄露项目信息，Gemini 3.5 Pro 并非 Mythos 架构路线，更接近 GPT-5.5 或 Claude Opus 4.7 的产品形态，同时着重通过 grounding 机制降低真实场景中的幻觉率。
Misty
OpenAI 通用推理模型证明 1946 年单位距离猜想
模型动态
•
2026年5月21日 09:48
•
···
据 OpenAI 官方博客披露，OpenAI 发布的通用推理模型自主破解了 1946 年提出的平面单位距离问题。该模型通过构建包含至少 n^{1+\delta} (其中 \delta \approx 0.014) 个单位对点的集合，彻底打破了持续 80 年认为网格构造是最优解的数学猜想。这一由 125 页思维链推理构成的证明，经 Noga Alon 和 Timothy Gowers 等顶级数学家验证，标志着 OpenAI 通用推理模型 在独立解决前沿基础科学难题上取得了里程碑式进展。
Misty