据 TestingCatalog 曝料,Anthropic 正加速推进 Claude Mythos 模型的公开发布,暂命名为 Mythos 1。用户界面已短暂出现该模型入口,代码字符串亦确认将集成至 Claude Code 与 Claude Security。与此同时,Claude Opus 4.8 也被曝处于内部评估阶段,或于数周内发布。
据 X 平台科技博主 Pankaj Kumar 最新 GPT-5.6 泄露信息,OpenAI 正在开发的 GPT-5.6 系列模型或于 2026 年 6 月发布。爆料指出,内部测试中已出现 iris-alpha、ember-alpha 和 beacon-alpha 三款变体代号,GPT-5.6 将侧重于多步推理、智能体工作流与前端生成能力的提升。此外,Sonnet 4.8 与 Gemini 3.5 Pro 也预计同期登场,六月或成 AI 模型发布密集期。
OpenAI Codex 正在加速向外围开源工具生态导流。此次 OpenAI Codex 流量分配的新策略直接调整了开发者调用路径,约 10% 的生产流量已经由 Pi harness 与 OpenCode 等第三方开源项目调用。得益于 OpenAI 开放了 app server 与官方 SDK,开发者现可直接使用 ChatGPT 账号登录这些工具,无需承担额外 API 费用。
据 Anthropic 工程博客,Project Glasswing 首月 Claude Mythos Preview 漏洞挖掘成果显著:在约 50 家合作伙伴配合下发现超万枚高危或严重等级漏洞,Cloudflare 单家即确认 2,000 枚漏洞,开源项目评估准确率达 90.6%。
据开发者爆料,Anthropic 的 Claude Sonnet 4.8 泄露事件源于一次意外的 Claude Code npm 更新打包失误。开发者在 npm 更新中发现 512,000 行内部调试源码,其关键词过滤器直接引用 Sonnet 4.8,暗示 Anthropic 或跳过 Sonnet 4.7 版本,预计 2026 年 6 月中下旬发布。
智谱正式发布 GLM-5.1-HighSpeed,其速度表现刷新行业预期。据 智谱官方工程博客 披露,该模型采用自研 TileRT 推理引擎进行系统级重构,在 8 块 H200 GPU 环境下输出速度达 400 tokens/s,首次实现旗舰级能力与极低延迟的并行落地,为实时编码 Agent 与语音交互提供算力基座。
据 Artificial Analysis 评测,Cursor 发布的 Composer 2.5 在 Coding Agent Index 中获得 62 分,位列测试的编码智能体第三。该模型在 SWE-Bench 等核心基准上表现大幅提升,同时单任务成本仅为 0.07 美元,远低于 Opus 4.7 与 GPT-5.5 等高价变体,成功跻身领先梯队。
据 OpenAI 工程团队博文 披露,Codex 正式更新 Computer Use 功能,新增锁定模式。该功能允许 Mac 设备在锁屏且屏幕关闭的状态下,仍能通过手机端触发远程桌面任务。
阿里巴巴发布闭源旗舰模型 Qwen3.7 Max,在第三方评测机构 Artificial Analysis Intelligence Index 获得 56.6 分,较 2026 年 4 月发布的 Qwen3.6 Max Preview 提升 4.8 分,达到其历史最高水平。
据 彭博社报道, Manus 三位创始人正推动一项重大资本运作,拟通过外部融资完成 Manus 股权回购,以此换取被 Meta 收购的智能体 AI 业务独立运营。该操作旨在满足北京方面关于外资剥离与算法合规的监管要求,并为其后续中外合资架构重组与港股上市铺路。
据开发者 Pankaj Kumar 在社交平台泄露的信息显示,Google 正将 Gemini 3.5 Pro 定于 6 月中旬至下旬正式发布。该模型定位接替现有旗舰的 SOTA 级别产品,在编程、智能体 (agent) 工作流与逻辑推理方面进行深度强化,定价预计维持在 Gemini 3.1 Pro 水平或上浮约 1.5 倍。据泄露项目信息,Gemini 3.5 Pro 并非 Mythos 架构路线,更接近 GPT-5.5 或 Claude Opus 4.7 的产品形态,同时着重通过 grounding 机制降低真实场景中的幻觉率。
据 OpenAI 官方博客 披露,OpenAI 发布的通用推理模型自主破解了 1946 年提出的平面单位距离问题。该模型通过构建包含至少 n^{1+\delta} (其中 \delta \approx 0.014) 个单位对点的集合,彻底打破了持续 80 年认为网格构造是最优解的数学猜想。这一由 125 页思维链推理构成的证明,经 Noga Alon 和 Timothy Gowers 等顶级数学家验证,标志着 OpenAI 通用推理模型 在独立解决前沿基础科学难题上取得了里程碑式进展。