OpenAI 于 5 月 16 日 宣布修复 Codex 中 GPT-5.5 模型的能力衰减问题,并同步重置所有付费计划的用量限制。据开发者社区反馈,此次 Codex GPT-5.5 修复 耗时不足 10 小时,迅速平息了因底层模型响应异常引发的生产力中断危机。在 Codex 用户规模突破峰值的背景下,底层模型路由策略的稳定性直接决定了多轮代码生成的连贯性。
Claude Mythos 被曝已出现在 Google Cloud 控制台列表中,配置有跨区域 token 与请求配额,此前 Anthropic 曾明确表示该模型因滥用风险过高而无广泛发布计划。
Google I/O 大会前夕,Veo 4 视频生成模型的核心特性在社交平台被曝光。据爆料,该模型正从单镜头 AI 片段迈向全多机位场景生成,支持动态视角切换与原生音频同步,单条视频时长或达 9 秒、分辨率 720p。
OpenAI 宣布 Greg Brockman 正式接管产品战略,主导公司内部新一轮 OpenAI 产品重组。据 WIRED 报道,该公司计划将 ChatGPT、智能体平台 Codex 及开发者 API 整合至单一核心产品团队,目标在年内完成首次公开募股(IPO)前统一消费与企业级服务架构。
据 OpenAI 官方博客 披露,ChatGPT 个人财务功能今日面向美国 Pro 用户开启预览。 该功能支持通过 Plaid 安全对接超 1.2 万家金融机构账户,默认调用 GPT‑5.5 Thinking 模型处理复杂财务推理,帮助 Pro 用户实时追踪资金流向并生成场景化规划。 系统计划基于早期使用反馈逐步扩展至 Plus 订阅层级。
据 推文用户 Pankaj Kumar 披露,谷歌正准备推出一版主打极速推理与极低成本的 Flash 模型,或正式命名为 Gemini 3.5 Flash。该 Gemini 3.5 Flash 采用 distillation 与 sparsity 技术压缩架构,传闻多项查询响应延迟控制在 200 毫秒以内。
蚂蚁百灵团队开源 Ring-2.6-1T 万亿参数大模型,定位面向真实世界复杂任务的执行型思考模型。该模型结合 IcePop 异步强化学习算法,提供 high 与 xhigh 两种推理力度选项,在 PinchBench、AIME 26 等 benchmark 中跑出 87.60 与 95.83 的领先成绩。据 Hugging Face 官方模型库披露,Ring-2.6-1T 模型的设计重心已从传统问答转向多步骤任务规划、工具调用与长程稳定性保障。
Google I/O 大会前夕,X 用户 Fandu 爆料称,Google 即将发布 Gemini Spark Agent。据其披露,该 Gemini Spark Agent 将作为 24/7 全天候 AI 助手运行,具备从用户交互中持续学习的能力,并可通过 Connected Apps 与第三方服务深度集成。
OpenAI 于 5 月 14 日宣布启动 Codex 企业账户切换激励计划。针对计划在 30 天内签约的新增企业客户,OpenAI 将直接赠送 2 个月 的免费使用额度,活动将持续至 6 月中旬。此次 OpenAI Codex 企业推广活动通过直接降低试错成本,旨在吸引开发者与团队从竞品向自家生态迁移。
Anthropic 发布涵盖 20 余项 MCP 连接器与 12 个专业插件的 Claude 法律插件生态更新。该生态深度整合 Microsoft 办公套件及合同管理、电子发现等垂直系统,底层依托 Opus 4.7 模型强化法律文书处理与推理能力。据官方介绍,这些工具旨在降低法律团队重复性工作负担,并为公益法律援助提供更具可负担性的接入方案。
Arena 模型排名显示前沿模型呈现出明显的能力分化。根据 Arena 榜单最新数据,五大主流模型在**创意写作**、**专家推理**与**数学计算**等维度展现出不同的技术权衡。
Interfaze模型发布全新混合架构,主打计算机级确定的高精度任务。该架构融合深度神经网络与Transformer解码器,官方公布的9项基准测试结果显示,其在光学字符识别、语音转文本及结构化输出等场景中准确率达领先水平,同时保持与闪省模型同档的定价策略。