Mozilla 用 Claude Mythos 做 Firefox 安全加固
Mozilla 披露了 Firefox 安全加固的内部流程:团队使用 Claude Mythos Preview、Claude Opus 4.6 与其他模型,结合自研 agentic harness 发现并修复潜伏安全漏洞。Mozilla 称,Claude Mythos Preview 在 Firefox 150 版本中识别的漏洞修复数量为 271 个;Firefox 在 2026 年 4 月发布的安全修复数量升至 423 个。这次 Firefox 安全加固的重点不是一次性提示模型,而是把模型接入可复现测试、去重、分诊、补丁与发布流程。

Claude Mythos Firefox 安全加固修复了哪些漏洞
Mozilla 在官方技术文章中披露了一组样例漏洞。这些漏洞覆盖 JIT、WebAssembly GC、IPC、IndexedDB、XSLT、WebTransport、RLBox 与 HTML 表格布局等子系统。多个样例属于 sandbox escape,需要与另一个内容进程漏洞组合,才可能形成完整 Firefox 攻击链。Mozilla 强调,这类问题通常很难靠传统 fuzzing 全面覆盖。 样例显示,模型不只发现表面代码异味。Bug 2024918 涉及错误相等性检查,可能让 JIT 优化掉仍然存活的 WebAssembly GC 结构初始化。Bug 2024437 是一个存在约 15 年的 legend 元素问题,触发条件横跨递归栈深度、expando 属性与 cycle collection。Bug 2025977 是一个约 20 年的 XSLT 问题,reentrant key() 调用会在哈希表 rehash 后继续使用已释放的 backing store。
agentic harness 把模型输出变成可复现证据
Mozilla 的关键变化来自 agentic harness。早期用 GPT 4 或 Sonnet 3.5 做静态代码审计时,误报率太高,难以规模化。新的 harness 能根据接口与指令创建测试用例,并运行这些用例来验证漏洞假设。它会过滤无法复现的猜测,把模型输出转化为安全团队可处理的信号。 Mozilla 先用 Claude Opus 4.6 让 harness 寻找 sandbox escape。初期工程师在终端监督运行过程,观察模型路径并调整 prompt 与逻辑。流程稳定后,团队把任务并行到多个临时 VM。每个 VM 针对一个目标文件找漏洞,并把发现写回共享存储。这个设计说明,模型能力只有嵌入动态验证循环后,才适合进入高风险安全流程。
Firefox 安全加固依赖完整漏洞生命周期
发现系统只是第一步。Mozilla 表示,要让 Firefox 安全加固在大规模场景中可用,还必须接入完整安全漏洞生命周期。流程包括确定扫描目标、选择高风险代码区域、对照已知问题去重、创建 bug、分诊、测试补丁,并把修复送入发布版本。 这条流水线具有强项目属性。harness 的底层思路可以复用,但语义、构建系统、测试设施与安全发布流程都与 Firefox 代码库绑定。Mozilla 还提到,超过 100 人参与了这一轮工作,职责覆盖补丁编写、代码审查、流水线扩展、分诊、测试与发布管理。这个规模反映了一个现实:AI 能扩大漏洞发现能力,但不会消除修复、验证与发布成本。
模型升级放大了安全流水线效率
Mozilla 的经验是,端到端流水线搭好后,更换新模型的成本很低。团队先用公开模型发现严重漏洞;当获得 Claude Mythos Preview 评估机会时,现有流水线可以直接承接更强模型。Mozilla 称,模型升级同时改善了 3 件事:发现潜在漏洞、生成 proof-of-concept 测试用例、解释漏洞机理与影响。 Firefox 150 版本修复了 Claude Mythos Preview 识别的 271 个漏洞。Mozilla 还在 Firefox 149.0.2、150.0.1 与 150.0.2中发布了更多相关修复。修复量曲线也出现明显变化:2025 年每月安全修复大致在 20-30个区间,2026 年 2 月与 3 月升至 60-70个,2026 年 4 月达到 423个。
AI 没找到的漏洞同样说明防御有效
Mozilla 认为,模型没有绕过某些防线同样有价值。过去几年,研究人员曾通过父进程中的 prototype pollution 逃逸进程沙箱。Mozilla 后来选择在架构层默认冻结这些 prototypes,而不是逐个修补同类问题。团队审计 harness 日志时,看到模型多次尝试沿这条路径逃逸,但被这一设计阻断。 这一点说明,AI 安全审计不仅能发现新漏洞,也能验证历史加固措施是否挡住了真实攻击路径。对安全团队而言,这构成了不同于传统 fuzzing 的增量价值:模型可以跨文件、跨进程、跨信任边界推理,并尝试组合利用链;动态 harness 则负责把这些尝试沉淀为可复现结果或失败证据。 Mozilla 的结论很直接:任何软件项目都可以从简单 prompt 与现代模型开始,用 harness 找漏洞并逐步扩展。Firefox 安全加固案例的行业含义在于,防守方已可以把前沿模型接入持续安全工程,而不是只把 AI 当成离线代码审计工具。Mozilla 计划把这类分析整合进 CI,在补丁进入代码树时扫描变更;如果 patch-based scanning 成熟,安全漏洞发现会更早靠近开发流程。
评论 ···