xAI 创始人 Elon Musk 在 X 平台 披露,下一代 Grok 基础模型 V9 已完成训练,参数量达 1.5T,预计 3 至 4 周 后正式发布。据 Musk 透露,该模型当前正在进行补充训练(supplemental training),随后将依次推进 SFT(监督微调)与 RL(强化学习)阶段。

Elon Musk 在 X 平台发布 Grok V9 1.5T 模型训练完成消息

Grok V9 1.5T 模型规格与训练进展

据 Musk 公布,1.5T V9 是 Grok 基础模型的重大升级版本,参数量从当前公开版本 Grok 4.3(基于 V8 架构,0.5T)提升 3 倍。该版本于近日完成预训练阶段(Musk 强调该术语使用有误,实际应为基础训练完成),标志着模型主体架构已定型。

当前 V9 已进入补充训练阶段。Musk 披露,xAI 正在将 Cursor 数据 整合进该阶段(业界常称为中期训练 / mid-training),预计耗时数周。完成后将依次执行 SFT 与 RL 环节,整体流程约需 3 至 4 周。

当前版本 Grok 4.3 的迭代节奏

Musk 同时提及,基于 V8 架构 的 Grok 4.3(0.5T 参数)目前仍以数日一次的频率持续优化。该版本为当前公开可用版本,与即将发布的 V9 形成明显的代际差距。

从参数量对比看,V9 的 1.5T 规格已进入当前大模型主流区间。作为参照,GPT-4 公开推测参数量约 1.8T(MoE 架构),DeepSeek-V3 为 671B MoE(等效 37B 激活)。Grok V9 的具体架构细节(稠密或 MoE)尚未披露。

发布时间与行业定位

Musk 用 “banger” 形容即将到来的 V9 版本,暗示其性能将有显著提升。按 3 至 4 周推算,该模型或将于 2026 年 6 月中旬至下旬 正式发布,正值夏季窗口。

xAI 自去年以来加速模型迭代节奏。Grok 3 系列于 2025 年初发布,此后保持高频更新。V9 的 1.5T 规格若属实,将使 Grok 在参数量层面与头部闭源模型处于同一量级,实际能力需待第三方 benchmark 验证。

考虑到披露信息来自 Musk 个人社交账号、具体技术细节有限且最终发布日期存在浮动空间,该 Grok V9 1.5T 模型的实际表现与完整规格仍待官方技术报告与独立评测确认。

参考 2025 年 xAI 发布节奏及同类大模型从训练完成到公开部署的周期,该时间线具备一定合理性,但 3 至 4 周仅为预估区间,具体日期仍以 xAI 官方公告为准。

鉴于 Musk 过往披露与最终产品间的变动先例,V9 的实际参数量、上下文窗口长度及多模态能力等关键指标,需待发布时方能最终确认。

该爆料反映了 xAI 在基础模型层面的激进扩张策略。1.5T 参数规模配合 Cursor 数据的定向补充训练,或指向代码能力与 agent 任务的专项强化。

评论 ···