LLM 大模型邮报
  • 首页
  • 工程实践
  • 教程指南
  • 行业观察
  • 模型动态
  • 研究前沿
  • 关于

    分类: 模型动态


    LLMPOSTS.com 模型动态分类追踪大模型生态的发布动向:覆盖 GPT、Claude、Gemini、Qwen、DeepSeek、Llama、Mistral 等主流模型家族的版本更新、参数规格、上下文窗口、benchmark 跑分与量化变体。涵盖 OpenAI、Anthropic、谷歌、Meta、阿里、字节、深度求索等厂商的官方发布、内部代号爆料与红队测试动态,为中文 AI 从业者提供第一时间的中文化技术解读与对比参考。


    全部分类

      • 模型动态 (57)‍•
      • 工程实践 (45)‍•
      • 行业观察 (30)‍•
      • 研究前沿 (9)‍•
      • 教程指南 (4)
      • Chatgpt (8)‍•
      • Openai (8)‍•
      • Gemini (1)‍•
      • GPT5.5 (1)‍•
      • Sonnet (1)
    • MiniCPM-V 4.6 1.3B 刷新 2B 以下开源权重得分

      MiniCPM-V 4.6 1.3B 刷新 2B 以下开源权重得分

      • 模型动态
      • •
      • 2026年5月12日 10:13
      • •
      • ···
      MiniCPM-V 4.6 1.3B 刷新 2B 以下开源权重得分

      OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct,这是一款 1.3B 参数的开源权重视觉语言模型。根据 Artificial Analysis 测评,MiniCPM-V 4.6 1.3B 在 Intelligence Index 上得分 13,是 2B 参数以下开源权重模型中的最高非推理得分。模型支持文本、图像与视频输入,输出为文本,权重采用 Apache 2.0 许可证发布。

      Misty
      Misty
    • Featured image

      Claude Sonnet 4.5 将于 5 月 15 日下架

      • 模型动态
      • •
      • 2026年5月9日 20:46
      • •
      • ···
      Featured image

      Anthropic 已在 Claude app 内通过 pop-up 与官方支持页面 Note 形式确认 Claude Sonnet 4.5 将于 2026 年 5 月 15 日从 Claude 模型选择器中下架。该模型于 2025 年 9 月 29 日发布,消费端在线时长约 7.5 个月。API 端 claude-sonnet-4-5-20250929 时间表保留至最少 2026 年 9 月 29 日。

      Misty
      Misty
    • 文心 5.1 发布 预训练成本降至 6%

      文心 5.1 发布 预训练成本降至 6%

      • 模型动态
      • •
      • 2026年5月9日 12:37
      • •
      • ···
      文心 5.1 发布 预训练成本降至 6%

      百度正式上线文心 5.1,并公布模型在参数效率、训练成本和多项 benchmark 上的表现。文心 5.1 将总参数压缩至文心 5.0 约 1/3,激活参数压缩至约 1/2,预训练算力成本约为业界同规模模型的 6%。5 月 9 日,文心 5.1 以 1223 分位列 Arena 搜索榜全球第 4、国内第 1。

      Misty
      Misty
    • 蚂蚁百灵发布 Ring-2.6-1T

      蚂蚁百灵发布 Ring-2.6-1T

      • 模型动态
      • •
      • 2026年5月9日 02:32
      • •
      • ···
      蚂蚁百灵发布 Ring-2.6-1T

      蚂蚁百灵公布 Ring-2.6-1T 的多档能力设置与一组 benchmark 成绩。官方称 high 档面向真实任务执行、通用 agent 与 coding agent,xhigh 档面向数学、研究和多路径推理;OpenRouter 上的免费试用持续到 5 月 15 日。

      Misty
      Misty
    • Zyphra 发布 AMD 训练模型 ZAYA1-8B

      Zyphra 发布 AMD 训练模型 ZAYA1-8B

      • 模型动态
      • •
      • 2026年5月8日 22:46
      • •
      • ···
      Zyphra 发布 AMD 训练模型 ZAYA1-8B

      Zyphra 官方发布 ZAYA1-8B,这是在 AMD Instinct MI300 栈上完成预训练、中期训练与监督微调的 MoE 模型。ZAYA1-8B 的活跃参数少于 10 亿,官方称其在数学、代码与复杂推理任务上超过部分更大开源权重模型。Zyphra 还公布了 Markovian RSA 测试时计算方法,在 HMMT'25 上取得 89.6 分,高于 Claude 4.5 Sonnet 的 88.3 分。

      Misty
      Misty
    • OpenAI 推出 GPT-5.5-Cyber 预览

      OpenAI 推出 GPT-5.5-Cyber 预览

      • 模型动态
      • •
      • 2026年5月8日 20:32
      • •
      • ···
      OpenAI 推出 GPT-5.5-Cyber 预览

      OpenAI 推出 GPT-5.5-Cyber 有限预览,面向负责关键基础设施安全的防御者开放。GPT-5.5-Cyber 与 Trusted Access for Cyber 共同构成分级访问机制:多数团队仍以 GPT-5.5 with TAC 作为起点,少数经更强验证的伙伴可测试更宽松的网络安全工作流。

      Misty
      Misty
    • OpenAI 发布 GPT-Realtime-2 语音模型

      OpenAI 发布 GPT-Realtime-2 语音模型

      • 模型动态
      • •
      • 2026年5月8日 10:24
      • •
      • ···
      OpenAI 发布 GPT-Realtime-2 语音模型

      OpenAI 在 Realtime API 发布 GPT-Realtime-2 语音模型、GPT-Realtime-Translate 与 GPT-Realtime-Whisper。3 款模型分别覆盖实时语音推理、实时语音翻译与流式语音转写,面向可对话、可调用工具、可跨语言工作的语音应用。GPT-Realtime-2 的上下文窗口从 32K 扩展到 128K,并提供从 minimal 到 xhigh 的可调推理强度。

      Misty
      Misty
    • Gemma 4 推出 MTP drafter 推理加速最高 3 倍

      Gemma 4 推出 MTP drafter 推理加速最高 3 倍

      • 模型动态
      • •
      • 2026年5月6日 02:24
      • •
      • ···
      Gemma 4 推出 MTP drafter 推理加速最高 3 倍

      Google 发布 Multi-Token Prediction 方案,为 Gemma 4 MTP drafter 引入推测解码架构。该工具链将模型推理速度提升至多 3 倍,通过轻量级起草模型与目标模型的协同工作,在零质量损耗的前提下显著削减延迟。Gemma 官方开源模型仓库已同步更新相关工具链与使用文档。

      Misty
      Misty
    • OpenAI 推送 GPT-5.5 Instant 模型 语气更简洁并升级个性化记忆

      OpenAI 推送 GPT-5.5 Instant 模型 语气更简洁并升级个性化记忆

      • 模型动态
      • •
      • 2026年5月6日 01:26
      • •
      • ···
      OpenAI 推送 GPT-5.5 Instant 模型 语气更简洁并升级个性化记忆

      OpenAI 推送 GPT-5.5 Instant 模型版本。该版本 API 标识为 gpt-5.5-chat-latest,将在未来两天内作为默认配置向所有 ChatGPT 用户推送。新模型在回答风格与事实准确性上进行了显著升级,并同步引入基于用户历史数据的个性化记忆功能。

      Misty
      Misty
    • Gemini 3.2 Flash 定价泄露:预期发布或指向 5 月 I/O

      Gemini 3.2 Flash 定价泄露:预期发布或指向 5 月 I/O

      • 模型动态
      • •
      • 2026年5月6日 00:00
      • •
      • ···
      Gemini 3.2 Flash 定价泄露:预期发布或指向 5 月 I/O

      据 X 平台用户 @pankajkumar_dev 的爆料原帖,Gemini 3.2 Flash 预期发布已进入最后观察期。部分用户报告该模型已陆续出现在 Google AI Studio 与 iOS 应用内。接口日志显示其可能于 2026 年 5 月推出,时间窗口大概率围绕 Google I/O 大会或提前 1 到 2 天。

      Misty
      Misty
    • Peanut 图像生成模型亮相专业横评 对比 FLUX.2

      Peanut 图像生成模型亮相专业横评 对比 FLUX.2

      • 模型动态
      • •
      • 2026年5月5日 22:20
      • •
      • ···
      Peanut 图像生成模型亮相专业横评 对比 FLUX.2

      Peanut 图像生成模型于 5 月 4 日出现在 Artificial Analysis 的专业多模型横评中。该模型与 MAI-Image-2、grok-imagine-image 及 FLUX.2 [dev] Turbo 一同参与测试,评测采用 5 组涵盖艺术风格、写实摄影与动漫风格的复杂提示词,直观展示各模型的文本解析与视觉生成能力。

      Misty
      Misty
    • Anthropic 开发 Orbit 助手 或将在开发者大会亮相

      Anthropic 开发 Orbit 助手 或将在开发者大会亮相

      • 模型动态
      • •
      • 2026年5月5日 11:22
      • •
      • ···
      Anthropic 开发 Orbit 助手 或将在开发者大会亮相

      Anthropic 正在开发名为 Orbit 的新功能,Anthropic Orbit 助手被定位为面向 Claude Cowork 的主动式简报系统。近期在 Anthropic 的 web 与 mobile 构建版本中,该工具的测试入口已现身设置面板。结合代码描述,系统计划整合 Gmail、GitHub、Figma 等办公软件生成个性化洞察,预计面向开发者推出。

      Misty
      Misty
    • 第 4 / 5 页
      较新文章
    • 第 4 / 5 页
      较早文章

    网站

    • Hugo
    • Cloudflare
    • Artalk
    • 关于 LLM 大模型邮报

    关注我们

    • XX(Twitter)
    • Sina Weibo微博
    • TelegramTelegram
    • RSSRSS

    友情链接

    • WinDiscover

    © 2026 LLM大模型邮报 · 保留所有权利