LLM 大模型邮报
  • 首页
  • 工程实践
  • 教程指南
  • 行业观察
  • 模型动态
  • 研究前沿

    分类: 研究前沿


    LLMPOSTS.com 研究前沿分类追踪大模型领域的学术动态与方法论演进:覆盖 arXiv 论文解读、新算法、新架构、benchmark 设计、对齐技术、强化学习、推理能力、agent 评估等研究方向。涵盖 OpenAI、Anthropic、DeepMind、Meta AI、智源、上海 AI Lab 等机构的研究输出,以及独立研究者的实验性项目,为中文 AI 研究者与工程师提供持续更新的学术风向参考与论文中文化解读。


    全部分类

      • 模型动态 (8)‍•
      • 教程指南 (4)‍•
      • 工程实践 (3)‍•
      • 研究前沿 (1)
    • Missing image

      阿里开源 Qwen-Scope 可解释性工具 覆盖 7 个 Qwen3/3.5 模型

      • 研究前沿
      • •
      • 2026年5月2日 13:16
      Missing image

      阿里 Qwen 团队开源可解释性工具 Qwen-Scope,基于 Qwen3 与 Qwen3.5 系列共 7 个模型训练所得,提供 14 组稀疏自编码器(SAE)权重。该工具通过在隐藏层插入 SAE 并施加稀疏性约束,提取高度解耦的可解释性特征,覆盖稠密模型与混合专家模型两类架构。

      Misty
      Misty

    网站技术

    • Hugo
    • Cloudflare

    关注我们

    • XX(Twitter)
    • Sina Weibo微博
    • TelegramTelegram
    • RSSRSS

    友情链接

    • WinDiscover

    © 2026 LLM大模型邮报 · 保留所有权利