AI风向标
英伟达刷新 MLPerf 的 DeepSeek-V3 671B 训练记录:提速 60%,最快 2.02 分钟完成
英伟达昨日(6 月 16 日)发布博文,宣布在 MLPerf Training 6.0 全部 7 项基准测试中,其 Blackwell 平台拿下最快训练成绩,并成为唯一覆盖全部测试项目的平台。 IT之家注:MLPerf Training…
详细介绍
英伟达昨日(6 月 16 日)发布博文,宣布在 MLPerf Training 6.0 全部 7 项基准测试中,其 Blackwell 平台拿下最快训练成绩,并成为唯一覆盖全部测试项目的平台。
IT之家注:MLPerf Training 是业界常用的 AI 训练基准测试体系,用来比较不同硬件与系统在模型训练任务中的速度和效率。 而昨日(6 月 16 日)最新发布的 MLPerf Training 6.0 测试套件中,主要包含 7 项核心测试,涵盖了当前主流的大语言模型、生成式 AI 及经典机器学习工作负载:
DeepSeek-V3:基于拥有 671B 参数的大规模预训练语言模型,侧重测试稀疏计算(MoE 架构)的性能。
GPT-OSS 20B:包含 210 亿参数的生成式预训练语言模型测试。
Llama 3.1-8B:主流的 8B 参数大规模语言模型(LLM)预训练测试。
Llama 2-70B:利用低秩自适应(LoRA)技术对 70B 参数的 Llama 2 模型进行微调测试。
FLUX.1:文生图(Text-to-Image)生成模型测试,测试多节点扩展下的处理能力。
GNN(图神经网络):基于 RGAT 模型的大规模图结构数据分类测试。
内容信息
- 分类
- AI趋势
- 时间
- 2026-06-16T15:15:03.000Z
