AI风向标

英伟达刷新 MLPerf 的 DeepSeek-V3 671B 训练记录：提速 60%，最快 2.02 分钟完成

英伟达昨日（6 月 16 日）发布博文，宣布在 MLPerf Training 6.0 全部 7 项基准测试中，其 Blackwell 平台拿下最快训练成绩，并成为唯一覆盖全部测试项目的平台。 IT之家注：MLPerf Training…

详细介绍

英伟达昨日（6 月 16 日）发布博文，宣布在 MLPerf Training 6.0 全部 7 项基准测试中，其 Blackwell 平台拿下最快训练成绩，并成为唯一覆盖全部测试项目的平台。

IT之家注：MLPerf Training 是业界常用的 AI 训练基准测试体系，用来比较不同硬件与系统在模型训练任务中的速度和效率。而昨日（6 月 16 日）最新发布的 MLPerf Training 6.0 测试套件中，主要包含 7 项核心测试，涵盖了当前主流的大语言模型、生成式 AI 及经典机器学习工作负载：

DeepSeek-V3：基于拥有 671B 参数的大规模预训练语言模型，侧重测试稀疏计算（MoE 架构）的性能。

GPT-OSS 20B：包含 210 亿参数的生成式预训练语言模型测试。

Llama 3.1-8B：主流的 8B 参数大规模语言模型（LLM）预训练测试。

Llama 2-70B：利用低秩自适应（LoRA）技术对 70B 参数的 Llama 2 模型进行微调测试。

FLUX.1：文生图（Text-to-Image）生成模型测试，测试多节点扩展下的处理能力。

GNN（图神经网络）：基于 RGAT 模型的大规模图结构数据分类测试。

内容信息

分类: AI趋势
时间: 2026-06-16T15:15:03.000Z

返回列表