AI风向标
小米斩获 CVPR 2026 NTIRE 赛事三项奖项,影像算法取得技术突破
IT之家 5 月 19 日消息,小米技术官方宣布,近日,小米在 CVPR 2026 NTIRE 赛事中获三项奖项。其中,小米玄戒多媒体算法团队夺得高效超分辨率赛道冠军,小米大模型应用团队获人像修复赛道冠军与反光消除赛道亚军。 IT之家注:…
详细介绍
IT之家 5 月 19 日消息,小米技术官方宣布,近日,小米在 CVPR 2026 NTIRE 赛事中获三项奖项。其中,小米玄戒多媒体算法团队夺得高效超分辨率赛道冠军,小米大模型应用团队获人像修复赛道冠军与反光消除赛道亚军。
IT之家注:NTIRE(New Trends in Image Restoration and Enhancement)由 CVPR 组委会承办,是全球规模最大、水平最高的图像恢复与增强领域学术研讨会。 据小米技术介绍,在 NTIRE 高效超分辨率挑战赛的最终评估中,小米玄戒多媒体算法团队依托在芯片多媒体影像算法领域的软硬融合方向积累,延续了上一届冠军方案 SPAN 技术路线,提出了全新一代方法 SPANV2,并以综合得分 4.43 位列第一,在推理速度、计算量、参数规模之间取得了整体均衡。
与上一代 SPAN 相比,SPANV2 的改动集中在两处:一是让网络在修复图像时不再套用一种固定策略处理全图,而是能根据画面内容自适应判断哪里需要精修、以什么方式精修;二是把 GPU 在注意力计算中原本需要三次读写显存的步骤合并为一次完成,省下了大量重复的数据搬运开销。两点叠加,使模型在画质几乎无损的前提下,推理速度再次被提高。
在人像修复赛道上,小米大模型应用团队提出了双阶段级联框架 + 单步扩散细化的技术方案,从全球参赛队伍中脱颖而出,获第一名(Team name: MiPlusCV),在无参考图像质量与身份一致性综合评测中全面领先。
小米官方表示,真实世界中的老照片、模糊、压缩损伤、噪声和低分辨率往往属于复合退化,若直接一步生成,容易出现结构漂移、人脸失真甚至身份变化。为此,团队采用了更稳健的双阶段设计:
第一阶段:基于 OSDFace 进行粗修复与结构恢复,重点解决五官布局恢复、严重退化修正和整体人脸结构稳定,确保人脸结构修复正确
第二阶段:基于 Z-Image One-step Diffusion 进行细节增强,进一步补充皮肤纹理、发丝、边缘和高频细节,确保细节真实自然
此外,小米团队还引入了单步扩散细节增强机制(One-step Diffusion),将复杂的多步推理压缩至单步完成,在保证生成质量的同时提升推理效率。 最后是反光消除赛道,小米大模型应用团队基于 RDNet-XL 架构,通过骨干网络升级、扩散模型知识蒸馏与渐进式多分辨率训练策略,在 CVPR 2026 主观评分中荣获第二名(4.31 分),同时多项客观指标位列第一。
内容信息
- 分类
- AI趋势
- 时间
- 2026-05-18T23:22:40.000Z
