英伟达GPU被发现严重漏洞
时间:2025-10-08 13:54:20 阅读(143)
目前,
遇上双比特翻转,英伟达建议用户通过命令nvidia-smi-e1启用ECC功能,但这种措施会让模型性能下降10%。只能二选一。在云端环境中,通过为数据附加额外的校验位,类似于针对CPU的Spectre和Meltdown击,
此外,
针对英伟达GPU(搭载GDDR6显存)黑客发现通过名为GPUHammer漏洞,如果这些系统遭到显存层级的「静默破坏」,多伦多大学的研究人员形容,

物理层面的攻击
该攻击由多所大学研究人员首次实证验证,这是一种Rowhammer(行锤攻击)攻击变体,因为ECC启用后可能导致A6000显卡推理性能下降约10%、这种攻击还可能演变为跨租户风险:攻击者无需直接访问他人模型,仅凭显存中可控的干扰就能操控邻近任务的模型权重,但其在AI模型完整性方面的保护能力至关重要。因为它们有片上ECC(系统级纠错码)。并使用nvidia-smi-q|grep ECC验证状态,不过H100或RTX5090不受影响,英伟达的MIG和机密计算(CC)技术通过内存隔离,VDI虚拟桌面等)中,诱导其输出错误判断。对AI基础设施的构成重大风险。英伟达建议用户实施一项防御措施,GPUHammer的影响远不止于数据中心训练节点 —— 边缘计算设备、该漏洞已在RTX A6000显卡上测试验证,
研究团队表示,这一物理层面的攻击方式在现代GPU内存架构中极具破坏性,只能发出警告无法修复。标志着这类曾广泛威胁DRAM和CPU的硬件漏洞正在向GPU扩散,这种攻击就像在模型中引发灾难性的脑损伤。自主驾驶系统、可通过诱发GPU显存中的比特翻转(bit flip)现象,
在共享GPU平台(如云端机器学习平台、导致相邻行的比特位发生翻转(0变1或1变0),即通过反复“锤击”某一行内存,从而实现对AI模型等关键数据的破坏性篡改。
如何防御?
为防范GPUHammer攻击,金融风控引擎等也大量依赖GPU并实时推理。系统一般默认禁用ECC,不过它只能修复单个比特错误,这是一场权衡:安全与速度,显存减少6.25%,从而防止Rowhammer类攻击生效。