英伟达显卡安全升级,无后门设计获官方保障!
26
5
英伟达发布可视化GPU集群监控方案,助力云服务合作伙伴提升GPU运行效率
英伟达官方于本周(12月10日)在官网发布了一篇博文,详细介绍了他们正在开发的可视化GPU集群监控方案。这一方案旨在帮助云服务合作伙伴计算GPU的正常运行时间,从而提高GPU系统的整体运行效率。方案特点:用户自愿选择,客户自行安装
该监控方案由用户自愿选择、客户自行安装,旨在监控GPU的使用情况、配置以及错误信息。方案内含开源的客户端软件代理,旨在帮助客户充分发挥GPU系统的价值。软件功能详解
这套软件能进行以下操作: - 追踪功耗峰值,在控制能耗预算的同时最大化每瓦性能; - 监控整个GPU集群的利用率、内存带宽以及互联状况; - 尽早发现热控制问题,避免因过热出现降频、组件老化等风险; - 确认软件配置与设置的一致性,确保结果可复现、运行可靠; - 识别错误与异常,提早发现潜在故障部件。实时监控,直观了解GPU集群运行状况
官方表示,这套软件可帮助企业和云服务提供商直观了解其GPU集群运行状况,解决系统瓶颈,优化生产力。整套服务通过实时监控实现,每个GPU系统会与外部云服务通信并共享GPU指标。英伟达强调:GPU不含任何硬件追踪技术、远程终止开关或后门
英伟达强调,他们的GPU不包含任何硬件追踪技术、远程终止开关或后门,确保用户数据的安全。开源客户端软件代理,提供更高的透明度和可审计性
英伟达计划将客户端软件代理开源,提供更高的透明度和可审计性。整套软件可提供企业GPU资产的可视化信息,无法修改GPU配置或底层运作方式,只能够提供只读的遥测数据,交由客户自行管理并可按需定制。
