NVIDIA Data Center GPU Manager (DCGM) es un conjunto de herramientas para administrar y monitorear las GPU de NVIDIA datacenter en entornos de clúster. Incluye monitoreo activo de la salud, diagnósticos integrales, alertas del sistema y políticas de gobierno, incluida la administración de energía y reloj. Los equipos de infraestructura pueden usarlo de forma independiente y se integra fácilmente en las herramientas de administración de clústeres, la programación de recursos y los productos de monitoreo de los socios de NVIDIA.
NVIDIA ha lanzado una actualización de software para NVIDIA® Data Center GPU Manager (DCGM). La actualización aborda problemas de seguridad que pueden provocar la denegación de servicio y la manipulación de datos.
NVIDIA DCGM para Linux contiene una vulnerabilidad CVE‑2023‑0208 en HostEngine (componente del servidor) donde un usuario puede causar un desbordamiento de búfer basado en almacenamiento dinámico a través del socket enlazado. Una explotación exitosa de esta vulnerabilidad puede conducir a la denegación de servicio y la manipulación de datos.
La evaluación de riesgos de NVIDIA se basa en un promedio de riesgo en un conjunto diverso de sistemas instalados y es posible que no represente el verdadero riesgo para su instalación local. NVIDIA recomienda evaluar el riesgo de su configuración específica.
Versiones afectadas:
Todas las versiones anteriores a la 3.1.7
Recomendaciones:
Actualizar a la versión 3.1.7
Referencias:
https://nvd.nist.gov/vuln-metrics/cvss/v3-calculator?vector=AV:L/AC:L/PR:L/UI:N/S:C/C:N/I:H/A:H
https://nvidia.custhelp.com/app/answers/detail/a_id/5453#security-updates
https://nvidia.custhelp.com/app/answers/detail/a_id/5452/related/1
https://www.tenable.com/cve/CVE-2023-0208
https://developer.nvidia.com/dcgm
https://cve.report/CVE-2023-0208