El colapso de las CPU EPYC Rome: AMD no ofrece soluciones.

AMD EPYC ROME.

Las CPU “AMD EPYC Rome» sufren un sorprendente fallo de funcionamiento que interrumpe su actividad tras exactamente 1.044 días de uso continuo. 

De hecho, este inconveniente plantea una serie de interrogantes sobre las razones detrás de este evento inesperado y las consecuencias que acarrea.

Ahora bien, en la actualidad numerosos negocios y empresas dependen de servidores en línea que operan sin descanso para brindar servicios y mantener una infraestructura conectada a Internet en funcionamiento constante. 

Sin embargo, se ha descubierto que los procesadores “AMD EPYC Rome” experimentan una detención total después de transcurrir exactamente 1.044 días de actividad ininterrumpida. 

Por consiguiente, esta situación plantea un desafío significativo para las empresas, ya que se ven obligadas a realizar mantenimientos programados para reiniciar los sistemas. 

Además, deben renunciar a las medidas de ahorro de energía, lo cual se traduce en un problema económico.

AMD EPYC ROME.

Este fenómeno inesperado ha dejado perplejos a los usuarios y ha generado preocupación en la industria, dado que los procesadores para servidores se diseñan para funcionar de manera continua, sin interrupciones. Mantenimiento Informático Tancra.

Sin embargo, ante la incapacidad de las CPU “AMD EPYC Rome” para mantener su rendimiento más allá del umbral de 1.044 días, ha nacido el interrogante sobre las posibles causas de esta falla. 

¿Por qué las CPU AMD EPYC Rome se detienen a los 1.044 días?

Desde “Mantenimiento Informático” sabemos que los procesadores AMD EPYC Rome experimentan una peculiar parada tras 1.044 días de actividad continua. 

Sin embargo, en un giro sorprendente, se ha descubierto que no todo el procesador de las CPU “AMD EPYC Rome” se apaga después de alcanzar el umbral de 1.044 días de funcionamiento. 

Al parecer, experimentan una parada en el tiempo, donde su actividad se detiene por completo durante un lapso de tiempo.

Según fuentes oficiales de AMD, este fenómeno ocurre cuando uno de los núcleos del procesador, debido a la inactividad, es incapaz de reactivarse nuevamente. 

De hecho, las causas detrás de este comportamiento aún son desconocidas, ya que no se ha proporcionado una explicación oficial sobre este problema.

AMD EPYC ROME.

Por otro lado, es importante destacar que los procesadores “EPYC Rome de AMD” se basan en la arquitectura Zen 2 y ya han pasado varios años desde su lanzamiento. 

Lo curioso es que este error se manifiesta casi tres años después del último reinicio del sistema.

No obstante, si bien los servidores están diseñados para funcionar sin interrupciones, es normal que diferentes partes del sistema se apaguen periódicamente para llevar a cabo tareas de mantenimiento programadas. Mantenimiento Informático Tancra.

Además, a diferencia de las PC convencionales, los servidores modernos están equipados con mecanismos para almacenar la información del estado de la memoria RAM y las líneas de caché del procesador, algo que facilita una recuperación inmediata.

En resumen, si se produce una caída de voltaje, un corte de energía o un mantenimiento programado, el problema no es tan grave como podría parecer a simple vista, ya que los servidores cuentan con medidas de respaldo para garantizar una recuperación eficiente y proteger los datos críticos.

¿Por qué AMD no ofrece una solución?

El inconveniente radica en el interior mismo del procesador, no en el firmware ni en los controladores.

A lo largo del tiempo, desde el lanzamiento del “AMD EPYC Rome” hasta la fecha en que se produce la congelación a los 1.044 días, AMD ha presentado dos generaciones adicionales de sus procesadores para servidores. 

Estas generaciones se basan en las arquitecturas Zen 3 y Zen 4, lo que indica que no existe un interés evidente por parte de AMD en resolver este problema.

Desde “Mantenimiento informático” sabemos que el problema fundamental reside en la forma en que cada núcleo maneja el estado conocido como CC6, que se produce cuando se reduce el voltaje de un núcleo a 0 voltios. 

AMD EPYC ROME.

Esta reducción de voltaje se realiza constantemente en los procesadores actuales como una medida para reducir el consumo de energía. Mantenimiento Informático Tancra.

Sin embargo, el problema surge cuando, tras un período de tiempo determinado, el subsistema responsable de esta gestión es incapaz de reactivar el núcleo afectado.

Por consiguiente, es clave destacar que este problema no ocurre mientras un núcleo está activo, sino que se manifiesta únicamente después de los 1.044 días desde el último reinicio, cuando los núcleos pasan al estado de reposo y ya no pueden despertar.

En consecuencia, AMD recomienda actualmente desactivar el estado CC6, lo cual evita que los distintos núcleos del procesador entren en reposo.

(S.M.C).

¡Haz clic para puntuar esta entrada!
(Votos: 1 Promedio: 5)