¿Cómo ser un sysadmin altamente efectivo?

La Ley de Pareto, también conocida como la regla 80/20, sugiere que el 80% de los efectos provienen del 20% de las causas. Aplicada al ámbito de la administración de sistemas, esto podría significar que el 80% de los problemas que enfrentas en tu red de servidores podrían estar siendo causados por solo el 20% de las fuentes de problemas.
Para aprovechar la Ley de Pareto en la administración de sistemas, sigue estos pasos:

  1. Identifica y clasifica los problemas: Registra y categoriza todos los incidentes, problemas y desafíos que enfrentas regularmente en tus servidores.
  2. Analiza los datos: Una vez que tengas suficientes datos, analiza para identificar patrones. Es probable que descubras que una fracción relativamente pequeña de problemas o fuentes de problemas son responsables de la mayoría de los incidentes.
  3. Dirige tus esfuerzos hacia las principales causas: Una vez que hayas identificado el 20% de las causas que generan el 80% de tus problemas, enfoca tus esfuerzos en abordar y resolver esos problemas principales.
  4. Reevalúa y ajusta: La tecnología y las necesidades cambian con el tiempo. Es esencial reevaluar periódicamente y ajustar tu enfoque para asegurarte de estar siempre abordando las causas más impactantes.

Ejemplo:

Supongamos que eres un sysadmin coordinando sistemas de 500 servidores. Tras analizar los registros durante un mes, descubres que el 80% de los problemas de rendimiento provienen de solo 100 servidores (20% del total). Al investigar más a fondo, descubres que esos 100 servidores están ejecutando una versión antigua de un software específico.
En lugar de tratar de optimizar todos los servidores, te centras en actualizar o reemplazar el software en esos 100 servidores. Al hacerlo, resuelves el 80% de tus problemas de rendimiento, lo que te permite centrarte en otros desafíos y operaciones.
En resumen, al identificar y abordar las causas más impactantes de problemas (siguiendo la Ley de Pareto), puedes trabajar de manera más eficiente y efectiva.

¿Cómo encontrar la causa raíz?

La técnica de los «Cinco Porqués» es una herramienta popular y efectiva utilizada en la gestión de la calidad y en la resolución de problemas para llegar a la raíz de un problema. Fue desarrollada por Taiichi Ohno, el ingeniero detrás del Sistema de Producción Toyota.

¿Qué es la técnica de los Cinco Porqués? La idea es simple: cada vez que te enfrentas a un problema, preguntas «¿por qué?» cinco veces. Al hacerlo, a menudo puedes rastrear el problema hasta su causa raíz. Resolver el problema a nivel de causa raíz previene que el problema vuelva a ocurrir.

Ejemplo práctico:

Imagina que un servidor se ha caído:

  1. ¿Por qué? – El servidor se sobrecalentó.
  2. ¿Por qué? – El sistema de refrigeración no estaba funcionando adecuadamente.
  3. ¿Por qué? – El filtro del sistema de refrigeración estaba obstruido.
  4. ¿Por qué? – No se había realizado mantenimiento en varios meses.
  5. ¿Por qué? – No había un programa de mantenimiento regular establecido para el sistema de refrigeración.

La solución superficial podría ser simplemente reiniciar el servidor o solucionar el sistema de refrigeración. Pero al utilizar la técnica de los «Cinco Porqués», se identifica que el problema raíz es la falta de un programa de mantenimiento regular. Al establecer un programa de mantenimiento, puedes prevenir problemas similares en el futuro.

Combinando la Ley de Pareto y los Cinco Porqués:

Al combinar la Ley de Pareto con la técnica de los Cinco Porqués, los sysadmins pueden identificar no solo los problemas más impactantes (el 20% que causa el 80% de los problemas), sino también las causas raíz de esos problemas. Esto permite implementar soluciones más duraderas y efectivas.

Por ejemplo, si descubres que el 80% de tus problemas de rendimiento provienen de solo 100 servidores (como en el ejemplo anterior), puedes usar la técnica de los Cinco Porqués para identificar la causa raíz de por qué esos servidores específicos están teniendo problemas. Una vez identificada, puedes implementar soluciones que aborden ese problema fundamental, previniendo futuros incidentes relacionados.

No todo son leyes, también los buenos hábitos son necesarios

Y recuerda, lo buenos hábitos para un sysadmin:

  1. Documentación: Mantener una documentación actualizada y detallada de la infraestructura, configuraciones y procesos es esencial.
  2. Automatización: Automatizar tareas repetitivas puede ayudar a reducir errores y liberar tiempo para centrarse en problemas más críticos.
  3. Monitoreo proactivo: No esperes a que surja un problema. Usa herramientas de monitoreo para recibir alertas antes de que los problemas se conviertan en crisis.
  4. Formación continua: La tecnología evoluciona rápidamente. Dedicar tiempo a la formación y aprendizaje continuo es esencial.
  5. Comunicación: Mantente en contacto con otros sysadmins, equipos de desarrollo y stakeholders para estar informado sobre los cambios y necesidades.

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.