Maximizar el tiempo de actividad del servidor: Mejores prácticas

El mantenimiento de servidores en funcionamiento requiere una cuidadosa combinación de planificación, mantenimiento preventivo y el sentido común.

El correcto mantenimiento de servidores activos, o servidores listos para entrar en acción cuando sea necesario, es un deseo de prácticamente todos los líderes de Datta Centers.

Sin embargo, pocos gerentes pueden decir que están haciendo absolutamente todo lo posible para obtener el máximo tiempo de funcionamiento de sus sistemas. De hecho, muchos gerentes pierden innecesariamente el tiempo y fondos en tecnologías y prácticas que tienen poco o ningún impacto positivo en el tiempo de actividad.

Lograr una optimización del tiempo de actividad del servidor es a la vez una ciencia y un arte de gestión. Es una combinación de muchas cosas diferentes, incluyendo el tener una autoridad personal, el uso de hardware tolerante a fallos, la adopción de prácticas de seguridad dinámica, y un buen mantenimiento y práctica de gestión del cambio (no perder tiempo y recursos en actividades y herramientas que no contribuyen directamente a mejorar el tiempo de actividad).

Organizarse
La mayoría de los gerentes están de acuerdo en que planificar cuidadosamente todos los trabajos relacionados con el servidor, desde la adquisición de la gestión a la sustitución, es un paso clave para garantizar la fiabilidad del sistema. «Saber cuándo y cómo reemplazar el hardware y el software de actualización es importante, ya que afecta el desempeño, la sostenibilidad y el tiempo de actividad en general», Por ejemplo, si usted tiene que realizar una actualización de software, la comprensión de los requisitos de hardware y el estado de su hardware actual es crítica. Es posible que desee comprar el hardware como parte de la actualización de software para garantizar que se cumplan los requisitos y evitar cortes demás, o realizar uno antes que el otro para reducir al mínimo el número de cambios.

La normalización de estándares de trabajo, es fundamental para la organización. Por ejemplo: Antes instalar algo o hacer un cambio en el Servidor, tiene que haber un proceso de gestión del cambio». La gestión del cambio, es saber «cómo todo se configura y se puso de pie, y [evaluar] los cambios antes de que se implementen, de esa manera, siempre sabrá cómo las cosas se supone que son y cómo las cosas van a interactuar.
La disciplina de la gestión del cambio hace que sea posible predecir el número de servidores va a reaccionar cuando se configura de tal o cual manera o si se colocan en un nuevo entorno.

La actitud también juega un papel muy importante ya que resulta un esfuerzo adicional garantizar que las tareas rutinarias, relacionadas con el servidor se tomen en serio y se traten oportunamente.

Prácticas de mantenimiento preventivo

Las acciones rutinarias preventivas, son quizás la forma más fácil y menos dolorosa de reforzar la fiabilidad del servidor. La realización de tareas esenciales – actualización del software del sistema, proporcionar energía adicional y garantizar una correcta refrigeración – son el camino hacia la creación de un centro de datos con servidores estables, sin sorpresas de presupuesto o sin distracción de los miembros del personal de otras tareas vitales.

Para asegurarse que todo el trabajo vital se lleve a cabo cuando sea necesario, las tareas de mantenimiento del servidor deben ser identificadas y organizadas en un calendario. Hay ciertas cuestiones en las que hay que actuar de inmediato – como actualizaciones de seguridad – y hay otras cosas que tienen sentido para lotes y aplicar a intervalos regulares. Esta segunda categoría incluye actualizaciones de software con mejoras de funcionalidad no crítica. La única razón legítima para realizar un mantenimiento de un servidor funcional durante horas de oficina sería la instalación de una actualización de software crítico, tales como la aplicación de un parche de seguridad de día cero.

Automatizar las tareas esenciales de la gestión del servidor

No es ningún secreto que la administración de servidores se ha convertido en algo de gran complejidad en los últimos años, sobre todo debido a la llegada de las tecnologías de virtualización y a las prácticas encaminadas a aumentar la eficiencia y la utilización del servidor.

La virtualización ayuda a proteger los Data Center a los efectos del tiempo de inactividad del servidor. Mediante la consolidación de servidores y la conexión de ellos en un entorno compartido, la virtualización permite que múltiples máquinas virtuales se puedan ejecutar en máquinas diferentes. La caída de cualquier host se redistribuirá el trabajo entre los hosts restantes. Usted puede sufrir un fallo del servidor, pero eso no quiere decir que tiene que tener un impacto en el servicio».

Para gestionar entornos cada vez más virtuales, hay muchos proveedores que ofrecen herramientas que están diseñadas para ayudar al personal del centro de datos y mantener un ojo en el rendimiento del servidor, detectar problemas emergentes y aprovechar las oportunidades de mejora del rendimiento.

Asegúrese de tener herramientas para activar alertas

Es importante buscar una herramienta que pueda desencadenar una alerta cuando una condición del servidor cruza un umbral específico, por ejemplo, cuando la sobrecarga de memoria o la utilización de CPU excesivo.

Aunque la mayoría de las Servidores cuentan con herramientas con funciones integradas de alerta, Es importante contar con un producto con avisos configurables – los umbrales que desencadenan los correos electrónicos o mensajes SMS. Se necesita una información significativa para que pueda tomar las medidas necesarias para corregir la situación – lo que sea que trabaje para su medio ambiente, incluida también la alerta en el monitor de pantalla grande para el personal de operaciones.
Realizar un análisis de tiempo de la actividad más significativa, se basa en las mediciones que muestran el impacto de las fallas en el servidor de servicios de negocio clave. Por ejemplo, cuantificar el impacto de un corte de luz no sólo en el tiempo, sino en pesos.

No permita que los hackers roben su tiempo de actividad

La seguridad también juega un papel importante para garantizar el tiempo de actividad del servidor. Como era de esperar, los servidores que están en peligro por los malware o caminos sin garantía de la red son más propensos a bajar de sus homólogos bien protegido. «Usted comienza con la seguridad física – el edificio del centro de datos – y asegurarse de que es físicamente seguro». Después, es importante contar con reglas de acceso de servidor que se conocen y aplican, estantes seguro, antivirus, Firewalls y administradores disciplinados. «Todos ellos juegan un papel igualmente importante en la seguridad del servidor y tiempo de la promoción.»

Proteja sus datos

Para protegerse de cualquier pérdida de datos causada por un fallo del servidor, se recomienda desarrollar un plan de protección de datos que está ligado a la estrategia global de negocios de la empresa.

Normalmente se utiliza una solución de almacenamiento fuera del sitio para replicar todos los datos almacenados. Se trata de una recuperación de desastres de centros de datos. También se utiliza la tecnología de balanceo de carga integrado en la infraestructura de red para proteger contra un fallo súbito del servidor.

Los servicios de Cluster proporcionan una capa adicional de redundancia. Si uno de los nodos del clúster falla, o las necesidades de tiempo de inactividad para el mantenimiento, la aplicación en clúster o componente de un servicio que se ejecuta en ese nodo se puede ejecutar sin problemas en otro nodo del clúster.

Mire la calidad de hardware

La adquisición de servidores de calidad es una manera obvia de aumentar la fiabilidad del servidor de largo plazo. La longevidad del hardware en servidores de alto grado, garantiza estabilidad. Sin embargo, en el mundo real, los presupuesto a menudo se enfrentan a una elección dolorosa entre la satisfacción de sus necesidades con productos de servidor de bajo costo o adquirir una mejor, los sistemas más fiables que cumplen con criterios de eficiencia establecidos. ¿Qué hacer?

Una compra inteligente, se basa en el análisis del equilibro entre un muy buen presupuesto económico y los perjuicios financieros que puedan ser causados por los servidores poco fiables. Es un punto que puede ser fácilmente demostrado con figuras simples y proyecciones.

Sepa cuándo es el momento de cortar sus pérdidas

El simple sentido común puede ser la mejor forma de garantizar el tiempo de actividad máxima del servidor sin romper el presupuesto. «El hardware es hardware. En algún momento, algo se romperá». Es importante aprender de lo sucedido y estar preparados con un plan si alguna vez vuelva a suceder.

Usar el sentido común también significa saber cuándo es el momento de cortar sus pérdidas y pasar a algo nuevo, independientemente de la etapa actual de su ciclo de reemplazo. El porcentaje de tiempo que gasta el personal de IT en el apoyo a la lucha contra los incendios fuera de los sistemas actuales, y cuanto se reduciría esto renovando el hardware, son variables que deben tenerse en cuenta a la hora de decidir un reemplazo. Un entorno activo que continuamente anima a los miembros del personal para identificar y el silenciamiento de potenciales problemas antes de que causen ningún daño es clave para maximizar el tiempo de actividad

Cursos relacionados:

Cursos de SQL Server 2005

Cursos de ORACLE