latam 0813 minimizing downtime with vmware vsphere ha and ft

45
© 2010 VMware Inc. Todos los derechos reservados Análisis técnico profundo: Reducción del tiempo fuera de servicio al mínimo con las funciones High Availability y Fault Tolerance de VMware vSphere 5.1

Upload: jmmmax

Post on 28-Dec-2015

21 views

Category:

Documents


0 download

DESCRIPTION

Análisis técnico profundo: Reducción del tiempo fuera de servicio al mínimo con las funciones High Availability y Fault Tolerance de VMware vSphere 5.1

TRANSCRIPT

Page 1: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

© 2010 VMware Inc. Todos los derechos reservados

Análisis técnico profundo: Reducción del tiempo

fuera de servicio al mínimo con las funciones

High Availability y Fault Tolerance de

VMware vSphere 5.1

Page 2: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

La alta disponibilidad forma parte de la continuidad del negocio de TI

Page 3: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

La virtualización es un excelente comienzo

Creación de depósitos de recursos compartidos • Permite compartir y asignar recursos de hardware de

manera transparente.

• Permite optimizar los recursos de manera automática.

Independencia del hardware • Permite recuperar una máquina virtual (VM, virtual machine)

en cualquier hardware de manera confiable.

• Permite presentar hardware estándar (virtual) a todas las cargas de trabajo.

La automatización es necesaria para reducir

los riesgos y el tiempo fuera de servicio.

Encapsulamiento • Toda la información sobre el sistema se almacena como

archivos planos en el disco.

• Se pueden proteger sistemas completos con herramientas de protección de datos.

Page 4: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Disponibilidad incorporada en la infraestructura para todas las aplicaciones

Sitio principal Sitio de recuperación

Alta disponibilidad

Protección de datos

Recuperación ante desastres

vMotion, DRS en modo

de mantenimiento

High Availability, Fault Tolerance

vSphere Data Protection

vSphere APIs for Data Protection

Site Recovery Manager

vSphere Replication

Page 5: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Mejoras recientes a la función High Availability (vSphere 5.0)

Fault Domain Manager (FDM)

Aumento de la escalabilidad y la confiabilidad

Implementación y configuración del agente

de anfitrión más rápidas

Modelo de maestro-esclavo

Eliminación de las dependencias de DNS

Datastores de heartbeat

Verificación de SSL obligatoria

Page 6: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Integración de Auto Deploy

Tamaño de la ranura de control de admisión configurable

Permanent Device Loss (PDL)

Manejo de All Paths Down (APD)

Cambio de SDK para el monitoreo de aplicaciones

Mejoras recientes a la función High Availability (vSphere 5.1)

Page 7: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Manejo de PDL y APD

disk.terminateVMOnPDLDefault

• Garantiza la interrupción de la VM cuando ocurre PDL.

• La VM se interrumpe cuando ordena E/S.

das.maskCleanShutdownEnabled

• La opción predeterminada es “False” (falso).

Recomendación: Establecer como “True” (verdadero).

• La función HA puede reiniciar las VM interrumpidas por PDL.

• Las VM desconectadas desde APD también se reinician.

Page 8: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Redes

Red de administración redundante

La menor cantidad posible de saltos

Ruta basada en la ID del puerto de origen

Política de conmutación de retorno = No

Habilitación de PortFast, Edge, etc.

Mismo tamaño de MTU

Simplificación

Page 9: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Redes

Nombres de grupos de puertos, etiquetas de red coherentes

Monitoreo del anfitrión durante el mantenimiento de la red

Uso del modo de mantenimiento

Subred distinta para vSphere High Availability

Especificación de dirección adicional de aislamiento de red

Posibilidad de que cada anfitrión se comunique

con el resto de los anfitriones

Simplificación

Page 10: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Redes

Opciones de configuración avanzadas

•das.allowNetwork[0-9]=

•das.isolationAddress[0-9]=

•das.useDefaultIsolationAddress= (true/false)

(verdadero/falso)

•das.failuredetectiontime

• No compatible con vCenter 5.x

Page 11: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Almacenamiento

Implementación de múltiples rutas

• HBA, procesadores de almacenamiento

(SP, storage processors), NIC, switches

•Política de múltiples rutas apropiada

Page 12: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Almacenamiento

Heartbeats de almacenamiento

• La función High Availability selecciona dos datastores

de manera predeterminada.

Page 13: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Almacenamiento

Heartbeats de almacenamiento • Todos los anfitriones del clúster deben ver los mismos datastores.

• Se pueden redefinir los datastores seleccionados de manera automática en caso de ser necesario.

Page 14: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Eventos de vSphere High Availability

Falla del anfitrión

Partición de red

Aislamiento del anfitrión

Page 15: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Falla del anfitrión

Maestro

Page 16: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Partición de red

Maestro

Page 17: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Aislamiento del anfitrión

Maestro

Page 18: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Respuesta ante el aislamiento del anfitrión

Leave Powered On (dejar encendido) (opción

predeterminada con 5.x)

Shutdown (apagar) (opción predeterminada con 4.x)

Power Off (desconectar)

P: ¿Qué opción debería usar?

R: Por lo general, la opción predeterminada,

pero depende…

Page 19: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Respuesta ante el aislamiento

¿El anfitrión podrá

seguir teniendo

acceso al

almacenamiento?

¿Las VM podrán

seguir teniendo

acceso a la red

de VM?

Política de

aislamiento

recomendada

Fundamento

Sí Sí Leave

Powered On

La VM se está ejecutando

bien, ¿por qué se debería

desconectar?

Sí No

Leave

Powered On

Shutdown

Usar la opción

Shutdown si el acceso

a la red es importante

No Sí Power Off Evitar tener dos instancias

de la misma VM en la red

No No

Power Off

Leave

Powered On

Usar la opción Leave

Powered On si la VM se

recuperará de la pérdida de

la red y el almacenamiento

Page 20: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Función Admission Control de VMware vSphere High Availability

“vCenter Server utiliza el control de admisión de

vSphere High Availability para garantizar la reserva de

recursos suficientes en el clúster para la recuperación

de la máquina virtual en caso de que se produzcan fallas

en el anfitrión”.

- Guía VMware vSphere® 5.0 High Availability Deployment Best Practices

Cantidad de anfitriones

• Antes conocido como Host Failures Cluster Tolerates (fallas del

anfitrión que tolera el clúster)

Porcentaje de recursos de clúster

Anfitriones de conmutación de recuperación dedicados

Page 21: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones

•Utilización del concepto de tamaños de ranuras

VMware vSphere

Función Admission Control de VMware vSphere High Availability

Page 22: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones: explicación de tamaños de ranuras

Sin reservas (explícitas) de CPU y memoria

• Uso de memoria de 32 MHz, 0 MB + sobrecarga de memoria

Ejemplo de tamaño de la ranura = memoria de 32 MHz, 65 MB

Función Admission Control de VMware vSphere High Availability

Page 23: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones: explicación de tamaños de ranuras

Reserva:

2 GHz

1024 MB

Reserva:

1 GHz

2048 MB

Función Admission Control de VMware vSphere High Availability

Page 24: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones: explicación de tamaños de ranuras

Reserva:

2 GHz

1024 MB

Reserva:

1 GHz

2048 MB

Función Admission Control de VMware vSphere High Availability

Page 25: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones: explicación de tamaños de ranuras

Reserva:

2 GHz

1024 MB

Reserva:

1 GHz

2048 MB

Función Admission Control de VMware vSphere High Availability

Page 26: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones: explicación de tamaños de ranuras

VM VM

Función Admission Control de VMware vSphere High Availability

Page 27: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones: explicación de tamaños de ranuras

VM VM

Función Admission Control de VMware vSphere High Availability

Page 28: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones: explicación de tamaños de ranuras

VM VM

Función Admission Control de VMware vSphere High Availability

Page 29: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones: explicación de tamaños de ranuras

VM VM

Función Admission Control de VMware vSphere High Availability

Page 30: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones: explicación de tamaños de ranuras

VM VM

Función Admission Control de VMware vSphere High Availability

Page 31: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones

vSphere

Client

vSphere

Web Client

Función Admission Control de VMware vSphere High Availability

Page 32: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Cantidad de anfitriones

VM VM

Función Admission Control de VMware vSphere High Availability

Page 33: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Admission Control

Cantidad de anfitriones

• Diseñar clústeres “de manera uniforme”

• Permitir que la función High Availability calcule

la configuración

• No usar reservas de VM a menos que sea

realmente necesario

• Evitar reducir el tamaño de las ranuras

• Ventaja: Los cálculos se realizan de manera automática

• Desventaja: Es posible que sea más conservador

Page 34: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Porcentaje de recursos de clúster

Función Admission Control de VMware vSphere High Availability

Page 35: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Admission Control

Porcentaje de recursos de clúster

• Diseñar clústeres “de manera uniforme”

• Es útil cuando las reservas varían de manera considerable

• La capacidad reservada para High Availability en cada

anfitrión es mayor que las reservas para las VM más

grandes (CPU, memoria)

• Ventaja: Flexibilidad

• Desventaja: Necesidad de cálculos manuales

Page 36: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Función Admission Control de VMware vSphere HA

Page 37: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Admission Control

Anfitrión de conmutación de recuperación dedicado

• Diseñar clústeres “de manera uniforme”

• De lo contrario, usar el anfitrión más grande como

anfitrión de conmutación de recuperación

• Es útil cuando las reservas varían de manera considerable

• La capacidad reservada para High Availability en cada

anfitrión es mayor que las reservas para las VM más

grandes (CPU, memoria)

• Ventajas: No presentan recursos fragmentados

• Desventaja: El anfitrión está inactivo cuando todo

funciona bien

Page 38: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Recomendaciones: Admission Control

“Hacer las cuentas y considerar los requisitos

del cliente. Recomendamos usar una política

de control de admisión basada en „porcentajes‟,

ya que es la más flexible”.

- Duncan Epping, Frank Denneman, (26/08/2012).

VMware vSphere 5.1 Clustering Deepdive (pág. 101). Edición Kindle.

• Establecer el porcentaje = un anfitrión (N+1) o múltiples

anfitriones (N+X)

• Volver a calcular cuando se agregan anfitriones nuevos

• 6 anfitriones, N+1 1 / 6 = 17 %

• 10 anfitriones, N+1 1 / 10 = 10 %

Page 39: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Servicio VM Monitoring de vSphere High Availability

VM Monitoring reinicia la VM si…

•No se recibe el heartbeat de VMware Tools.

•No existe actividad de red o disco dentro del intervalo

de estadísticas de E/S.

• Opción predeterminada de 120 segundos: personalizar

en vSphere Web Client

Page 40: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Servicio Application Monitoring de vSphere High Availability

Soluciones de terceros

•Symantec ApplicationHA

•Neverfail vAppHA

Apertura de Application Awareness API con vSphere 5.0

• Descargar VMware GuestAppMonitor SDK con 5.0

• Descargar VMware Guest SDK para vSphere 5.1

Page 41: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

VMware vSphere Fault Tolerance (FT)

Page 42: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

VMware vSphere Fault Tolerance (FT)

Se puede probar la conmutación de recuperación

con la función Fault Tolerance.

La función Fault Tolerance funciona con

High Availability y DRS.

Fault Tolerance se activa y se desactiva fácilmente.

Requisitos y limitaciones

• Ejemplos: almacenamiento compartido, solo una vCPU

• Consultar las secciones “Fault Tolerance Checklist”

(Lista de verificación de Fault Tolerance) y “Fault Tolerance

Interoperability” (Interoperabilidad de Fault Tolerance)

en la guía de vSphere Availability

Page 43: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

¿Cómo funciona Fault Tolerance?

Se crea una VM con Fault Tolerance duplicada

(secundaria).

Se utiliza la tecnología VMware vLockstep.

Los eventos se graban en la VM principal.

Los eventos grabados se transmiten a la VM secundaria.

Los eventos se reproducen en la VM secundaria.

Page 44: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Resumen

La virtualización brinda las bases para una mejor

disponibilidad.

Las funciones High Availability y Fault Tolerance

de vSphere brindan una recuperación automatizada

ante el tiempo fuera de servicio no planificado.

Niveles de disponibilidad: High Availability para la

mayoría de las cargas de trabajo, Fault Tolerance

para las más importantes.

Page 45: Latam 0813 Minimizing Downtime With Vmware Vsphere Ha and Ft

Gracias

Este webcast está grabado, por lo que se le enviará un enlace para la versión cuando lo solicite

junto con una copia de las diapositivas en PDF en un correo electrónico posterior.

Para obtener más información sobre el webcast, visite www.vmware.com/go/webcasts. Síganos en Twitter en www.twitter.com/vmwareevents.