fbpx
Saltear al contenido principal

Qué son el RTO y el RPOEn la tecnología suceden cosas, simplemente pasan. Y la forma en que nos afectan tiene que ver tanto con la forma en la que nos hemos preparado para lo inevitable, como con la forma en la que hacemos con lo que hemos hecho para evitar el tiempo de inactividad. Entonces, ¿qué pasa cuando las luces se apagan? Trate de imaginar lo que sucede cuando los sistemas de su empresa se caen. Diría que es más una cuestión de “cuándo sucede” y no “si sucede”. ¿Cuál es el impacto en su negocio cuando su SAP se cae durante una hora? ¿Un día? ¿Más tiempo? Lo que suceda a continuación dependerá de su plan de Continuidad comercial (Business Continuity, BC). Y el núcleo de su plan de BC dependerá de su tolerancia al tiempo de inactividad, lo que nos lleva a formular la pregunta: ¿qué es RTO y RPO?

¿Qué es un RTO?

Hemos debatido esto antes, pero vale la pena profundizar en este tema. RTO significa «Objetivo de tiempo de recuperación» (por sus siglas en inglés). El RTO es la cantidad de tiempo que está dispuesto a dejar que pase antes de que sus sistemas de respaldo se pongan en línea. El RTO varía ampliamente en el mundo de los negocios. Para sistemas no críticos, el RTO se puede medir en horas o incluso días. Para los sistemas centrales, el RTO podría ser en cuestión de segundos.

El RTO depende de la urgencia con la que necesite que el sistema se recupere. En el caso de SAP ERP, la mayoría de las empresas desean que los sistemas se transmitan por fallo a instancias de copia de seguridad de manera relativamente rápida. Aunque esto depende de la empresa. Si su empresa envía contenedores cada tres semanas, es probable que un RTO de 15 minutos no interfiera en gran medida en su operación. Permitirá que las personas descansen y tomen un café mientras el departamento de TI se esfuerza por poner en marcha el entorno SAP de respaldo.

Las empresas más rápidas y con mayor intensidad de transacciones generalmente requieren RTO más cortos. Los ejemplos más extremos se encuentran en el campo financiero, donde los segundos cuentan. Una transacción de acciones o una transferencia bancaria que se retrasa por una interrupción del servicio puede ser una propuesta costosa. También puede afectar la reputación de la empresa en cuestión.

¿Qué es un RPO?

El RPO es el «Objetivo de punto de recuperación». Refleja el momento en el tiempo en que desea poder recuperarse cuando inicia sus sistemas de respaldo. Como ejemplo, digamos que Smith le compra un producto a las 11:00 a. m. y Jones compra un producto a las 11:01 a. m. Su sistema SAP registra las transacciones en sus respectivos horarios. Entonces, imagine que sufre una interrupción a las 11:02 a. m. ¿Hasta cuándo desea recuperar su sistema? ¿Desea poder recuperar la transacción de Jones de un minuto antes o la transacción de Smith de dos minutos antes? Su RPO determina el punto en el tiempo que desea recuperar.

¿Por qué el RTO y el RPO son importantes en la Continuidad comercial?

El RTO y el RPO son elementos importantes de cada plan de BC. Estas son las métricas específicas que integran el proceso de copia de seguridad y recuperación, la disponibilidad y la transferencia por fallos. Y, como puede imaginar, cuanto más rápido sea el RTO y cuanto más corto sea el RPO, mayor será el costo de implementación. Si quiere un RTO medido en segundos, por ejemplo, tendrá que diseñarlo según corresponda. Una metodología común es la de «sitio espejo».

Un sitio espejo es una copia idéntica de su entorno SAP existente que se ejecuta en una ubicación separada (con la esperanza de que sea segura). Si se encuentra en Nueva York, su sitio espejo podría estar en Arizona. Puede configurar su entorno SAP para transferir el sistema por fallo al sitio espejo en segundos y, por lo tanto, permite transacciones para continuar dentro del RTO definido.

Los sitios espejo son caros porque presentan un desafío doble. Tiene que ejecutarlos en perfecta alineación con el sistema primario. Esa es una tarea operativa. Lo peor, sin embargo, es que debe mantener los dos sistemas en paralelo de forma exacta en términos administrativos. Si actualiza el software en uno, debe actualizarlo en el otro, y así sucesivamente. Es un proceso que requiere mucho tiempo y recursos.

Los RTO menos costosos y más lentos pueden incluir sitios de respaldo «cálidos» que deben iniciarse junto con la restauración de las copias de seguridad de las bases de datos que se han replicado a intervalos periódicos durante el día. Por ejemplo, si replica cada hora, entonces su RPO tendrá una duración de hasta una hora. Los «sitios fríos», donde tiene que instalar su entorno SAP desde cero, son incluso más baratos. Esto podría requerir días. Pero, de acuerdo con su empresa, puede que no importe.

Mejores Prácticas de DR

Existe un conjunto útil de conocimientos de mejores prácticas que puede aplicar a sus requisitos de Recuperación ante desastres (Disaster Recovery, DR). Aprender de las buenas prácticas (y errores) de otros. El siguiente es un resumen de alto nivel. Para obtener más información, recomendamos nuestro Manual de planificación de recuperación ante desastres.

Asignar prioridades de DR con un enfoque basado en el riesgo

La mayoría de nuestros clientes tienen un enfoque de múltiples niveles para RTO y RPO. Para sus sistemas más críticos, invierten en RTO rápidos y RPO cortos. Para sistemas menos esenciales, como los volúmenes de almacenamiento de archivos, se conforman con un RTO menos costoso, pero más lento. La pregunta que surge, por supuesto, es: ¿qué activos y amenazas merecen el nivel más alto de inversión en RD y cuáles no?

Un enfoque basado en el riesgo le permite cuantificar el impacto de las amenazas y planificar la DR según corresponda. Hay un buen grado de subjetividad en esto, pero le permite diferenciar entre la probabilidad y el impacto de situaciones de desastres más y menos graves. Aquí hay una versión simplificada del proceso. Para cada activo digital, por ejemplo, su SAP ERP, sistema de correo electrónico, etc.:

  • Identifique la amenaza, algo que interrumpirá las operaciones comerciales, como desastres naturales y ataques cibernéticos.
  • Estime la probabilidad de que ocurra el desastre, por ejemplo, la probabilidad de que la amenaza se exprese como un valor entre 0 y 1.
  • Calcule el impacto y asigne una calificación entre 0 y 1 que sugiera cuán significativamente afectaría la amenaza/evento sus operaciones comerciales.
  • Asigne una clasificación de riesgo, el valor derivado al multiplicar la probabilidad por el impacto de la amenaza en particular.

Como se muestra en la tabla a continuación, los diferentes sistemas tienen diferentes clasificaciones de riesgo según el impacto de una interrupción. Cuanto mayor sea la clasificación de riesgo, mayor será la necesidad de un RTO alto.

AmenazaSistema afectadoProbabilidadEfectosClasificación de riesgoImplicaciones para RTO/RPO
HuracánPanorama de SAP0.10.90.09Lo más rápido
HuracánServidor de correo electrónico0.10.70.07Rápido

 

Seleccionar las tecnologías de DR adecuadas

Después de evaluar las clasificaciones de riesgo, es necesario seleccionar la tecnología o las herramientas que proporcionen un medio para lograr el RTO, el RPO y otros aspectos del plan de DR. Hay muchas opciones disponibles. Estas incluyen la replicación del hipervisor de SAP, las copias de seguridad secundarias del centro de datos, la replicación de la base de datos, la replicación del almacenamiento, etc. Cada solución tecnológica para DR tiene sus ventajas y desventajas. Un socio de DR experimentado puede ayudarlo a descubrir el enfoque óptimo desde las perspectivas de la continuidad empresarial y de costos.

Considere la recuperación ante desastres como servicio (DRaaS)

La DR puede ser lo suficientemente compleja como para que tenga sentido subcontratarla a un proveedor que pueda encargarse de todo esto como un servicio. Podemos ayudar en este sentido. Nuestra Recuperación ante desastres como servicio es solo una parte de una solución completa de infraestructura de TI y nube. Trabajamos con nuestros socios para asignar recursos basados ​​en lo siguiente:

  • RTO y RPO
  • Necesidades informáticas actuales
  • Crecimiento futuro
  • Proyectos especiales

Una tarifa mensual asequible le da acceso a los recursos que utiliza. Al mismo tiempo, se beneficia de la escalabilidad del DRaaS en nuestra nube administrada. En caso de un desastre, puede recuperarse y ampliarse rápidamente y cumplir con los RTO y RPO predeterminados. Esto garantiza la continuidad comercial sin los costos de invertir en infraestructura de DR.