fbpx
Saltear al contenido principal

Aunque HANA de SAP es la solución perfecta para los datos de gran valor y uso frecuente, en ocasiones necesitamos recurrir a cantidades masivas de datos para ver patrones y tendencias de mayor envergadura. Aunque HANA es ideal para datos empresariales para los que se necesita un acceso directo, como es el caso de las transacciones diarias en órdenes de venta, órdenes de compra, inventarios de piezas y plazos de entrega, hay una gran cantidad de datos para los que es posible que necesite hacer un seguimiento a largo plazo.

Hadoop, por otro lado, está diseñado para los macrodatos, como sensores de información, sensores remotos, cámaras, lectores RFID y más. Las bases de datos de Hadoop almacenan los datos de una forma menos estructurada y son ideales para grandes fuentes de información, como registros web, redes sociales, documentos de oficina, gráficos y cualquier cosa que no necesite incluirse en una fila o una columna.

No obstante, la mayor diferencia reside en que HANA de SAP mantiene los datos empresariales formateados almacenados en la memoria, mientras que Hadoop guarda grandes cantidades de datos primarios en bancos de discos.

Los macrodatos suponen el uso de los sistemas de archivos distribuidos

Como puede suponer, no es posible acceder rápidamente a los datos primarios no estructurados. SAP utiliza Spark para estructurar el sistema de archivos distribuidos de Hadoop (HDFS). Spark es un motor rápido para el procesamiento de datos a gran escala que combina SQL, streaming y analíticas complejas. Su inconveniente es que no dispone de una interfaz web sencilla y familiar. Necesitará Spark para estructurar sus archivos HDFS y que estos estén disponibles para una búsqueda mediante SQL.

Vora es un motor de búsquedas en memoria que se conecta a Spark para obtener analíticas actualizadas de Hadoop. Vora le ofrece una interfaz interactiva para modelar y procesar los datos para su visualización o análisis. Puede funcionar solo, para ofrecer esa interfaz a sus macrodatos, o con HANA, para ampliar sus analíticas a la empresa y los macrodatos.

Vora se usó en un primer momento para proporcionar procesamiento analítico en línea (OLAP) para el análisis de los macrodatos, aunque ha evolucionado gracias a su capacidad bidireccional para leer datos de HANA y volver a escribirlos en esta. Esto permite a los usuarios de Vora evitar el traslado de datos de HANA a HDFS para ejecutar un análisis, usando ambas fuentes de datos.

En pocas palabras, Vora salva la brecha entre los datos que almacena y a los que accede a diario, usando HANA, y los datos almacenados en Hadoop.

Cómo funciona Vora de HANA de SAP

Vora ofrece tres herramientas: un navegador de datos, un editor SQL y un modelador de datos, todas ellas accesibles desde una intuitiva interfaz web. Esto significa que su equipo de datos puede conseguir lo que necesita sin los problemas de las herramientas excesivamente técnicas y los lenguajes de programación, como Python, Java y Scala.

El navegador de datos de Vora le permite ver tablas, vistas, dimensiones y cubos que existen en el motor Vora. También puede previsualizar datos, filtrar columnas y actualizarlas, o descargar datos. El motor SQL facilita la ejecución de consultas en el motor de Vora, visualizando los errores y alertas de compilación, además de visualizar el resultado de la consulta. El modelador de datos facilita la creación de vistas, dimensiones y/o cubos SQL sin cambiar las aplicaciones. Consigue que el modelado de datos en Hadoop sea tan fácil como en HANA.

Simplificación de los macrodatos

La mayoría de las funciones empresariales estándar están incluidas en Vora, como las conversiones de moneda, unidades de medida y jerarquías. Estas funciones integradas reducen el tiempo necesario para crear, unir o agregar modelos de datos. También permiten a los modeladores obtener valiosos conocimientos de los grandes datos con solo un modelo de datos y una consulta.

Al analizar Vora de SAP frente a Spark, con Vora sus científicos de datos tendrán que trabajar con Spark directamente. Vora trabaja sobre Spark, ofreciendo a los analistas una perfecta integración con HANA, así como una menor cantidad de programación y depuración. Vora también se configura con una seguridad a nivel de empresa, en lugar de tan solo una seguridad de datos, facilitándole las cosas en el momento de la auditoría y poniéndoselo difícil a los piratas informáticos.

Combinación de datos empresariales y macrodatos

Como los datos empresariales se almacenan en costosas memorias de HANA y los macrodatos se almacenan en dispositivos baratos de Hadoop, lograr que los macrodatos soporten los datos empresariales no es tan fácil ni rápido como desearían la mayoría de las empresas. Vora ayuda a salvar esa deficiencia.

Debido a que Vora de HANA de SAP es un motor de procesamiento en memoria que se ejecuta en un clúster de Hadoop, crea jerarquías de datos estructurados para los datos de Hadoop. Esto hace posible el acceso a esos datos con los datos de HANA, por lo que puede ejecutar un análisis OLAP en memoria.  La función de modelado de datos de Vora también permite a los modeladores previsualizar modelos de datos para las analíticas mucho más rápido, acelerando todo el proceso. Vora también puede virtualizar los datos de Hadoop para unirlos con los de HANA y generar informes.

Cómo comenzar

No intente comenzar en casa sin, al menos, unos sólidos conocimientos de sus datos, de las mejores prácticas sobre la ciencia de datos y con experiencia en SAP. Combinar los macrodatos con los datos empresariales es difícil incluso si las estructuras de datos fueran idénticas. Pero no lo son. HANA de SAP se basa en filas, Hadoop no está estructurado y SQL se basa en columnas. Estas estructuras de datos esencialmente distintas crean muchos quebraderos de cabeza al obtener los datos para poder realizar una comparación y análisis.

Si su equipo de ciencia de datos está ya saturado de trabajo, como en la mayoría de las empresas, puede que desee subcontratar su formación e implementación de Vora de HANA de SAP. Obtenga un equipo certificado en SAP que pueda reconocer cómo trabajan sus científicos y modeladores de datos, saber qué intenta lograr y, posteriormente, reunir todas esas variables en una solución relativamente sencilla de usar que le permita acceder a los datos empresariales y macrodatos.

No es fácil, pero a largo plazo, combinar los macrodatos con los datos empresariales podría ayudarle a llevar su toma de decisiones a un nivel completamente nuevo, descubrir algunas nuevas oportunidades y ayudarle a detectar y solucionar las dificultades antes de que estas se conviertan en problemas.

¿Quiere obtener más información? Hable con Symmetry para saber cómo puede usar Vora de HANA SAP y aprovechar sus ventajas.