skip to Main Content

SAP HANA est idéal pour accéder rapidement à des données de grande valeur et utilisées fréquemment, mais il est parfois nécessaire d’examiner de grandes quantités de données pour identifier des évolutions et des tendances globales. Tandis que HANA convient idéalement aux données d’entreprise auxquelles vous devez accéder instantanément, comme les commandes quotidiennes, les bons d’achat, les stocks de pièces et les calendriers d’expédition, d’autres données nécessitent un suivi sur le long terme.

Hadoop, en revanche, convient aux big data, comme les données provenant des capteurs d’information, des capteurs à distance, des caméras, des lecteurs RFID, etc. Les bases de données Hadoop stockent les données de manière moins structurée et sont idéales pour les sources d’informations volumineuses, telles que les rapports Web, les médias sociaux, les documents bureautiques, les graphiques et, plus généralement, tout ce qui ne rentre pas aisément dans une ligne ou une colonne.

Cependant, la plus grande différence est que SAP HANA conserve les données d’entreprise formatées en mémoire, tandis que Hadoop stocke d’énormes quantités de données brutes sur des fermes de disques.

Les big data nécessitent des systèmes de fichiers distribués

Comme vous pourrez le deviner, il est impossible d’accéder rapidement à des données brutes non structurées. SAP utilise Spark pour structurer le système de fichiers distribué de Hadoop (« Hadoop Distributed File System », HDFS). Spark est un moteur rapide de traitement des données à grande échelle qui combine SQL, streaming et analyses complexes. Son inconvénient est qu’il ne dispose d’aucune interface Web simple et intuitive. Vous avez besoin de Spark pour structurer vos fichiers HDFS et les rendre consultables via SQL.

Vora est un moteur de requête en mémoire qui se connecte à Spark pour obtenir des analyses enrichies à partir de Hadoop. Vora fournit une interface interactive pour modéliser les données et les traiter aux fins de visualisation ou d’analyse. Il peut fonctionner seul pour fournir cette interface à vos big data, ou avec HANA pour étendre vos analyses au niveau des données d’entreprise et des big data.

À l’origine, Vora était utilisé pour fournir un traitement analytique en ligne (OLAP) pour l’analyse des big data. Cependant, il a évolué en raison de sa capacité bidirectionnelle à lire les données HANA et les écrire en retour. Cela permet aux utilisateurs de Vora d’éviter de déplacer les données HANA vers HDFS pour exécuter l’analyse, en utilisant les deux sources de données.

En bref, Vora comble le fossé entre les données que vous stockez et auxquelles vous accédez quotidiennement, en utilisant HANA, et les données stockées dans Hadoop.

Comment fonctionne SAP HANA Vora ?

Vora propose trois outils : un explorateur de données, un éditeur SQL et un modeleur de données, tous accessibles à partir d’une interface Web intuitive. Cela signifie que votre équipe de données peut obtenir ce dont elle a besoin sans se soucier des outils hautement techniques et des langages de script tels que Python, Java et Scala.

Le navigateur de données de Vora vous permet de voir les tables, les vues, les dimensions et les cubes qui existent dans le moteur Vora. Vous pouvez également prévisualiser les données, filtrer les colonnes et les actualiser ou télécharger les données. Le moteur SQL facilite l’exécution de requêtes sur le moteur Vora, l’affichage des erreurs de compilation et des avertissements, ainsi que la sortie des résultats de la requête. Le modeleur de données facilite la création de vues SQL, de dimensions et/ou de cubes, sans changer d’application. Il rend la modélisation de données dans Hadoop aussi simple que la modélisation de données dans HANA.

Simplifier les big data

La plupart des fonctions opérationnelles standard sont intégrées à Vora, telles que la conversion de devises, les unités de mesure et les hiérarchies. Ces fonctions intégrées réduisent le temps nécessaire pour créer, joindre ou agréger des modèles de données. Elles permettent également aux modélisateurs d’obtenir de bonnes analyses sur des données volumineuses avec un simple modèle de données et une requête.

Si l’on compare SAP Vora avec Spark, avant Vora, vos experts en mégadonnées devaient travailler directement avec Spark. Vora vient se greffer sur Spark, offrant aux analystes une intégration plus transparente avec HANA, tout en réduisant le codage et le débogage. Vora est également configuré avec une sécurisation au niveau de l’entreprise plutôt qu’une simple sécurisation des données, ce qui simplifie les tâches d’audit, tout en protégeant mieux contre le piratage.

Combiner entreprise et big data

Comme les données essentielles (entreprise) sont stockées dans une mémoire coûteuse sur HANA et que les données non essentielles (big data) sont stockées sur des disques peu coûteux dans Hadoop, obtenir des big data pour soutenir les données d’entreprise n’est pas une opération aussi simple et rapide que ce dont la plupart des entreprises ont besoin. Vora permet de combler ce fossé.

Comme SAP HANA Vora est un moteur de traitement en mémoire qui s’exécute sur un cluster Hadoop, il crée des hiérarchies de données structurées pour les données Hadoop. Cela permet d’accéder à ces données avec des données HANA pour que vous puissiez exécuter l’analyse OLAP en mémoire. La fonction de modélisation de données de Vora permet également aux modélisateurs de prévisualiser les modèles de données pour les analyser beaucoup plus rapidement, ce qui accélère l’ensemble du processus. Vora permet également de virtualiser les données Hadoop afin de les joindre aux données HANA pour la création de rapports.

Comment commencer

Ne vous lancez pas dans une migration sans disposer au préalable d’une bonne compréhension de vos données, des meilleures pratiques en matière de gestion des données et d’une expertise SAP. Il serait déjà difficile de combiner les big data avec les données d’entreprise si les structures de données étaient identiques. A fortiori si elles sont différentes. SAP HANA est basé sur des lignes, Hadoop n’est pas structuré et SQL est basé sur des colonnes. Des structures de données fondamentalement différentes créent un certain nombre de problèmes dans l’alignement des données à des fins de comparaison et d’analyse.

Si votre équipe d’experts en mégadonnées est déjà surmenée, comme dans la plupart des entreprises, il est fortement conseillé d’externaliser votre formation et votre déploiement SAP HANA Vora. Demandez une équipe certifiée SAP capable d’identifier le mode opératoire de vos experts en mégadonnées et de vos modélisateurs de données, de comprendre ce que vous tentez de mettre en œuvre, puis d’effectuer la synthèse de ces variables dans une solution facile d’utilisation qui vous permette d’accéder aux données d’entreprise et big data.

La tâche n’est pas facile, mais sur le long terme, combiner des big data avec des données d’entreprise peut vous aider à prendre de nouvelles décisions, découvrir de nouvelles opportunités, repérer et résoudre les problèmes avant qu’ils ne deviennent critiques.

Vous souhaitez en savoir plus ? Parlez à Symmetry pour savoir comment exploiter SAP HANA Vora au mieux.