skip to Main Content

SAP HANA eignet sich hervorragend für den schnellen Zugriff auf hochwertige und häufig genutzte Daten. Manchmal benötigen Sie jedoch Zugriff auf große Datenmengen, um große Muster oder Trends zu erkennen. HANA eignet sich ideal für den sofortigen Zugriff auf Unternehmensdaten, z. B. auf tagtägliche Transaktionen wie Verkaufsaufträge, Bestellungen, Teilebestände oder Versandpläne. Manchmal müssen Sie jedoch auch große Datenmengen nachverfolgen, um langfristige Entwicklungen zu erkennen.

Hadoop dagegen wurde für große Datenmengen konzipiert, z. B. Informationssensoren, Fernsensoren, Kameras, RFID-Leser etc. Hadoop-Datenbanken speichern Daten weniger strukturiert und eignen sich ideal für umfangreiche Informationsquellen wie z. B. Web-Logs, soziale Medien, Bürounterlagen, Grafiken und andere Daten, die sich nicht einfach in eine Zeile oder Spalte pressen lassen.

Der wichtigste Unterschied ist jedoch, dass SAP HANA formatierte Unternehmensdaten direkt im Hauptspeicher ablegt, während Hadoop große unformatierte Daten auf Disk Farms speichert.

Große Datenmengen bedeuten verteilte Dateisysteme

Sie können sich vorstellen, dass der Zugriff auf unstrukturierte und unformatierte Daten nicht so schnell funktioniert. SAP strukturiert das Hadoop Distributed File System (HDFS) mittels Spark. Spark ist eine schnelle Engine für umfangreiche Datenverarbeitung, die SQL, Streaming und komplexe Analysen miteinander verbindet. Der Nachteil ist, dass es keine einfache und vertraute Webschnittstelle bietet. Sie brauchen aber Spark, um Ihre HDFS-Dateien zu strukturieren und über SQL durchsuchbar zu machen.

Vora ist eine in den Speicher integrierte Abfrage-Engine, die sich an Spark ankoppelt, um aus Hadoop erweiterte Analysen zu erstellen. Vora bietet Ihnen eine interaktive Schnittstelle zum Modellieren der Daten und zur Verarbeitung dieser Daten für die Visualisierung oder die Analyse. Es kann eigenständig verwendet werden als Schnittstelle zu Ihren großen Datenmengen, oder in Verbindung mit HANA , um Ihre Analysen auf Unternehmensdaten und große Datenmengen auszudehnen.

Vora wurde ursprünglich für OLAP-Analysen großer Datenmengen eingesetzt. Inzwischen hat es sich jedoch weiter entwickelt und wird dank seiner Bidirektionalität zum Lesen von HANA-Daten und zum Zurückschreiben dieser Daten genutzt. Mithilfe von Vora brauchen die Benutzer HANA-Daten nicht mehr auf HDFS verschieben, um Analysen mit beiden Datenquellen durchzuführen.

Vora überbrückt also die Lücke zwischen den Daten, die Sie mit HANA Tag für Tag speichern und aufrufen, und den in Hadoop gespeicherten Daten.

Funktionsweise von SAP HANA Vora

Vora umfasst drei Werkzeuge: Einen Daten-Browser, einen SQL-Editor und einen Datenmodellierer, die alle über die intuitive Webschnittstelle aufgerufen werden können. Ihr Datenteam kann also alle benötigten Daten aufrufen, ohne sich mit komplizierten Tools und Skriptsprachen wie Python, Java und Scala abmühen zu müssen.

Der Vora-Daten-Browser ermöglicht die Anzeige der Tabellen, Ansichten, Dimensionen und Datenwürfel in der Vora-Engine. Sie können eine Vorschau der Daten anzeigen, Spalten filtern und aktualisieren oder die Daten herunterladen. Die SQL-Engine erleichtert die Ausführung von Abfragen auf der Vora-Engine. Sie zeigt Kompilierungsfehler und Warnungen an und gibt die Ergebnisse der Abfragen aus. Der Datenmodellierer erleichtert die Erstellung von SQL-Ansichten, Dimensionen und/oder Datenwürfeln, ohne Änderungen an den Anwendungen vorzunehmen. Dadurch ist die Datenmodellierung in Hadoop ebenso einfach wie die in HANA.

Vereinfachung großer Datenmengen

Die meisten Standard-Geschäftsfunktionen sind in Vora integriert, z. B. Währungsumrechnungen, Maßeinheiten und Hierarchien. Dadurch wird die Zeit zum Erstellen, Verbinden oder Kombinieren von Datenmodellen reduziert. Außerdem liefern die integrierten Funktionen mit einem einzigen Daten- und Abfragemodell gute Einblicke in große Datenmengen.

Vor SAP Vora mussten sich Ihre Datenspezialisten direkt mit Spark auseinandersetzen. Vora sitzt auf Spark auf und bietet den Analytikern eine besonders nahtlose Integration mit HANA sowie einen geringeren Aufwand beim Codieren und Debugging. Außerdem wird Vora mit einer Sicherheit auf Unternehmensebene eingerichtet statt nur einer Datensicherheit, was es Hackern schwerer macht und Ihnen die Situation bei Audits entscheidend erleichtert.

Unternehmensdaten und große Datenmengen kombinieren

Da (Unternehmens-)Daten, die ständig verfügbar sein müssen, bei HANA im teuren Hauptspeicher liegen, die weniger dringend benötigten Daten dagegen auf preisgünstigen Laufwerken in Hadoop, ist der Aufruf großer Datenmengen zur Unterstützung der Unternehmensdaten nicht immer so einfach und so schnell, wie es die meisten Unternehmen brauchen. Vora hilft Ihnen, diese Lücke zu überbrücken.

SAP HANA Vora ist eine in einem Hadoop-Cluster ausgeführte Speicherverarbeitungs-Engine, die strukturierte Datenhierarchien für Hadoop-Daten erstellt. Dadurch können diese Daten zusammen mit HANA-Daten aufgerufen werden, um eine OLAP-Analyse im Speicher auszuführen.  Die Vora-Datenmodellierungsfunktion ermöglicht auch eine Vorschau der Datenmodelle für eine schnellere Analyse, was den Gesamtprozess deutlich beschleunigt. Vora kann auch Hadoop-Daten virtualisieren, um sie für Berichte mit HANA-Daten zu verbinden.

Erste Schritte

Versuchen Sie dies nicht allein ohne ein gründliches Verständnis Ihrer Daten, einer bewährten Praxis und umfangreicher SAP-Kenntnis. Die Kombination großer Datenmengen mit Unternehmensdaten stellt eine enorme Herausforderung dar, selbst wenn die Datenstrukturen dieselben wären. Das ist aber nicht der Fall. SAP HANA ist zeilenbasiert, Hadoop ist unstrukturiert, und SQL ist spaltenbasiert. Diese fundamental unterschiedlichen Daten bereiten eine Menge Kopfschmerzen, wenn sie für Vergleich und Analyse aufeinander abgestimmt werden sollen.

Wenn Ihr Daten-Team bereits jetzt zu viel zu tun hat, wie in den meisten Unternehmen, empfiehlt sich ein Outsourcing der Schulung und Bereitstellung von SAP HANA Vora. Holen Sie sich ein SAP-zertifiziertes Team, das erkennt, wie Ihre Datenspezialisten und -modellierer arbeiten, das versteht, was Sie erreichen wollen, und das diese beiden Variablen zu einer bedienerfreundlichen Lösung verbindet, die den Zugriff auf Unternehmensdaten und auf große Datenmengen erlaubt.

Diese Kombination aus Unternehmensdaten und großen Datenmengen ist nicht einfach, aber sie hilft Ihnen, Ihre Entscheidungsfindung auf eine neue Stufe zu stellen, neue Möglichkeiten zu entdecken und Herausforderungen zu erkennen und zu lösen, bevor sie sich zu einem Problem entwickeln.

Sie wollen mehr erfahren? Sprechen Sie mit Symmetry und überzeugen Sie sich davon, welche Vorteile SAP HANA Vora Ihnen bieten kann