Multidimensionale Datenbanken/ Modellierung (Cubes)

Multidimensionale Datenkbanken/ Modellierung (Cubes)

OLAP

Online Analytical Processing (OLAP) und Cubes stehen für multidimensionale Datenbestände, die im Wesentlichen als Zwischenspeicherbereich für die Analyse dienen. Diese speziellen OLAP-Datenbanken speichern Daten nicht in Tabellen, sondern in OLAP Cubes – eine Methode der Datenspeicherung und Abfrage anhand einer organisierten, multidimensionalen Struktur, die eigens für die Analyse optimiert wurde.

OLAP-Datenbanken sind so konzipiert, dass sie möglichst viele Abfragen und Kombinationen von Datenfeldern im Voraus berechnen. Auf diese Weise liefern sie schnelle Abfrageergebnisse. Doch auch wenn diese Lösungen effizienter arbeiten als klassische relationale Datenbanken – ihre multidimensionale Struktur macht sie unflexibel, und Änderungen können nicht ohne weiteres integriert werden. Hinzu kommt, dass die Speicherung großer Datenmengen in einem Cube Performance-Engpässe produziert. Für einfache Anwendungsszenarien sind OLAP-Datenbanken durchaus sinnvoll, doch für große Datenbestände müssen parallel weitere Tools herangezogen werden – was die Analyse verkompliziert und ein spezifisches Know-how erfordert.

ROLAP

Eine weitere Methode zur Organisation von Daten für die multidimensionale Abfrage ist das Relational Online Analytical Processing (ROLAP). ROLAP ist eine Form des OLAP, mit der multidimensionale Analysen von Daten durchgeführt werden, die in einer relationalen statt in einer multidimensionalen Datenbank (die als OLAP-Standard gilt) gespeichert sind. ROLAP ist bei der Verarbeitung großer Datenvolumina zwar leistungsfähiger als OLAP-Datenbanken, kann bei kleineren Datenmengen aber nicht mit der Geschwindigkeit und Effizienz eines OLAP-Systems mithalten. ROLAP-Datenbanken bringen einen hohen manuellen Wartungsaufwand mit sich und sind für Business User schwer zu bedienen. Deshalb haben sie den Ruf, unflexibler zu sein als OLAP-Cubes. Sowohl OLAP- als auch ROLAP-Datenbanken sind derzeit noch weit verbreitet – aber keine der beiden Technologien erfüllt die heutigen Ansprüche im Hinblick auf Echtzeit-Informationen für die Analyse oder unstrukturierte Daten.