Analytische Datenbanken

Analytische Datenbanken

Die SSBI-Tools entwickelten sich weiter, doch die Herausforderung blieb die gleiche: eine analytische Datenbank zu finden, die für die Analyse dieselbe Flexibilität bot wie relationale Datenbanken für die transaktionale Datenverarbeitung. Progressive Softwarehersteller versuchten, die Grenzen der Data Warehouses, Cubes und SSBIs zu überwinden. Sie begannen, auf Datenbanken hinzuarbeiten, die nicht nur flexibel, sondern auch in der Lage waren, Analysedaten zu verarbeiten. Diese analytischen oder spaltenorientierten Datenbanken stellten den nächsten Schritt auf dem Weg zu einer zufriedenstellenden Lösung für Business-Analysten dar. Sie hatten sich zu analytischen MPP-Datenbanken (MPP = Massively Parallel Processing) entwickelt, die flexibler und leistungsfähiger als Cubes waren – sogar dann, wenn große Datenmengen gespeichert und abgefragt werden.

Bei analytischen Datenbanken müssen die Daten jedoch mit Prozessen einkopiert werden, die den oben beschriebenen ETL-Prozessen sehr ähnlich sind – und leider auch ähnliche Nachteile bergen. Die Ladeprozesse sind in der Regel langsamer als in einem traditionellen, datensatzbasierend arbeitenden Data Warehouse. Denn um die Daten für eine schnelle Analyseabfrage zu optimieren, ist ein zusätzlicher Schritt erforderlich. Dieser Extraschritt ist notwendig, um die Daten von einem datensatzbasierten Format in ein Spaltenformat zu konvertieren und die Daten dann auf Feldebene zu komprimieren. Er bringt zwar erhebliche Performance-Verbesserungen mit sich, benötigt aber trotzdem mehr Zeit – Zeit, die dem Analysten bei der Datenanalyse fehlt. Diese Latenzzeit verhindert, dass aus analytischen Datenbanken Echtzeitdaten abgerufen werden können.