Power BI Dataset, Dataflow, Datamart … What is the difference?

Datamart ist das neue Feature, welches auf der Build verkündet wurde. Datamart ist aber nicht die Lösung für alles. Es ist wichtig zu verstehen, was Datamart, Dataflows oder Datasets sind und wann welches Tool verwendet werden sollte bzw. verwendet werden kann.

Dataset

Ein Dataset ist die Hauptentität in Power BI. Sie stellen Datenquellen dar, die für Berichtserstellung und Visualisierung einsatzbereit ist. Datasets werden bei der Erstellung von Pushdatasets, Streamingdatasets, beim hochladen von Excel-Arbeitsmappen oder direkt mit dem Report (*.PBIX file) erstellt.

In einem Dataset werden folgende Informationen gespeichert:

  • Die Verbindung zur Datenquelle
  • Tabellen und ihre Daten
  • Berechnete Spalten, Tabellen und Measures
  • Hierarchien
  • Formatierung und Einstellungen der Felder
  • Relationen

Datasets sind in allen Version von Power BI verfügbar, inklusive der Free Version.

Dataflow

Ein Dataflow ist eine Sammlung von Tabellen, die im Power BI Service erstellt und verwaltet werden. Sie sind eine Art Self-Service Datenaufbereitung für Big Data in Power BI. Nach dem der Dataflow erstellt wurde kann man mit Power BI Desktop oder Power BI Service, Datasets, Reports, Dashboards und Apps erstellen.

Dataflow wird häufig bei wiederverwendbaren Datenaufbereitungen verwendet (ETL), die in mehreren Datasets oder Reports verwendet werden. Dadurch kann man eine Singe Source of Truth schaffen, indem Data Analysten eine Verbindung zu den Dataflow aufbauen müssen und nicht zu den zugrunde liegenden Systemen.

Dataflow ist geeignet für Tabellen die häufig verwendet werden (Kalender, Personaldaten, Hierarchien, Gruppierungen, etc.) oder bei der Verwendung von Azure Data Lake (Dataflow wurde dafür gemacht 😉)

Dataflow steht ab der Version Power BI Pro zur Verfügung.

Datamart (Preview)

Power BI Datamart ist eine Self Service Datenbank die genau genommen eine Azure SQL Datenbank ist, die vom Power BI Benutzer ohne Datenbank Administrator erstellt werden kann. Die Daten können aus unterschiedlichen Datenquellen geladen, mit Hilfe von Power Query extrahiert anschließend transformiert und danach gespeichert werden. Aggregatfunktonen, Gruppieren, etc können entweder mit Power Query oder SQL erstellt werde.

Verwendung finden Datamarts bei Usern die keinen Zugriff auf Power BI Desktop haben, Daten schnell über einen SQL Enpunkt zur Verfügung stellen möchten oder Ad-Hoc Analysen im Web durchführen möchten, egal um welche Datenquelle es sich handelt.

Datamart ist in der Version Power BI Premium-Kapatiztät und Premium-Einzelbenutzerlizenz enthalten.