1. Data Warehouse
1. Das Konzept des Data Warehouse
1) Funktionen des Data Warehouse:
- Subjektorientiert: eine Abstraktion zur Integration, Analyse und Klassifizierung von Daten
- Integriert: Integrieren Sie Daten aus verschiedenen Datenquellen (Geschäftsdaten, externe Systemdaten und eingebettete Protokolle) in das Warehouse durch Vorgänge wie einheitliche Codierung, standardisierte Benennung und Feldtypkonvertierung
- Relativ stabil: Wird entsprechend den Geschäftsszenarien in Echtzeit aktualisiert und im Allgemeinen lange aufbewahrt, ohne dass Änderungen oder Löschungen erforderlich sind
- Eine Sammlung von Daten, die historische Änderungen widerspiegeln: Änderungsdaten über Änderungszeit usw. aufzeichnen.
2) Der gesamte Datenfluss des Data Warehouse
- Datensammlung
- Datenspeicher
- Datenzugriff
3)ETL
- Datenextraktion
- Datenbereinigung und -transformation
- Daten laden
2. Offline-Data-Warehouse und Echtzeitdaten
Die Architektur muss zwei Codesätze verwalten: Offline-Architekturcode und Echtzeit-Architekturcode
3. Modellierungsprozess und Methode des Data Warehouse
1) Prozess
- Konzeptioneller Modellentwurf: Analyse der Verteilung verschiedener Datenquellen, Dateninhalte und Datenorganisation, Bestimmung des Umfangs und der Themendomäne
- Logisches Modelldesign: Subjektdomänenanalyse (achten Sie auf die Definition der beteiligten Entitäten), Aufteilung der Datengranularität (Grad der Datenverfeinerung und -vollständigkeit), Datensegmentierung (Zeitleiste, geografischer Standort, Aufteilung der Organisationsstruktur und