Startseite topics Was ist Datenmanagement? Was ist Datenmanagement?
Wenn Sie die Bestandteile des Datenmanagements kennen, können Sie datengesteuerte Entscheidungsfindung in Ihrem Unternehmen vorantreiben.
Zwei Personen, die sich in einer Fabrik anschauen
Was ist Datenmanagement?

Datenmanagement bezeichnet Aufnahme, Verarbeitung, Sicherung und Speicherung der Daten eines Unternehmens, wo sie dann für strategische Entscheidungen zur Verbesserung der Geschäftsergebnisse verwendet werden. Im letzten Jahrzehnt haben Entwicklungen in den Bereichen Hybrid Cloud, künstliche Intelligenz, Internet der Dinge (IoT) und Edge-Computing  zu einer exponentiellen Zunahme von Big Data geführt, sodass Unternehmen mit noch höherer Komplexität konfrontiert sind. Infolgedessen ist Datenmanagement in Unternehmen immer wichtiger geworden, da diese Zunahme zu erheblichen Herausforderungen wie Datensilos, Sicherheitsrisiken und allgemeinen Engpässen bei der Entscheidungsfindung geführt hat. Teams begegnen diesen Herausforderungen direkt mit einer Reihe von Datenmanagementlösungen, die darauf abzielen, Daten zu bereinigen, zu vereinheitlichen und zu sichern. Auf diese Weise können Führungskräfte wiederum Einblicke durch Dashboards und andere Datenvisualisierungstools gewinnen, um fundierte Geschäftsentscheidungen zu ermöglichen. Außerdem können Data-Science-Teams damit komplexere Fragen untersuchen und so fortschrittlichere Analysefunktionen, wie z. B. maschinelles Lernen, für Konzeptnachweisprojekte nutzen. Wenn es ihnen gelingt, Geschäftsergebnisse bereitzustellen und zu verbessern, können sie mit relevanten Teams zusammenarbeiten, um diese Erkenntnisse durch Automatisierungspraktiken in ihrem gesamten Unternehmen zu skalieren.

Datenmanagement im Vergleich zu Stammdatenmanagement

Während sich Datenmanagement auf eine ganze Disziplin bezieht, ist Stammdatenmanagement in seinem Umfang spezifischer, da es sich auf Transaktionsdaten konzentriert – d. h., auf Verkaufsdaten. Verkaufsdaten umfassen normalerweise Kunden-, Verkäufer- und Produktinformationen. Mit dieser Art von Daten können Unternehmen ihre erfolgreichsten Produkte und Märkte sowie ihre wertvollsten Kunden bestimmen. Da Stammdaten personenbezogene Daten (PII) enthalten, entsprechen sie auch strengeren Vorschriften wie der DSGVO. 

Arten des Datenmanagements

Der Umfang einer Datenmanagementdisziplin ist recht groß, und eine solide Datenmanagementstrategie implementiert normalerweise die folgenden Bestandteile, um Strategie und Betrieb im gesamten Unternehmen zu optimieren: 

Datenverarbeitung: In dieser Phase des Datenmanagementlebenszyklus werden Rohdaten aus einer Reihe von Datenquellen wie Web-APIs, mobilen Apps, IoT-Geräten (Internet of Things), Formularen, Umfragen und mehr erfasst. Sie werden dann normalerweise mit Datenintegrationsverfahren verarbeitet oder geladen, z. B. Extrahieren, Transformieren, Laden (ETL) oder Extrahieren, Laden, Transformieren (ELT)Während ETL in der Vergangenheit die Standardmethode zum Integrieren und Organisieren von Daten über verschiedene Datenbestände hinweg war, erfreut sich ELT mit dem Aufkommen von Cloud-Datenplattformen und der steigenden Nachfrage nach Echtzeitdaten wachsender Beliebtheit. Unabhängig vom verwendeten Verfahren für die Datenintegration , werden die Daten in der Regel während der Datenverarbeitung gefiltert, zusammengeführt oder aggregiert, um die Anforderungen für den beabsichtigten Zweck zu erfüllen, der von einem Business-Intelligence-Dashboard bis zu einem prädiktiven maschinellen Lernalgorithmus reichen kann. 

Datenspeicherung: Während Daten vor oder nach der Datenverarbeitung gespeichert werden können, bestimmen die Art der Daten und deren Zweck normalerweise das genutzte Speicherrepository. Beispielsweise ist für Data Warehousing ein definiertes Schema erforderlich, um bestimmte Datenanalyseanforderungen für Datenausgaben wie Dashboards, Datenvisualisierungen und andere Business-Intelligence -Aufgaben zu erfüllen. Diese Datenanforderungen werden in der Regel von Geschäftsanwendern in Zusammenarbeit mit Dateningenieuren gesteuert und dokumentiert, die letztendlich das definierte Datenmodell ausführen. Die zugrunde liegende Struktur eines Data Warehouse ist typischerweise als relationales System organisiert (d. h. in einem strukturierten Datenformat), das Daten aus Transaktionsdatenbanken bezieht. Aber auch andere Speichersysteme, wie z. B. Data Lakes, integrieren Daten aus relationalen und nicht relationalen Systemen und werden damit zu einer Sandbox für innovative Datenprojekte. Data Lakes kommen insbesondere Data Scientists zugute, da sie es ihnen ermöglichen, sowohl strukturierte als auch unstrukturierte Daten in ihre Data Science-Projekte zu integrieren. 

Datengovernance: Datengovernance bezeichnet eine Reihe von Standards und Geschäftsprozessen, die sicherstellen, dass Datenbestände in einem Unternehmen effektiv genutzt werden. Dies umfasst im Allgemeinen Prozesse rund um Datenqualität, Datenzugriff, Benutzerfreundlichkeit und Datensicherheit. Datengovernance-Councils richten sich in der Regel nach Taxonomien, um sicherzustellen, dass Metadaten konsistent über verschiedene Datenquellen hinweg aufgenommen werden. Diese Taxonomie sollte auch über einen Datenkatalog weiter dokumentiert werden, um die Daten für Benutzer zugänglicher zu machen und die Demokratisierung von Daten in Unternehmen zu erleichtern. Datengovernance-Teams helfen auch bei der Definition von Rollen und Verantwortlichkeiten, um sicherzustellen, dass der Datenzugriff in angemessenem Umfang bereitgestellt wird; dies ist besonders wichtig, um den Datenschutz zu wahren. 

Datensicherheit: Die Datensicherheit setzt Leitplanken, um digitale Informationen vor unbefugtem Zugriff, Beschädigung oder Diebstahl zu schützen. Da digitale Technologie ein immer größerer Teil unseres Lebens wird, werden die Sicherheitspraktiken moderner Unternehmen genauer unter die Lupe genommen, um sicherzustellen, dass Kundendaten vor Cyberkriminellen oder Disaster-Recovery-Vorfällen geschützt sind. Während Datenverlust für jedes Unternehmen verheerend sein kann, können insbesondere Datenschutzverletzungen sowohl aus finanzieller als auch aus Markensicht kostspielige Folgen haben. Datensicherheitsteams können ihre Daten besser schützen, indem sie Verschlüsselung und Datenmaskierung im Rahmen ihrer Datensicherheitsstrategie nutzen. 

Datenarchitektur von Datenmanagementsystemen

Während Datenverarbeitung, Datenspeicherung, Datengovernance und Datensicherheit alle Teil des Datenmanagements sind, hängt der Erfolg jedes dieser Bestandteile von der Datenarchitektur oder dem Technologiestack eines Unternehmens ab. Die Dateninfrastruktur eines Unternehmens erstellt eine Pipeline für die Erfassung, Verarbeitung und Speicherung von Daten und den Zugriff darauf durch Integration dieser Systeme. Datenservices und APIs führen Daten aus traditionellen Systemen, Data Lakes, Data Warehouses, SQL-Datenbanken und Apps zusammen und bieten damit eine ganzheitliche Übersicht der betrieblichen Leistung. 

Jeder dieser Bestandteile im Bereich des Datenmanagements unterliegt derzeit einem enormen Wandel. Beispielsweise ist die Umstellung von On-Premise-Systemen auf Cloud-Plattformen derzeit eine der disruptivsten Technologien in diesem Bereich. Im Gegensatz zu On-Premise-Bereitstellungen ermöglichen Cloud-Speicheranbieter den Benutzern, nach Bedarf große Cluster einzurichten, wobei nur die Zahlung für den angegebenen Speicher erforderlich ist. Wenn Sie also zusätzliche Rechenleistung benötigen, um einen Job in wenigen Stunden statt in wenigen Tagen auszuführen, können Sie dies ganz einfach auf einer Cloud-Plattform tun, indem Sie zusätzliche Rechenknoten erwerben.

Diese Umstellung auf Cloud-Datenplattformen erleichtert auch die Einführung der Streaming-Datenverarbeitung. Tools wie Apache Kafka ermöglichen Datenverarbeitung in Echtzeit, sodass Nutzer Themen abonnieren können, um Daten in Sekundenschnelle zu erhalten. Die Stapelverarbeitung hat jedoch immer noch ihre Vorteile, da sie bei der Verarbeitung großer Datenmengen effizienter ist. Da die Stapelverarbeitung einem festgelegten Zeitplan folgt, z. B. täglich, wöchentlich oder monatlich, eignet sie sich ideal für Business-Performance-Dashboards, die normalerweise keine Echtzeitdaten erfordern. 

Der Wandel beschleunigt sich in diesem Bereich immer weiter. In jüngerer Zeit sind Data Fabrics entstanden, um Unterstützung angesichts der Komplexität des Managements dieser Datensysteme bereitzustellen. Data Fabrics  nutzen intelligente und automatisierte Systeme, um die End-to-End-Integration verschiedener Datenpipelines und Cloud-Umgebungen zu erleichtern. Mit der Entwicklung neuer Technologien wie dieser können wir davon ausgehen, dass Führungskräfte eine ganzheitlichere Übersicht der betrieblichen Leistung erhalten, da Daten funktionsübergreifend integriert werden. Die Vereinheitlichung von Daten über Personalwesen, Marketing, Vertrieb, Lieferkette usw. kann Führungskräften nur ein besseres Verständnis ihrer Kunden vermitteln. 

Vorteile des Datenmanagements

Unternehmen profitieren von mehreren Vorteilen, wenn sie Datenmanagementinitiativen starten und pflegen: 

Reduzierte Datensilos: Die meisten, wenn nicht alle Unternehmen haben Datensilos innerhalb ihrer Organisation. Verschiedene Datenmanagement-Tools und -Frameworks wie Data Fabrics und Data Lakes tragen dazu bei, Datensilos und Abhängigkeiten von Dateneignern zu beseitigen. Beispielsweise helfen Data Fabrics dabei, potenzielle Integrationen zwischen unterschiedlichen Datensätzen in verschiedenen Funktionen wie Personalwesen, Marketing, Vertrieb usw. aufzudecken. Data Lakes hingegen nehmen Rohdaten aus denselben Funktionen auf, entfernen Abhängigkeiten und eliminieren einzelne Eigner eines bestimmten Datensatzes. 

Verbesserte Compliance und Sicherheit: Governance-Councils helfen beim Aufstellen von Leitplanken, um Unternehmen vor Bußgeldern und negativer Publicity zu schützen, die aus der Nichteinhaltung staatlicher Vorschriften und Richtlinien resultieren können. Fehltritte können hier sowohl aus Marken- als auch aus finanzieller Sicht kostspielig sein. 

Verbessertes Kundenerlebnis: Auch wenn dieser Vorteil nicht sofort sichtbar ist, können erfolgreiche Konzeptnachweise das allgemeine Benutzererlebnis verbessern und Teams in die Lage versetzen, die Customer Journey durch umfassendere Analysen besser zu verstehen und zu personalisieren.

Skalierbarkeit: Datenmanagement kann Unternehmen bei der Skalierung helfen, dies hängt jedoch weitgehend von der Technologie und den vorhandenen Prozessen ab. Beispielsweise bieten Cloud-Plattformen höhere Flexibilität und ermöglichen es Dateneignern, die Rechenleistung je nach Bedarf zu steigern oder zu reduzieren. Darüber hinaus können Governance-Councils dazu beitragen, dass definierte Taxonomien übernommen werden, wenn ein Unternehmen wächst. 

Lösungen Data Warehousing

Erfahren Sie mehr über die IBM® Db2-Produktfamilie, die Betriebs- und Warehousinglösungen umfasst.

Cloud-Datenplattformen

Entdecken Sie den Wert der Bereitstellung von Db2 auf der cloudnativen IBM® Cloud Pak for Data-Plattform.

Open-Source-Integrationen

Informieren Sie sich über die Open-Source-Partnerschaften von IBM mit MongoDB, EDB Postgres, DataStax und Cloudera.

Ressourcen Bericht lesen

Lesen Sie den kostenlosen Bericht von 451 Research, um zu erfahren, wie Datenmanagement auf einer einheitlichen Plattform für Daten, Analyse und KI die Zeit bis zur Gewinnung von Erkenntnissen verkürzen kann.

Analystenbericht lesen

Lernen Sie die Best Practices kennen, um Datenqualität, -zugänglichkeit und -sicherheit als Grundlage einer KI-zentrierten Datenarchitektur zu gewährleisten (4,5 MB)

Datenmanagement und IBM

IBM bietet basierend auf der offenen Plattform von Red Hat® OpenShift® KI-gestützte hybride Datenmanagementlösungen, die Datenerfassung und -management durch automatisierte Containerisierung einfacher und intelligenter machen.