Data Stewards sind mit der Durchführung von Data Stewardship-Programmen beauftragt. Zu den spezifischen Aufgaben eines Data Stewards gehören die Definition von Metriken für die Datenqualität, die Verwaltung von Metadaten und Referenzdaten, die Nachverfolgung der Datenabstammung und die Klassifizierung sensibler Daten.
Verschiedene Technologien und Tools können Data-Steward-Workflows unterstützen, darunter künstliche Intelligenz (KI), Datenkataloge, relationale Datenbanken, Datenqualitätsplattformen und Data-Governance-Software.
Unternehmen sammeln und analysieren heute mehr Daten als je zuvor, in der Hoffnung, wertvolle Erkenntnisse zu gewinnen. Datenerfassung und -analyse allein reichen jedoch nicht aus, um erfolgreiche Ergebnisse zu erzielen. Data Stewardship und Data Stewards können eine effektive Datennutzung innerhalb einer datengestützten Kultur unterstützen und anleiten.
In den letzten Jahren – mit der zunehmenden Einführung von KI – hat Data Stewardship an Bedeutung gewonnen. KI-Systeme verbrauchen und produzieren riesige Datenmengen. Data Stewardship trägt dazu bei, die Qualität und Integrität dieser Daten sicherzustellen, sodass KI-gestützte Geschäftsprozesse effektiv sind sowie den staatlichen Vorschriften und den Governance- und ethischen KI-Standards entsprechen.
Gute Data-Stewardship-Programme ermöglichen eine erfolgreiche Datenpflege, indem sie die Datenqualität , -zugänglichkeit, -brauchbarkeit und -sicherheit verbessern. Data Stewards stellen sicher, dass Mitarbeiter auf nützliche und genaue Geschäftsdaten zugreifen können, um datengestützte Entscheidungen und KI-gestützte Produktivitätssteigerungen zu ermöglichen. Zu den weiteren Vorteilen von Data Stewardship gehören eine einheitlichere Dateninterpretation und eine verbesserte Audit-Bereitschaft.
Data Stewards arbeiten oft mit einer Vielzahl von Stakeholdern zusammen – darunter Dateneigentümer, Datenanalysten, Data-Science-Experten und allgemeine Geschäftsanwender –, um diese Vorteile zu erzielen.
Mitarbeiter, die keine offiziellen „Data Stewards“ sind, können dennoch mit Data-Stewardship-Aufgaben betraut sein und einen erheblichen Teil ihrer Zeit darauf verwenden, die Datenanforderungen ihres Unternehmens zu erfüllen, beispielsweise durch die Inventarisierung von Daten und die Bewertung der Datenqualität. Einige Experten für Datenverwaltung sind jedoch der Meinung, dass die Formalisierung der Data-Stewardship-Aufgaben wichtig ist, da dies zeigt, dass ein Unternehmen es mit der Datenqualität ernst meint1
Data Governance und Data Stewardship sind unterschiedliche, aber verwandte Konzepte. Die Data Governance-Programme von Unternehmen tragen zur Gewährleistung der Datenintegrität und der Datensicherheit durch Richtlinien, Standards und Verfahren für die Erfassung, das Eigentum, die Speicherung, die Verarbeitung und die Nutzung von Daten bei. Viele Aufgaben im Bereich der Data Stewardship beinhalten die Umsetzung von Regeln, die in Data-Governance-Frameworks festgelegt sind. Daher kann Data Stewardship als „der operative Aspekt“ der Data Governance betrachtet werden.2
In Unternehmen mit ausgereifteren Data-Stewardship-Programmen kann es verschiedene Arten von Data Steward-Rollen geben, darunter:
Zu den Anwendungsfällen für Data Stewardship gehören:
Data Stewardship ist oft der Schlüssel zum Master Data Management (MDM), einem Ansatz zur Verwaltung kritischer Daten eines Unternehmens mithilfe von Technologien, Tools und Prozessen. Unternehmen nutzen MDM, um eine Single-Source-of-Truth (SSOT) zu schaffen, die Daten aus verschiedenen Quellen integriert, sodass alle Datenbenutzer mit denselben Informationen arbeiten.
Unternehmen und Data Stewards beginnen oft mit der Implementierung einer MDM-Initiative in einem einzigen Datenbereich (logische Gruppierungen ähnlicher Daten, wie z. B. Kunden- oder Mitarbeiterdaten), bevor sie diese Arbeit auf die Daten-Assets des Unternehmens skalieren.4
Date Stewards können die Datenqualität verbessern, indem sie den Inhalt einer Datenbank überprüfen, was als Datenprofilierung bezeichnet wird. Sie arbeiten auch mit Daten-Stakeholdern zusammen, um Datendefinitionen zu erstellen, Metriken für die Datenqualität zu entwerfen und Business Rules für Daten festzulegen, z. B. welche Werte als gültig oder ungültig gelten.
Wie im Buch „Data Stewardship“ erläutert, könnte beispielsweise eine Regel für den Familienstand eines Kunden besagen, dass „ledig“, „verheiratet“, „verwitwet“ oder „geschieden“ gültige Werte sind, während eine leere Antwort als ungültig angesehen würde.5 Data Stewards können auch einen Beitrag zur Lösung von Problemen mit der Datenqualität leisten, wenn diese auftreten.
Metadaten sind Informationen, die einen Datenpunkt oder Datensatz beschreiben, wie z. B. das Erstellungsdatum der Daten oder Angaben zur Urheberschaft. Data Stewards können dafür verantwortlich sein, qualitativ hochwertige Metadaten zu erstellen und die Qualität vorhandener Metadaten zu bewerten. Wie bei der allgemeinen Datenqualität haben Data Stewards die Aufgabe, sich mit Qualitätsproblemen der Metadaten zu befassen.
Data Stewards pflegen häufig Referenzdaten, d. h. Daten, die andere Daten innerhalb des Unternehmens kategorisieren. Beispiele für Referenzdaten sind Ländercodes, Währungsinformationen und Produktcodes. Mithilfe der Datendokumentation können Data Stewards gültige Werte für Referenzdaten aufzeichnen, bewerten, ob neue gültige Werte erforderlich sind, und Referenzdatenwerte in verschiedenen Systemen abgleichen.
Im letztgenannten Fall könnte ein Data Steward damit beauftragt werden, zu entscheiden, welche Maßnahmen zu ergreifen sind, wenn ein System „verwitwet“ und „geschieden“ als Personenstandsdaten zulässt, während ein anderes nur „verheiratet“ und „ledig“ akzeptiert.6
Oft repräsentieren mehrere Dateninstanzen dieselbe Entität. Stellen Sie sich zum Beispiel einen einzelnen Kunden vor, der mehrfach in der Datenbank einer Apothekenkette erscheint, weil er unterschiedliche Rezepte erhalten hat, die in verschiedenen Filialen eingelöst wurden.
Durch einen Prozess namens Identitätsauflösung bestimmen Data Stewards, wann verschiedene Dateninstanzen auf dieselbe Entität verweisen. Im Falle von Apothekenkunden kann die Identitätsauflösung beispielsweise dazu beitragen, dass potenziell gefährliche Wechselwirkungen von Medikamenten beim Einlösen von Rezepten erkannt werden.7
Informationssicherheit ist der Schutz wichtiger Informationen vor unbefugtem Zugriff, Offenlegung, Verwendung, Änderung oder Unterbrechung. Gemäß den Datenschutzbestimmungen sind Unternehmen verpflichtet, erweiterte Schutzmaßnahmen für sensible Informationen wie Gesundheitsdaten zu implementieren. Sie müssen außerdem Regeln zur Datenfreigabe, zur Beschränkung der Datenerfassung und vielem mehr einhalten. Data Stewards können eine Rolle beim Datenschutz und der Einhaltung von Vorschriften spielen, indem sie Sicherheitsklassifizierungen für verschiedene Datentypen erstellen und einrichten.
Datenabstammung ist der Prozess der Verfolgung von Datenlebenszyklen, der ein klares Verständnis dafür vermittelt, woher die Daten stammen, wie sie sich verändert haben und wohin sie letztendlich gelangen. Data Stewards können die Datenabstammung zurückverfolgen, was einem Unternehmen hilft, die Datenintegrität für regulatorische Berichtszwecke zu gewährleisten.
Schlechte Datenqualität kann Geschäftsprozesse gefährden. Data Stewards können mit den Verantwortlichen für Geschäftsprozesse zusammenarbeiten, um die Verwendung von Daten in einem Prozess zu bestimmen und festzustellen, wie anfällig der Prozess im Fall von schlechter Datenqualität ist.8
Unternehmen können verschiedene Lösungen und Tools zur Unterstützung von Data Stewards implementieren, darunter:
Zwischen KI und Data Stewardship besteht das, was manche als symbiotische Beziehung bezeichnen würden. Während Data Stewardship dazu beiträgt, dass KI-Systeme mit qualitativ hochwertigen Daten arbeiten, können KI-basierte Tools Data Stewardship-Aufgaben optimieren. Beispielsweise können KI-gestützte Datenaufbereitungstools Validierungsprüfungen durchführen und Fehler wie eine falsche Formatierung kennzeichnen, während KI-gestützte Tools zur Vermeidung von Datenverlust sensible Informationen erkennen und bei Bedarf Sicherheitskontrollen anwenden können.
Ein Datenkatalog ist ein Bestand aller Daten-Assets in einem Unternehmen. Er soll Data Stewards und anderen Datenexperten helfen, Informationen einfach und schnell zu finden. Die mit jedem Daten-Asset verbundenen Metadaten ermöglichen die Durchsuchbarkeit des Katalogs.
Tools zur Erstellung von Datenprofilen und zur Analyse können Daten auf Konsistenz und Qualität bewerten. Zu den Funktionen solcher Tools können die Identifizierung von Anomalien, die Validierung von Datenquellen und die Zusammenfassung von Analyseergebnissen durch benutzerdefinierte Berichte gehören.
Data Stewards können Daten unter anderem mithilfe relationaler Datenbanken organisieren. Eine relationale Datenbank (RDB) ist ein Datenbanktyp, in dem Daten in Zeilen und Spalten organisiert sind. Die resultierenden Tabellen können miteinander verknüpft werden, um die Beziehungen zwischen Datenpunkten darzustellen. Relationale Datenbankmanagementsysteme (RDBMS) sind Softwarelösungen, die von Data Stewards und anderen zur Wartung und Aktualisierung von RDBs verwendet werden können.
Data-Governance-Software enthält häufig Tools zur Erstellung von Datenprofilen und -analysen sowie KI-gestützte Funktionen. Zu den Funktionen können die KI-gestützte Metadaten-Aufbereitung, die Erstellung von Datenkatalogen, die Nachverfolgung der Datenabstammung und die Einrichtung einer rollenbasierten Datenzugriffskontrolle gehören.
Alle Links befinden sich außerhalb von ibm.com.
1, 4 Allen et al. „Multi-Domain Master Data Management.“ Morgan Kaufmann. 10. April 2015.
2, 3, 5, 6, 7, 8 Plotkin. „Data Stewardship, Second Edition.“ Academic Press. 20. November 2020.
Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.
Watsonx.data ermöglicht es Ihnen, Analysen und KI mit all Ihren Daten zu skalieren, unabhängig davon, wo sie sich befinden, und zwar über einen offenen, hybriden und kontrollierten Datenspeicher.
Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisgesteuertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.