Was ist Data Stewardship?

Zwei Personen sitzen zusammen an einem Schreibtisch und sehen auf einen großen Computerbildschirm und ein Tablet.

Autoren

Alice Gomstyn

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

Was ist Data Stewardship?

Data Stewardship ist eine Sammlung von Datenverwaltungspraktiken, die dazu beitragen sollen, eine hohe Datenqualität und Zugänglichkeit zu gewährleisten. Data-Stewardship-Programme arbeiten in der Regel in Übereinstimmung mit den Data-Governance-Richtlinien eines Unternehmens.
 

Data Stewards sind mit der Durchführung von Data Stewardship-Programmen beauftragt. Zu den spezifischen Aufgaben eines Data Stewards gehören die Definition von Metriken für die Datenqualität, die Verwaltung von Metadaten und Referenzdaten, die Nachverfolgung der Datenabstammung und die Klassifizierung sensibler Daten.

Verschiedene Technologien und Tools können Data-Steward-Workflows unterstützen, darunter künstliche Intelligenz (KI), Datenkataloge, relationale Datenbanken, Datenqualitätsplattformen und Data-Governance-Software.

3D-Design aus Kugeln, die auf einer Schiene rollen

Die neuesten Erkenntnisse und Insights zu KI

Entdecken Sie von Experten kuratierte Erkenntnisse und Neuigkeiten zu KI, Cloud und mehr im wöchentlichen Newsletter Think. 

Warum ist Data Stewardship wichtig?

Unternehmen sammeln und analysieren heute mehr Daten als je zuvor, in der Hoffnung, wertvolle Erkenntnisse zu gewinnen. Datenerfassung und -analyse allein reichen jedoch nicht aus, um erfolgreiche Ergebnisse zu erzielen. Data Stewardship und Data Stewards können eine effektive Datennutzung innerhalb einer datengestützten Kultur unterstützen und anleiten.

In den letzten Jahren – mit der zunehmenden Einführung von KI – hat Data Stewardship an Bedeutung gewonnen. KI-Systeme verbrauchen und produzieren riesige Datenmengen. Data Stewardship trägt dazu bei, die Qualität und Integrität dieser Daten sicherzustellen, sodass KI-gestützte Geschäftsprozesse effektiv sind sowie den staatlichen Vorschriften und den Governance- und ethischen KI-Standards entsprechen.

Gute Data-Stewardship-Programme ermöglichen eine erfolgreiche Datenpflege, indem sie die Datenqualität , -zugänglichkeit, -brauchbarkeit und -sicherheit verbessern. Data Stewards stellen sicher, dass Mitarbeiter auf nützliche und genaue Geschäftsdaten zugreifen können, um datengestützte Entscheidungen und KI-gestützte Produktivitätssteigerungen zu ermöglichen. Zu den weiteren Vorteilen von Data Stewardship gehören eine einheitlichere Dateninterpretation und eine verbesserte Audit-Bereitschaft.

Data Stewards arbeiten oft mit einer Vielzahl von Stakeholdern zusammen – darunter Dateneigentümer, Datenanalysten, Data-Science-Experten und allgemeine Geschäftsanwender –, um diese Vorteile zu erzielen.

Mitarbeiter, die keine offiziellen „Data Stewards“ sind, können dennoch mit Data-Stewardship-Aufgaben betraut sein und einen erheblichen Teil ihrer Zeit darauf verwenden, die Datenanforderungen ihres Unternehmens zu erfüllen, beispielsweise durch die Inventarisierung von Daten und die Bewertung der Datenqualität. Einige Experten für Datenverwaltung sind jedoch der Meinung, dass die Formalisierung der Data-Stewardship-Aufgaben wichtig ist, da dies zeigt, dass ein Unternehmen es mit der Datenqualität ernst meint1

AI Academy

Ist Datenverwaltung das Geheimnis generativer KI?

Erfahren Sie, warum qualitativ hochwertige Daten für den erfolgreichen Einsatz generativer KI unerlässlich sind.

Was ist der Unterschied zwischen Data Stewardship und Data Governance?

Data Governance und Data Stewardship sind unterschiedliche, aber verwandte Konzepte. Die Data Governance-Programme von Unternehmen tragen zur Gewährleistung der Datenintegrität und der Datensicherheit durch Richtlinien, Standards und Verfahren für die Erfassung, das Eigentum, die Speicherung, die Verarbeitung und die Nutzung von Daten bei. Viele Aufgaben im Bereich der Data Stewardship beinhalten die Umsetzung von Regeln, die in Data-Governance-Frameworks festgelegt sind. Daher kann Data Stewardship als „der operative Aspekt“ der Data Governance betrachtet werden.2

Welche verschiedenen Arten von Data Stewards gibt es?

In Unternehmen mit ausgereifteren Data-Stewardship-Programmen kann es verschiedene Arten von Data Steward-Rollen geben, darunter:

  • Business Data Steward: Business Data Stewards sind auf die Verwaltung von Daten innerhalb bestimmter Geschäftsfunktionen spezialisiert, z. B. Marketing oder Kundenservice.

  • Technical Data Steward: Technical Data Stewards verfügen über technisches Fachwissen in Bezug auf Datenprozesse und -systeme wie ETL-Prozesse (Extrahieren, Transformieren und Laden) und Data Warehouses.

  • Enterprise Data Stewards: Enterprise Data Stewards leiten Gruppen von Data Stewards innerhalb von Unternehmen und fungieren als Bindeglied zu anderen Geschäftsbereichsleitern.3

Was sind Anwendungsfälle für Data Stewardship?

Zu den Anwendungsfällen für Data Stewardship gehören:

  • Master Data Management
  • Verbesserung der Datenqualität
  • Metadatenverwaltung
  • Verwaltung von Referenzdaten
  • Identitätsauflösung
  • Informationssicherheit und Datenschutz
  • Nachverfolgung der Datenabstammung
  • Geschäftsprozessrisikomanagement

Master Data Management

Data Stewardship ist oft der Schlüssel zum Master Data Management (MDM), einem Ansatz zur Verwaltung kritischer Daten eines Unternehmens mithilfe von Technologien, Tools und Prozessen. Unternehmen nutzen MDM, um eine Single-Source-of-Truth (SSOT) zu schaffen, die Daten aus verschiedenen Quellen integriert, sodass alle Datenbenutzer mit denselben Informationen arbeiten.

Unternehmen und Data Stewards beginnen oft mit der Implementierung einer MDM-Initiative in einem einzigen Datenbereich (logische Gruppierungen ähnlicher Daten, wie z. B. Kunden- oder Mitarbeiterdaten), bevor sie diese Arbeit auf die Daten-Assets des Unternehmens skalieren.4

Verbesserung der Datenqualität

Date Stewards können die Datenqualität verbessern, indem sie den Inhalt einer Datenbank überprüfen, was als Datenprofilierung bezeichnet wird. Sie arbeiten auch mit Daten-Stakeholdern zusammen, um Datendefinitionen zu erstellen, Metriken für die Datenqualität zu entwerfen und Business Rules für Daten festzulegen, z. B. welche Werte als gültig oder ungültig gelten.

Wie im Buch „Data Stewardship“ erläutert, könnte beispielsweise eine Regel für den Familienstand eines Kunden besagen, dass „ledig“, „verheiratet“, „verwitwet“ oder „geschieden“ gültige Werte sind, während eine leere Antwort als ungültig angesehen würde.5 Data Stewards können auch einen Beitrag zur Lösung von Problemen mit der Datenqualität leisten, wenn diese auftreten.

Metadatenverwaltung

Metadaten sind Informationen, die einen Datenpunkt oder Datensatz beschreiben, wie z. B. das Erstellungsdatum der Daten oder Angaben zur Urheberschaft. Data Stewards können dafür verantwortlich sein, qualitativ hochwertige Metadaten zu erstellen und die Qualität vorhandener Metadaten zu bewerten. Wie bei der allgemeinen Datenqualität haben Data Stewards die Aufgabe, sich mit Qualitätsproblemen der Metadaten zu befassen.

Verwaltung von Referenzdaten

Data Stewards pflegen häufig Referenzdaten, d. h. Daten, die andere Daten innerhalb des Unternehmens kategorisieren. Beispiele für Referenzdaten sind Ländercodes, Währungsinformationen und Produktcodes. Mithilfe der Datendokumentation können Data Stewards gültige Werte für Referenzdaten aufzeichnen, bewerten, ob neue gültige Werte erforderlich sind, und Referenzdatenwerte in verschiedenen Systemen abgleichen.

Im letztgenannten Fall könnte ein Data Steward damit beauftragt werden, zu entscheiden, welche Maßnahmen zu ergreifen sind, wenn ein System „verwitwet“ und „geschieden“ als Personenstandsdaten zulässt, während ein anderes nur „verheiratet“ und „ledig“ akzeptiert.6

Identitätsauflösung

Oft repräsentieren mehrere Dateninstanzen dieselbe Entität. Stellen Sie sich zum Beispiel einen einzelnen Kunden vor, der mehrfach in der Datenbank einer Apothekenkette erscheint, weil er unterschiedliche Rezepte erhalten hat, die in verschiedenen Filialen eingelöst wurden.

Durch einen Prozess namens Identitätsauflösung bestimmen Data Stewards, wann verschiedene Dateninstanzen auf dieselbe Entität verweisen. Im Falle von Apothekenkunden kann die Identitätsauflösung beispielsweise dazu beitragen, dass potenziell gefährliche Wechselwirkungen von Medikamenten beim Einlösen von Rezepten erkannt werden.7

Informationssicherheit und Datenschutz

Informationssicherheit ist der Schutz wichtiger Informationen vor unbefugtem Zugriff, Offenlegung, Verwendung, Änderung oder Unterbrechung. Gemäß den Datenschutzbestimmungen sind Unternehmen verpflichtet, erweiterte Schutzmaßnahmen für sensible Informationen wie Gesundheitsdaten zu implementieren. Sie müssen außerdem Regeln zur Datenfreigabe, zur Beschränkung der Datenerfassung und vielem mehr einhalten. Data Stewards können eine Rolle beim Datenschutz und der Einhaltung von Vorschriften spielen, indem sie Sicherheitsklassifizierungen für verschiedene Datentypen erstellen und einrichten.

Nachverfolgung der Datenabstammung

Datenabstammung ist der Prozess der Verfolgung von Datenlebenszyklen, der ein klares Verständnis dafür vermittelt, woher die Daten stammen, wie sie sich verändert haben und wohin sie letztendlich gelangen. Data Stewards können die Datenabstammung zurückverfolgen, was einem Unternehmen hilft, die Datenintegrität für regulatorische Berichtszwecke zu gewährleisten.

Geschäftsprozessrisikomanagement

Schlechte Datenqualität kann Geschäftsprozesse gefährden. Data Stewards können mit den Verantwortlichen für Geschäftsprozesse zusammenarbeiten, um die Verwendung von Daten in einem Prozess zu bestimmen und festzustellen, wie anfällig der Prozess im Fall von schlechter Datenqualität ist.8

Welche Technologien und Tools unterstützen Data Stewardship?

Unternehmen können verschiedene Lösungen und Tools zur Unterstützung von Data Stewards implementieren, darunter:

  • Künstliche intelligenz (KI)
  • Datenkataloge
  • Tools zur Erstellung von Datenprofilen und zur Analyse
  • Relationale Datenbankmanagementsysteme (RDBMS)
  • Data-Governance-Software

Künstliche Intelligenz

Zwischen KI und Data Stewardship besteht das, was manche als symbiotische Beziehung bezeichnen würden. Während Data Stewardship dazu beiträgt, dass KI-Systeme mit qualitativ hochwertigen Daten arbeiten, können KI-basierte Tools Data Stewardship-Aufgaben optimieren. Beispielsweise können KI-gestützte Datenaufbereitungstools Validierungsprüfungen durchführen und Fehler wie eine falsche Formatierung kennzeichnen, während KI-gestützte Tools zur Vermeidung von Datenverlust sensible Informationen erkennen und bei Bedarf Sicherheitskontrollen anwenden können.

Datenkataloge

Ein Datenkatalog ist ein Bestand aller Daten-Assets in einem Unternehmen. Er soll Data Stewards und anderen Datenexperten helfen, Informationen einfach und schnell zu finden. Die mit jedem Daten-Asset verbundenen Metadaten ermöglichen die Durchsuchbarkeit des Katalogs.

Tools zur Erstellung von Datenprofilen und zur Analyse

Tools zur Erstellung von Datenprofilen und zur Analyse können Daten auf Konsistenz und Qualität bewerten. Zu den Funktionen solcher Tools können die Identifizierung von Anomalien, die Validierung von Datenquellen und die Zusammenfassung von Analyseergebnissen durch benutzerdefinierte Berichte gehören.

Relationale Datenbankmanagementsysteme

Data Stewards können Daten unter anderem mithilfe relationaler Datenbanken organisieren. Eine relationale Datenbank (RDB) ist ein Datenbanktyp, in dem Daten in Zeilen und Spalten organisiert sind. Die resultierenden Tabellen können miteinander verknüpft werden, um die Beziehungen zwischen Datenpunkten darzustellen. Relationale Datenbankmanagementsysteme (RDBMS) sind Softwarelösungen, die von Data Stewards und anderen zur Wartung und Aktualisierung von RDBs verwendet werden können.

Data-Governance-Software

Data-Governance-Software enthält häufig Tools zur Erstellung von Datenprofilen und -analysen sowie KI-gestützte Funktionen. Zu den Funktionen können die KI-gestützte Metadaten-Aufbereitung, die Erstellung von Datenkatalogen, die Nachverfolgung der Datenabstammung und die Einrichtung einer rollenbasierten Datenzugriffskontrolle gehören.

Fußnoten

Alle Links befinden sich außerhalb von ibm.com.

1, 4 Allen et al. „Multi-Domain Master Data Management.“ Morgan Kaufmann. 10. April 2015.

2, 3, 5, 6, 7, 8 Plotkin. „Data Stewardship, Second Edition.“ Academic Press. 20. November 2020.

Weiterführende Lösungen
Software und Lösungen für die Datenverwaltung

Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.

Lösungen für Datenmanagement erkunden
IBM watsonx.data

Watsonx.data ermöglicht es Ihnen, Analysen und KI mit all Ihren Daten zu skalieren, unabhängig davon, wo sie sich befinden, und zwar über einen offenen, hybriden und kontrollierten Datenspeicher.

IBM watsonx.data entdecken
Beratungsservices für Daten und Analysen

Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisgesteuertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.

Analyse-Services entdecken
Machen Sie den nächsten Schritt

Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.

Lösungen für Datenmanagement erkunden IBM watsonx.data entdecken