Mein IBM

Anmelden

Was ist ein Algorithmus für maschinelles Lernen?

Ein Algorithmus für maschinelles Lernen ist eine Reihe von Regeln oder Prozessen, die von einem KI-System verwendet werden, um Aufgaben auszuführen – meistens, um neue Datenerkenntnisse und -muster zu entdecken oder um Ausgabewerte aus einem gegebenen Satz von Eingabevariablen vorherzusagen. Algorithmen ermöglichen es dem maschinellen Lernen (ML) zu lernen.

Branchenanalysten sind sich über die Bedeutung des maschinellen Lernens und der zugrunde liegenden Algorithmen einig. Forrester: „Fortschritte bei den Algorithmen des maschinellen Lernens bringen Präzision und Tiefe in die Analyse von Marketingdaten, die Vermarktern helfen zu verstehen, wie Marketingdetails – wie Plattform, Kreativität, Call-to-Action oder Messaging – die Marketingleistung beeinflussen.¹“ Gartner stellt fest, dass „maschinelles Lernen der Kern vieler erfolgreicher KI-Anwendungen ist, was ihre enorme Zugkraft auf dem Markt fördert.²“

In den meisten Fällen liefert das Training von ML-Algorithmen mit mehr Daten genauere Antworten als das Training mit weniger Daten. Mithilfe statistischer Methoden werden Algorithmen darauf trainiert, Klassifizierungen zu ermitteln oder Vorhersagen zu treffen und wichtige Erkenntnisse aus Data-Mining-Projekten zu gewinnen. Diese Erkenntnisse können Ihre Entscheidungsfindung verbessern und wichtige Wachstumsmetriken steigern.

Zu den Anwendungsfällen für Algorithmen des maschinellen Lernens gehört die Fähigkeit, Daten zu analysieren, um Trends zu erkennen und Probleme vorherzusagen, bevor sie auftreten.³ Fortgeschrittenere KI kann einen individuelleren Support ermöglichen, Reaktionszeiten verkürzen, Spracherkennung bieten und die Kundenzufriedenheit verbessern. Zu den Branchen, die besonders von Algorithmen aus dem Bereich des maschinellen Lernens profitieren und aus riesigen Datenmengen neue Inhalte erstellen, gehören Lieferkettenmanagement, Transport und Logistik, Einzelhandel und Fertigung⁴– sie alle nutzen generative KI, um Aufgaben zu automatisieren, die Effizienz zu steigern und selbst Anfängern wertvolle Erkenntnisse zu vermitteln.

Die neuesten Erkenntnisse und Insights zu KI

Entdecken Sie von Experten kuratierte Erkenntnisse und Neuigkeiten zu KI, Cloud und mehr im wöchentlichen Newsletter Think.

Abonnieren Sie noch heute

Deep Learning

Deep Learning ist eine spezifische Anwendung der fortgeschrittenen Funktionen von Algorithmen des maschinellen Lernens. Der Unterschied besteht darin, wie jeder Algorithmus lernt. „Deep“ Modelle für maschinelles Lernen können Ihre markierten Datensätze, auch bekannt als überwachtes Lernen, verwenden, um ihren Algorithmus zu informieren, aber sie benötigen nicht unbedingt markierte Daten. Deep Learning kann unstrukturierte Daten in ihrer Rohform (wie Text oder Bilder) aufnehmen und automatisch die Merkmale ermitteln, die verschiedene Datenkategorien voneinander unterscheiden. Dadurch entfällt ein Teil des erforderlichen menschlichen Eingreifens und ermöglicht die Nutzung größerer Datensätze.

Die einfachste Art, über künstliche Intelligenz, maschinelles Lernen, Deep Learning und neuronale Netze nachzudenken, ist, sie als eine Reihe von KI-Systemen vom größten zum kleinsten zu betrachten, von denen jedes das nächste umfasst. Künstliche Intelligenz (KI) ist das übergreifende System. Maschinelles Lernen ist eine Teilmenge der KI. Deep Learning ist ein Unterfeld des maschinellen Lernens, und neuronale Netze bilden das Rückgrat von Deep-Learning-Algorithmen. Die Anzahl der Knotenschichten bzw. die Tiefe der neuronalen Netze unterscheidet ein einzelnes neuronales Netz von einem Deep-Learning-Algorithmus, der mehr als drei Schichten haben muss.

Mixture of Experts | Podcast

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Schließen Sie sich unserer erstklassigen Expertenrunde aus Ingenieuren, Forschern, Produktführern und anderen an, die sich durch das KI-Rauschen kämpfen, um Ihnen die neuesten KI-Nachrichten und Erkenntnisse zu liefern.

Folgen ansehen

So funktionieren Algorithmen für maschinelles Lernen

In einem Artikel der UC Berkeley wird das Lernsystem eines Algorithmus für maschinelles Lernen in drei Hauptteile unterteilt.⁵

Ein Entscheidungsprozess: Im Allgemeinen werden Algorithmen des maschinellen Lernens verwendet, um eine Vorhersage oder Klassifizierung zu treffen. Basierend auf einigen Eingabedaten, die gekennzeichnet oder nicht gekennzeichnet werden können, erzeugt Ihr Algorithmus eine Schätzung über ein Muster in den Daten.
Fehlerfunktion: Bei einer Fehlerfunktion wird die Vorhersage des Modells ausgewertet. Wenn es bekannte Beispiele gibt, kann eine Fehlerfunktion einen Vergleich durchführen, um die Genauigkeit des Modells zu beurteilen.

3. Ein Modelloptimierungsprozess: Wenn das Modell besser an die Datenpunkte im Trainingssatz angepasst werden kann, werden die Gewichtungen angepasst, um die Abweichung zwischen dem bekannten Beispiel und der Modellschätzung zu reduzieren. Der Algorithmus wiederholt diesen Prozess zur „Bewertung und Optimierung“ und aktualisiert die Gewichtungen selbstständig, bis eine bestimmte Genauigkeitsschwelle erreicht ist.

Insbesondere beim überwachten Lernen wird ein Trainingssatz verwendet, um Modelle so zu trainieren, dass sie die gewünschte Ausgabe erzielen. Dieser Trainings-Datensatz enthält Eingaben und korrekte Ausgaben, mit denen das Modell im Laufe der Zeit lernen kann. Der Algorithmus misst seine Genauigkeit durch die Verlustfunktion und passt sich so lange an, bis ein Fehler ausreichend minimiert wurde.

Arten von Algorithmen für maschinelles Lernen

Es gibt vier Arten von Algorithmen für maschinelles Lernen: überwachte, unbeaufsichtigte, halbüberwachte und verstärkte. Abhängig von Ihrem Budget, dem Bedarf an Geschwindigkeit und Präzision hat jede Art und jede Variante ihre eigenen Vorteile. Fortgeschrittene Algorithmen des maschinellen Lernens erfordern mehrere Technologien – darunter Deep Learning, neuronale Netze und die Verarbeitung natürlicher Sprache – und können sowohl unbeaufsichtigtes als auch beaufsichtigtes Lernen einsetzen.⁶ Im Folgenden sind die beliebtesten und am häufigsten verwendeten Algorithmen aufgeführt.

Überwachte Lernalgorithmen

Überwachtes Lernen kann beim Data Mining in zwei Problemkategorien unterteilt werden: Klassifizierung und Regression.

Klassifizierung verwendet einen Algorithmus, um Testdaten präzise bestimmten Kategorien zuzuweisen. Sie erkennt bestimmte Entitäten innerhalb des Datensatzes und versucht, Schlussfolgerungen darüber zu ziehen, wie diese Entitäten gekennzeichnet oder definiert werden sollen. Übliche Klassifikationsalgorithmen sind lineare Klassifikatoren, Support Vector Machines (SVM), Entscheidungsbäume, K-Nearest Neighbor und Random Forest, die im Folgenden näher beschrieben werden.

Regression dient dazu, die Beziehung zwischen abhängigen und unabhängigen Variablen zu verstehen. Dies wird häufig verwendet, um Prognosen zu erstellen, beispielsweise den Umsatz eines bestimmten Unternehmens. Lineare Regression, logistische Regression und polynomiale Regression sind beliebte Regressionsalgorithmen.

In überwachten maschinellen Lernprozessen werden verschiedene Algorithmen und Berechnungstechniken verwendet, die häufig mithilfe von Programmen wie Python berechnet werden. Überwachte Lernalgorithmen:

AdaBoost oder Gradient Boosting: Diese Technik wird auch adaptives Boosting⁷ genannt und steigert einen leistungsschwachen Regressionsalgorithmus, indem sie ihn mit schwächeren kombiniert, um einen stärkeren Algorithmus zu erstellen, der zu weniger Fehlern führt. Boosting kombiniert die Prognoseleistung mehrerer Basisschätzer.

Künstliche neuronale Netze: Auch bekannt als ANNs, neuronale Netze oder simulierte neuronale Netze (SNNs), sind eine Teilmenge maschineller Lerntechniken und der Kern von Deep-Learning-Algorithmen. Der Lernalgorithmus erkennt Muster in den Eingabedaten mithilfe von Bausteinen, den sogenannten Neuronen, die den Neuronen im menschlichen Gehirn nachempfunden sind und mit der Zeit trainiert und verändert werden. (Mehr unter „Neural Networks“.)

Entscheidungsbaumalgorithmen: Entscheidungsbäume werden sowohl zur Vorhersage numerischer Werte (Regressionsprobleme) als auch zur Klassifizierung von Daten in Kategorien verwendet und nutzen eine verzweigte Folge verknüpfter Entscheidungen, die mit einem Baumdiagramm dargestellt werden können. Einer der Vorteile von Entscheidungsbäumen ist, dass sie im Gegensatz zur Blackbox eines neuronalen Netzes leicht zu validieren und zu überprüfen sind.

Verringerung der Dimensionalität: Wenn ein ausgewählter Datensatz eine hohe Anzahl von Merkmalen aufweist⁷ , weist er eine hohe Dimensionalität auf. Die Dimensionalitätsreduzierung verringert dann die Anzahl der Merkmale, so dass nur die aussagekräftigsten Erkenntnisse oder Informationen übrig bleiben. Ein Beispiel ist die Hauptkomponentenanalyse.

K-Nearest Neighbor: Dieser nicht parametrische Algorithmus, auch KNN genannt, klassifiziert Datenpunkte basierend auf ihrer Nähe und Zuordnung zu anderen verfügbaren Daten. Es wird davon ausgegangen, dass ähnliche Datenpunkte nahe beieinander gefunden werden können. Daher wird versucht, den Abstand zwischen Datenpunkten zu berechnen, in der Regel durch die euklidische Entfernung, und dann wird eine Kategorie basierend auf der häufigsten Kategorie oder dem Durchschnitt zugewiesen.

Lineare Regression: Die lineare Regression wird verwendet, um die Beziehung zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen zu identifizieren, und wird normalerweise genutzt, um Vorhersagen über zukünftige Ergebnisse zu treffen. Wenn es nur eine unabhängige Variable und eine abhängige Variable gibt, wird sie als einfache lineare Regression bezeichnet.

Logistische Regression: Während die lineare Regression bei kontinuierlichen abhängigen Variablen eingesetzt wird, wird die logistische Regression gewählt, wenn die abhängige Variable kategorisch ist, d. h. es gibt binäre Ausgaben wie „wahr“ und „falsch“ oder „ja“ und „nein“. Beide Regressionsmodelle versuchen zwar, Beziehungen zwischen Dateneingaben zu verstehen, aber die logistische Regression wird hauptsächlich verwendet, um binäre Klassifizierungsprobleme wie Spam-Erkennung zu lösen.

Neural Networks: Neuronale Netze werden in erster Linie für Deep-Learning-Algorithmen eingesetzt und verarbeiten die eingegebenen Trainingsdaten, indem sie die Vernetzung des menschlichen Gehirns durch Knotenschichten nachahmen. Jeder Knoten besteht aus Eingaben, Gewichtungen, einer Verzerrung (Schwellenwert) und einer Ausgabe. Wenn dieser Ausgabewert einen bestimmten Schwellenwert überschreitet, wird der Knoten „ausgelöst“ oder aktiviert und Daten an die nächste Schicht im Netz übergeben. Neuronale Netze lernen aus Anpassungen basierend auf der Verlustfunktion durch den Prozess des Gradientenabstiegs. Wenn die Kostenfunktion bei oder nahe Null liegt, können Sie sich auf die Genauigkeit des Modells verlassen.

Naïve Bayes: Dieser Ansatz setzt das Prinzip der konditionalen Unabhängigkeit der Klasse aus dem Bayes-Theorem ein. Das bedeutet, dass das Vorhandensein eines Merkmals keinen Einfluss auf das Vorhandensein eines anderen Merkmals in Bezug auf die Wahrscheinlichkeit eines bestimmten Ergebnisses hat, und dass jeder Prädiktor die gleiche Wirkung auf das Ergebnis hat. Es gibt drei Arten von Naïve-Bayes-Klassifizierungen: Multinomial Naïve Bayes, Bernoulli Naïve Bayes und Gaussian Naïve Bayes. Diese Technik wird hauptsächlich in Textklassifizierungs-, Spam-Identifikations- und Empfehlungssystemen verwendet.

Random Forests: In einem Random Forest prognostiziert der Algorithmus für maschinelles Lernen einen Wert oder eine Kategorie, indem die Ergebnisse aus einer Reihe von Entscheidungsbäumen kombiniert werden. Der „Forest“ bezieht sich auf nicht korrelierte Entscheidungsbäume, die zusammengesetzt sind, um Varianzen zu reduzieren und genauere Vorhersagen zu ermöglichen.

Support Vector Machines (SVM): Dieser Algorithmus kann sowohl für die Datenklassifizierung als auch für die Regression verwendet werden, in der Regel jedoch für Klassifikationsprobleme, bei denen eine Hyperebene mit einem maximalen Abstand zwischen zwei Klassen von Datenpunkten konstruiert wird. Diese Hyperplane wird als Entscheidungsgrenze bezeichnet und trennt die Klassen von Datenpunkten (z. B. Orangen vs. Äpfel) auf beiden Seiten der Ebene.

Unüberwachte Lernalgorithmen

Im Gegensatz zu überwachtem Lernen verwendet unüberwachtes Lernen nicht gekennzeichnete Daten. Aus diesen Daten erkennt der Algorithmus Muster, die bei der Lösung von Clustering- oder Zuordnungsproblemen helfen. Dies ist besonders nützlich, wenn Fachexperten sich über gemeinsame Eigenschaften innerhalb eines Datensatzes nicht sicher sind. Gemeinsame Clustering-Algorithmen sind hierarchische, K-Means-, Gauß'sche Mischungsmodelle und Dimensionalitätsreduzierungsmethoden wie PCA und t-SNE.

Clustering: Diese Algorithmen können Muster in Daten identifizieren, damit sie gruppiert werden können. Algorithmen können Data Scientists helfen, indem sie Unterschiede zwischen Datenelementen identifizieren, die Menschen übersehen haben.

Hierarchische Cluster-Bildung: Damit werden Daten in einen Baum von Clustern gruppiert⁸. Hierarchische Cluster-Bildung beginnt mit der Verarbeitung jedes Datenpunktes als separater Cluster. Anschließend werden diese Schritte wiederholt: 1) Identifizieren der beiden Cluster, die am nächsten beieinander liegen könnten, und 2) Zusammenführen der beiden am meisten vergleichbaren Cluster. Diese Schritte werden fortgesetzt, bis alle Cluster zusammengeführt sind.

K-Means-Clustering: Dies identifiziert Gruppen innerhalb von Daten ohne die Bezeichnung⁹in verschiedenen Clustern, indem Gruppen von Daten gefunden werden, die einander ähnlich sind. Der Name „K-Means“ stammt von den Schwerpunkten, die es zur Definition von Clustern verwendet. Ein Punkt wird einem bestimmten Cluster zugewiesen, wenn er näher am Schwerpunkt dieses Clusters liegt als an jedem anderen Schwerpunkt.

Halbüberwachte Lernalgorithmen

In diesem Fall findet das Lernen statt, wenn nur ein Teil der gegebenen Eingabedaten gekennzeichnet wurde – was dem Algorithmus einen gewissen „Vorsprung“ verschafft. Dieser Ansatz kann das Beste aus beiden Welten kombinieren¹⁰ – verbesserte Genauigkeit im Zusammenhang mit überwachtem maschinellem Lernen und die Möglichkeit, kosteneffiziente unmarkierte Daten zu nutzen, wie im Fall des unüberwachten maschinellen Lernens.

Verstärkungsalgorithmen

In diesem Fall werden die Algorithmen so trainiert, wie Menschen lernen – durch Belohnungen und Strafen –, die von einem Reinforcement-Learning-Agenten¹¹ gemessen und verfolgt werden, der ein allgemeines Verständnis für die Wahrscheinlichkeit hat, den Punktestand erfolgreich nach oben oder nach unten zu verschieben. Durch Versuch und Irrtum lernt der Agent, Maßnahmen zu ergreifen, die im Laufe der Zeit zu den günstigsten Ergebnissen führen. Reinforcement Learning wird häufig in den Bereichen Ressourcenmanagement, Robotertechnik und Videospiele eingesetzt¹² .

So entscheiden Sie sich für das richtige Foundation Model

Erfahren Sie, wie Sie bei der Vorbereitung von Datensätzen und dem Einsatz von Foundation Models den richtigen Ansatz wählen.

Ressourcen

KI in Aktion 2024

Wir haben 2.000 Unternehmen zu ihren KI-Initiativen befragt, um herauszufinden, was funktioniert, was nicht und wie Sie vorankommen können.

IBM Granite erkunden

IBM® Granite ist unsere Familie offener, leistungsfähiger und vertrauenswürdiger KI-Modelle, die auf Unternehmen zugeschnitten und für die Skalierung Ihrer KI-Anwendungen optimiert sind. Entdecken Sie die Optionen zu Sprache, Code, Zeitreihen und Guardrails.

Zu mehr KI-Know-how

Greifen Sie auf unseren vollständigen Katalog mit über 100 Online-Kursen zu, indem Sie noch heute ein Abonnement für Einzel- oder Mehrbenutzer erwerben, mit dem Sie Ihre Fähigkeiten in einer Reihe unserer Produkte zu einem günstigen Preis erweitern können.

IBM AI Academy

Das Programm, das von führenden IBM Experten geleitet wird, soll Führungskräften dabei helfen, das nötige Wissen zu erwerben, um die Prioritäten für KI-Investitionen zu setzen, die zu mehr Wachstum führen.

KI zum Einsatz bringen: Mehr ROI dank generativer KI

Möchten Sie eine bessere Rendite für Ihre KI-Investitionen erzielen? Erfahren Sie, wie die Skalierung generativer KI in Schlüsselbereichen Veränderungen vorantreibt, indem Sie Ihre besten Köpfe dabei unterstützen, innovative neue Lösungen zu entwickeln und bereitzustellen.

Nutzen Sie die Leistungsfähigkeit generativer KI und ML

Erfahren Sie, wie Sie generative KI und maschinelles Lernen sicher in Ihr Unternehmen integrieren können.

Wie Sie im neuen KI-Zeitalter vertrauensvoll und zuversichtlich in eine erfolgreiche Zukunft blicken

Erfahren Sie mehr über die drei entscheidenden Elemente einer starken KI-Strategie: die Schaffung eines Wettbewerbsvorteils, die Skalierung von KI im gesamten Unternehmen und die Förderung vertrauenswürdiger KI.

Weiterführende Lösungen

IBM watsonx.ai

Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.

Entdecken sie watsonx.ai

Lösungen im Bereich künstlicher Intelligenz

Setzen Sie KI in Ihrem Unternehmen ein
– mit branchenführendem Fachwissen im Bereich KI und dem umfassenden Lösungsportfolio von IBM an Ihrer Seite.

Erkunden Sie KI-Lösungen

KI-Beratung und -Services

Erfinden Sie kritische Workflows und Abläufe neu, indem Sie KI einsetzen, um Erfahrungen, Entscheidungsfindung in Echtzeit und den geschäftlichen Nutzen zu maximieren.

KI-Services entdecken

Machen Sie den nächsten Schritt

Profitieren Sie von einem einheitlichen Zugriff auf Funktionen, die den gesamten Lebenszyklus der KI-Entwicklung abdecken. Erstellen Sie leistungsstarke KI-Lösungen mit benutzerfreundlichen Oberflächen, Workflows und Zugriff auf branchenübliche APIs und SDKs.

watsonx.ai erkunden

Live-Demo buchen