Zusammengesetzte KI-Systeme sind fortschrittliche Konfigurationen, die mehrere KI-Modelle oder -Systeme kombinieren, um komplexe Probleme effektiver zu lösen, als es ein einzelnes Modell der künstlichen Intelligenz (KI) könnte. Diese Systeme integrieren verschiedene Komponenten, die jeweils auf eine bestimmte Aufgabe spezialisiert sind, um gemeinsam oder sequenziell zu arbeiten.
Obwohl großen Sprachmodellen (LLMs) viel Aufmerksamkeit gewidmet wird, haben diese umfassenden Modelle des maschinellen Lernens (ML) ihre Grenzen. Sie zu betreiben und entwickeln ist teuer und sie sind langsam. Ihnen fehlt domänenspezifisches Fachwissen und sie können nicht alle komplexe Aufgaben, für die viele Schritte auf mehreren Systemen nötig sind, bewältigen.
In Anbetracht solcher Beschränkungen haben Forscher festgestellt, dass die Ergänzung monolithischer Modelle durch andere Modelle und Instrumente, die jeweils für eine bestimmte Aufgabe optimiert sind, einen effektiveren Ansatz darstellen kann.
Ein Blogbeitrag des Berkeley Artificial Intelligence Research (BAIR) Lab von 2024 war eine frühe erklärende Vision davon, wie zusammengesetzte KI-Systeme aussehen würden. Der Beitrag schlug vor, dass durch den Aufbau zusammengesetzter KI-Systeme bessere Ergebnisse erzielt werden könnten und dass die Zukunft der KI darin bestehen würde, dass Unternehmen LLMs, Abfragesysteme, KI-Agenten und externe Tools zusammenführen, die jeweils für bestimmte Aufgaben optimiert sind.
Die Orchestrierung mehrerer einzelner Modelle und interagierender Komponenten bietet zahlreiche Vorteile.
Durch die Aufteilung der Aufgaben auf spezialisierte Modelle reduzieren die zusammengesetzten Systeme die kognitive Belastung der einzelnen KI-Komponenten. Zum Beispiel könnte sich ein Modell auf die Analyse strukturierter Daten konzentrieren, während ein anderes unstrukturierte Daten wie Bilder oder Text interpretiert. Diese Arbeitsteilung führt zu einer verbesserten Leistung und höheren Genauigkeit im Vergleich zu Einzelmodellsystemen.
LLMs sind beeindruckend und gewinnen an Bedeutung, wenn sie mit mehr Rechenressourcen ausgestattet werden, laufen aber aufgrund von Skalierbarkeitsgesetzen gegen Leistungsobergrenzen und abnehmende Erträge an. In manchen Fällen ist es vielleicht besser, bestimmte Aufgaben an ein anderes Modell, einen anderen Agenten oder ein anderes Werkzeug zu übertragen, das nicht so viele Ressourcen benötigt, als mehr Rechenleistung in ein LLM zu stecken.
Die Kombination mehrerer Modelle für eine Aufgabe kann manchmal schneller sein als das Training eines einzelnen LLMs für diese Aufgabe. Darüber hinaus können kombinierte Systeme verschiedene Arten von Daten gleichzeitig verarbeiten und so Entscheidungen in Echtzeit ermöglichen. Dies ist entscheidend bei KI-Anwendungen wie der Betrugserkennung, wo schnelle Reaktionen unerlässlich sind, oder bei Edge-Anwendungen, bei denen die Latenz minimiert werden muss.
Zusammengesetzte Systeme sind vielseitig und in verschiedenen Anwendungsfällen einsetzbar. Diese Vielseitigkeit macht zusammengesetzte KI-Systeme zu einer bevorzugten Wahl für Unternehmen, die ihre Abläufe in verschiedenen Bereichen optimieren möchten.
Unternehmen können von Systemendesigns profitieren, die eine Kombination aus vortrainierten Komponenten, Open-Source-Lösungen und benutzerdefinierten Modulen verwenden. Alle Komponente kann unabhängig aktualisiert oder ersetzt werden, wenn sich die Technologie weiterentwickelt, ohne dass das gesamte System überarbeitet werden muss. Indem Aufgaben auf verschiedene Modelle verteilt werden, profitieren zusammengesetzte Systeme von der Anpassungsfähigkeit und der Widerstandsfähigkeit gegenüber Ausfällen einzelner Komponenten.
Zusammengesetzte Methoden wie Retrieval Augmented Generation (RAG), erweitern die Fähigkeiten von LLMs, indem sie ihnen den Zugriff auf Datenquellen außerhalb ihrer anfänglichen Trainingsdatensätze zuzugreifen. Die Kombination verschiedener Modelle ermöglicht es Entwicklern, für bestimmte Ziele zu optimieren, wie z. B. Geschwindigkeit oder Fachwissen.
LLMs können schwerfällig sein, zu Halluzinationen neigen und Entscheidungen treffen, die nicht immer leicht erklärbar sind. Eine zusammengesetzte KI-Lösung kann dabei helfen, Eingaben zu kontrollieren und Ausgaben zu filtern, was zu einem kontrollierten Verhalten führt und das Vertrauen fördert.
Zusammengesetzte KI-Systeme werden bereits in realen Anwendungsfällen eingesetzt, z. B.:
Bestimmte Versionen von Chatbots, darunter ChatGPT von OpenAI und Copilot von Microsoft, basieren auf zusammengesetzten Architekturen. ChatGPT erweitert beispielsweise seinen Nutzen um mehrere Tools und APIs für bestimmte Aufgaben.
Das System vereint ein LLM, den DALL-E-Bildgenerator und ein Code-Interpreter-Plugin. Es nutzt RAG, um dynamisch auf externe Datenquellen und Wissensdatenbanken zuzugreifen. Separate KI-Modelle werden verwendet, um schädliche oder unangemessene Inhalte zu erkennen und zu filtern, bevor eine Antwort geliefert wird.
Obwohl sich diese Technologie noch nicht durchgesetzt hat, verwenden autonome Fahrzeugsysteme Computer-Vision-Modelle, um Objekte in der Umgebung des Fahrzeugs zu erkennen und zu identifizieren. Algorithmen zur Sensorfusion kombinieren Daten von Kameras, LiDAR-, Radar- und Ultraschallsensoren, um eine umfassende 3D-Karte der Umgebung zu erstellen und das Situationsbewusstsein zu verbessern.
Mithilfe von Modellen des Reinforcement Learning werden Entscheidungen getroffen, z. B. wann die Spur gewechselt, die Geschwindigkeit angepasst oder an einer Ampel angehalten werden soll, und zwar auf der Grundlage von Echtzeitbedingungen.
Darüber hinaus ermöglicht die Verarbeitung natürlicher Sprache (NLP) dem Fahrzeug, gesprochene Befehle von Passagieren zu interpretieren und darauf zu reagieren. Die Komponenten arbeiten reibungslos zusammen, um große Datenmengen zu verarbeiten, intelligente Sofortentscheidungen zu treffen und ein intuitives Erlebnis zu bieten.
Ein zusammengesetztes KI-System für den Kundensupport kombiniert mehrere KI-Technologien, um einen effizienten, personalisierten und reaktionsschnellen Service zu bieten. Zum Beispiel analysieren NLP-Modelle Kundenanfragen, um die Absicht und wichtige Details zu extrahieren, damit das System das Problem genau verstehen kann.
Nachdem die Absicht identifiziert wurde, interagiert ein Chatbot mit KI (Gen AI) im Gespräch mit dem Kunden, bietet sofortige Hilfe an oder klärt zusätzliche Details. Gleichzeitig schlägt ein Empfehlungssystem relevante Lösungen vor, wie z. B. Schritte zur Fehlerbehebung, FAQ-Artikel oder Produktempfehlungen, die auf die Bedürfnisse des Kunden zugeschnitten sind.
Um das Erlebnis zu verbessern, wertet ein Stimmungsanalysemodell den Tonfall und den emotionalen Zustand des Kunden aus und hilft dabei, dringende oder unzufriedene Fälle für den menschlichen Eingriff zu priorisieren. Diese Kombination von Komponenten ermöglicht einen schnellen, intelligenten und einfühlsamen Kundensupport, der die Lösungszeit verkürzt und gleichzeitig eine hohe Kundenzufriedenheit gewährleistet.
Ein zusammengesetztes KI-System in Lieferketten nutzt mehrere KI-Komponenten, um Logistik, Bestandsverwaltung und die gesamte Effizienz zu optimieren. Beispielsweise prognostizieren vorausschauende Analysemodelle die Nachfrage durch die Analyse historischer Verkaufsdaten, saisonaler Trends und Marktvariablen und ermöglichen so eine präzise Bestandsplanung.
Computer-Vision-Systeme überwachen die Abläufe in den Lagern und erkennen Ineffizienzen oder Fehler in Echtzeit, z. B. verlegte Artikel oder beschädigte Waren. Gleichzeitig ermitteln Algorithmen zur Routenoptimierung die effizientesten Lieferwege unter Berücksichtigung von Faktoren wie Verkehr, Wetter und Kraftstoffverbrauch.
Darüber hinaus ermöglicht NLP die automatisierte Abwicklung der Kommunikation mit Lieferanten und Kunden, z. B. die Bearbeitung von Bestellungen oder die Beantwortung von Anfragen. Durch die Integration dieser Komponenten verbessert das System die Reaktionsfähigkeit der Lieferkette, verringert die Ausschussquote und trägt zur rechtzeitigen Lieferung bei, während es sich gleichzeitig dynamisch an Veränderungen der Nachfrage und der äußeren Bedingungen anpasst.
Bei der Entwicklung zusammengesetzter KI-Systeme müssen mehrere KI-Modelle und -Komponenten in zusammenhängende Frameworks integriert werden, mit denen komplexe Aufgaben bewältigt werden können. Diese Frameworks bieten die Infrastruktur für die Kombination verschiedener Modelle und sorgen für eine nahtlose Kommunikation zwischen ihnen.
In einem zusammengesetzten KI-System könnte eine programmierte Steuerungslogik ein Modell aufrufen oder ein LLM „die Verantwortung“ tragen, je nach den Zielen des Systems.
Für beide Ansätze gibt es eindeutige Vorteile, und die verschiedenen Möglichkeiten, wie Modelle und andere Komponenten in einem KI-System zusammenarbeiten können, sind grenzenlos, sodass die Entwickler ihren Ansatz kritisch überdenken und bereit sein müssen, mit verschiedenen Architekturen und Kombinationen von Komponenten zu experimentieren.
Machine Learning Operations (MLOps) werden durch zusammengesetzte Workflows immer schwieriger. So ist es zum Beispiel schwierig, konsistente Metriken für verschiedene Arten von Tools und Modellen anzuwenden. Die BAIR-Forscher behaupten, dass eine neue Phase der KI-Entwicklung mit der Umstellung auf zusammengesetzte Systeme einhergeht, um die Herausforderungen zu bewältigen, die sich aus der Überwachung, Fehlersuche und anderen betrieblichen Belangen ergeben.