Intelligente Single-Agent-Systeme interagieren mit ihrer Umgebung, um autonom zu planen, Tools aufzurufen und Antworten zu geben. Die einem Agenten zur Verfügung gestellten Tools liefern Informationen, die ihm sonst nicht zur Verfügung stehen würden. Wie bereits beschrieben, kann es sich bei diesen Informationen um eine Datenbank handeln, die über eine API oder einen anderen Agenten erfasst wird. Man unterscheidet hier zwischen Single- und Multi-Agent-Systemen. Wenn Sie einen anderen Agenten als Tool aufrufen, ist dieser sekundäre Agent Teil der Umgebungsreize des ursprünglichen Agenten. Diese Informationen werden beschafft und es findet keine weitere Zusammenarbeit statt. Multi-Agent-Systeme unterscheiden sich dadurch, dass alle Agenten innerhalb der Umgebung einbezogen werden, um die Ziele, Erinnerungen und Aktionspläne der anderen zu modellieren.4 Die Kommunikation zwischen Agenten kann direkt oder indirekt durch Veränderung der gemeinsamen Umgebung erfolgen.
Jede Entität innerhalb eines Multi-Agent-Systems ist bis zu einem gewissen Grad ein autonomer Agent. Diese Autonomie zeigt sich in der Regel in der Planung, dem Aufrufen von Tools und der allgemeinen Argumentation des Agenten. In einem Multi-Agent-System bleiben Agenten autonom, kooperieren und koordinieren sich jedoch auch in Agentenstrukturen.3 Zur Lösung komplexer Probleme sind Agentenkommunikation und verteilte Problemlösung von entscheidender Bedeutung. Diese Art der Agenteninteraktion kann als Multi-Agent Reinforcement Learning beschrieben werden. Die durch diese Form des Lernens weitergegebenen Informationen können Echtzeit-Informationen enthalten, die durch Sensoren oder Aktionen erfasst werden. Außerdem können die Erfahrungen eines Agenten in Form von episodischen Informationen geteilt werden. Diese Episoden können Sequenzen von Empfindungen, Aktionen und erlernten Richtlinien sein. Schließlich können Agenten ihre Erfahrungen in Echtzeit teilen, um zu verhindern, dass andere Agenten wiederholt dieselben Richtlinien erlernen.5
Einzelne Agenten sind für sich genommen schon leistungsstark. Sie können Teilaufgaben erstellen, Tools verwenden und durch ihre Interaktionen lernen. Das kollektive Verhalten von Multi-Agent-Systemen erhöht das Potenzial für Genauigkeit, Anpassungsfähigkeit und Skalierbarkeit. Multi-Agent-Systeme übertreffen Single-Agent-Systeme aufgrund des größeren Pools gemeinsam genutzter Ressourcen, Optimierung und Automatisierung tendenziell. Anstatt dass mehrere Agenten dieselben Richtlinien erlernen, können gelernte Erfahrung geteilt werden, um die Zeitkomplexität und Effizienz zu optimieren.5