NLP Expert Group Meeting - AI Agents
AI Agent Collaboration
Vom Assistenten zum Agenten: Wenn KI im Prozess ankommt
Der Begriff „AI Agent“ ist schnell verwendet, doch oft bleibt unklar, ob wirklich dasselbe gemeint ist. In meinem Webinar setze ich deshalb bei einer präzisen Einordnung an: Ein reaktiver Assistent beantwortet Anfragen und liefert Inhalte „neben dem Prozess“. Ein prozessintegrierter Agent ist so gedacht, dass er im Ablauf arbeitet – er reagiert auf Ereignisse, verfolgt Ziele über mehrere Schritte, nutzt Tools und interagiert mit Systemen. Entscheidend ist dabei nicht maximale Autonomie, sondern verlässliche Ausführung innerhalb klarer Leitplanken, sodass Ergebnisse nachvollziehbar bleiben.
What are AI Agents? I guess we know, but do we agree? Reactive Assistants vs. Process Integrated Agents
Ein Spektrum statt Schwarz-Weiss: Control vs. Freedom
Agenten sind selten ein Entweder-Oder. Ich beschreibe sie als Spektrum zwischen vordefinierten Workflows und vollständig autonomen Systemen. In der Praxis liegt der produktive Bereich häufig dazwischen: Je nach Risiko und Komplexität ist „mehr Freiheit“ nicht automatisch besser. Ein Agent ist dann nützlich, wenn er genug Handlungsspielraum hat, um Arbeit zu erledigen, aber genug Kontrolle, um stabil zu bleiben – technisch wie organisatorisch.
The Spectrum of Agents — Control vs. Freedom
Modularität als Prinzip: Bausteine statt Monolith
Ein weiterer Schwerpunkt ist Modularität. Wenn Agenten als monolithische Alleskönner gebaut werden, werden sie schnell schwer testbar und schwer steuerbar. Deshalb denke ich in „Building Blocks“: klar abgegrenzte Komponenten, die sich kombinieren lassen, ohne dass jede Erweiterung das Gesamtsystem destabilisiert. Das ist Architektur- und Teamprinzip zugleich: Fähigkeiten bleiben austauschbar, Verantwortlichkeiten klar, und Weiterentwicklung wird planbarer.
Building Blocks — The Power of Modular Agents
Rollenmodell TACO: Wie Agenten in Zusammenarbeit wirken
Um die Funktionen in agentischen Systemen greifbar zu machen, nutze ich ein Rollenmodell (TACO). Es hilft, Agenten nach ihrer Aufgabe in der Wertschöpfung zu unterscheiden: von fokussierten „Askers“ für einzelne Ziele, über „Automators“ für wiederkehrende Tätigkeiten, hin zu „Collaborators“ für Mensch-Agent-Teamwork und „Orchestrators“, die komplexe End-to-End-Prozesse über mehrere Systeme hinweg koordinieren. Mit wachsender Orchestrierung steigt typischerweise die Integrations- und Betriebsanforderung – und damit die Notwendigkeit, Kommunikation und Kontrolle sauber zu gestalten.
Focus on single goals, broken into simple steps. Are the easiest to manage. Are for human-agent teamwork, acting like teammates, not just tools Manage complex, end-to-end processes across systems
Mehrere Agenten, ein Kernproblem: Kommunikation
Sobald mehrere Agenten zusammenarbeiten, wird Kommunikation zur zentralen Systemfrage. Ich greife dafür das „Agent Communication Trilemma“ auf: Effizienz, Portabilität und Vielseitigkeit stehen in Spannung zueinander. Ein Ansatz, der sehr effizient für eine bestimmte Umgebung ist, verliert oft an Portabilität. Ein stark portabler Ansatz ist häufig weniger optimiert. Und maximale Vielseitigkeit kann Standardisierung und Betrieb verteuern. Daraus folgt eine praktische Konsequenz: Agenten brauchen eine explizite Sprache für Aufgaben, Zustände und Ergebnisse – passend zur Systemlandschaft und zum Betriebsmodell.
The Agent Communication Trilemma EFFICIENCY — PORTABILITY — VERSATILITY
Protokolle als Brücke: MCP, Agent Protocol und chat-nahe Ansätze
Ich ordne mehrere Protokollrichtungen ein, die genau diese Lücke zwischen Modell und „Aussenwelt“ adressieren. Das Model Context Protocol (MCP) steht dabei als Ansatz, Tool- und Kontextanbindung zu standardisieren. Agentprotocol.ai beschreibt Arbeit stärker über Tasks, Steps und Artifacts, also in klaren, prozessnahen Einheiten. Und chat-inspirierte Protokolle wie das LangChain Agent Protocol orientieren sich stärker an Konversations- und Laufzeitkonzepten, wie sie viele Agentensysteme ohnehin nutzen.
Model Context Protocol (MCP) — Anthropic’s approach Just Tasks, Steps and Artifacts? Langchain Agent Protocol — A chat-inspired approach
AGORA: Protokolle nach Bedarf, natürliche Sprache nur wenn nötig
Als konzeptionelle Ergänzung stelle ich AGORA vor: ein Ansatz, der unterschiedliche Protokollformen zulässt und je nach Situation passende Strukturen nutzt – bis hin zu „Protocol Documents“, die referenzierbar sind. Der Leitgedanke ist pragmatisch: Natürliche Sprache ist flexibel, aber schwer zu validieren und zu versionieren. Darum wird sie als letzte Option verstanden, nicht als Default-Transportformat für präzise Zustände.
Natural language as a last resort Agents negotiate which protocol to use
Ein eigener Zielrahmen: geschlossen, event-basiert, beobachtbar
Zum Schluss verdichte ich die Inhalte in einem praxisorientierten Zielbild: ein geschlossenes, event-basiertes System, das Proaktivität ermöglicht, aber Human-in-the-Loop konsequent mitdenkt. Transparenz ist dabei Grundvoraussetzung: Aktionen und Events sollen beobachtbar sein, damit Debugging, Auditierbarkeit und Betriebssicherheit möglich werden. Workflows sind überwiegend vordefiniert, während KI vor allem beim Routing und bei der flexiblen Ausführung innerhalb der Leitplanken wirkt; als Laufzeitstruktur dienen Konzepte wie Threads und Runs als Orientierung.
Transparency — Every action and event can be observed Predominantly predefined workflows with AI routing Event-based system allowing for proactivity — Human in the Loop
