Warum ein KI-Agent nicht ausreicht, wenn Sie mit Ihren Daten sprechen — AssistYou
Die meisten KI-Produkte, mit denen man mit seinen Daten chatten kann, sind alle auf genau dieselbe Weise aufgebaut. Man nimmt ein einziges großes Sprachmodell, verbindet es mit der Datenbank und stellt ihm eine Frage.
In einer sorgfältig inszenierten Demo funktioniert das wunderbar. In der Praxis versagt es jedoch sofort.
Das habe ich in den letzten Monaten auf die harte Tour gelernt, als ich „Chat with your Analyst“ entwickelt habe. Dabei handelt es sich um die Produktfunktion von „AssistYou“, mit der Sie die Analysen Ihres Sprachagenten in einfacher Sprache abfragen können.
Dieser Artikel ist der ehrliche Bericht darüber, was bei unserer ersten Version schiefgelaufen ist, warum ein einzelner KI-Agent diese Aufgabe einfach nicht bewältigen kann und welche architektonische Entscheidung das Problem schließlich gelöst hat.
Die Falle des einzelnen Agenten
Als ich die erste Version dieser Funktion entwickelte, verließ ich mich auf einen einzigen Agenten. Ein großes Sprachmodell erhielt die Frage des Benutzers, die relevanten Daten und eine Anweisung, wie es sich verhalten sollte.
Fast sofort stieß ich auf eine massive technische Hürde. Es traten zwei wesentliche Fehlerquellen auf.
Das erste war Halluzination. Wenn das Modell aufgefordert wurde, Zahlen zu liefern, die es nicht direkt berechnen konnte, erfand es manchmal plausibel wirkende Werte. Wenn ein Nutzer nach einer Anruf-Lösungsquote fragte, spuckte das Modell selbstbewusst eine Zahl aus, die korrekt aussah, aber absolut keine Grundlage in der Realität hatte. In einem Unternehmensanalyseprodukt ist das katastrophal. Man kann keine geschäftlichen Entscheidungen auf der Grundlage gefälschter Zahlen treffen.
Der zweite Fehler war der ständige Kompromiss zwischen quantitativer und qualitativer Leistung. Wenn ich das System so optimierte, dass es bei numerischen Fragen maximale mathematische Genauigkeit lieferte, verschlechterte sich die Qualität der narrativen Zusammenfassungen. Wenn ich das Modell so optimierte, dass es bessere narrative Zusammenfassungen schrieb, begannen die Zahlen zu driften.
Ich verlangte von genau demselben Modell, zwei Aufgaben zu erfüllen, die in völlig entgegengesetzte Richtungen zogen. Eine Verbesserung bei der einen führte zu einer Verschlechterung bei der anderen.
Teile und herrsche
Die Lösung für dieses Problem ist älter als die künstliche Intelligenz selbst. Es ist das Kernprinzip, das die Softwareentwicklung seit vierzig Jahren leitet. Wenn von einer Komponente zu viel verlangt wird, teilt man sie auf.
Ich habe „Chat with your Analyst“ komplett neu auf einer Multi-Agenten-Architektur aufgebaut. Anstelle eines einzigen Modells, das versucht, jede Anfrage zu bearbeiten, nutzt das System nun ein hochgradig koordiniertes Team spezialisierter Agenten.
Ein Orchestrator verwaltet den Nutzer, und ein Team von Unteragenten erledigt die Hauptarbeit.
Wie der Orchestrator tatsächlich funktioniert
Der Orchestrator ist der einzige Agent, der tatsächlich mit Ihnen spricht. Wenn Sie eine Nachricht senden, führt er einen strengen Prozess durch, um absolute Genauigkeit zu gewährleisten.
Zunächst interpretiert er Ihre Absicht und durchläuft eine Klärungsschleife. Wenn Ihre Eingabe vage ist, rät der Orchestrator nicht. Er weigert sich rundweg, eine Antwort zu erfinden, und bittet Sie stattdessen um Klarstellung. Diese strenge Grenze verhindert, dass jemals unbrauchbare Daten in das System gelangen.
Zweitens erstellt er einen Plan und verteilt die Arbeit parallel. Basierend auf Ihrer Absicht löst der Orchestrator die entsprechenden Unteragenten gleichzeitig aus. Wenn Sie nach numerischen Daten und einer schriftlichen Zusammenfassung fragen, wartet das System nicht, bis das eine fertig ist, bevor es mit dem anderen beginnt. Die Agenten laufen parallel.
Drittens setzt er die Antwort zusammen. Die Unteragenten geben ihre Ergebnisse als strukturierte interne Nachrichten zurück. Der Orchestrator überprüft die Daten und setzt die endgültige Ausgabe nahtlos zusammen.
Sie erleben ein einziges natürliches Gespräch. Im Hintergrund hat sich gerade ein ganzes Team von Spezialisten an die Arbeit für Sie gemacht.
Lernen Sie die Unteragenten kennen
Jeder Unteragent innerhalb von „Chat with your Analyst“ wird streng getestet und ist auf eine bestimmte analytische Fähigkeit ausgerichtet.
Der Analyst-Agent bearbeitet Ihre quantitativen Anfragen. Er erstellt die Logik zum Abrufen der richtigen Daten und berechnet die konkreten Zahlen. Er liefert exakt übereinstimmende Datensätze. Er erfindet keine Werte und liefert niemals Annäherungswerte.
Der Summariser-Agent übernimmt die Extraktion von Textinhalten. Er liest die relevanten Inhalte und erkennt Themen in Tausenden von Anrufen. Er ist ausschließlich auf qualitative Tiefe ausgelegt.
Der Investigator Agent ist unsere ultimative Waffe gegen Fehlinterpretationen. Dieser Sub-Agent taucht tief in die Rohtranskripte ein und extrahiert exakte Zitate, um überprüfbare Beweise zu liefern. Er beweist Ihnen, dass die Daten echt sind.
Die gesamte Architektur ist zudem von Grund auf mehrsprachig ausgelegt. Sie können eine Frage auf Englisch zu einer Datenbank mit niederländischen Kundengesprächen stellen, und die Agenten werden die Erkenntnisse nahtlos verarbeiten und übersetzen.
Warum dies den Daten-Trade-off behebt
Das ursprüngliche Problem bestand darin, dass ein einziges Modell nicht gleichzeitig sowohl in Mathematik als auch im Storytelling hervorragend sein konnte. Die Multi-Agenten-Architektur löst dies, indem sie es gar nicht mehr dazu auffordert, dies zu versuchen.
Der Analyst-Agent muss niemals eine Erzählung verfassen. Der Summariser-Agent muss niemals eine Formel berechnen. Der Kompromiss verschwand nicht, weil die zugrunde liegenden KI-Modelle auf magische Weise besser wurden. Er verschwand, weil ich die grundlegende Softwarearchitektur geändert habe.
Wir haben aufgehört, von einem Generalisten zu verlangen, ein Spezialist zu sein.
Wie es weitergeht
Die Roadmap für „Chat with your Analyst“ erstreckt sich in zwei sehr spannende Richtungen.
Die erste ist die geplante Berichterstellung. Sie werden bald in der Lage sein, dem Analysten eine Frage zu stellen, die Antwort zu überprüfen und dann genau diese Analyse so zu planen, dass sie jeden Montagmorgen ausgeführt und direkt in Ihren Posteingang gesendet wird.
Die längerfristige Richtung ist die vollständige Konvergenz mit Ihrem Flow Builder. Ein Sprachagenten-Flow generiert Analysen. Die Analysen beschreiben genau, was funktioniert und was nicht. Ein logischer nächster Schritt ist, dass der Analyst direkte Änderungen am Flow selbst vorschlägt. Ein Knotenpunkt, an dem Nutzer häufig abspringen, könnte mit einer empfohlenen Neugestaltung gekennzeichnet werden. Getestet und implementiert.
Die Grenze zwischen der Analyse Ihrer Abläufe und deren aktiver Verbesserung wird vollständig verschwinden.
Architektur schlägt immer das Modell
Es ist verlockend anzunehmen, dass mit zunehmender Größe von Sprachmodellen solche strukturellen Entscheidungen überflüssig werden. Man geht davon aus, dass ein riesiges Modell einfach jede Art von Frage perfekt bewältigen wird.
Das geht völlig am Kern der Sache vorbei.
Ein größeres Modell lässt sich immer noch nicht gleichzeitig für zwei widersprüchliche Ziele optimieren. Ein größeres Modell liefert immer noch viel bessere Ergebnisse, wenn die Arbeit in Schritte zerlegt wird, die unabhängig voneinander durchdacht, getestet und verbessert werden können.
Multi-Agenten-Orchestrierung ist keine vorübergehende Notlösung für aktuelle Modellbeschränkungen. Sie ist die Grundlage, auf der zuverlässige Systeme auf Unternehmensniveau aufgebaut werden. Softwareentwickler haben dies bereits vor Jahrzehnten gelernt. KI-Entwickler lernen es gerade neu.
Häufig gestellte Fragen
Was ist eine Multi-Agenten-Architektur in KI-Produkten? Ein Entwurfsmuster, bei dem mehrere spezialisierte KI-Agenten unter einem Koordinator zusammenarbeiten, anstatt dass ein einzelner Agent jede Aufgabe übernimmt. Jeder Agent ist für eine bestimmte Aufgabe optimiert, was die Zuverlässigkeit erheblich verbessert.
Was ist ein Orchestrator-Agent? Der Agent, der zwischen dem Nutzer und den spezialisierten Unteragenten sitzt. Er interpretiert die Absicht, führt Abklärungsschleifen durch, um fehlerhafte Eingaben zu verhindern, und löst die Ausführung der richtigen Unteragenten parallel aus.
Warum reicht ein einzelner KI-Agent für Analysen nicht aus? Quantitative Analysen erfordern strenge mathematische Präzision. Qualitative Analysen erfordern Nuancen und narrative Tiefe. Durch die Aufteilung der Arbeit auf spezialisierte Unteragenten wird der Kompromiss zwischen beiden vollständig beseitigt.
Wie verhindert dies Fehlinterpretationen? Die Multi-Agent-Architektur weist jedem Agenten eine eng gefasste Aufgabe zu, bei der Fehler seltener auftreten. Darüber hinaus lehnt der Orchestrator vage Eingaben ab, und der Subagent „Investigator“ liefert überprüfbare Belege, indem er exakte Zitate aus den rohen Konversationsprotokollen hervorhebt.
Was ist „Chat with your Analyst“? Die Produktfunktion „AssistYou“, mit der Nutzer ihre „AI Voice Agent“-Analysedaten über natürliche Sprache abfragen können. Anstatt Dashboards zu erstellen, stellen Nutzer direkt Fragen und erhalten Antworten, die auf ihren tatsächlichen Betriebsdaten basieren.
← Zurück zum Blog