Waarom één AI-agent niet genoeg is als je met je data communiceert — AssistYou
De meeste AI-producten waarmee je met je data kunt chatten, zijn op precies dezelfde manier gebouwd. Je neemt één groot taalmodel, koppelt dat aan je database en stelt er een vraag aan.
In een zorgvuldig geënsceneerde demo werkt het prachtig. In de praktijk faalt het onmiddellijk.
Ik heb dit de afgelopen maanden op de harde manier geleerd tijdens het bouwen van Chat with your Analyst. Dit is de productfunctie van AssistYou waarmee je de analytics van je spraakagent kunt opvragen in gewone taal.
Dit artikel is het eerlijke verhaal over wat er misging met onze eerste versie, waarom één enkele AI-agent het werk simpelweg niet aankan en de architecturale beslissing die het uiteindelijk heeft opgelost.
De valkuil van de enkele agent
Toen ik de eerste versie van deze functie bouwde, vertrouwde ik op één enkele agent. Eén groot taalmodel kreeg de vraag van de gebruiker, de relevante gegevens en een prompt met gedetailleerde instructies over hoe het zich moest gedragen.
Vrijwel onmiddellijk liep ik tegen een enorme technische muur aan. Er deden zich twee belangrijke storingsmodi voor.
De eerste was hallucinatie. Wanneer het model werd gevraagd om getallen te produceren die het niet direct kon berekenen, verzon het soms waarsijnlijk ogende waarden. Als een gebruiker vroeg naar een percentage opgeloste calls, spuwde het model vol vertrouwen een getal uit dat er correct uitzag, maar absoluut geen basis had in de werkelijkheid. In een enterprise analytics-product is dit catastrofaal. Je kunt geen zakelijke beslissingen nemen op basis van valse cijfers.
De tweede fout was de voortdurende afweging tussen kwantitatieve en kwalitatieve prestaties. Toen ik het systeem afstemde om de wiskundige nauwkeurigheid bij numerieke vragen te maximaliseren, verslechterde de kwaliteit van de verhalende samenvattingen. Toen ik het model afstemde om betere verhalende samenvattingen te schrijven, begonnen de cijfers af te wijken.
Ik vroeg exact hetzelfde model om twee taken uit te voeren die in volledig tegengestelde richtingen gaan. Als het beter werd in het ene, werd het slechter in het andere.
Verdeel en heers
De oplossing voor dit probleem is ouder dan kunstmatige intelligentie zelf. Het is het kernprincipe dat al veertig jaar de leidraad vormt voor software-engineering. Wanneer van één component te veel wordt gevraagd, splits je deze op.
Ik heb Chat with your Analyst volledig opnieuw opgebouwd rond een multi-agentarchitectuur. In plaats van één enkel model dat elke aanvraag probeert af te handelen, maakt het systeem nu gebruik van een goed gecoördineerd team van gespecialiseerde agents.
Een orchestrator beheert de gebruiker, en een team van sub-agenten doet het zware werk.
Hoe de Orchestrator Werkelijk Werkt
De orchestrator is de enige agent die daadwerkelijk met je praat. Wanneer je een bericht verstuurt, voert hij een strikt proces uit om totale nauwkeurigheid te garanderen.
Ten eerste interpreteert hij je intentie en doorloopt hij een verduidelijkingscyclus. Als je vraag vaag is, gaat de orchestrator niet gissen. Hij weigert ronduit een antwoord te verzinnen en vraagt je in plaats daarvan om verduidelijking. Deze strikte grens voorkomt dat ongewenste gegevens ooit het systeem binnenkomen.
Ten tweede stelt hij een plan op en verdeelt hij het werk parallel. Op basis van uw intentie activeert de orchestrator tegelijkertijd de juiste subagenten. Als u om numerieke gegevens en een schriftelijke samenvatting vraagt, wacht het systeem niet tot het ene klaar is voordat het andere begint. De agenten werken parallel.
Ten derde stelt hij het antwoord samen. De subagenten sturen hun resultaten terug als gestructureerde interne berichten. De orchestrator controleert de gegevens en stelt naadloos de uiteindelijke uitvoer samen.
U ervaart één natuurlijk gesprek. Achter de schermen is een heel team van specialisten voor u aan het werk gegaan.
Maak kennis met de subagenten
Elke subagent binnen Chat with your Analyst is grondig getest en gebouwd rond één specifieke analytische functie.
De Analyst Agent verwerkt uw kwantitatieve verzoeken. Hij bouwt de logica om de juiste gegevens op te halen en berekent de harde cijfers. Hij retourneert exact overeenkomende records. Hij verzint geen waarden en geeft nooit schattingen.
De Summariser Agent verwerkt narratieve extractie. Hij leest de relevante inhoud en signaleert thema’s in duizenden gesprekken. Hij is puur afgestemd op kwalitatieve diepgang.
De Investigator Agent is ons ultieme wapen tegen hallucinaties. Deze subagent duikt in de ruwe transcripties en haalt exacte citaten eruit om verifieerbaar bewijs te leveren. Hij bewijst u dat de gegevens echt zijn.
De gehele architectuur is bovendien meertalig ontworpen. U kunt een vraag in het Engels stellen over een database met Nederlandse klantgesprekken en de agents zullen de inzichten naadloos verwerken en vertalen.
Waarom dit de data-afweging oplost
Het oorspronkelijke probleem was dat één model niet zowel uitblinken in wiskunde als in storytelling kon. De multi-agentarchitectuur lost dit op door het model niet langer te vragen dit te proberen.
De Analyst-agent hoeft nooit een verhaal te schrijven. De Summariser-agent hoeft nooit een formule te berekenen. De afweging verdween niet omdat de onderliggende AI-modellen op magische wijze beter werden. Het verdween omdat ik de fundamentele softwarearchitectuur veranderde.
We zijn gestopt met het vragen aan een generalist om een specialist te zijn.
Waar we naartoe gaan
De roadmap voor Chat with your Analyst strekt zich uit in twee zeer spannende richtingen.
De eerste is geplande rapportage. Binnenkort kunt u de analist een vraag stellen, het antwoord verifiëren en vervolgens die exacte analyse zo instellen dat deze elke maandagochtend wordt uitgevoerd en rechtstreeks in uw inbox terechtkomt.
De richting op de langere termijn is totale convergentie met uw Flow Builder. Een voice agent-flow genereert analyses. De analyses beschrijven precies wat werkt en wat niet. Een logische volgende stap is dat de analist directe wijzigingen in de flow zelf voorstelt. Een knooppunt waar gebruikers vaak afhaken, kan worden gemarkeerd met een aanbevolen herontwerp. Getest en geïmplementeerd.
De grens tussen het analyseren van uw activiteiten en het actief verbeteren ervan zal volledig verdwijnen.
Architectuur wint altijd van het model
Het is verleidelijk om aan te nemen dat naarmate taalmodellen groter worden, dit soort structurele beslissingen overbodig zullen worden. Mensen gaan ervan uit dat een enorm model simpelweg elke soort vraag perfect zal afhandelen.
Dit gaat volledig voorbij aan de kern van de zaak.
Een groter model kan nog steeds niet worden geoptimaliseerd voor twee tegenstrijdige doelstellingen tegelijk. Een groter model levert nog steeds veel betere resultaten op wanneer het werk wordt opgesplitst in stappen die onafhankelijk van elkaar kunnen worden beredeneerd, getest en verbeterd.
Multi-agent-orkestratie is geen tijdelijke oplossing voor de huidige beperkingen van modellen. Het is de manier waarop betrouwbare systemen op bedrijfsniveau worden gebouwd. Software-engineers hebben dit decennia geleden geleerd. AI-engineers leren het nu opnieuw.
Veelgestelde vragen
Wat is een multi-agentarchitectuur in AI-producten? Een ontwerppatroon waarbij meerdere gespecialiseerde AI-agenten samenwerken onder leiding van een coördinator, in plaats van dat één enkele agent alle taken afhandelt. Elke agent is geoptimaliseerd voor een specifieke taak, wat de betrouwbaarheid drastisch verbetert.
Wat is een orchestrator-agent? De agent die zich tussen de gebruiker en de gespecialiseerde subagenten bevindt. Deze interpreteert de intentie, voert verduidelijkende loops uit om onjuiste invoer te voorkomen en activeert de juiste subagenten om parallel te draaien.
Waarom is één AI-agent niet voldoende voor analyses? Kwantitatieve analyse vereist strikte wiskundige precisie. Kwalitatieve analyse vereist nuance en narratieve diepgang. Door het werk te verdelen over gespecialiseerde subagenten wordt de afweging tussen deze twee volledig weggenomen.
Hoe voorkomt dit hallucinaties? De multi-agentarchitectuur geeft elke agent een specifieke taak die moeilijker verkeerd kan worden uitgevoerd. Bovendien weigert de orchestrator vage invoer en levert de subagent Investigator verifieerbaar bewijs door exacte citaten uit ruwe gesprekslogboeken naar voren te halen.
Wat is ‘Chat with your Analyst’? Dit is de productfunctie van ‘AssistYou’ waarmee gebruikers hun ‘AI Voice Agent’-analysedata kunnen opvragen via natuurlijke taal. In plaats van dashboards te bouwen, stellen gebruikers direct vragen en ontvangen ze antwoorden die zijn gebaseerd op hun daadwerkelijke operationele data.
← Terug naar blog