Een POC van zes maanden is het verkeerde instrument voor een AI recruitment agent. Je hebt niet zo lang nodig om te weten of het op jouw desk werkt — en hoe langer je de evaluatie rekt, hoe meer de leverancier configureert rond je echte vragen. Twee weken op één desk, drie cijfers, één heldere beslissing.
Dit is de methode die ik zou draaien als ik morgen agentisch recruitment voor een Benelux-bureau kocht. Bewust strak. Lange POC's belonen sales, niet kopers.
Waarom precies veertien dagen
Week één is kalibratieruis. Toon, briefingformaat, voorkeuren van de klant — de agent leert dat in 5-7 dagen. Week twee is het eerste echte signaal. Wat daarna komt is óf incrementeel polijsten, óf het servicesteam van de leverancier compenseert een structureel probleem.
Eurofound-data plaatst de gemiddelde Europese tijd tot shortlist op 8-12 dagen voor bureaurollen. Twee weken dekken dus een volledige cyclus agent → menselijke review → klant-feedback. Dat is de meeteenheid die telt.
Als je in twee weken eerlijke inzet geen echt signaal ziet, past de agent niet bij jouw desk. Meer tijd lost dat niet op.
De opzet: één desk, één mandaat, drie cijfers
Kies een representatief mandaat. Niet je moeilijkste (dan geef je de tool de schuld). Niet je makkelijkste (dan trek je foutief de conclusie dat het werkt). Middelhoge moeilijkheid, recruiter met gemiddelde anciënniteit: dat is het juiste signaal.
De drie cijfers die je volgt
| Kengetal | Hoe meten | Slaagdrempel |
|---|---|---|
| Tijd tot shortlist | Vanaf briefing tot top-10 klaar | ≥50 % sneller dan baseline |
| Klant-acceptatiegraad | % van shortlist klant wil interviewen | ≥70 % |
| Outreach-reactiepercentage | % antwoord binnen 7 dagen | Binnen 10 % van beste menselijke recruiter |
Drie cijfers, geen twaalf. Voeg een vierde toe en je verspilt week één met meet-discussies.
Het dag-voor-dag draaiboek
Dag 1-2: setup en briefing
Onboard de agent. Verbind LinkedIn, bestaand CRM en e-mail. Schrijf één briefing van zes regels in heldere taal. Geen over-engineering van het prompt — agenten die 800-woord systeemprompts nodig hebben om zich te gedragen, zijn niet klaar.
Dag 3-5: eerste shortlist en iteratie
De agent genereert de eerste shortlist. Recruiter beoordeelt top 20 in een ochtendsessie van 15 minuten. Markeer expliciet false positives zodat het systeem leert. LinkedIn Talent data is consistent: de feedbackloop in de eerste 72 uur bepaalt 80 % van de latere kwaliteit.
Dag 6-9: outreach in vlucht
Keur de outreach-sequentie goed. Volg toonkalibratie nauwkeurig — lees de eerste 5 berichten vóór verzending, sample daarna willekeurig. Lees antwoorden op toonpassendheid. Pas stem aan indien nodig.
Dag 10-12: klant-review
Stuur shortlist naar de klant. Meet acceptatiegraad eerlijk: hoeveel willen ze daadwerkelijk interviewen? Onder 70 % zoekt de agent op de verkeerde briefing, niet het verkeerde mandaat.
Dag 13-14: beslissing
Ga zitten met de drie cijfers. Twee van drie geslaagd = koop. Eén van drie = meer configuratie nodig. Nul van drie = verkeerde tool voor deze desk.
De valkuilen
De leverancier de desk laten kiezen
Als de leverancier de rol voorstelt, krijg je een gecureerde winst. Kies je eigen representatieve mandaat.
Activiteit meten in plaats van uitkomsten
"Hoeveel profielen heeft de agent opgeleverd" is een ijdelheidsmetriek. Klant-acceptatiegraad is het enige cijfer dat naar plaatsingen mapt.
Zonder baseline draaien
Voor dag 1 documenteer: hoe lang doet je beste recruiter momenteel over shortlisten van deze rol? Wat is hun typische reactiepercentage? Zonder dat is de vergelijking lucht.
Toonkalibratie negeren
Een perfect accurate sourcing-agent gekoppeld aan ongemakkelijke outreach doodt je merk in twee weken. Besteed disproportioneel veel reviewtijd aan de berichttemplates.
Hoe "goed" eruitziet op dag 14
Vanuit Benelux-bureaus die deze methode met Yena draaien:
- Tijd tot shortlist 60-75 % omlaag vs baseline
- Klant-acceptatiegraad 75-85 % op representatieve rollen
- Reactiepercentage binnen 5 % van beste menselijke recruiter
- Recruiter besteedde in totaal 60-90 minuten aan de zoekopdracht
Die cijfers staan niet in de decks van leveranciers omdat leveranciers testen op perfecte rollen. Draai de test op een echte desk en bovenstaande is het eerlijke bereik dat je van een werkende agent mag verwachten.
FAQ
Kan ik dit parallel op meerdere mandaten draaien?
Ja, maar het signaal wordt troebeler. Voor je eerste eval: één rol, één recruiter, twee weken. Schaal na de baseline.
En als de agent zakt — is de techniek niet klaar?
Niet per se. Verschillende agenten passen bij verschillende markten. Een platform dat zakt op UK exec search kan schitteren op Pools IT-staffing. De juiste conclusie is "verkeerde fit voor deze desk".
Hoe krijg ik een echte 14-dagen-proef van een leverancier?
Vraag er expliciet om. De meeste moderne platforms (waaronder Yena) leveren een 10-14 dagen-proef zonder sales call. Een leverancier die alleen betaalde POC's van 30-90 dagen aanbiedt? Doorlopen.
Moet ik outreach opnemen in de 14-dagen-test?
Ja. Sourcing zonder outreach is de halve agent. Het reactiepercentage is het eerlijkste signaal van berichtkwaliteit.
Wat is het faalpatroon van deze methode?
Je gaat over-indexeren op de eigenaardigheden van de gekozen desk. Draai een tweede 14-dagen-cyclus op een andere desk vóór bureau-brede uitrol.
Draai de test, vertrouw de cijfers
Als je het op Yena wilt draaien, is de 10-daagse proef genoeg voor de kalibratiefase plus één volledige cyclus. De agent-laag zit in de gratis proef — niet achter een enterprise-poort — omdat we de methode bouwden rond recruiters die hun eigen eerlijke test draaien, niet rond verkoopdecks.
14 dagen. Drie cijfers. Eén beslissing.