Un POC de six mois pour un agent IA recrutement, c'est l'instrument de mesure préféré des éditeurs. Ils ont raison de l'aimer : plus c'est long, plus ils ont le temps de configurer autour de vos vraies questions. La bonne méthode tient en deux semaines, un mandat réel, et trois chiffres. Voici comment je l'ai mené chez des cabinets français en 2025-2026.
L'objectif : décider en quatorze jours si le produit fonctionne sur votre desk — sans laisser le commercial le temps de papoter.
Pourquoi quatorze jours, pas plus, pas moins
La première semaine, c'est du bruit. Tonalité, format du brief, préférences du client final — l'agent apprend ça en 5-7 jours. La deuxième semaine, c'est le premier vrai signal. Au-delà, on est soit en polissage incrémental, soit l'équipe services de l'éditeur compense un problème structurel.
Les benchmarks de l'APEC placent le délai moyen brief-vers-shortlist à 8-12 jours pour les cabinets français sur des rôles cadres. Deux semaines couvrent donc un cycle complet agent → revue humaine → feedback client. C'est l'unité de mesure qui compte.
Si vous ne voyez pas de signal réel en deux semaines d'usage honnête, l'agent ne va pas avec votre desk. Plus de temps ne résoudra pas ça.
Le setup : un desk, un mandat, trois chiffres
Choisissez un mandat représentatif. Pas votre mandat le plus dur (vous blâmerez l'outil). Pas votre mandat le plus facile (vous conclurez à tort que ça marche). Difficulté moyenne, consultant d'expérience moyenne sur le desk : c'est le bon signal.
Les trois chiffres à suivre
| Indicateur | Mesure | Seuil de passage |
|---|---|---|
| Délai jusqu'à shortlist | Du brief envoyé aux 10 candidats classés | ≥50 % plus rapide que la baseline |
| Taux d'acceptation client | % de la shortlist que le client veut interviewer | ≥70 % |
| Taux de réponse à l'approche | % de réponses sous 7 jours | À 10 % près du meilleur consultant humain |
Trois chiffres, pas douze. Ajoutez-en un quatrième et vous perdrez la semaine un à débattre de mesure plutôt qu'à faire tourner l'expérience.
Le déroulé jour par jour
Jours 1-2 : setup et brief
Onboarding de l'agent. Connectez LinkedIn, votre CRM existant, et l'email. Écrivez un brief unique de six lignes en langage clair. Sur-engineering du prompt = signal d'un agent qui n'est pas prêt.
Jours 3-5 : première shortlist et itération
L'agent génère la première shortlist. Le consultant revoit les 20 premiers en 15 minutes le matin. Marquez explicitement les faux positifs pour que le système apprenne. Les données LinkedIn Talent sont constantes : la boucle de feedback des 72 premières heures détermine 80 % de la qualité ultérieure.
Jours 6-9 : approche en vol
Validez la séquence d'approche. Surveillez le calibrage du ton de près — relisez les 5 premiers messages avant envoi, puis échantillonnez aléatoirement. Lisez les réponses pour l'adéquation du ton. Ajustez la voix si nécessaire.
Jours 10-12 : revue client
Envoyez la shortlist au client. Mesurez le taux d'acceptation honnêtement : combien veut-il interviewer ? En dessous de 70 %, l'agent source sur le mauvais brief, pas le mauvais mandat.
Jours 13-14 : décision
Asseyez-vous avec les trois chiffres. Deux sur trois validés = achat. Un sur trois = à configurer plus. Zéro sur trois = mauvais outil pour ce desk.
Les pièges à éviter
Laisser l'éditeur choisir le mandat
Si l'éditeur propose le rôle, vous aurez une victoire scénarisée. Choisissez votre propre mandat représentatif.
Mesurer l'activité plutôt que les résultats
« Combien de profils l'agent a fait remonter » est une métrique de vanité. Le taux d'acceptation client est le seul chiffre qui mappe sur les placements.
Démarrer sans baseline
Avant le jour 1, documentez : combien de temps prend votre meilleur consultant pour shortlister ce rôle ? Quel est son taux de réponse typique ? Sans ça, la comparaison est du vent.
Ignorer le calibrage du ton
Un agent de sourcing parfaitement précis associé à une approche maladroite tue votre marque en deux semaines. Passez disproportionnellement de temps de revue sur les templates de message.
Ce que « bon » donne au jour 14
Sur les cabinets français qui ont mené cette méthode avec Yena :
- Délai jusqu'à shortlist divisé par 3 à 4 vs baseline
- Taux d'acceptation client à 75-85 % sur des mandats représentatifs
- Taux de réponse à 5 % près du meilleur consultant humain
- Temps consultant total sur la search : 60-90 minutes
Ces chiffres n'apparaissent pas dans les decks éditeurs parce que les éditeurs testent sur des rôles parfaits. Sur un desk réel, c'est la fourchette honnête à attendre d'un agent fonctionnel.
FAQ
Puis-je tester en parallèle sur plusieurs mandats ?
Oui, mais le signal devient flou. Pour votre première éval, un mandat, un consultant, deux semaines. Échelle après la baseline.
Et si l'agent échoue au test — la tech n'est pas prête ?
Pas forcément. Un agent qui échoue sur la chasse cadre UK peut briller sur le staffing IT polonais. La bonne conclusion est « mauvais fit pour ce desk », pas « les agents ne marchent pas ».
Comment obtenir une vraie période de test de 14 jours ?
Demandez-la explicitement. La plupart des plateformes modernes (dont Yena) proposent une période de test de 10-14 jours sans appel commercial. Un éditeur qui n'offre que des POC payants 30-90 jours, vous passez votre chemin.
Faut-il inclure l'approche dans le test 14 jours ?
Oui. Le sourcing sans approche, c'est la moitié de l'agent. Le taux de réponse est le signal le plus honnête de la qualité des messages.
Quel est le mode d'échec de cette méthode ?
Vous sur-indexerez sur les particularités du desk choisi. Lancez un deuxième cycle de 14 jours sur un autre desk avant tout déploiement en cabinet entier.
Lancez le test, faites confiance aux chiffres
Si vous voulez le lancer sur Yena, la période de test de 10 jours couvre la phase de calibrage plus un cycle complet. La couche agent est dans l'essai gratuit — pas derrière un mur enterprise — parce que nous avons construit la méthode autour de consultants qui mènent leur propre test honnête, pas autour de decks commerciaux.
14 jours. Trois chiffres. Une décision.