Tester un agent IA recrutement en 14 jours

Un POC de six mois pour un agent IA recrutement, c'est l'instrument de mesure préféré des éditeurs. Ils ont raison de l'aimer : plus c'est long, plus ils ont le temps de configurer autour de vos vraies questions. La bonne méthode tient en deux semaines, un mandat réel, et trois chiffres. Voici comment je l'ai mené chez des cabinets français en 2025-2026.

L'objectif : décider en quatorze jours si le produit fonctionne sur votre desk — sans laisser le commercial le temps de papoter.

Pourquoi quatorze jours, pas plus, pas moins

La première semaine, c'est du bruit. Tonalité, format du brief, préférences du client final — l'agent apprend ça en 5-7 jours. La deuxième semaine, c'est le premier vrai signal. Au-delà, on est soit en polissage incrémental, soit l'équipe services de l'éditeur compense un problème structurel.

Les benchmarks de l'APEC placent le délai moyen brief-vers-shortlist à 8-12 jours pour les cabinets français sur des rôles cadres. Deux semaines couvrent donc un cycle complet agent → revue humaine → feedback client. C'est l'unité de mesure qui compte.

Si vous ne voyez pas de signal réel en deux semaines d'usage honnête, l'agent ne va pas avec votre desk. Plus de temps ne résoudra pas ça.

Le setup : un desk, un mandat, trois chiffres

Choisissez un mandat représentatif. Pas votre mandat le plus dur (vous blâmerez l'outil). Pas votre mandat le plus facile (vous conclurez à tort que ça marche). Difficulté moyenne, consultant d'expérience moyenne sur le desk : c'est le bon signal.

Les trois chiffres à suivre

Indicateur	Mesure	Seuil de passage
Délai jusqu'à shortlist	Du brief envoyé aux 10 candidats classés	≥50 % plus rapide que la baseline
Taux d'acceptation client	% de la shortlist que le client veut interviewer	≥70 %
Taux de réponse à l'approche	% de réponses sous 7 jours	À 10 % près du meilleur consultant humain

Trois chiffres, pas douze. Ajoutez-en un quatrième et vous perdrez la semaine un à débattre de mesure plutôt qu'à faire tourner l'expérience.

Le déroulé jour par jour

Jours 1-2 : setup et brief

Onboarding de l'agent. Connectez LinkedIn, votre CRM existant, et l'email. Écrivez un brief unique de six lignes en langage clair. Sur-engineering du prompt = signal d'un agent qui n'est pas prêt.

Jours 3-5 : première shortlist et itération

L'agent génère la première shortlist. Le consultant revoit les 20 premiers en 15 minutes le matin. Marquez explicitement les faux positifs pour que le système apprenne. Les données LinkedIn Talent sont constantes : la boucle de feedback des 72 premières heures détermine 80 % de la qualité ultérieure.

Jours 6-9 : approche en vol

Validez la séquence d'approche. Surveillez le calibrage du ton de près — relisez les 5 premiers messages avant envoi, puis échantillonnez aléatoirement. Lisez les réponses pour l'adéquation du ton. Ajustez la voix si nécessaire.

Jours 10-12 : revue client

Envoyez la shortlist au client. Mesurez le taux d'acceptation honnêtement : combien veut-il interviewer ? En dessous de 70 %, l'agent source sur le mauvais brief, pas le mauvais mandat.

Jours 13-14 : décision

Asseyez-vous avec les trois chiffres. Deux sur trois validés = achat. Un sur trois = à configurer plus. Zéro sur trois = mauvais outil pour ce desk.

Les pièges à éviter

Laisser l'éditeur choisir le mandat

Si l'éditeur propose le rôle, vous aurez une victoire scénarisée. Choisissez votre propre mandat représentatif.

Mesurer l'activité plutôt que les résultats

« Combien de profils l'agent a fait remonter » est une métrique de vanité. Le taux d'acceptation client est le seul chiffre qui mappe sur les placements.

Démarrer sans baseline

Avant le jour 1, documentez : combien de temps prend votre meilleur consultant pour shortlister ce rôle ? Quel est son taux de réponse typique ? Sans ça, la comparaison est du vent.

Ignorer le calibrage du ton

Un agent de sourcing parfaitement précis associé à une approche maladroite tue votre marque en deux semaines. Passez disproportionnellement de temps de revue sur les templates de message.

Ce que « bon » donne au jour 14

Sur les cabinets français qui ont mené cette méthode avec Yena :

Délai jusqu'à shortlist divisé par 3 à 4 vs baseline
Taux d'acceptation client à 75-85 % sur des mandats représentatifs
Taux de réponse à 5 % près du meilleur consultant humain
Temps consultant total sur la search : 60-90 minutes

Ces chiffres n'apparaissent pas dans les decks éditeurs parce que les éditeurs testent sur des rôles parfaits. Sur un desk réel, c'est la fourchette honnête à attendre d'un agent fonctionnel.

FAQ

Puis-je tester en parallèle sur plusieurs mandats ?

Oui, mais le signal devient flou. Pour votre première éval, un mandat, un consultant, deux semaines. Échelle après la baseline.

Et si l'agent échoue au test — la tech n'est pas prête ?

Pas forcément. Un agent qui échoue sur la chasse cadre UK peut briller sur le staffing IT polonais. La bonne conclusion est « mauvais fit pour ce desk », pas « les agents ne marchent pas ».

Comment obtenir une vraie période de test de 14 jours ?

Demandez-la explicitement. La plupart des plateformes modernes (dont Yena) proposent une période de test de 10-14 jours sans appel commercial. Un éditeur qui n'offre que des POC payants 30-90 jours, vous passez votre chemin.

Faut-il inclure l'approche dans le test 14 jours ?

Oui. Le sourcing sans approche, c'est la moitié de l'agent. Le taux de réponse est le signal le plus honnête de la qualité des messages.

Quel est le mode d'échec de cette méthode ?

Vous sur-indexerez sur les particularités du desk choisi. Lancez un deuxième cycle de 14 jours sur un autre desk avant tout déploiement en cabinet entier.

Lancez le test, faites confiance aux chiffres

Si vous voulez le lancer sur Yena, la période de test de 10 jours couvre la phase de calibrage plus un cycle complet. La couche agent est dans l'essai gratuit — pas derrière un mur enterprise — parce que nous avons construit la méthode autour de consultants qui mènent leur propre test honnête, pas autour de decks commerciaux.

14 jours. Trois chiffres. Une décision.

L'objectif : décider en quatorze jours si le produit fonctionne sur votre desk — sans laisser le commercial le temps de papoter.

Pourquoi quatorze jours, pas plus, pas moins

Si vous ne voyez pas de signal réel en deux semaines d'usage honnête, l'agent ne va pas avec votre desk. Plus de temps ne résoudra pas ça.

Le setup : un desk, un mandat, trois chiffres

Les trois chiffres à suivre

Indicateur	Mesure	Seuil de passage
Délai jusqu'à shortlist	Du brief envoyé aux 10 candidats classés	≥50 % plus rapide que la baseline
Taux d'acceptation client	% de la shortlist que le client veut interviewer	≥70 %
Taux de réponse à l'approche	% de réponses sous 7 jours	À 10 % près du meilleur consultant humain

Trois chiffres, pas douze. Ajoutez-en un quatrième et vous perdrez la semaine un à débattre de mesure plutôt qu'à faire tourner l'expérience.

Le déroulé jour par jour

Jours 1-2 : setup et brief

Onboarding de l'agent. Connectez LinkedIn, votre CRM existant, et l'email. Écrivez un brief unique de six lignes en langage clair. Sur-engineering du prompt = signal d'un agent qui n'est pas prêt.

Jours 3-5 : première shortlist et itération

Jours 6-9 : approche en vol

Jours 10-12 : revue client

Envoyez la shortlist au client. Mesurez le taux d'acceptation honnêtement : combien veut-il interviewer ? En dessous de 70 %, l'agent source sur le mauvais brief, pas le mauvais mandat.

Jours 13-14 : décision

Asseyez-vous avec les trois chiffres. Deux sur trois validés = achat. Un sur trois = à configurer plus. Zéro sur trois = mauvais outil pour ce desk.

Les pièges à éviter

Laisser l'éditeur choisir le mandat

Si l'éditeur propose le rôle, vous aurez une victoire scénarisée. Choisissez votre propre mandat représentatif.

Mesurer l'activité plutôt que les résultats

« Combien de profils l'agent a fait remonter » est une métrique de vanité. Le taux d'acceptation client est le seul chiffre qui mappe sur les placements.

Démarrer sans baseline

Avant le jour 1, documentez : combien de temps prend votre meilleur consultant pour shortlister ce rôle ? Quel est son taux de réponse typique ? Sans ça, la comparaison est du vent.

Ignorer le calibrage du ton

Un agent de sourcing parfaitement précis associé à une approche maladroite tue votre marque en deux semaines. Passez disproportionnellement de temps de revue sur les templates de message.

Ce que « bon » donne au jour 14

Sur les cabinets français qui ont mené cette méthode avec Yena :

Délai jusqu'à shortlist divisé par 3 à 4 vs baseline
Taux d'acceptation client à 75-85 % sur des mandats représentatifs
Taux de réponse à 5 % près du meilleur consultant humain
Temps consultant total sur la search : 60-90 minutes

Ces chiffres n'apparaissent pas dans les decks éditeurs parce que les éditeurs testent sur des rôles parfaits. Sur un desk réel, c'est la fourchette honnête à attendre d'un agent fonctionnel.

FAQ

Puis-je tester en parallèle sur plusieurs mandats ?

Oui, mais le signal devient flou. Pour votre première éval, un mandat, un consultant, deux semaines. Échelle après la baseline.

Et si l'agent échoue au test — la tech n'est pas prête ?

Pas forcément. Un agent qui échoue sur la chasse cadre UK peut briller sur le staffing IT polonais. La bonne conclusion est « mauvais fit pour ce desk », pas « les agents ne marchent pas ».

Comment obtenir une vraie période de test de 14 jours ?

Faut-il inclure l'approche dans le test 14 jours ?

Oui. Le sourcing sans approche, c'est la moitié de l'agent. Le taux de réponse est le signal le plus honnête de la qualité des messages.

Quel est le mode d'échec de cette méthode ?

Vous sur-indexerez sur les particularités du desk choisi. Lancez un deuxième cycle de 14 jours sur un autre desk avant tout déploiement en cabinet entier.

Lancez le test, faites confiance aux chiffres

14 jours. Trois chiffres. Une décision.

Pourquoi quatorze jours, pas plus, pas moins

Le setup : un desk, un mandat, trois chiffres

Les trois chiffres à suivre

Le déroulé jour par jour

Jours 1-2 : setup et brief

Jours 3-5 : première shortlist et itération

Jours 6-9 : approche en vol

Jours 10-12 : revue client

Jours 13-14 : décision

Les pièges à éviter

Laisser l'éditeur choisir le mandat

Mesurer l'activité plutôt que les résultats

Démarrer sans baseline

Ignorer le calibrage du ton

Ce que « bon » donne au jour 14

FAQ

Puis-je tester en parallèle sur plusieurs mandats ?

Et si l'agent échoue au test — la tech n'est pas prête ?

Comment obtenir une vraie période de test de 14 jours ?

Faut-il inclure l'approche dans le test 14 jours ?

Quel est le mode d'échec de cette méthode ?

Lancez le test, faites confiance aux chiffres

Explore Yena

Sourcing candidats avec Yena Sourcer

Guide complet

Effets sur le métier

Continue Reading

Agent IA RH : comment ça change le métier en 2026

Agent IA recrutement : guide complet 2026

Intelligence artificielle recrutement : 12 cas d'usage

Réactiver votre vivier : 71 % des placements déjà là

Help recruiters make more placements.

Pourquoi quatorze jours, pas plus, pas moins

Le setup : un desk, un mandat, trois chiffres

Les trois chiffres à suivre

Le déroulé jour par jour

Jours 1-2 : setup et brief

Jours 3-5 : première shortlist et itération

Jours 6-9 : approche en vol

Jours 10-12 : revue client

Jours 13-14 : décision

Les pièges à éviter

Laisser l'éditeur choisir le mandat

Mesurer l'activité plutôt que les résultats

Démarrer sans baseline

Ignorer le calibrage du ton

Ce que « bon » donne au jour 14

FAQ

Puis-je tester en parallèle sur plusieurs mandats ?

Et si l'agent échoue au test — la tech n'est pas prête ?

Comment obtenir une vraie période de test de 14 jours ?

Faut-il inclure l'approche dans le test 14 jours ?

Quel est le mode d'échec de cette méthode ?

Lancez le test, faites confiance aux chiffres

Explore Yena

Sourcing candidats avec Yena Sourcer

Guide complet

Effets sur le métier

Continue Reading

Agent IA RH : comment ça change le métier en 2026

Agent IA recrutement : guide complet 2026

Intelligence artificielle recrutement : 12 cas d'usage

Réactiver votre vivier : 71 % des placements déjà là

Help recruiters make more placements.