Evaluar un agente IA de reclutamiento en 14 días

Un POC de seis meses para un agente IA de reclutamiento es el instrumento de medida preferido del proveedor. Tienen razón en quererlo: cuanto más largo, más tiempo para configurar alrededor de sus preguntas reales. La metodología correcta cabe en dos semanas, un mandato real, tres números. Aquí va, tal como la he llevado en despachos españoles en 2025-2026.

Objetivo: decidir en catorce días si el producto funciona en su desk — sin dejarle al comercial tiempo para conversación.

Por qué catorce días y no más

La primera semana es ruido de calibración. Tono, formato de briefing, preferencias de cliente — el agente aprende eso en 5-7 días. La segunda semana es la primera señal real. Más allá: o es pulido incremental, o el equipo de servicios del proveedor está tapando un problema estructural.

Los benchmarks SHRM colocan el tiempo medio europeo hasta shortlist en 8-12 días para roles de cabinet. Dos semanas cubren un ciclo completo agente → revisión humana → feedback cliente. Es la unidad de trabajo que importa.

Si no ve señal real en dos semanas de uso honesto, el agente no encaja con su desk. Más tiempo no lo arregla.

El setup: un desk, un mandato, tres números

Elija un mandato representativo. No el más difícil (culpará a la herramienta). No el más fácil (concluirá falsamente que funciona). Dificultad media, consultor con antigüedad media: ahí está la señal correcta.

Los tres números a seguir

Indicador	Medida	Umbral de paso
Tiempo hasta shortlist	Desde briefing enviado a 10 clasificados	≥50 % más rápido que baseline
Tasa aceptación cliente	% de shortlist que el cliente quiere entrevistar	≥70 %
Tasa de respuesta outreach	% de respuestas en 7 días	Dentro del 10 % del mejor consultor humano

Tres números, no doce. Añada un cuarto y perderá la semana uno discutiendo la medición en lugar de ejecutar el experimento.

El cuadro día a día

Días 1-2: setup y briefing

Onboarding del agente. Conecte LinkedIn, su CRM existente y email. Escriba un único briefing de seis líneas en lenguaje claro. Nada de sobre-ingeniería del prompt — agentes que necesitan 800 palabras de system prompt no están listos.

Días 3-5: primera shortlist e iteración

El agente genera la primera shortlist. El consultor revisa los 20 primeros en una sesión matinal de 15 minutos. Marque explícitamente los falsos positivos para que el sistema aprenda. Los datos LinkedIn Talent son consistentes: la retroalimentación de las primeras 72 horas determina el 80 % de la calidad posterior.

Días 6-9: outreach en vuelo

Apruebe la secuencia de outreach. Vigile la calibración del tono — relea los 5 primeros mensajes antes del envío, después muestre aleatoriamente. Lea respuestas para adecuación del tono. Ajuste la voz si hace falta.

Días 10-12: revisión cliente

Envíe shortlist al cliente. Mida tasa de aceptación con honestidad: ¿cuántos quiere entrevistar realmente? Por debajo del 70 % el agente busca con el briefing equivocado, no el mandato equivocado.

Días 13-14: decisión

Siéntese con los tres números. Dos de tres pasan = compra. Uno de tres = necesita más configuración. Cero de tres = herramienta equivocada para este desk.

Las trampas que evitar

Dejar que el proveedor elija el desk

Si el proveedor propone el rol, obtendrá una victoria escenificada. Elija su propio mandato representativo.

Medir actividad en lugar de resultados

"Cuántos perfiles ha sacado el agente" es una métrica de vanidad. La tasa de aceptación del cliente es el único número que mapea a colocaciones.

Empezar sin baseline

Antes del día 1, documente: ¿cuánto tarda su mejor consultor en shortlistar este rol? ¿Cuál es su tasa de respuesta típica? Sin eso, la comparación es aire.

Ignorar la calibración del tono

Un agente de sourcing perfectamente preciso combinado con outreach incómodo mata su marca en dos semanas. Dedique tiempo de revisión desproporcionado a los templates de mensaje.

Cómo se ve "bueno" al día 14

De los despachos españoles que han ejecutado esta metodología con Yena:

Tiempo hasta shortlist 60-75 % menos vs baseline
Tasa de aceptación cliente 75-85 % en mandatos representativos
Tasa de respuesta dentro del 5 % del mejor consultor humano
Tiempo total del consultor en la búsqueda: 60-90 minutos

Esos números no aparecen en los decks de proveedores porque los proveedores prueban contra roles perfectos. Sobre un desk real, lo de arriba es el rango honesto a esperar de un agente que funciona.

FAQ

¿Puedo correr este test en paralelo sobre varios mandatos?

Sí, pero la señal se enturbia. Para su primera evaluación: un rol, un consultor, dos semanas. Escale después de la baseline.

¿Y si el agente suspende la prueba — no está lista la tecnología?

No necesariamente. Distintos agentes encajan en distintos mercados. Un agente que falla en exec search UK puede brillar en staffing IT polaco. La conclusión correcta es "mal encaje para este desk".

¿Cómo conseguir un prueba real de 14 días de un proveedor?

Pídala explícitamente. La mayoría de plataformas modernas (incluida Yena) entregan prueba de 10-14 días sin llamada comercial. Un proveedor que solo ofrece POC pagados de 30-90 días: pase de largo.

¿Debe incluirse outreach en el test de 14 días?

Sí. Sourcing sin outreach es la mitad del agente. La tasa de respuesta es la señal más honesta de calidad del mensaje.

¿Cuál es el modo de fallo de esta metodología?

Sobre-indexará en las particularidades del desk elegido. Ejecute un segundo ciclo de 14 días sobre otro desk antes del despliegue en todo el despacho.

Ejecute el test, confíe en los números

Si quiere ejecutarlo sobre Yena, los 10 días de prueba cubren la fase de calibración más un ciclo completo. La capa de agente está en la prueba gratuita — no detrás de un muro enterprise — porque construimos la metodología alrededor de consultores que ejecutan su propia prueba honesta, no de decks comerciales.

14 días. Tres números. Una decisión.

Objetivo: decidir en catorce días si el producto funciona en su desk — sin dejarle al comercial tiempo para conversación.

Por qué catorce días y no más

Si no ve señal real en dos semanas de uso honesto, el agente no encaja con su desk. Más tiempo no lo arregla.

El setup: un desk, un mandato, tres números

Los tres números a seguir

Indicador	Medida	Umbral de paso
Tiempo hasta shortlist	Desde briefing enviado a 10 clasificados	≥50 % más rápido que baseline
Tasa aceptación cliente	% de shortlist que el cliente quiere entrevistar	≥70 %
Tasa de respuesta outreach	% de respuestas en 7 días	Dentro del 10 % del mejor consultor humano

Tres números, no doce. Añada un cuarto y perderá la semana uno discutiendo la medición en lugar de ejecutar el experimento.

El cuadro día a día

Días 1-2: setup y briefing

Días 3-5: primera shortlist e iteración

Días 6-9: outreach en vuelo

Días 10-12: revisión cliente

Días 13-14: decisión

Siéntese con los tres números. Dos de tres pasan = compra. Uno de tres = necesita más configuración. Cero de tres = herramienta equivocada para este desk.

Las trampas que evitar

Dejar que el proveedor elija el desk

Si el proveedor propone el rol, obtendrá una victoria escenificada. Elija su propio mandato representativo.

Medir actividad en lugar de resultados

"Cuántos perfiles ha sacado el agente" es una métrica de vanidad. La tasa de aceptación del cliente es el único número que mapea a colocaciones.

Empezar sin baseline

Antes del día 1, documente: ¿cuánto tarda su mejor consultor en shortlistar este rol? ¿Cuál es su tasa de respuesta típica? Sin eso, la comparación es aire.

Ignorar la calibración del tono

Un agente de sourcing perfectamente preciso combinado con outreach incómodo mata su marca en dos semanas. Dedique tiempo de revisión desproporcionado a los templates de mensaje.

Cómo se ve "bueno" al día 14

De los despachos españoles que han ejecutado esta metodología con Yena:

Tiempo hasta shortlist 60-75 % menos vs baseline
Tasa de aceptación cliente 75-85 % en mandatos representativos
Tasa de respuesta dentro del 5 % del mejor consultor humano
Tiempo total del consultor en la búsqueda: 60-90 minutos

Esos números no aparecen en los decks de proveedores porque los proveedores prueban contra roles perfectos. Sobre un desk real, lo de arriba es el rango honesto a esperar de un agente que funciona.

FAQ

¿Puedo correr este test en paralelo sobre varios mandatos?

Sí, pero la señal se enturbia. Para su primera evaluación: un rol, un consultor, dos semanas. Escale después de la baseline.

¿Y si el agente suspende la prueba — no está lista la tecnología?

No necesariamente. Distintos agentes encajan en distintos mercados. Un agente que falla en exec search UK puede brillar en staffing IT polaco. La conclusión correcta es "mal encaje para este desk".

¿Cómo conseguir un prueba real de 14 días de un proveedor?

¿Debe incluirse outreach en el test de 14 días?

Sí. Sourcing sin outreach es la mitad del agente. La tasa de respuesta es la señal más honesta de calidad del mensaje.

¿Cuál es el modo de fallo de esta metodología?

Sobre-indexará en las particularidades del desk elegido. Ejecute un segundo ciclo de 14 días sobre otro desk antes del despliegue en todo el despacho.

Ejecute el test, confíe en los números

14 días. Tres números. Una decisión.

Por qué catorce días y no más

El setup: un desk, un mandato, tres números

Los tres números a seguir

El cuadro día a día

Días 1-2: setup y briefing

Días 3-5: primera shortlist e iteración

Días 6-9: outreach en vuelo

Días 10-12: revisión cliente

Días 13-14: decisión

Las trampas que evitar

Dejar que el proveedor elija el desk

Medir actividad en lugar de resultados

Empezar sin baseline

Ignorar la calibración del tono

Cómo se ve "bueno" al día 14

FAQ

¿Puedo correr este test en paralelo sobre varios mandatos?

¿Y si el agente suspende la prueba — no está lista la tecnología?

¿Cómo conseguir un prueba real de 14 días de un proveedor?

¿Debe incluirse outreach en el test de 14 días?

¿Cuál es el modo de fallo de esta metodología?

Ejecute el test, confíe en los números

Explore Yena

Búsqueda de candidatos con Yena Sourcer

Guía de compradores

Headhunting España

Continue Reading

Agente IA de reclutamiento: guía de compradores 2026

Reclutamiento con IA: agentes autónomos en España 2026

Sourcing de candidatos con IA: perfiles pasivos 2026

Help recruiters make more placements.

Por qué catorce días y no más

El setup: un desk, un mandato, tres números

Los tres números a seguir

El cuadro día a día

Días 1-2: setup y briefing

Días 3-5: primera shortlist e iteración

Días 6-9: outreach en vuelo

Días 10-12: revisión cliente

Días 13-14: decisión

Las trampas que evitar

Dejar que el proveedor elija el desk

Medir actividad en lugar de resultados

Empezar sin baseline

Ignorar la calibración del tono

Cómo se ve "bueno" al día 14

FAQ

¿Puedo correr este test en paralelo sobre varios mandatos?

¿Y si el agente suspende la prueba — no está lista la tecnología?

¿Cómo conseguir un prueba real de 14 días de un proveedor?

¿Debe incluirse outreach en el test de 14 días?

¿Cuál es el modo de fallo de esta metodología?

Ejecute el test, confíe en los números

Explore Yena

Búsqueda de candidatos con Yena Sourcer

Guía de compradores

Headhunting España

Continue Reading

Agente IA de reclutamiento: guía de compradores 2026

Reclutamiento con IA: agentes autónomos en España 2026

Sourcing de candidatos con IA: perfiles pasivos 2026

Help recruiters make more placements.