Un POC de seis meses para un agente IA de reclutamiento es el instrumento de medida preferido del proveedor. Tienen razón en quererlo: cuanto más largo, más tiempo para configurar alrededor de sus preguntas reales. La metodología correcta cabe en dos semanas, un mandato real, tres números. Aquí va, tal como la he llevado en despachos españoles en 2025-2026.
Objetivo: decidir en catorce días si el producto funciona en su desk — sin dejarle al comercial tiempo para conversación.
Por qué catorce días y no más
La primera semana es ruido de calibración. Tono, formato de briefing, preferencias de cliente — el agente aprende eso en 5-7 días. La segunda semana es la primera señal real. Más allá: o es pulido incremental, o el equipo de servicios del proveedor está tapando un problema estructural.
Los benchmarks SHRM colocan el tiempo medio europeo hasta shortlist en 8-12 días para roles de cabinet. Dos semanas cubren un ciclo completo agente → revisión humana → feedback cliente. Es la unidad de trabajo que importa.
Si no ve señal real en dos semanas de uso honesto, el agente no encaja con su desk. Más tiempo no lo arregla.
El setup: un desk, un mandato, tres números
Elija un mandato representativo. No el más difícil (culpará a la herramienta). No el más fácil (concluirá falsamente que funciona). Dificultad media, consultor con antigüedad media: ahí está la señal correcta.
Los tres números a seguir
| Indicador | Medida | Umbral de paso |
|---|---|---|
| Tiempo hasta shortlist | Desde briefing enviado a 10 clasificados | ≥50 % más rápido que baseline |
| Tasa aceptación cliente | % de shortlist que el cliente quiere entrevistar | ≥70 % |
| Tasa de respuesta outreach | % de respuestas en 7 días | Dentro del 10 % del mejor consultor humano |
Tres números, no doce. Añada un cuarto y perderá la semana uno discutiendo la medición en lugar de ejecutar el experimento.
El cuadro día a día
Días 1-2: setup y briefing
Onboarding del agente. Conecte LinkedIn, su CRM existente y email. Escriba un único briefing de seis líneas en lenguaje claro. Nada de sobre-ingeniería del prompt — agentes que necesitan 800 palabras de system prompt no están listos.
Días 3-5: primera shortlist e iteración
El agente genera la primera shortlist. El consultor revisa los 20 primeros en una sesión matinal de 15 minutos. Marque explícitamente los falsos positivos para que el sistema aprenda. Los datos LinkedIn Talent son consistentes: la retroalimentación de las primeras 72 horas determina el 80 % de la calidad posterior.
Días 6-9: outreach en vuelo
Apruebe la secuencia de outreach. Vigile la calibración del tono — relea los 5 primeros mensajes antes del envío, después muestre aleatoriamente. Lea respuestas para adecuación del tono. Ajuste la voz si hace falta.
Días 10-12: revisión cliente
Envíe shortlist al cliente. Mida tasa de aceptación con honestidad: ¿cuántos quiere entrevistar realmente? Por debajo del 70 % el agente busca con el briefing equivocado, no el mandato equivocado.
Días 13-14: decisión
Siéntese con los tres números. Dos de tres pasan = compra. Uno de tres = necesita más configuración. Cero de tres = herramienta equivocada para este desk.
Las trampas que evitar
Dejar que el proveedor elija el desk
Si el proveedor propone el rol, obtendrá una victoria escenificada. Elija su propio mandato representativo.
Medir actividad en lugar de resultados
"Cuántos perfiles ha sacado el agente" es una métrica de vanidad. La tasa de aceptación del cliente es el único número que mapea a colocaciones.
Empezar sin baseline
Antes del día 1, documente: ¿cuánto tarda su mejor consultor en shortlistar este rol? ¿Cuál es su tasa de respuesta típica? Sin eso, la comparación es aire.
Ignorar la calibración del tono
Un agente de sourcing perfectamente preciso combinado con outreach incómodo mata su marca en dos semanas. Dedique tiempo de revisión desproporcionado a los templates de mensaje.
Cómo se ve "bueno" al día 14
De los despachos españoles que han ejecutado esta metodología con Yena:
- Tiempo hasta shortlist 60-75 % menos vs baseline
- Tasa de aceptación cliente 75-85 % en mandatos representativos
- Tasa de respuesta dentro del 5 % del mejor consultor humano
- Tiempo total del consultor en la búsqueda: 60-90 minutos
Esos números no aparecen en los decks de proveedores porque los proveedores prueban contra roles perfectos. Sobre un desk real, lo de arriba es el rango honesto a esperar de un agente que funciona.
FAQ
¿Puedo correr este test en paralelo sobre varios mandatos?
Sí, pero la señal se enturbia. Para su primera evaluación: un rol, un consultor, dos semanas. Escale después de la baseline.
¿Y si el agente suspende la prueba — no está lista la tecnología?
No necesariamente. Distintos agentes encajan en distintos mercados. Un agente que falla en exec search UK puede brillar en staffing IT polaco. La conclusión correcta es "mal encaje para este desk".
¿Cómo conseguir un prueba real de 14 días de un proveedor?
Pídala explícitamente. La mayoría de plataformas modernas (incluida Yena) entregan prueba de 10-14 días sin llamada comercial. Un proveedor que solo ofrece POC pagados de 30-90 días: pase de largo.
¿Debe incluirse outreach en el test de 14 días?
Sí. Sourcing sin outreach es la mitad del agente. La tasa de respuesta es la señal más honesta de calidad del mensaje.
¿Cuál es el modo de fallo de esta metodología?
Sobre-indexará en las particularidades del desk elegido. Ejecute un segundo ciclo de 14 días sobre otro desk antes del despliegue en todo el despacho.
Ejecute el test, confíe en los números
Si quiere ejecutarlo sobre Yena, los 10 días de prueba cubren la fase de calibración más un ciclo completo. La capa de agente está en la prueba gratuita — no detrás de un muro enterprise — porque construimos la metodología alrededor de consultores que ejecutan su propia prueba honesta, no de decks comerciales.
14 días. Tres números. Una decisión.