Um POC de seis meses para um agente IA de recrutamento é o instrumento de medida preferido do fornecedor. Têm razão em gostar dele: quanto mais longo, mais tempo para configurar à volta das suas perguntas reais. A metodologia certa cabe em duas semanas, um mandato real, três números. Eis como a tenho conduzido em consultoras portuguesas em 2025-2026.
O objetivo: decidir em catorze dias se o produto funciona no seu desk — sem dar ao comercial tempo para conversa.
Porquê catorze dias
A primeira semana é ruído de calibração. Tom, formato de briefing, preferências do cliente — o agente aprende isso em 5-7 dias. A segunda semana é o primeiro sinal real. Para além: ou é polimento incremental, ou a equipa de serviços do fornecedor está a tapar um problema estrutural.
Os benchmarks SHRM colocam o tempo médio europeu até shortlist em 8-12 dias para funções de consultora. Duas semanas cobrem um ciclo completo agente → revisão humana → feedback do cliente. É a unidade de trabalho que conta.
Se em duas semanas de uso honesto não vir um sinal real, o agente não encaixa neste desk. Mais tempo não resolve isso.
O setup: um desk, um mandato, três números
Escolha um mandato representativo. Não o mais difícil (vai culpar a ferramenta). Não o mais fácil (vai concluir falsamente que funciona). Dificuldade média, consultor com antiguidade média: é aí que está o sinal certo.
Os três números a seguir
| Indicador | Medição | Limite de passagem |
|---|---|---|
| Tempo até shortlist | Do briefing enviado a 10 classificados | ≥50 % mais rápido que baseline |
| Aceitação do cliente | % da shortlist que o cliente quer entrevistar | ≥70 % |
| Resposta outreach | % de respostas em 7 dias | A 10 % do melhor consultor humano |
Três números, não doze. Junte um quarto e perde a semana um a debater medição em vez de executar o ensaio.
O guião dia a dia
Dias 1-2: setup e briefing
Onboarding do agente. Ligue LinkedIn, o CRM existente e o e-mail. Escreva um único briefing de seis linhas em linguagem clara. Nada de over-engineering do prompt — agentes que precisam de prompts de sistema com 800 palavras não estão prontos.
Dias 3-5: primeira shortlist e iteração
O agente gera a primeira shortlist. Consultor revê os 20 primeiros numa sessão matinal de 15 minutos. Sinalize explicitamente falsos positivos para o sistema aprender. Os dados LinkedIn Talent são consistentes: o loop de feedback nas primeiras 72 horas decide 80 % da qualidade posterior.
Dias 6-9: outreach em voo
Aprove a sequência de outreach. Vigie a calibração do tom — reler as 5 primeiras mensagens antes do envio, depois amostragem aleatória. Leia respostas para adequação do tom. Ajuste a voz se necessário.
Dias 10-12: revisão do cliente
Envie shortlist ao cliente. Meça a taxa de aceitação com honestidade: quantos quer realmente entrevistar? Abaixo de 70 %, o agente procura no briefing errado, não no mandato errado.
Dias 13-14: decisão
Sente-se com os três números. Dois em três passam = compra. Um em três = precisa de mais configuração. Zero em três = ferramenta errada para este desk.
As armadilhas a evitar
Deixar o fornecedor escolher o desk
Se o fornecedor propõe o cargo, terá uma vitória encenada. Escolha o seu próprio mandato representativo.
Medir atividade em vez de resultados
"Quantos perfis o agente apresentou" é métrica de vaidade. A taxa de aceitação do cliente é o único número que mapeia para colocações.
Começar sem baseline
Antes do dia 1, documente: quanto tempo leva o seu melhor consultor a fazer shortlist deste cargo? Qual a sua taxa de resposta típica? Sem isso, a comparação é vento.
Ignorar a calibração do tom
Um agente de sourcing perfeitamente preciso aliado a outreach desajeitado mata a marca em duas semanas. Dedique tempo de revisão desproporcionado aos templates de mensagem.
Como é "bom" ao dia 14
Das consultoras portuguesas que conduzem esta metodologia com a Yena:
- Tempo até shortlist 60-75 % abaixo vs baseline
- Taxa de aceitação do cliente 75-85 % em mandatos representativos
- Taxa de resposta a 5 % do melhor consultor humano
- Tempo total do consultor na pesquisa: 60-90 minutos
Estes números não aparecem nos decks de fornecedores porque os fornecedores testam contra cargos perfeitos. Num desk real, o intervalo honesto a esperar de um agente que funciona é o acima.
FAQ
Posso correr este teste em paralelo em vários mandatos?
Sim, mas o sinal fica mais turvo. Para a primeira avaliação: um cargo, um consultor, duas semanas. Escale depois da baseline.
E se o agente falhar o teste — a tecnologia não está pronta?
Não necessariamente. Diferentes agentes encaixam em diferentes mercados. Uma plataforma que falha em exec search UK pode brilhar em staffing IT polaco. A conclusão certa é "encaixe errado para este desk".
Como conseguir uma verdadeira versão de teste de 14 dias?
Peça-a explicitamente. A maioria das plataformas modernas (incluindo a Yena) entrega versão de teste de 10-14 dias sem chamada comercial. Um fornecedor que só oferece POC pagos de 30-90 dias: passe à frente.
Devo incluir outreach no teste de 14 dias?
Sim. Sourcing sem outreach é metade do agente. A taxa de resposta é o sinal mais honesto da qualidade da mensagem.
Qual o modo de falha desta metodologia?
Vai super-indexar nas particularidades do desk escolhido. Corra um segundo ciclo de 14 dias noutro desk antes do rollout em toda a consultora.
Corra o teste, confie nos números
Se quiser correr na Yena, os 10 dias de teste cobrem a fase de calibração mais um ciclo completo. A camada de agente está no teste gratuito — não atrás de um muro enterprise — porque construímos a metodologia em torno de consultores a correrem o seu próprio teste honesto, não em torno de decks comerciais.
14 dias. Três números. Uma decisão.