Avaliar um agente IA de recrutamento em 14 dias

Um POC de seis meses para um agente IA de recrutamento é o instrumento de medida preferido do fornecedor. Têm razão em gostar dele: quanto mais longo, mais tempo para configurar à volta das suas perguntas reais. A metodologia certa cabe em duas semanas, um mandato real, três números. Eis como a tenho conduzido em consultoras portuguesas em 2025-2026.

O objetivo: decidir em catorze dias se o produto funciona no seu desk — sem dar ao comercial tempo para conversa.

Porquê catorze dias

A primeira semana é ruído de calibração. Tom, formato de briefing, preferências do cliente — o agente aprende isso em 5-7 dias. A segunda semana é o primeiro sinal real. Para além: ou é polimento incremental, ou a equipa de serviços do fornecedor está a tapar um problema estrutural.

Os benchmarks SHRM colocam o tempo médio europeu até shortlist em 8-12 dias para funções de consultora. Duas semanas cobrem um ciclo completo agente → revisão humana → feedback do cliente. É a unidade de trabalho que conta.

Se em duas semanas de uso honesto não vir um sinal real, o agente não encaixa neste desk. Mais tempo não resolve isso.

O setup: um desk, um mandato, três números

Escolha um mandato representativo. Não o mais difícil (vai culpar a ferramenta). Não o mais fácil (vai concluir falsamente que funciona). Dificuldade média, consultor com antiguidade média: é aí que está o sinal certo.

Os três números a seguir

Indicador	Medição	Limite de passagem
Tempo até shortlist	Do briefing enviado a 10 classificados	≥50 % mais rápido que baseline
Aceitação do cliente	% da shortlist que o cliente quer entrevistar	≥70 %
Resposta outreach	% de respostas em 7 dias	A 10 % do melhor consultor humano

Três números, não doze. Junte um quarto e perde a semana um a debater medição em vez de executar o ensaio.

O guião dia a dia

Dias 1-2: setup e briefing

Onboarding do agente. Ligue LinkedIn, o CRM existente e o e-mail. Escreva um único briefing de seis linhas em linguagem clara. Nada de over-engineering do prompt — agentes que precisam de prompts de sistema com 800 palavras não estão prontos.

Dias 3-5: primeira shortlist e iteração

O agente gera a primeira shortlist. Consultor revê os 20 primeiros numa sessão matinal de 15 minutos. Sinalize explicitamente falsos positivos para o sistema aprender. Os dados LinkedIn Talent são consistentes: o loop de feedback nas primeiras 72 horas decide 80 % da qualidade posterior.

Dias 6-9: outreach em voo

Aprove a sequência de outreach. Vigie a calibração do tom — reler as 5 primeiras mensagens antes do envio, depois amostragem aleatória. Leia respostas para adequação do tom. Ajuste a voz se necessário.

Dias 10-12: revisão do cliente

Envie shortlist ao cliente. Meça a taxa de aceitação com honestidade: quantos quer realmente entrevistar? Abaixo de 70 %, o agente procura no briefing errado, não no mandato errado.

Dias 13-14: decisão

Sente-se com os três números. Dois em três passam = compra. Um em três = precisa de mais configuração. Zero em três = ferramenta errada para este desk.

As armadilhas a evitar

Deixar o fornecedor escolher o desk

Se o fornecedor propõe o cargo, terá uma vitória encenada. Escolha o seu próprio mandato representativo.

Medir atividade em vez de resultados

"Quantos perfis o agente apresentou" é métrica de vaidade. A taxa de aceitação do cliente é o único número que mapeia para colocações.

Começar sem baseline

Antes do dia 1, documente: quanto tempo leva o seu melhor consultor a fazer shortlist deste cargo? Qual a sua taxa de resposta típica? Sem isso, a comparação é vento.

Ignorar a calibração do tom

Um agente de sourcing perfeitamente preciso aliado a outreach desajeitado mata a marca em duas semanas. Dedique tempo de revisão desproporcionado aos templates de mensagem.

Como é "bom" ao dia 14

Das consultoras portuguesas que conduzem esta metodologia com a Yena:

Tempo até shortlist 60-75 % abaixo vs baseline
Taxa de aceitação do cliente 75-85 % em mandatos representativos
Taxa de resposta a 5 % do melhor consultor humano
Tempo total do consultor na pesquisa: 60-90 minutos

Estes números não aparecem nos decks de fornecedores porque os fornecedores testam contra cargos perfeitos. Num desk real, o intervalo honesto a esperar de um agente que funciona é o acima.

FAQ

Posso correr este teste em paralelo em vários mandatos?

Sim, mas o sinal fica mais turvo. Para a primeira avaliação: um cargo, um consultor, duas semanas. Escale depois da baseline.

E se o agente falhar o teste — a tecnologia não está pronta?

Não necessariamente. Diferentes agentes encaixam em diferentes mercados. Uma plataforma que falha em exec search UK pode brilhar em staffing IT polaco. A conclusão certa é "encaixe errado para este desk".

Como conseguir uma verdadeira versão de teste de 14 dias?

Peça-a explicitamente. A maioria das plataformas modernas (incluindo a Yena) entrega versão de teste de 10-14 dias sem chamada comercial. Um fornecedor que só oferece POC pagos de 30-90 dias: passe à frente.

Devo incluir outreach no teste de 14 dias?

Sim. Sourcing sem outreach é metade do agente. A taxa de resposta é o sinal mais honesto da qualidade da mensagem.

Qual o modo de falha desta metodologia?

Vai super-indexar nas particularidades do desk escolhido. Corra um segundo ciclo de 14 dias noutro desk antes do rollout em toda a consultora.

Corra o teste, confie nos números

Se quiser correr na Yena, os 10 dias de teste cobrem a fase de calibração mais um ciclo completo. A camada de agente está no teste gratuito — não atrás de um muro enterprise — porque construímos a metodologia em torno de consultores a correrem o seu próprio teste honesto, não em torno de decks comerciais.

14 dias. Três números. Uma decisão.

O objetivo: decidir em catorze dias se o produto funciona no seu desk — sem dar ao comercial tempo para conversa.

Porquê catorze dias

Se em duas semanas de uso honesto não vir um sinal real, o agente não encaixa neste desk. Mais tempo não resolve isso.

O setup: um desk, um mandato, três números

Os três números a seguir

Indicador	Medição	Limite de passagem
Tempo até shortlist	Do briefing enviado a 10 classificados	≥50 % mais rápido que baseline
Aceitação do cliente	% da shortlist que o cliente quer entrevistar	≥70 %
Resposta outreach	% de respostas em 7 dias	A 10 % do melhor consultor humano

Três números, não doze. Junte um quarto e perde a semana um a debater medição em vez de executar o ensaio.

O guião dia a dia

Dias 1-2: setup e briefing

Dias 3-5: primeira shortlist e iteração

Dias 6-9: outreach em voo

Dias 10-12: revisão do cliente

Envie shortlist ao cliente. Meça a taxa de aceitação com honestidade: quantos quer realmente entrevistar? Abaixo de 70 %, o agente procura no briefing errado, não no mandato errado.

Dias 13-14: decisão

Sente-se com os três números. Dois em três passam = compra. Um em três = precisa de mais configuração. Zero em três = ferramenta errada para este desk.

As armadilhas a evitar

Deixar o fornecedor escolher o desk

Se o fornecedor propõe o cargo, terá uma vitória encenada. Escolha o seu próprio mandato representativo.

Medir atividade em vez de resultados

"Quantos perfis o agente apresentou" é métrica de vaidade. A taxa de aceitação do cliente é o único número que mapeia para colocações.

Começar sem baseline

Antes do dia 1, documente: quanto tempo leva o seu melhor consultor a fazer shortlist deste cargo? Qual a sua taxa de resposta típica? Sem isso, a comparação é vento.

Ignorar a calibração do tom

Um agente de sourcing perfeitamente preciso aliado a outreach desajeitado mata a marca em duas semanas. Dedique tempo de revisão desproporcionado aos templates de mensagem.

Como é "bom" ao dia 14

Das consultoras portuguesas que conduzem esta metodologia com a Yena:

Tempo até shortlist 60-75 % abaixo vs baseline
Taxa de aceitação do cliente 75-85 % em mandatos representativos
Taxa de resposta a 5 % do melhor consultor humano
Tempo total do consultor na pesquisa: 60-90 minutos

Estes números não aparecem nos decks de fornecedores porque os fornecedores testam contra cargos perfeitos. Num desk real, o intervalo honesto a esperar de um agente que funciona é o acima.

FAQ

Posso correr este teste em paralelo em vários mandatos?

Sim, mas o sinal fica mais turvo. Para a primeira avaliação: um cargo, um consultor, duas semanas. Escale depois da baseline.

E se o agente falhar o teste — a tecnologia não está pronta?

Como conseguir uma verdadeira versão de teste de 14 dias?

Devo incluir outreach no teste de 14 dias?

Sim. Sourcing sem outreach é metade do agente. A taxa de resposta é o sinal mais honesto da qualidade da mensagem.

Qual o modo de falha desta metodologia?

Vai super-indexar nas particularidades do desk escolhido. Corra um segundo ciclo de 14 dias noutro desk antes do rollout em toda a consultora.

Corra o teste, confie nos números

14 dias. Três números. Uma decisão.

Porquê catorze dias

O setup: um desk, um mandato, três números

Os três números a seguir

O guião dia a dia

Dias 1-2: setup e briefing

Dias 3-5: primeira shortlist e iteração

Dias 6-9: outreach em voo

Dias 10-12: revisão do cliente

Dias 13-14: decisão

As armadilhas a evitar

Deixar o fornecedor escolher o desk

Medir atividade em vez de resultados

Começar sem baseline

Ignorar a calibração do tom

Como é "bom" ao dia 14

FAQ

Posso correr este teste em paralelo em vários mandatos?

E se o agente falhar o teste — a tecnologia não está pronta?

Como conseguir uma verdadeira versão de teste de 14 dias?

Devo incluir outreach no teste de 14 dias?

Qual o modo de falha desta metodologia?

Corra o teste, confie nos números

Conheça a Yena

Yena Sourcer para pesquisa de candidatos

Guia do comprador

Sourcing autónomo

Continue a ler

Agente IA de recrutamento: guia do comprador 2026

Recrutamento com agentes IA: sourcing autónomo 2026

Sourcing IA: pesquisa de candidatos em linguagem natural

Recrutamento com IA em Portugal: como adoptar em 2026

Encontre candidatos antes de começarem a procurar.

Porquê catorze dias

O setup: um desk, um mandato, três números

Os três números a seguir

O guião dia a dia

Dias 1-2: setup e briefing

Dias 3-5: primeira shortlist e iteração

Dias 6-9: outreach em voo

Dias 10-12: revisão do cliente

Dias 13-14: decisão

As armadilhas a evitar

Deixar o fornecedor escolher o desk

Medir atividade em vez de resultados

Começar sem baseline

Ignorar a calibração do tom

Como é "bom" ao dia 14

FAQ

Posso correr este teste em paralelo em vários mandatos?

E se o agente falhar o teste — a tecnologia não está pronta?

Como conseguir uma verdadeira versão de teste de 14 dias?

Devo incluir outreach no teste de 14 dias?

Qual o modo de falha desta metodologia?

Corra o teste, confie nos números

Conheça a Yena

Yena Sourcer para pesquisa de candidatos

Guia do comprador

Sourcing autónomo

Continue a ler

Agente IA de recrutamento: guia do comprador 2026

Recrutamento com agentes IA: sourcing autónomo 2026

Sourcing IA: pesquisa de candidatos em linguagem natural

Recrutamento com IA em Portugal: como adoptar em 2026

Encontre candidatos antes de começarem a procurar.