Desde que Donald Kirkpatrick publicou quatro artigos na revista da ATD nos anos 1950 e 60, o modelo que ele criou sem saber que criaria um modelo se tornou o framework de avaliação de treinamento mais adotado no mundo. Ele foi ao evento perguntar “que modelo?” quando o campo já o usava há décadas.
Sete décadas depois, na ATD26 em Los Angeles, a atualização mais significativa do Kirkpatrick em anos foi apresentada ao vivo, e as mudanças são pequenas o suficiente para parecerem incrementais, mas têm implicações que mudam como qualquer programa de T&D deveria ser desenhado.
O que mudou no Modelo Kirkpatrick
Vanessa Alzate, CEO da Kirkpatrick Partners e autora do novo livro lançado durante a conferência, apresentou as atualizações formais nas definições de cada nível. Duas sessões na ATD26 cobriram o tema, uma com foco em aplicações práticas e outra no conceito de cultura de avaliação, e juntas entregaram a leitura mais completa do estado atual do modelo.
Nível 1: Reação deixou de ser medida de satisfação. A definição histórica, “as pessoas gostaram do treinamento?”, foi reposicionada. Assim, o novo Nível 1 mede o grau em que os participantes consideraram o programa engajante, relevante e de suporte ao trabalho real que terão que fazer.
A diferença é fundamental: uma avaliação de satisfação mede se as pessoas curtiram a experiência. A nova definição, por sua vez, mede se elas perceberam conexão com o trabalho. São perguntas diferentes e, portanto, produzem dados diferentes.
Nível 2: Aprendizagem ganhou dois componentes novos. O modelo original trabalhava com conhecimento, habilidades e atitudes. A versão atual, no entanto, adiciona confiança e comprometimento.
A lógica é direta: uma pessoa pode saber o que fazer e ter a habilidade para fazer, mas mesmo assim, se não tiver confiança para agir ou comprometimento com a mudança, o comportamento não vai mudar. Medir só KSA (knowledge, skills, attitudes) é medir o quanto a pessoa aprendeu. Medir confiança e comprometimento, por outro lado, é medir a probabilidade de ela aplicar.
Nível 3: Comportamento continua sendo o mais negligenciado e, ao mesmo tempo, o mais importante. O modelo atualizado reforça três componentes: os comportamentos críticos em si (observáveis, mensuráveis e que, quando executados, geram os resultados do Nível 4), o suporte de performance (o que reforça e apoia o comportamento no trabalho) e, além disso, o ambiente de performance (as condições que tornam o comportamento possível ou impossível).
Nível 4: Resultados passou a distinguir entre resultados organizacionais (o norte da organização) e resultados da iniciativa (o impacto específico do programa), com indicadores de curto prazo (leading) e, por fim, longo prazo (lagging).
O dado que mais incomoda: a maioria mede o que é mais fácil, não o que importa
As duas sessões convergiram no mesmo diagnóstico.
A maioria das organizações avalia os programas de treinamento pelo Nível 1 e, quando vai além, pelo Nível 2 com métricas de consumo, nota no teste, taxa de conclusão. Poucas chegam ao Nível 3. Menos ainda conectam o programa a dados do Nível 4.
O problema não é falta de vontade, é falta de estrutura. As barreiras mais citadas pelo público da sessão foram reconhecíveis por qualquer profissional de T&D: não estar presente no ambiente de trabalho depois do treinamento, dificuldade de isolar o impacto do programa de outros fatores, falta de tempo após o lançamento para fazer follow-up.
A resposta que Wendy Kirkpatrick, co-facilitadora da sessão, ofereceu é contraintuitiva: o follow-up precisa ser desenhado antes do treinamento, não depois. Quando as ferramentas de suporte pós-treinamento são construídas junto com o conteúdo, elas acontecem. Quando são planejadas para depois do lançamento, não acontecem, porque o time já está no próximo projeto.
Conheça as soluções em Educação Corporativa da Bravend:👉 Educação corporativa – soluções Bravend
Nível 3 é onde o dinheiro está, e onde quase ninguém chega
Wendy descreveu um exercício que ela chama de “encontrar o Nível 3” nas publicações do ATD Best Award: ler os cases premiados e procurar onde está descrito o que as pessoas fizeram diferente no trabalho como resultado do treinamento. “Às vezes você encontra muito investimento descrito (Nível 2) e os resultados celebrados (Nível 4), mas o Nível 3, o que as pessoas efetivamente fizeram diferente, está conspicuamente ausente.”
Isso importa porque o Nível 3 é a conexão causal entre aprendizagem e resultado. Sem ele, o T&D não consegue demonstrar impacto, só correlação. E sem conseguir demonstrar impacto, o argumento para o próximo orçamento fica mais frágil do que precisaria ser.
A orientação prática: transformar o processo ou os passos ensinados no treinamento no próprio comportamento mensurável do Nível 3. Se você ensina um processo de quatro etapas para uma conversa difícil, o comportamento de Nível 3 é “o processo foi seguido quando a situação ocorreu”, observável, específico, rastreável.
📖 Leitura relacionada:
Cultura de aprendizagem: o que é e como implementar
Lifelong learning para líderes: parar de aprender compromete o sucesso
Cultura de avaliação: por que uma mudança de modelo não resolve
A segunda sessão, conduzida por Vanessa Alzate, foi além dos níveis e abordou o que ela chama de cultura de avaliação, ou seja, o ambiente organizacional que torna possível, ou impossível, avaliar com consistência.
O diagnóstico é duro: a maioria das organizações são “ricas em dados e pobres em inteligência”. Têm métricas, mas no entanto, não têm perguntas. E quando têm perguntas, cada departamento opera com um mapa diferente, o que torna, portanto, a colaboração entre T&D e as outras áreas estruturalmente difícil.
Vanessa identificou cinco razões pelas quais iniciativas de avaliação em escala falham nas organizações: falta de compreensão do problema real (o T&D gasta cinco minutos no problema e cinquenta na solução), dados siloados por departamento, ausência de um framework comum, tensão entre velocidade executiva e tempo de maturação dos dados e, por fim, falta de comprometimento coletivo com a mudança.
A resposta que ela propõe tem quatro pilares: comprometimento (cultura de avaliação leva cinco a dez anos, nesse sentido, não é projeto, é processo), framework colaborativo (todos olhando para o mesmo mapa), coragem e confiança (para compartilhar dados e admitir o que não funcionou) e, além disso, comunidade de prática (avaliação como atividade coletiva, não como relatório produzido por um departamento).
O ponto central: avaliação não é um relatório que o T&D produz. É, ao contrário, uma prática que a organização constrói. E ela começa antes do treinamento, e não depois.
📌 Líderes que entendem esse ciclo, da necessidade de negócio ao resultado mensurável, desenvolvem times que aprendem mais rápido e entregam com mais consistência:
👉 Conheça o PDL: Programa de Desenvolvimento de Líderes da Bravend
O que levar para o próximo programa que você vai desenhar
As duas sessões convergiram em orientações práticas que qualquer profissional de T&D pode começar a aplicar imediatamente:
Sempre comece com o Nível 4 em mente. Mesmo para um microlearning de oito minutos, qual é o resultado de negócio que justifica esse investimento de tempo multiplicado por todos os participantes?
Defina o Nível 3 antes de criar o conteúdo. O que, especificamente, você espera que as pessoas façam, façam diferente ou parem de fazer? Essa pergunta, aparentemente simples, é difícil de responder, e é exatamente onde está o valor.
Construa os materiais de suporte pós-treinamento junto com o conteúdo. Não depois. Se você espera ter tempo depois do lançamento para criar os materiais de follow-up, você não vai ter.
Meça confiança e comprometimento no Nível 2. Se as pessoas saem do treinamento sabendo o que fazer mas não confiantes para fazer, você já sabe que a transferência está em risco.
Encontre quem tem os dados do Nível 4 e construa a parceria antes de precisar deles. Descobrir quem tem o KPI conectado ao sucesso do programa e tornar essa pessoa uma aliada desde o início muda completamente o que é possível medir.
Garanta seu e-book da ATD 2026
Modelo Kirkpatrick e a ATD26
As sessões sobre o Modelo Kirkpatrick foram realizadas na ATD International Conference 2026, em Los Angeles. O livro Building a Culture of Evaluation with the Kirkpatrick Model, de Vanessa Alzate, foi lançado durante a conferência. As sessões atraíram participantes de diferentes níveis de familiaridade com o modelo, de quem nunca tinha ouvido falar até profissionais que estruturam todo o trabalho de T&D em torno dele.
A atualização do Kirkpatrick conversa com outros temas que dominaram a conferência. Zack Kass, na keynote de abertura, argumentou que em um mundo onde a IA entrega conteúdo em escala, o diferencial do T&D é demonstrar impacto no comportamento e no resultado, exatamente o que os Níveis 3 e 4 mensuram. Liz Wiseman, no encerramento, mostrou que desenvolver só habilidade, sem confiança e comprometimento para aplicar, não muda comportamento, o mesmo argumento que fundamenta a atualização do Nível 2 do Kirkpatrick.
📖 Veja mais coberturas da ATD26:
Will Guidara: hospitalidade, presença e o que diferencia experiências memoráveis
ATD 2026: cobertura completa da conferência
FAQ
O que mudou de fato no Modelo Kirkpatrick na versão mais recente?
As principais mudanças são no Nível 1, que deixou de medir satisfação e passou a medir engajamento, relevância e suporte percebido ao trabalho real; e no Nível 2, que adicionou confiança e comprometimento aos componentes tradicionais de conhecimento, habilidades e atitudes. O Nível 3 ganhou estrutura mais clara com três elementos, comportamentos críticos, suporte de performance e ambiente de performance, e o Nível 4 passou a distinguir entre resultados organizacionais e resultados da iniciativa.
Por que o Nível 3 é o mais negligenciado e o mais importante?
Porque é o único que demonstra causalidade entre treinamento e resultado de negócio. Os Níveis 1 e 2 mostram que as pessoas gostaram e aprenderam. O Nível 4 mostra que o resultado aconteceu. Só o Nível 3 conecta os dois, e é onde está a prova de impacto que o T&D precisa apresentar para o C-level.
Como começar a medir o Nível 3 sem estar presente no ambiente de trabalho?
Construindo os materiais de follow-up antes do treinamento, não depois. Definindo o comportamento esperado em termos específicos e observáveis durante o design. Criando ferramentas de suporte que acompanham os participantes de volta ao trabalho. E estabelecendo checkpoints automáticos que não dependem de o profissional de T&D estar fisicamente presente.


