Neste post, explicaremos o que é um estudo de replicação. Primeiro, veremos como a ciência constrói um conhecimento cumulativo. Em seguida, abordaremos o conceito de replicação e sua importância para validar descobertas. Depois, discutiremos os principais tipos de estudo de replicação e como avaliá-los. Também traremos recomendações sobre como conduzir esse tipo de pesquisa. Por fim, diferenciaremos replicabilidade e reprodutibilidade, conceitos próximos, mas distintos.
Como a ciência produz um conhecimento cumulativo?
A ciência avança por meio do acúmulo de evidências. Pesquisadores testam hipóteses, publicam resultados, e outros cientistas confrontam esses achados com novos estudos. Assim, ideias se fortalecem ou são revistas, conforme novos dados surgem.
Por exemplo, um único estudo positivo sobre uma intervenção psicológica não basta para garantir sua eficácia. São necessárias várias investigações, em diferentes amostras e contextos, para consolidar a evidência. Em outras palavras, nossas conclusões sobre um dado fenômeno se baseiam em um conjunto de estudos.

O que é replicação na ciência?
Em síntese, replicar é repetir um estudo para verificar se os resultados se mantêm. A replicação funciona como um teste de consistência: se os achados forem robustos, eles provavelmente emergirão após a repetição do método original.
Esse princípio é fundamental no método científico e diferencia a ciência da opinião. Sem estudos de replicação, teorias podem se basear em achados frágeis ou anedóticos. Em áreas aplicadas, como psicologia e medicina, isso pode gerar decisões com impacto direto na vida das pessoas.
O que é um estudo de replicação?
Um estudo de replicação é uma pesquisa planejada para repetir um estudo anterior e verificar se os resultados originais se confirmam. O objetivo não é “copiar por copiar”, mas testar a robustez dos achados.
Por exemplo, se um experimento encontrou que dormir oito horas melhora o desempenho em testes de matemática, outros pesquisadores podem tentar replicar esse achado em uma nova amostra. Se o efeito reaparecer, ganhamos confiança no resultado. Se não, é preciso investigar o porquê dos achados discrepantes.

Quais são os principais tipos de estudo de replicação?
Nem todo estudo de replicação é igual. Em geral, os pesquisadores distinguem dois tipos principais: replicação direta e replicação sistemática. Há ainda um terceiro tipo — a replicação conceitual — que, embora carregue o termo replicação no nome, não é considerada uma replicação genuína por muitos metodólogos. No entanto, devido à sua relevância para avaliar a generalização de resultados, também será abordada nesta discussão.
Em seguida, vamos diferenciar essas três categorias. Contudo, é importante destacar que essas distinções formam um continuum. Assim, em muitos casos, classificar um estudo de forma precisa pode ser uma tarefa desafiadora.
Replicação direta
Na replicação direta — também chamada de replicação exata —, os pesquisadores repetem o estudo original da forma mais fiel possível. Sendo assim, eles usam o mesmo delineamento, materiais, medidas, população-alvo e análises. O tamanho amostral pode variar, principalmente se for ajustado para aumentar o poder estatístico.
Por exemplo, um experimento com estudantes universitários demonstrou a eficácia de uma técnica mnemônica na retenção de informações factuais de história após 24 horas.
Em seguida, outro grupo de pesquisadores pode replicar esse estudo usando estudantes com perfis semelhantes, aplicando o mesmo teste de memória, com o mesmo material e intervalo de retenção que o estudo original.

Replicação sistemática
Na replicação sistemática — também chamada de replicação aproximada —, mantém-se a essência do estudo original, mas variam-se alguns elementos do novo projeto de pesquisa.
O termo sistemática decorre do fato de que, nesse tipo de replicação, os pesquisadores variam sistematicamente — de maneira deliberada e controlada — certas características do estudo original. Isso permite que eles verifiquem se os achados originais são robustos em diferentes contextos.
Por exemplo, retomemos o experimento sobre memória da seção anterior. Algumas possibilidades de replicação sistemática envolveriam investigar a eficácia da técnica mnemônica: (a) em intervalos de retenção mais longos (e.g., 1 semana); (b) com materiais em outros domínios de conhecimento (e.g., português); ou (c) com uma população distinta (e.g., pessoas idosas).
Replicação conceitual
Na pesquisa científica, nós geralmente queremos identificar relações entre variáveis conceituais. Em síntese, as variáveis conceituais são nossos construtos de interesse, isto é, as entidades teóricas que assumimos estarem subjacentes às mensurações que realizamos.
Por exemplo, pesquisadores podem investigar a relação entre empatia e comportamento pró-social. Para isso, eles operacionalizaram empatia como “o resultado em um teste de reconhecimento de emoções faciais” e comportamento pró-social como “a quantidade de doações feitas em um experimento econômico”.
Em uma replicação conceitual — também chamada de estudo de extensão —, a ênfase não recai em replicar as relações entre as medidas de estudos prévios, mas, sim, a relação conceitual que observamos — a partir de outras definições operacionais dos construtos de interesse. Em última análise, o objetivo é avaliar a generalizabilidade, ou validade externa, dos achados originais.
Retomando nosso exemplo, uma replicação conceitual poderia operacionalizar empatia como “o escore em uma escala de autorrelato” e comportamento pró-social como “a disposição em ajudar um colega em uma situação simulada em um contexto naturalista”. Isso possibilitaria investigar se a relação entre empatia e comportamento pró-social também emerge a partir dessas novas definições operacionais dos construtos.

Como avaliar um estudo de replicação?
Avaliar estudos de replicação não é tarefa simples. A questão central é: quando podemos afirmar que um estudo replicou os achados anteriores? Trata-se de um tema ainda em debate na comunidade científica.
No entanto, três aspectos estatísticos ajudam a organizar essa avaliação (LeBel et al., 2019):
- O estudo de replicação detectou um sinal? Aqui, sinal significa evidência de efeito. Tecnicamente, isso ocorre quando o intervalo de confiança (IC) da estimativa de efeito exclui o zero. Se isso acontecer, o estudo sugere que há um efeito real; se o IC incluir o zero, considera-se um resultado nulo.
- O efeito é consistente com o do estudo original? Ou seja, o IC da replicação inclui o valor estimado no estudo original? Se sim, os achados são compatíveis. Se não, mesmo com o sinal presente, pode haver discrepância importante (e.g., efeito significativamente diferente de zero, mas também significativamente menor que o do estudo original).
- A replicação foi precisa? Isso se avalia comparando a largura dos ICs. Um IC muito mais largo na replicação indica menor precisão, o que dificulta conclusões firmes.
Com base nesses critérios, é possível classificar os resultados em cinco categorias (LeBel et al., 2019):
- Sinal consistente: efeito detectado, e similar ao original.
- Sinal inconsistente: efeito detectado, mas diferente (maior, menor ou oposto).
- Sem sinal, mas consistente: sem efeito, mas ainda compatível com o original.
- Sem sinal e inconsistente: sem efeito, e incompatível com o original.
- Menor precisão: IC muito amplo para conclusões confiáveis.
Em qualquer cenário, é essencial interpretar os resultados com cautela. Sempre que possível, recomenda-se considerar evidências acumuladas, como as fornecidas por sínteses metanalíticas.
Saiba mais: Sete etapas para conduzir uma revisão metanalítica

A crise de replicação
Nos últimos anos, a psicologia e outras ciências sociais passaram pela chamada crise de replicação. O termo se refere à constatação de que pesquisadores não conseguiam replicar muitos dos efeitos de estudos clássicos, quando novos estudos foram realizados.
Essa crise ganhou força a partir de 2011, quando casos de má conduta científica vieram à tona e grandes projetos colaborativos tentaram replicar estudos influentes (veja Nelson et al., 2018, pp. 512–514, para uma síntese).
Um exemplo marcante é o Reproducibility Project, que mostrou que apenas cerca de 40% dos resultados em psicologia social e cognitiva se replicavam. Além disso, os efeitos replicados apresentaram, em média, metade da magnitude dos efeitos originais (Open Science Collaboration, 2015).
As causas apontadas incluem o uso excessivo de amostras pequenas, a ênfase exagerada no valor p na inferência estatística, a prática de ajustar análises até encontrar resultados significativos (p-hacking) e a publicação seletiva de apenas estudos “positivos”. Essas práticas inflam a literatura com achados frágeis e de difícil replicação.
As consequências foram profundas. Muitas teorias antes consideradas sólidas passaram a ser questionadas. Além disso, a confiança pública na psicologia e em outras ciências sociais foi abalada, reforçando a necessidade de mais transparência e rigor metodológico.
A fim de enfrentar o problema, a comunidade científica tem adotado medidas importantes, tais como o pré-registro de estudos, que evita mudanças post hoc nos métodos e análises; o compartilhamento aberto de dados e códigos, que aumenta a reprodutibilidade; e a valorização de estudos de replicação, mesmo quando não confirmam achados anteriores.
Portanto, a crise de replicação, embora preocupante, também trouxe avanços: ela impulsionou um movimento em direção a uma ciência mais transparente, colaborativa e confiável.

Como conduzir adequadamente um estudo de replicação?
Para que a replicação tenha valor, ela precisa ser planejada com rigor (para orientações, veja Brandt et al., 2014). Pesquisadores devem registrar o protocolo antes da coleta de dados, detalhando cada passo do procedimento. Isso garante transparência e evita o viés de mudar estratégias após ver os resultados.
Também é importante garantir poder estatístico adequado. Se a amostra for muito pequena, o estudo pode falhar em detectar efeitos reais, gerando resultados inconclusivos ou até mesmo conclusões enganosas sobre a replicação.
Ademais, é fundamental que estudos de replicação sejam publicados independentemente do resultado, pois isso evita viés de publicação e fortalece a literatura com uma visão mais equilibrada sobre um dado tema.
Replicabilidade, generalizabilidade e reprodutibilidade
A replicabilidade diz respeito à capacidade de repetir um estudo com novos dados e obter resultados semelhantes. Quando isso acontece, dizemos que os achados originais são confiáveis.
Já a generalizabilidade se refere à extensão desses achados para outras populações, contextos ou medidas. Muitas vezes, estudos de replicação — direta e sistemática — também testam essa capacidade de generalização.
No entanto, a replicação conceitual é um caso à parte. Como ela altera definições operacionais e o delineamento original, alguns autores preferem chamá-la de estudo de extensão, que avalia a generalizabilidade, mas não a replicabilidade.
Nesse caso, em replicações conceituais, resultados “positivos” aumentariam nossa confiança nos achados originais, mas resultados “negativos” não desconfirmariam os achados originais — apenas indicariam condições limítrofes para o fenômeno.
Por fim, a reprodutibilidade diz respeito à possibilidade de obter os mesmos resultados a partir dos mesmos dados, usando os mesmos códigos e/ou análises. Ou seja, não envolve nova coleta, mas sim repetição do processamento dos dados originais.
Nesse sentido, quando os pesquisadores compartilham seus dados e códigos, eles permitem que outros cientistas reproduzam as análises originais. Além disso, esses materiais abrem espaço para que colegas explorem os dados sob novas perspectivas, realizando verificações independentes ou aplicando abordagens analíticas alternativas.
Conclusão
Gostou desse conteúdo? Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências
Brandt, M. J., IJzerman, H., Dijksterhuis, A., Farach, F. J., Geller, J., Giner-Sorolla, R., Grange, J. A., Perugini, M., Spies, J. R., & van’t Veer, A. (2014). The Replication Recipe: What makes for a convincing replication? Journal of Experimental Social Psychology, 50, 217–224. https://doi.org/10.1016/j.jesp.2013.10.005
Kazdin, A. E. (2016). Research design in clinical psychology (5th ed.). Pearson.
LeBel, E. P., Vanpaemel, W., Cheung, I., & Campbell, L. (2019). A brief guide to evaluate replications. Meta-Psychology, 3, Article MP.2018.843. https://doi.org/10.15626/MP.2018.843
Nelson, L. D., Simmons, J., & Simonsohn, U. (2018). Psychology’s renaissance. Annual Review of Psychology, 69, 511–534. https://doi.org/10.1146/annurev-psych-122216-011836
Nosek, B. A., Hardwicke, T. E., Moshontz, H., Allard, A., Corker, K. S., Dreber, A., Fidler, F., Hilgard, J., Struhl, M. K., Nuijten, M. B., Rohrer, J. M., Romero, F., Scheel, A. M., Scherer, L. D., Schönbrodt, F. D., & Vazire, S. (2022). Replicability, robustness, and reproducibility in psychological science. Annual Review of Psychology, 73, 719–748. https://doi.org/10.1146/annurev-psych-020821-114157
Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), 943–952. https://doi.org/10.1126/science.aac4716
Como citar este post
Lima, M. (2025, 21 de agosto). O que é um estudo de replicação? Blog Psicometria Online. https://blog.psicometriaonline.com.br/o-que-e-um-estudo-de-replicacao
