O objetivo deste post é discutir o conceito de tamanho de efeito. Primeiramente, definiremos e apresentaremos três facetas do conceito. Em seguida, discorreremos sobre a importância dele em pesquisas quantitativas. Posteriormente, apresentaremos duas grandes famílias de medidas de tamanho de efeito. Por fim, nós abordaremos o importante e controverso tópico sobre diretrizes para interpretar os índices de tamanho de efeito.
Qual é a definição de tamanho de efeito?
Antes de mais nada, notamos que diferentes pesquisadores definem o conceito de tamanho de efeito de formas distintas. Por exemplo, Kelley e Preacher (2012, p. 140) propõem a seguinte definição abrangente: tamanho do efeito é um reflexo quantitativo da magnitude de algum fenômeno que é usado com o propósito de abordar uma questão de interesse.
Com base nessa definição, podemos fazer algumas considerações. Primeiramente, o tamanho de efeito é uma representação numérica, isto é, uma quantidade (e não uma qualidade). Além disso, ele mapeia um fenômeno do mundo real, como o efeito de um medicamento, a prevalência de uma psicopatologia na população ou a associação entre duas variáveis contínuas.
Em terceiro lugar, Kelley e Preacher (2012) associam a definição à tentativa de responder a alguma questão. Em outras palavras, podemos estar interessados em estimar diferenças, associações, taxas ou riscos, para citar alguns exemplos.
Esse último ponto da definição de Kelley e Preacher (2012) leva à seguinte consideração: embora tamanhos de efeito sejam estatísticas, nem sempre uma estatística será um tamanho de efeito. Por exemplo, quando um valor numérico é usado apenas para fins descritivos, mas sem quantificar um fenômeno que responde a uma questão de pesquisa, ele não será considerado um tamanho de efeito.
Quais são as três facetas do tamanho de efeito?
Podemos usar o termo tamanho de efeito tendo em vista três referentes distintos. Kelley e Preacher (2012) denominam esses referentes de facetas, isto é, aspectos particulares do conceito de tamanho de efeito.
A primeira faceta é a dimensão que almejamos quantificar, isto é, o aspecto mais abstrato do tamanho de efeito. Por exemplo, podemos querer quantificar as qualidades da associatividade, da separação entre dois grupos e do impacto relativo (Tabela 1).
Dimensão | Definição |
Associatividade | Grau de relacionamento entre duas variáveis |
Separação entre grupos | Grau de distância entre dois grupos em uma variável contínua |
Impacto relativo | Grau em que a alteração de uma variável influencia a alteração proporcional de outra variável |
Em contrapartida, a faceta da medida se refere à operacionalização do aspecto abstrato por meio de fórmulas matemáticas. Por exemplo, podemos propor diferentes medidas para dar concretude às dimensões anteriormente sugeridas.
Dimensão | Medidas (exemplos) |
Associatividade | Covariância, correlação de Pearson, coeficiente phi, coeficiente de regressão |
Separação entre grupos | Diferença absoluta entre médias, d de Cohen, g de Hedges, Δ de Glass |
Impacto relativo | Risco relativo, razão de chances, hazard ratio, taxa de incidência relativa |
Já a faceta do valor é o número que obtemos ao implementarmos a fórmula da medida de tamanho de efeito. Por exemplo, no caso do r de Pearson, podemos obter r = –0,06, r = 0,20 ou r = 0,87.
Em síntese, podemos usar o termo tamanho de efeito para se referir tanto a uma dimensão abstrata, a uma medida específica que visa refletir essa dimensão, ou a um valor computado por meio dessa medida. Sendo assim, o sentido do termo se depreenderá do contexto de seu uso.
Qual é a importância do tamanho de efeito?
É um erro acreditar que a informação mais importante em uma análise é se ela é ou não é significativa (com base no valor de p). Outro erro relacionado consiste em acreditar que a significância estatística (p < 0,05 ou p < 0,0001) é o que determina se um achado é forte ou não.
No entanto, o valor p não informa quão forte é o efeito observado, pois o valor de p é amplamente dependente da amostra. Amostras muito grandes podem atingir significância estatística (e.g., p < 0,001) mesmo que o efeito seja pequeno. É justamente pra isso que serve o tamanho de efeito, isto é, para fornecer uma informação clara sobre a magnitude do fenômeno.
Outra utilidade do tamanho de efeito é que podemos associá-lo à significância prática (e.g., clínica, médica, educacional) de um achado. Por exemplo, uma intervenção que diminua as chances de ataque cardíaco em homens acima de 50 anos pode ser fundamental para gestores transformarem tal intervenção em política pública.
Por fim, o tamanho de efeito é útil no planejamento de pesquisa. Em outras palavras, quando queremos realizar o cálculo de tamanho amostral, queremos definir um N adequado para obter significância estatística, dado um poder estatístico almejado (e.g., 80%) e um determinado tamanho de efeito hipotetizado (sob a hipótese alternativa). Desse modo, o tamanho de efeito é uma informação essencial no cálculo de tamanho amostral.
Saiba mais: Como fazer o cálculo de tamanho amostral no G*Power?
Quais os diferentes tipos de tamanho de efeito?
Metodólogos costumam agrupar as medidas de tamanho de efeito em duas categorias principais:
- Família d: inclui medidas que estimam a magnitude da diferença entre médias. Os principais exemplos consistem no d de Cohen, no Δ de Glass e no g de Hedges. Conceitualmente, os tamanhos de efeito da família d visam quantificar a dimensão de separação entre dois grupos;
- Família r: inclui medidas que estimam a força da associação entre as variáveis. Alguns exemplos consistem no r2, no eta2 (η2), no ômega2 (ω2), coeficiente phi, V de Cramér e f2 de Cohen. Os tamanhos de efeito da família r descrevem a proporção da variância que é explicada pelo pertencimento ao grupo. Por exemplo, uma correlação de r = 0,50 indica que 25% (r2) da variância é explicada pela diferença entre múltiplos grupos.
Também vale notar que tamanhos de efeito podem se referir a estatísticas amostrais ou a parâmetros populacionais. No caso de estatísticas amostrais, essas geralmente visam estimar aqueles parâmetros populacionais.
Sendo assim, outra diferenciação entre os tamanhos de efeito é se eles corrigem ou não vieses. Por exemplo, o d de Cohen e o η2 são estimadores enviesados dos tamanhos de efeito populacionais. Em contrapartida, as fórmulas do g de Hedges e do ω2 corrigem os vieses (ou a maior parte deles) em suas estimativas dos parâmetros populacionais de interesse.
Veja também:
Quando um efeito é pequeno ou grande?
Ao usar tamanhos de efeito para quantificar fenômenos de interesse, inevitavelmente nos deparamos com o desafio de interpretá-los da maneira mais clara possível.
Em uma série de contribuições seminais, Jacob Cohen (1962, 1988, 1992) refletiu sobre os padrões convencionais para a interpretação dos tamanhos de efeito. Sendo assim, ele recomendou que o julgamento qualitativo sobre os tamanhos de efeito (quantitativos) fossem feitos à luz da literatura de pesquisa relevante.
No entanto, Cohen também estava ciente que, para a maioria dos pesquisadores, era mais conveniente ter um atalho, ou seja, uma diretriz para a interpretação. Por esse motivo, Cohen (1988) sugeriu alguns pontos de corte para classificação do tamanho de efeito. No caso de diferenças padronizadas entre médias (e.g., d de Cohen), Cohen (1988, p. 40) sugeriu:
- d = 0,20: efeito pequeno;
- d = 0,50: efeito médio;
- d = 0,80: efeito grande.
No entanto, nós advertimos que esses pontos de corte devem ser utilizados e interpretados com cautela, pois as diretrizes costumam mudar entre diferentes pesquisadores ou para diferentes métricas (veja um exemplo para o V de Cramér).
Além disso, a significância prática de um efeito está intrinsecamente relacionada a uma área de pesquisa em particular, à população de interesse, ao delineamento de pesquisa e ao objetivo da investigação (para exemplos, veja Kelley & Preacher, 2012, p. 146).
Por exemplo, suponha que estejamos interessados no impacto do uso de coletes salva-vidas sobre a taxa de sobrevivência em acidentes marítimos. Assuma que o efeito é de uma redução de 2% no risco de morte. Embora o tamanho do efeito pareça “pequeno”, sua relevância prática é enorme, pois pode representar milhares de vidas salvas quando aplicado em larga escala, justificando políticas obrigatórias de uso.
Conclusão
Neste post, você aprendeu o que é tamanho de efeito. Esperamos que o conteúdo tenha sido útil. Aproveite e também se inscreva em nosso canal no YouTube para ficar por dentro de nossas novidades!
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Cohen, J. (1962). The statistical power of abnormal–social psychological research: A review. Journal of Abnormal and Social Psychology, 65(3), 145–153. https://doi.org/10.1037/h0045186
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum Publishers.
Cohen, J. (1992). A power primer. Psychological Bulletin, 112(1), 155–159. https://doi.org/10.1037//0033-2909.112.1.155
Kelley, K., & Preacher, K. J. (2012). On effect size. Psychological Methods, 17(2), 137–152. https://doi.org/10.1037/a0028086
Como citar este post
Lima, M. (2025, 14 de janeiro). O que é tamanho de efeito? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-tamanho-de-efeito/
Respostas de 2
Bruno, para tamanho de efeito calculado pela correlação biserial de ordens, Cohen (1988) comenta algo diferente? Achei em um local que seria grande, neste caso, a partir de 0,30 mas não se se faz sentido.
Kelly, em seu livro, Cohen (1988) menciona o coeficiente ponto-bisserial, mas não a correlação bisserial de ordens (rank-biserial correlation). Vargha e Delaney (2000) fornecem guidelines de como interpretar esse coeficiente [Vargha, A., & Delaney, H. D. (2000). A critique and improvement of the CL common language effect size statistics of McGraw and Wong. Journal of Educational and Behavioral Statistics, 25(2), 101–132]. Veja a Tabela 1 (p. 106), na linha “delta = p+ – p–”. No entanto, enfatizo um ponto notado pelo próprio Cohen e por outros metodólogos, de que essas regras de bolso são apenas uma sugestão inicial, e que uma medida de tamanho de efeito deve ser interpretada sempre à luz da própria área de pesquisa.
Equipe Psicometria Online.