Neste post, falaremos sobre como comparar duas correlações dependentes, isto é, os coeficientes de correlação de Pearson obtidos com os mesmos participantes. Primeiramente, descreveremos quando comparar duas correlações dependentes. Em seguida, introduziremos três testes estatísticos usados para esse fim. Por fim, descrevemos como interpretar, reportar e escolher o teste mais adequado.
Quando comparar duas correlações dependentes?
Em alguns contextos de pesquisa, podemos querer comparar duas correlações de Pearson obtidas em amostras dependentes. Por exemplo, alguns testes de memória possuem mais de um sistema de correção das respostas (e.g., Conway et al., 2005). Uma questão importante é identificar qual sistema de correção é o mais adequado em pesquisas científicas.
Em outras palavras, podemos examinar se o sistema de correção implementado influencia a relação entre desempenho de memória e escores de inteligência. Vamos nos referir aos escores no teste de inteligência como X, os escores no sistema de correção 1 (liberal) como Y e os obtidos no sistema de correção 2 (conservador) como Z.
Sendo assim, a nossa pergunta será a seguinte: existe diferença entre rXY e rXZ? Em outras palavras, a correlação entre os escores de inteligência e de memória diferem a depender de como operacionalizamos o desempenho no teste de memória?
No cenário anterior, as correlações comparadas compartilham uma mesma variável, isto é, os escores no teste de inteligência. No entanto, em alguns casos, as correlações que queremos comparar não compartilham variáveis.
Por exemplo, podemos querer examinar se há diferença entre a correlação de autoeficácia (X) com desempenho (Y) e a correlação de autoestima (Z) com sociabilidade (W) — ou seja, existe diferença entre rXY e rZW?
Em seguida, o objetivo deste post será descrever testes estatísticos que respondem a essas questões de pesquisa.

O que são testes para duas correlações dependentes?
Em um post anterior, vimos como comparar duas correlações independentes. Por exemplo, podemos querer comparar se a correlação entre capacidade de memória de trabalho e habilidades de leitura difere entre jovens adultos e idosos.
Contudo, quando os dois coeficientes de correlação comparados vêm da mesma amostra, não podemos tratá-los como independentes. Isso ocorre porque os valores amostrais compartilham variância em comum.
Sendo assim, os testes para duas correlações dependentes consistem em técnicas estatísticas que visam comparar coeficientes de correlação de Pearson por meio de testes de hipóteses, ao mesmo tempo em que levam em consideração o fato de que esses coeficientes compartilham as mesmas unidades de análise.
Testes estatísticos para duas correlações dependentes
Teste de Hotelling–Williams
O teste de Hotelling–Williams é indicado quando as duas correlações comparadas têm uma variável em comum. Anteriormente, descrevemos o cenário em que gostaríamos de examinar se a correlação de um teste de memória com uma medida externa (i.e., escores de inteligência) difere a depender do sistema de correção aplicado no teste de memória. Esse é um cenário típico em que o teste de Hotelling–Williams se aplica (Figura 1).

Em síntese, o teste de Hotelling–Williams também leva em conta a correlação entre as variáveis dependentes (em nosso exemplo, rYZ) para corrigir a dependência na comparação entre rXY e rXZ.
Por exemplo, na Figura 2, temos três correlações bivariadas hipotéticas entre inteligência, memória (sistema de correção 1) e memória (sistema de correção 2). O objetivo é investigar se a diferença entre as duas primeiras correlações é significativa, ao mesmo tempo em que levamos em consideração a terceira correlação.

O teste de Hotelling–Williams calcula uma estatística t e um valor p associado. Como a fórmula da estatística do teste é um pouco complicada, focaremo-nos aqui na interpretação da análise. No exemplo anterior, baseado em 220 observações, observamos t(217) = 0,551, p = 0,58. Logo, concluímos que a correlação dos escores no teste de memória e inteligência não diferem significativamente em função do sistema de correção utilizado no teste de memória.
Teste de Steiger
Steiger (1980) propôs uma formulação alternativa ao teste de Hotelling–Williams, baseada em uma estatística z, amplamente usada em softwares e em calculadoras on-line.
A lógica é a mesma que a solução anterior: verificar se a diferença entre rXY e rXZ é estatisticamente significativa, levando em conta o grau de associação entre as variáveis correlacionadas com X, rYZ.
Usando o mesmo exemplo anterior, o teste z de Steiger produziu z = 0,553, p = 0,58, um resultado bastante similar ao teste de Hotelling–Williams. Em síntese, ele corrobora a conclusão que chegamos com base no teste anterior, ou seja, a de que não há evidências de diferença entre as correlações de inteligência com os dois sistemas de correção do teste de memória.
Teste de Dunn–Clark
Nos dois exemplos anteriores, as correlações são dependentes e têm sobreposição, isto é, a variável X contribui para o cálculo dos dois coeficientes de correlação. No entanto, há circunstâncias em que queremos comparar coeficientes de correlação que, embora dependentes, não possuem sobreposição de variáveis. A Figura 3 ilustra essa ideia.

Quando as correlações não compartilham variáveis, podemos usar a transformação r para z de Fisher e comparar os valores transformados. A transformação r para z de Fisher é feita pela seguinte fórmula:

Por exemplo, considere as correlações bivariadas hipotéticas entre os dois pares distintos de variáveis da Figura 4.

Aplicando a fórmula da transformação r para z de Fisher, temos:

e

respectivamente.
Por fim, usamos os valores zs para calcular a estatística z do teste de Dunn–Clark pela seguinte fórmula:

Com zrXY = 0,33, zrZW = 0,54, n = 500, temos:

Como o valor absoluto de z ultrapassou o valor crítico (e.g., ±1,96 para α = 0,05), rejeitamos a hipótese nula, ou seja, concluímos que as duas correlações diferem significativamente.
Como interpretar os resultados dos testes para duas correlações dependentes?
Resumidamente, podemos expressar as hipóteses nula e alternativa dos três testes que vimos anteriormente da seguinte maneira:
- H0: ρXY = ρXZ (ρXY = ρZW), ou seja, não há diferença entre as correlações dependentes com (sem) sobreposição.
- H1: ρXY ≠ ρXZ (ρXY ≠ ρZW), isto é, há diferença entre as correlações dependentes com (sem) sobreposição.
Sendo assim, após calcularmos a estatística do teste (Hotelling–Williams: estatística t; Steiger e Dunn–Clark: estatística z), comparamos esse valor com a distribuição adequada (t ou normal-padrão) de modo a obtermos o valor p associado.
Se o valor p for menor que o nível de significância estabelecido (geralmente, α = 0,05), rejeitamos a hipótese nula em favor da hipótese alternativa, concluindo que as correlações comparadas diferem significativamente entre si. Caso contrário, afirmamos não termos evidências suficientes de diferença entre as correlações.
Em nossos exemplos, portanto, teríamos as seguintes conclusões:
- Teste de Hotelling–Williams: t(217) = 0,551, p = 0,58; logo, concluímos que não temos evidências de que as correlações dos escores de inteligência com os escores baseados nos dois sistemas de correção do teste de memória diferem entre si.
- Teste z de Steiger: z = 0,553, p = 0,58; logo, chegamos à mesma conclusão que o teste anterior.
- Teste de Dunn–Clark: z = –3,16, p = 0,002; logo, concluímos que a correlação entre autoestima e sociabilidade (r = 0,49) é estatisticamente maior que a correlação entre autoeficácia e desempenho (r = 0,35).

Como reportar os resultados dos testes para duas correlações dependentes?
Ao relatar os resultados do seu teste de hipótese, informe qual teste estatístico foi conduzido, e relate a estatística do teste (t ou z), os graus de liberdade (apenas para o teste de Hotelling–Williams) e o valor p. Também é relevante descrever os valores das correlações que estão sendo comparadas. Por fim, inclua uma interpretação textual do resultado, o que facilitará a compreensão por parte de seus leitores.
Em seguida, ilustramos a descrição com base no teste de Dunn–Clark, mas a lógica é semelhante para os demais testes estatísticos:
A correlação entre os escores de autoeficácia e de desempenho foi estatisticamente significativa (r = 0,35, p < 0,001). Além disso, a correlação entre os escores de autoestima e de sociabilidade também foi estatisticamente significativa (r = 0,49, p < 0,001). O teste de Dunn–Clark indicou que a primeira correlação foi estatisticamente superior à segunda, z = –3,16, p = 0,002. Em outras palavras, a associação entre autoestima e sociabilidade é mais forte que a associação entre autoeficácia e desempenho.
Veja também: Como comparar dois coeficientes de correlação de Pearson para grupos independentes?

Testes para duas correlações dependentes: qual alternativa escolher?
Quando usar cada um dos testes que descrevemos anteriormente? O teste de Hotelling–Williams é indicado quando as correlações compartilham uma variável em comum, pois leva em conta os graus de liberdade da amostra e retorna uma estatística t. Ele é especialmente indicado em amostras pequenas ou moderadas, já que sua distribuição de referência é mais conservadora.
Em contraste, o teste de Steiger também se aplica a correlações com sobreposição, mas utiliza uma estatística z baseada na distribuição normal-padrão. Por essa razão, ela costuma aparecer em calculadoras on-line que privilegiam simplicidade computacional, sendo bastante confiável quando o tamanho da amostra é grande.
Já o teste de Dunn–Clark é a alternativa recomendada quando as duas correlações não compartilham qualquer variável, situação em que nem Hotelling–Williams nem Steiger são apropriados. Nesse caso, a comparação é feita via transformação r para z de Fisher, resultando em uma estatística z.
Em síntese, todos esses testes têm o mesmo objetivo: verificar se duas correlações obtidas em um mesmo grupo de participantes diferem significativamente entre si. A principal diferença está nas condições de aplicação e na distribuição usada para obter o valor p. A Tabela 1 sumariza a discussão anterior.
| Teste | Quando usar | Estatística |
| Hotelling–Williams | Correlações com sobreposição (rXY vs. rXZ), amostras pequenas ou médias | t (gl = n – 3) |
| Steiger | Correlações com sobreposição (rXY vs. rXZ), amostras grandes | z (normal-padrão) |
| Dunn–Clark | Correlações sem sobreposição (rXY vs. rZW), | z (normal-padrão) |
Conclusão
Gostou desse conteúdo? Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências
Chen, P. Y., & Popovich, P. M. (2002). Correlation: Parametric and nonparametric measures. Sage.
Conway, A. R. A., Kane, M. J., Bunting, M. F., Hambrick, D. Z., Wilhelm, O., & Engle, R. W. (2005). Working memory span tasks: A methodological review and user’s guide. Psychonomic Bulletin and Review, 12(5), 769–786. https://doi.org/10.1016/j.tics.2003.10.005
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Steiger, J. H. (1980). Tests for comparing elements of a correlation matrix. Psychological Bulletin, 87(2), 245–251. https://doi.org/10.1037/0033-2909.87.2.245
Como citar este post
Lima, M. (2025, 2 de setembro). Como comparar dois coeficientes de correlação de Pearson para grupos dependentes? Blog Psicometria Online. https://blog.psicometriaonline.com.br/como-examinar-a-diferenca-entre-duas-correlacoes-dependentes/
