Neste post, falaremos sobre o pressuposto de homocedasticidade na regressão linear. Primeiramente, explicaremos o conceito de forma simples. Em seguida, mostraremos como identificar a homocedasticidade com o gráfico de resíduos e valores ajustados. Depois, abordaremos o gráfico de probabilidade normal dos resíduos. Por fim, indicaremos testes estatísticos úteis para essa verificação.
Homocedasticidade na regressão linear
Um dos pressupostos fundamentais da regressão linear múltipla é a homocedasticidade. Em síntese, isso significa que a variância da variável dependente Y deve permanecer constante para todos os valores das variáveis preditoras X1, X2, …, Xn.
Outra maneira de interpretar esse conceito é entender que os resíduos — isto é, as diferenças entre os valores observados e os valores previstos pelo modelo — devem ter variância constante ao longo de todos os níveis de Y. Quando essa condição não é atendida, os dados apresentam heterocedasticidade, o que pode comprometer a validade da regressão.
A fim de garantir análises mais confiáveis, é essencial verificar esse pressuposto. Em seguida, exploramos três métodos para avaliar a homocedasticidade. Idealmente, utilize todos eles para fortalecer suas conclusões.

Homocedasticidade na regressão linear: gráfico de resíduos e valores ajustados
Uma forma visual e bastante eficaz de avaliar a homocedasticidade na regressão linear é por meio do gráfico de resíduos versus valores ajustados. Esse gráfico é gerado a partir de uma regressão linear múltipla.
Se quiser relembrar os fundamentos da técnica, confira nossos artigos sobre regressão linear e regressão linear simples.
Na Figura 1, o eixo x representa os valores ajustados de Y, isto é, os valores de Y previstos pelo modelo de regressão. Por outro lado, o eixo y mostra os resíduos, ou seja, a diferença entre o valor observado e o valor previsto de Y.

Ao analisarmos esse gráfico, buscamos identificar se os resíduos se distribuem de forma aleatória e homogênea em torno do zero. É exatamente o que acontece na Figura 1.
Por outro lado, quando os resíduos se concentram em determinadas regiões ou formam padrões — como uma forma de funil — isso pode indicar heterocedasticidade. É o que acontece na Figura 2.

Na Figura 2, observamos uma maior quantidade de resíduos mais próximos dos valores ajustados para valores baixos, enquanto que os resíduos são mais heterogêneos conforme os valores ajustados aumentam. A mensagem é clara: nosso modelo de regressão erra de forma desigual ao longo dos diferentes valores ajustados.
Homocedasticidade na regressão linear: gráfico de probabilidade normal dos resíduos
Outra abordagem gráfica útil é o gráfico de probabilidade normal dos resíduos. Embora esse método não tenha como objetivo direto avaliar a homocedasticidade, ele pode apontar padrões problemáticos nos resíduos.
Neste gráfico (Figura 3), o eixo y representa os quantis residuais observados, enquanto o eixo x mostra os quantis esperados, assumindo distribuição normal. Como os erros aleatórios devem seguir uma distribuição normal, desvios significativos da linha de referência sugerem violação de pressupostos, como a homogeneidade de variância.

Na Figura 3, a maioria dos valores caem sobre a reta de referência vermelha, indicando assim adequada aderência dos resíduos a uma distribuição normal.
Por outro lado, se os resíduos se afastam da linha reta, especialmente nas extremidades, isso pode indicar problemas como a heterocedasticidade. É exatamente o que sugere a Figura 4. Por isso, ainda que indiretamente, esse gráfico contribui para a avaliação da homocedasticidade na regressão linear.

Homocedasticidade na regressão linear: testes de normalidade
Por fim, podemos recorrer a testes estatísticos para complementar a análise gráfica. Os testes de Shapiro–Wilk e Kolmogorov–Smirnov avaliam se os resíduos seguem uma distribuição normal.
Para fins de ilustração, a Figura 5 apresenta um histograma dos resíduos (mesmos dados das Figuras 1 e 3). Note que os valores ajustados parecem se distribuir normalmente ao redor de zero. Essa impressão visual é apoiada pelo teste de Shapiro–Wilk, que não rejeitou a hipótese nula de que os dados aderem a uma distribuição normal, W(150) = 0,99, p = 0,85.

Em contrapartida, a Figura 6 apresenta um histograma dos resíduos (mesmos dados das Figuras 2 e 4) que, embora estejam simetricamente distribuídos ao redor de zero, possuem uma dispersão que difere da normal. Essa impressão visual é apoiada pelo teste de Shapiro–Wilk, que rejeitou a hipótese nula de que os dados aderem a uma distribuição normal, W(150) = 0,86, p < 0,001.
Desse modo, um valor de p menor que 0,05 sugere que os resíduos não são normais, o que pode indicar, entre outros problemas, a ausência de homocedasticidade.

Embora esses testes sejam úteis, é importante interpretá-los junto com os gráficos. Isso porque testes de normalidade são sensíveis ao tamanho da amostra. Portanto, sempre que possível, combine métodos visuais e estatísticos para uma avaliação mais robusta da homocedasticidade na regressão linear.
Conclusão
Gostou deste conteúdo? Então aproveite e também se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades.
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referência
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Como citar este post
Damásio, B. (2021, 9 de março). O que é homoscedasticidade na regressão linear? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/como-verificar-a-homogeneidade-de-variancia-na-regressao-linear/
