O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é homoscedasticidade na regressão linear?

Bruno Damásio

mar 9, 2021

Neste post, falaremos sobre o pressuposto de homocedasticidade na regressão linear. Primeiramente, explicaremos o conceito de forma simples. Em seguida, mostraremos como identificar a homocedasticidade com o gráfico de resíduos e valores ajustados. Depois, abordaremos o gráfico de probabilidade normal dos resíduos. Por fim, indicaremos testes estatísticos úteis para essa verificação.

Homocedasticidade na regressão linear

Um dos pressupostos fundamentais da regressão linear múltipla é a homocedasticidade. Em síntese, isso significa que a variância da variável dependente Y deve permanecer constante para todos os valores das variáveis preditoras X1, X2, …, Xn​.

Outra maneira de interpretar esse conceito é entender que os resíduos — isto é, as diferenças entre os valores observados e os valores previstos pelo modelo — devem ter variância constante ao longo de todos os níveis de Y. Quando essa condição não é atendida, os dados apresentam heterocedasticidade, o que pode comprometer a validade da regressão.

A fim de garantir análises mais confiáveis, é essencial verificar esse pressuposto. Em seguida, exploramos três métodos para avaliar a homocedasticidade. Idealmente, utilize todos eles para fortalecer suas conclusões.

banner da Psicometria Online Academy.

Homocedasticidade na regressão linear: gráfico de resíduos e valores ajustados

Uma forma visual e bastante eficaz de avaliar a homocedasticidade na regressão linear é por meio do gráfico de resíduos versus valores ajustados. Esse gráfico é gerado a partir de uma regressão linear múltipla.

Se quiser relembrar os fundamentos da técnica, confira nossos artigos sobre regressão linear e regressão linear simples.

Na Figura 1, o eixo x representa os valores ajustados de Y, isto é, os valores de Y previstos pelo modelo de regressão. Por outro lado, o eixo y mostra os resíduos, ou seja, a diferença entre o valor observado e o valor previsto de Y.

scatterplot indicando homocedasticidade na regressão linear.
Figura 1. Gráfico de resíduos e valores ajustados: caso com homocedasticidade.

Ao analisarmos esse gráfico, buscamos identificar se os resíduos se distribuem de forma aleatória e homogênea em torno do zero. É exatamente o que acontece na Figura 1.

Por outro lado, quando os resíduos se concentram em determinadas regiões ou formam padrões — como uma forma de funil — isso pode indicar heterocedasticidade. É o que acontece na Figura 2.

scatterplot indicando heterocedasticidade na regressão linear.
Figura 2. Gráfico de resíduos e valores ajustados: caso com heterocedasticidade.

Na Figura 2, observamos uma maior quantidade de resíduos mais próximos dos valores ajustados para valores baixos, enquanto que os resíduos são mais heterogêneos conforme os valores ajustados aumentam. A mensagem é clara: nosso modelo de regressão erra de forma desigual ao longo dos diferentes valores ajustados.

Homocedasticidade na regressão linear: gráfico de probabilidade normal dos resíduos

Outra abordagem gráfica útil é o gráfico de probabilidade normal dos resíduos. Embora esse método não tenha como objetivo direto avaliar a homocedasticidade, ele pode apontar padrões problemáticos nos resíduos.

Neste gráfico (Figura 3), o eixo y representa os quantis residuais observados, enquanto o eixo x mostra os quantis esperados, assumindo distribuição normal. Como os erros aleatórios devem seguir uma distribuição normal, desvios significativos da linha de referência sugerem violação de pressupostos, como a homogeneidade de variância.

gráfico de probabilidade normal indicando homocedasticidade na regressão linear.
Figura 3. Gráfico de probabilidade normal dos resíduos: caso com homocedasticidade.

Na Figura 3, a maioria dos valores caem sobre a reta de referência vermelha, indicando assim adequada aderência dos resíduos a uma distribuição normal.

Por outro lado, se os resíduos se afastam da linha reta, especialmente nas extremidades, isso pode indicar problemas como a heterocedasticidade. É exatamente o que sugere a Figura 4. Por isso, ainda que indiretamente, esse gráfico contribui para a avaliação da homocedasticidade na regressão linear.

gráfico de probabilidade normal indicando heterocedasticidade na regressão linear.
Figura 4. Gráfico de probabilidade normal dos resíduos: caso com heterocedasticidade.

Homocedasticidade na regressão linear: testes de normalidade

Por fim, podemos recorrer a testes estatísticos para complementar a análise gráfica. Os testes de Shapiro–Wilk e Kolmogorov–Smirnov avaliam se os resíduos seguem uma distribuição normal.

Para fins de ilustração, a Figura 5 apresenta um histograma dos resíduos (mesmos dados das Figuras 1 e 3). Note que os valores ajustados parecem se distribuir normalmente ao redor de zero. Essa impressão visual é apoiada pelo teste de Shapiro–Wilk, que não rejeitou a hipótese nula de que os dados aderem a uma distribuição normal, W(150) = 0,99, p = 0,85.

histograma dos resíduos com normalidade.
Figura 5. Histograma dos resíduos: caso com homocedasticidade.

Em contrapartida, a Figura 6 apresenta um histograma dos resíduos (mesmos dados das Figuras 2 e 4) que, embora estejam simetricamente distribuídos ao redor de zero, possuem uma dispersão que difere da normal. Essa impressão visual é apoiada pelo teste de Shapiro–Wilk, que rejeitou a hipótese nula de que os dados aderem a uma distribuição normal, W(150) = 0,86, p < 0,001.

Desse modo, um valor de p menor que 0,05 sugere que os resíduos não são normais, o que pode indicar, entre outros problemas, a ausência de homocedasticidade.

histograma dos resíduos sem normalidade.
Figura 6. Histograma dos resíduos: caso com heterocedasticidade.

Embora esses testes sejam úteis, é importante interpretá-los junto com os gráficos. Isso porque testes de normalidade são sensíveis ao tamanho da amostra. Portanto, sempre que possível, combine métodos visuais e estatísticos para uma avaliação mais robusta da homocedasticidade na regressão linear.

Conclusão

Gostou deste conteúdo? Então aproveite e também se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades.

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referência

Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.

Como citar este post

Damásio, B. (2021, 9 de março). O que é homoscedasticidade na regressão linear? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/como-verificar-a-homogeneidade-de-variancia-na-regressao-linear/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

O que significa soma dos quadrados, em estatística?

O que é modelo linear geral?

O que é o tamanho de efeito em linguagem comum (common language effect size)?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

O que é correlação de Spearman?

Postados recentemente

O que significa soma dos quadrados, em estatística?

Como inverter itens no SPSS?

O algoritmo k-means clustering

Tudo que você precisa saber sobre inversão de itens de instrumentos de autorrelato

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias