O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

O que é Multicolinearidade, como identificar e como lidar?

psicometriaonline

maio 3, 2021

A multicolinearidade é uma situação em que duas ou mais variáveis independentes em um modelo de regressão encontram-se altamente correlacionadas.

Essa alta correlação pode afetar a qualidade dos resultados do modelo e dificultar a interpretação dos resultados.

Por exemplo, imagine que você queira estimar o efeito da escolaridade e renda na satisfação com a vida. Aqui no Brasil, renda e escolaridade são altamente correlacionadas. Isso pode dificultar a interpretação dos resultados do modelo, uma vez que a contribuição de cada variável para explicar a variável dependente fica menos clara.

Assim, é importante detectar a multicolinearidade antes de realizar a análise para que possa ser tratada adequadamente.

Como identificar a Multicolinearidade?

Uma maneira de detectar a multicolinearidade é examinar a matriz de correlação das variáveis independentes. Correlações altas, acima de 0,70 entre pares de variáveis indicam que elas estão fortemente correlacionadas. Correlações acima de 0,80 são ainda mais preocupantes.

Outro indicador é o valor do fator de inflação da variância (VIF), que mede quanto a variância do coeficiente estimado para uma variável é inflada devido à multicolinearidade com as outras variáveis independentes. VIFs maiores que 10 indicam alta multicolinearidade, enquanto valores entre 5 e 10 podem ser preocupantes.

A multicolinearidade é o mesmo fenômeno, só que para mais do que duas variáveis. Ou seja, quando três ou mais variáveis tem uma relação (quase) perfeita entre si.

Como lidar com a multicolinearidade?

Existem várias técnicas que podem ser utilizadas para lidar com a multicolinearidade:

Técnica 1: Exclusão de variáveis

A maneira mais simples de lidar com a multicolinearidade é excluir a variável multicolinear. Isso pode ser feito sem perda de informação, já que aquela variável está redundante com outras variáveis. No entanto, essa técnica pode ser problemática, especialmente se a variável excluída for importante para a análise.

Técnica 2: Agrupamento de variáveis

Outra maneira é realizar um agrupamento das variáveis multicolineares, por meio de técnicas de redução, como Análise de Componentes Principais (ACP). Nesse caso, ao invés de utilizar múltiplas VIs, gera-se um escore único, a partir de uma variável de agrupamento, gerada pela Análise de Componentes Principais (ACPs). A vantagem dessa técnica é que o modelo se torna mais parcimonioso. A desvantagem é que você perde a informação de cada preditor individualmente.

Técnica 3: Modelagem por Equações Estruturais

A modelagem por equações estruturais é um avanço das regressões tradicionais (lineares ou logísticas) e permite modelar as relações entre variáveis. Nesse caso, é possível incluir a correlação entre as variáveis colineares no modelo, purificando-o. Por exemplo, na imagem abaixo, veja que há uma correlação entre renda e escolaridade estimada no modelo (seta bidirecional vermelha). Após controlar pelo nível de correlação entre renda e escolaridade, o efeito das variáveis independentes na variável dependente será adequadamente estimado.

Conclusão

A multicolinearidade é um problema que pode comprometer a interpretação dos resultados de modelos de regressão. É importante identificar a multicolinearidade e escolher a técnica mais adequada para lidar com ela. As técnicas apresentadas neste post são eficientes para lidar com a multicolinearidade e garantir a qualidade dos resultados obtidos.

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Conteúdo

Mais lidos

Glossário de Análise Fatorial Exploratória

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Covariância e correlação

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Postados recentemente

Glossário de Análise Fatorial Exploratória

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Covariância e correlação

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

psicometriaonline

Posts sugeridos

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Nesse post, iremos te ensinar a lidar, de modo metodologicamente adequado com os pressupostos da análise de variância (ANOVA), quando eles não são acatados. O…

psicometriaonline

abr 6, 2024

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de…

Alex França

fev 18, 2024

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de…

Alex França

fev 11, 2024

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.