Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

O que é Multicolinearidade, como identificar e como lidar?

A multicolinearidade é uma situação em que duas ou mais variáveis independentes em um modelo de regressão encontram-se altamente correlacionadas.

Essa alta correlação pode afetar a qualidade dos resultados do modelo e dificultar a interpretação dos resultados.

Por exemplo, imagine que você queira estimar o efeito da escolaridade e renda na satisfação com a vida. Aqui no Brasil, renda e escolaridade são altamente correlacionadas. Isso pode dificultar a interpretação dos resultados do modelo, uma vez que a contribuição de cada variável para explicar a variável dependente fica menos clara.

Assim, é importante detectar a multicolinearidade antes de realizar a análise para que possa ser tratada adequadamente.

Como identificar a Multicolinearidade?

Uma maneira de detectar a multicolinearidade é examinar a matriz de correlação das variáveis independentes. Correlações altas, acima de 0,70 entre pares de variáveis indicam que elas estão fortemente correlacionadas. Correlações acima de 0,80 são ainda mais preocupantes.

Outro indicador é o valor do fator de inflação da variância (VIF), que mede quanto a variância do coeficiente estimado para uma variável é inflada devido à multicolinearidade com as outras variáveis independentes. VIFs maiores que 10 indicam alta multicolinearidade, enquanto valores entre 5 e 10 podem ser preocupantes.

A multicolinearidade é o mesmo fenômeno, só que para mais do que duas variáveis. Ou seja, quando três ou mais variáveis tem uma relação (quase) perfeita entre si.

Como lidar com a multicolinearidade?

Existem várias técnicas que podem ser utilizadas para lidar com a multicolinearidade:

Técnica 1: Exclusão de variáveis

A maneira mais simples de lidar com a multicolinearidade é excluir a variável multicolinear. Isso pode ser feito sem perda de informação, já que aquela variável está redundante com outras variáveis. No entanto, essa técnica pode ser problemática, especialmente se a variável excluída for importante para a análise.

Técnica 2: Agrupamento de variáveis

Outra maneira é realizar um agrupamento das variáveis multicolineares, por meio de técnicas de redução, como Análise de Componentes Principais (ACP). Nesse caso, ao invés de utilizar múltiplas VIs, gera-se um escore único, a partir de uma variável de agrupamento, gerada pela Análise de Componentes Principais (ACPs). A vantagem dessa técnica é que o modelo se torna mais parcimonioso. A desvantagem é que você perde a informação de cada preditor individualmente.

Técnica 3: Modelagem por Equações Estruturais

A modelagem por equações estruturais é um avanço das regressões tradicionais (lineares ou logísticas) e permite modelar as relações entre variáveis. Nesse caso, é possível incluir a correlação entre as variáveis colineares no modelo, purificando-o. Por exemplo, na imagem abaixo, veja que há uma correlação entre renda e escolaridade estimada no modelo (seta bidirecional vermelha). Após controlar pelo nível de correlação entre renda e escolaridade, o efeito das variáveis independentes na variável dependente será adequadamente estimado.

Conclusão

A multicolinearidade é um problema que pode comprometer a interpretação dos resultados de modelos de regressão. É importante identificar a multicolinearidade e escolher a técnica mais adequada para lidar com ela. As técnicas apresentadas neste post são eficientes para lidar com a multicolinearidade e garantir a qualidade dos resultados obtidos.

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Glossário de Análise Fatorial Exploratória

Glossário de Análise Fatorial Exploratória

A Psicometria Online tem o prazer de anunciar a publicação de um valioso recurso para profissionais e estudantes da Psicometria: o Glossário de Análise Fatorial Exploratória. Entender os termos e

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Nesse post, iremos te ensinar a lidar, de modo metodologicamente adequado com os pressupostos da análise de variância (ANOVA), quando eles não são acatados. O que é Análise de Variância

Estatística Descritiva e Estatística Inferencial: o que são e quais as diferenças

Estatística Descritiva e Estatística Inferencial: o que são e quais as diferenças

Olá. Neste post vamos explicar de forma fácil o que são e quais as principais diferenças entre a estatística descritiva e a estatística inferencial. O que é estatística descritiva? A

Análise de mediação e moderação: definições e diferenças

Análise de mediação e moderação: definições e diferenças

Nesse post, discutimos as caracteríticas e diferenças entre modelos de mediação e moderação.

Análise Fatorial Exploratória ou Análise Fatorial Confirmatória: Qual escolher?

Análise Fatorial Exploratória ou Análise Fatorial Confirmatória: Qual escolher?

Nesse post, discutimos quando utilizar uma análise fatorial exploratória e uma análise fatorial confirmatória.

Glossário de Análise Fatorial Exploratória

Glossário de Análise Fatorial Exploratória

A Psicometria Online tem o prazer de anunciar a publicação de um valioso recurso para profissionais e estudantes da Psicometria: o Glossário de Análise Fatorial Exploratória. Entender os termos e

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Nesse post, iremos te ensinar a lidar, de modo metodologicamente adequado com os pressupostos da análise de variância (ANOVA), quando eles não são acatados. O que é Análise de Variância

Estatística Descritiva e Estatística Inferencial: o que são e quais as diferenças

Estatística Descritiva e Estatística Inferencial: o que são e quais as diferenças

Olá. Neste post vamos explicar de forma fácil o que são e quais as principais diferenças entre a estatística descritiva e a estatística inferencial. O que é estatística descritiva? A

Análise de mediação e moderação: definições e diferenças

Análise de mediação e moderação: definições e diferenças

Nesse post, discutimos as caracteríticas e diferenças entre modelos de mediação e moderação.

Análise Fatorial Exploratória ou Análise Fatorial Confirmatória: Qual escolher?

Análise Fatorial Exploratória ou Análise Fatorial Confirmatória: Qual escolher?

Nesse post, discutimos quando utilizar uma análise fatorial exploratória e uma análise fatorial confirmatória.

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.