Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

Modelagem por Equações Estruturais no R: Conceitos e Aplicações

A Modelagem por Equações Estruturais (MEE) é uma técnica de análise estatística que explica a relação entre variáveis latentes e observadas.

Essa abordagem é uma técnica estatística multivariada que amplia a análise de regressão linear múltipla e a análise fatorial.

Neste post vamos falar sobre os conceitos e aplicações da MEE e como aplicá-la por meio do do pacote Lavaan no R.

Introdução a Modelagem por Equações Estruturais

A MEE é uma técnica de análise multivariada robusta, amplamente empregada nas ciências sociais e medicas. Suas aplicações variam desde a análise de relações simples entre variáveis até análises complexas de equivalência de medição para construtos de primeira e ordens superiores.

Por sua estrutura ser flexível para o desenvolvimento e análise de relações complexas entre múltiplas variáveis, permite que os pesquisadores testem teorias por meio de modelos empíricos.

Vantagens do SEM

Diferentemente de outros modelos estatísticos, como a regressão linear, a MEE modela relações complexas com variáveis inter-relacionadas. A MEE difere da regressão múltipla pelo fato de que os itens individuais podem contribuir para a construção do modelo. Regressões simples, bem como regressões múltiplas, são estimadas simultaneamente dentro deste modelo. Além disso, a MEE possibilita o cálculo de efeitos diretos e indiretos.

A MEE também fornece estimativas para efeitos diretos e indiretos entre variáveis e pode lidar com estimativas de parâmetros de modelos para dados ausentes.

Limitações do SEM

Apesar de suas vantagens, o MEE necessita de um tamanho de amostra grande para obter estimativas confiáveis dos parâmetros do modelo.

Isso significa que dados com uma amostra pequena tendem a ter parâmetros de modelo menos confiáveis em comparação com dados de uma amostra maior.

A MEE também exige um modelo teórico bem especificado, como a relação entre variáveis observadas e não observadas no modelo e também as variáveis preditoras e de resultado.

Algumas dessas especificações são desafiadoras e, se não feitas corretamente, podem levar a um ajuste inadequado do modelo. Por isso, é importante ter familiaridade com conceitos estatísticos tais como variável latente e observadas, bem como familiaridade com testes estatísticos – regressão linear, regressão logística, análise fatoriais – e software estatístico.

Conceitos Principais na MEE

A seguir vamos ver alguns dos conceitos principais que estão envolvidos na MEE.

Variáveis Latentes e Observadas

Variáveis latentes na MEE, também conhecidas como variáveis não observadas, são aquelas que não podem ser medidas diretamente e são inferidas a partir de variáveis observadas. Ao contrário das variáveis latentes, as variáveis observadas são medidas diretamente e são influenciadas pelas variáveis latentes.

Um exemplo típico é um estudo que busca entender como renda e estado civil afetam a felicidade. Como não podemos observar a felicidade diretamente, observamos a renda e o estado civil, tornando-os variáveis observadas e a felicidade, uma variável latente.

Diagramas de Caminho e Notações

O diagrama acima é conhecido como diagrama de caminho e mostra as várias relações entre variáveis em um modelo MEE.

Variáveis observadas são geralmente representadas em quadrados ou retângulos enquanto variáveis latentes em círculos ou ovais.

A seta entre as variáveis representa a relação hipotética entre elas, e essa relação pode ser direta, onde uma variável influencia outra, ou bidirecional, onde uma variável influencia duas variáveis.

Variáveis Endógenas e Exógenas

Variáveis endógenas são variáveis hipotéticas causadas por outras variáveis no modelo.

Estas são geralmente as variáveis dependentes no modelo, enquanto variáveis exógenas não são influenciadas por outras variáveis no modelo, mas, em vez disso, influenciam variáveis endógenas. Variáveis endógenas geralmente têm setas apontando para elas, enquanto variáveis exógenas não.

Na MEE, variáveis endógenas e exógenas podem ser tanto latentes quanto observadas.

Por exemplo, em um modelo que examina a relação entre felicidade e renda, a felicidade é modelada como uma variável latente com múltiplas variáveis observadas, como renda e estado civil.

A renda é uma variável endógena observada e diretamente medida no modelo, influenciada pela felicidade.

Efeitos Diretos e Indiretos

Um efeito direto é a relação direta entre duas variáveis, onde uma influencia a outra. Já um efeito indireto ocorre quando uma ou mais variáveis medeiam a relação no modelo.

Por exemplo, na relação entre ocupação e felicidade, a felicidade influencia a ocupação indiretamente com a variável renda como mediadora, enquanto um efeito direto da felicidade influencia o estado civil.

Avaliação do Modelo Interpretando Estimativas de Parâmetros e Erros Padrão

Estimativas de parâmetros são os valores dos coeficientes para cada variável preditora no modelo. Essas estimativas explicam como a variável preditora afeta a variável de resultado.

Por exemplo, se a variável renda tem um coeficiente de 4, significa que para uma mudança unitária na renda, a taxa de felicidade de um indivíduo provavelmente aumentará em 4.

Erros padrão são a medida de incerteza na estimativa dos coeficientes. Isso significa que quanto menor o erro padrão do coeficiente de uma variável, mais precisa é a estimativa da variável.

Interpretando Índices de Ajuste e Testes de Qualidade de Ajuste

Índices de ajuste e medidas de qualidade de ajuste são métricas usadas para medir o ajuste de um modelo. Esses índices incluem:

  • Qui-quadrado — Um valor não significativo indica um bom ajuste, embora às vezes não se possa confiar sempre no qui-quadrado devido à sua sensibilidade a grandes amostras. Ele provavelmente retornará um valor p significativo para um tamanho de amostra grande, independentemente da qualidade do ajuste do modelo.
  • A razão do qui-quadrado pelos graus de liberdade (χ2/gl; preferencialmente < 3.0),
  • Erro Quadrático Médio de Aproximação (RMSEA) — Um valor menor que 0,05 é considerado um bom ajuste, enquanto um valor entre .05 e .08 indica um ajuste razoável. Valores acima de 1 são considerados um ajuste ruim.
  • Índice de Ajuste Comparativo (CFI) — Um valor acima de 0,95 indica um bom ajuste, enquanto um valor abaixo de .90 indica um ajuste ruim.
  • Índice Tucker-Lewis (TLI) — Um valor acima de 0,95 indica um bom ajuste, enquanto um valor abaixo de .90 indica um ajuste ruim.
  • Resíduo Quadrático Médio Padronizado (SRMR) — Um valor de 0,08 ou menos é considerado um bom ajuste, enquanto um valor entre .08 e .10 indica um ajuste razoável. Valores acima de 0,10 são considerados um ajuste ruim.

Interpretando Resíduos e Índices de Modificação

Resíduos são a diferença entre os valores observados e previstos. Quanto menor o valor residual, pior o ajuste do modelo. Altos resíduos indicam que o modelo está omitindo variáveis preditoras importantes ou que o modelo não é apropriado para os dados.

Índices de modificação são alterações feitas em um modelo para melhorar a interpretação dos resíduos.

Aplicações da Modelagem por Equações Estruturais (MEE)

Psicologia

Na psicologia, os pesquisadores frequentemente buscam entender como diferentes fatores se relacionam entre si e como contribuem para comportamentos, emoções ou processos mentais.

A MEE ajuda a examinar essas relações complexas, criando um modelo que representa o quadro teórico do estudo.

A MEE também é usado para testar a existência de variáveis latentes. Por exemplo, um pesquisador pode querer testar a relação entre ansiedade e desempenho acadêmico.

A MEE pode ajudar a identificar se variáveis latentes como ansiedade e motivação, podem influenciar, por exemplo no desempenho acadêmico.

Ciências Sociais

Nas ciências sociais, os pesquisadores frequentemente buscam compreender como diferentes fatores contribuem para um determinado resultado, como as práticas parentais afetam o comportamento infantil ou como o apoio social impacta a saúde mental.

A MEE permite aos pesquisadores criar um modelo que representa as relações hipotéticas entre esses fatores e, em seguida, testar se os dados apoiam esse modelo.

A MEE também pode ser usada para explorar relações mais complexas, como efeitos mediadores e moderadores. Efeitos mediadores ocorrem quando uma terceira variável explica a relação entre duas outras, enquanto efeitos moderadores ocorrem quando a força ou direção da relação entre duas variáveis é afetada por uma terceira.

Educação

Na educação, a MEE pode ser aplicada para analisar vários aspectos da pesquisa educacional, como o impacto de diferentes métodos de ensino no desempenho dos alunos, a eficácia de intervenções ou programas e as relações entre vários fatores educacionais, como treinamento de professores, motivação dos alunos e resultados de aprendizagem.

Uma aplicação prática da MEE na educação é ajudar a determinar as práticas instrucionais mais eficazes para melhorar o desempenho dos alunos. Os pesquisadores podem usar a MEE para analisar a relação entre diferentes métodos de ensino, características dos alunos e desempenho acadêmico.

Por exemplo, podem investigar se estratégias de ensino, como instrução direta ou aprendizado baseado em solução de problemas, são mais eficazes para melhorar o desempenho dos alunos em diferentes disciplinas ou níveis de ensino.

Sintaxe da MEE usando o pacote Lavaan

O que é Lavaan?

O pacote Lavaan, criado por Yves Rosseel, é uma ferramenta importante no ambiente de programação R para realizar a análise de Modelo de Equações Estruturais (SEM).

Lançado em 2012, Lavaan é um acrônimo para “Latent Variable Analysis”, refletindo seu foco em análises estatísticas que envolvem variáveis latentes.

A principal utilidade do Lavaan é oferecer aos usuários de R uma maneira acessível e flexível de especificar e ajustar modelos MEE. Isso é particularmente útil em pesquisas que exploram relações complexas entre variáveis observáveis e não observáveis, como fatores psicológicos, sociais ou econômicos.

O Lavaan se destaca por sua facilidade de uso, permitindo que mesmo aqueles com conhecimento estatístico moderado possam construir e analisar modelos MEE.

Entre suas principais funcionalidades, o Lavaan permite realizar análises fatoriais confirmatórias (CFA), análises de caminho, modelos de variáveis latentes, além de calcular efeitos diretos, indiretos e totais entre variáveis.

Como na Lavaan utiliza til (~) como operador de regressão, lido como ‘é regredido em’. A variável dependente é chamada antes do til com as variáveis independentes chamadas após o til. Um modelo típico de caminho é definido por um conjunto de fórmulas de regressão.

Instalando e Carregando o Lavaan

Para instalar o pacote, você usa:

install.packages("lavaan")

Para carregar o pacote, você usa:

library(lavaan)

Criando um Objeto de Modelo

O objeto de modelo é onde você especifica seu modelo para a análise:

model <- "y =~ x1 + x2"

No código acima, o símbolo =~ especifica as variáveis observadas x1 e x2 para a variável latente y. Há outros símbolos que também podem ser usados na especificação do modelo, ~ especifica uma regressão entre variáveis de resultado e preditoras, e ~~ especifica a covariância entre variáveis.

model <- "y =~ x1 + x2 y ~ x3 + x4 x3 ~~ x5"

No código acima, x1 e x2 são variáveis observadas influenciadas por y, y também é predita por duas variáveis de resultado x3 e x4, enquanto x3 e x5 são covariantes.

Ajustando o Modelo

Para ajustar o modelo MEE, você usa a função sem(), especificando o objeto do modelo e também os dados.

fit <- sem(model, data = mydata)

Extraindo Resultados do Modelo

Os resultados são extraídos do modelo ajustado usando a função summary().

summary(fit, standardized = TRUE)

Compreender a sintaxe é apenas o início de uma jornada fascinante no mundo da análise multivariada. A habilidade de modelar e analisar relações complexas entre múltiplas variáveis abre portas para insights mais profundos e conclusões mais fundamentadas em suas pesquisas.

Conclusão

Este post é a um pouco do que é possível com MEE e como implementá-la. Se você está ansioso para expandir seu conhecimento e habilidades nessa área fascinante, temos um convite especial para você.

Visite o canal da Academy no YouTube, onde você encontrará um vídeo detalhado sobre modelagem de equações estruturais. Este vídeo é uma excelente oportunidade para aprofundar seu entendimento sobre MEE e aprender a aplicar essas técnicas em suas próprias pesquisas.

Aproveite, inscreva-se no canal, ative as notificações e esteja sempre atualizado com os mais recentes insights e tutoriais em análise de dados. Estamos ansiosos para vê-lo lá!

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Covariância e correlação

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de dados, entender a relação entre

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de dados. Embora ambos compartilhem o

Explorando as etapas da análise de dados

Explorando as etapas da análise de dados

No vasto universo da análise de dados, encontramos duas vertentes cruciais: as estatísticas descritivas e as estatísticas inferenciais. Cada uma desempenha um papel distintivo na interpretação e compreensão de conjuntos

Breve check list para escrita de artigo acadêmico

Breve check list para escrita de artigo acadêmico

Você está pronto para embarcar em uma jornada de descoberta acadêmica? Seja você um pesquisado experiente ou iniciante, ter um guia para escrever um artigo de pesquisa é essencial para

O que são médias marginais?

O que são médias marginais?

Ao começar com estatísticas descritivas tradicionais, como as médias brutas, reconhecemos a necessidade de ir além, considerando possíveis viéses decorrentes de variações no número de observações e covariâncias. A pergunta-chave

Covariância e correlação

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de dados, entender a relação entre

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de dados. Embora ambos compartilhem o

Explorando as etapas da análise de dados

Explorando as etapas da análise de dados

No vasto universo da análise de dados, encontramos duas vertentes cruciais: as estatísticas descritivas e as estatísticas inferenciais. Cada uma desempenha um papel distintivo na interpretação e compreensão de conjuntos

Breve check list para escrita de artigo acadêmico

Breve check list para escrita de artigo acadêmico

Você está pronto para embarcar em uma jornada de descoberta acadêmica? Seja você um pesquisado experiente ou iniciante, ter um guia para escrever um artigo de pesquisa é essencial para

O que são médias marginais?

O que são médias marginais?

Ao começar com estatísticas descritivas tradicionais, como as médias brutas, reconhecemos a necessidade de ir além, considerando possíveis viéses decorrentes de variações no número de observações e covariâncias. A pergunta-chave

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.