O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é análise fatorial exploratória?

Bruno Damásio

maio 17, 2021

A análise fatorial exploratória (AFE) é um conjunto de técnicas estatísticas multivariadas que tem como objetivo encontrar a estrutura subjacente em uma matriz de dados e determinar o número e a natureza das variáveis latentes (fatores) que melhor representam um conjunto de variáveis observadas.

Sendo assim, o principal objetivo da AFE é identificar fatores latentes — isto é, variáveis que não são diretamente observadas, mas que explicam as correlações entre os itens mensurados. Para isso, a técnica parte de uma matriz de correlação ou covariância e aplica métodos matemáticos a fim de extrair os fatores que melhor representam a estrutura interna dos dados.

Diferente da análise fatorial confirmatória (AFC), a AFE não parte de hipóteses fixas. Em vez disso, a AFE permite que os dados “falem por si”, indicando quantos fatores existem e como os itens se organizam entre eles. Sendo assim, a AFE é especialmente útil nas fases iniciais do desenvolvimento de instrumentos psicométricos.

banner da NAOPARE.

Aprenda a realizar uma análise fatorial exploratória PERFEITA

Se você precisa rodar uma análise fatorial e ainda tem dúvidas sobre como usar os procedimentos metodologicamente mais adequados, então o vídeo a seguir é para você:

Variáveis latentes e observáveis: o que são?

Agora que entendemos a ideia da análise fatorial aplicada a construtos psicológicos, fica mais fácil de entender sua função. Na psicometria, por meio da análise fatorial, queremos entender a relação entre as variáveis observáveis.

As variáveis observáveis são aquelas que conseguimos medir (por exemplo, comportamentos, sentimentos, emoções). Os itens de um instrumento são exemplos de variáveis observáveis. Já as variáveis latentes são fenômenos que não conseguimos medir diretamente, mas que podemos inferir através da relação entre as variáveis observáveis.

Em seguida, abordaremos um exemplo para consolidar nosso entendimento. Na teoria das variáveis latentes, comumente pensamos nas psicopatologias como um transtorno que causa determinados sintomas. Nesse sentido, podemos entender um episódio depressivo tal como esquematizamos na Figura 1.

análise fatorial, representação gráfica de modelo teórico de depressão.
Figura 1. Relação entre variável latente (depressão) e variáveis observadas (sintomas).

Nesse exemplo (meramente ilustrativo), os sintomas são as variáveis que podemos observar. Podemos criar uma pergunta em um instrumento de autorrelato onde a pessoa responde se está perdendo o sono e o apetite, e se está com o humor e energia mais deprimidos que o normal.

Já a depressão é uma variável latente. Nós não podemos observar diretamente a depressão. No entanto, é possível dizer uma pessoa que está tendo um episódio depressivo terá uma alteração naqueles sintomas que estamos avaliando.

Como a análise fatorial exploratória funciona, na prática?

Até aqui, entendemos o que são variáveis latentes e observáveis. Já passamos da metade do caminho, pois a função da análise fatorial é justamente descobrir e modelar essas variáveis latentes.

Para entender como a AFE funciona na prática, vamos retomar o exemplo da seção anterior. Suponha que estamos interessados em investigar o construto depressão. Se realmente estivermos medindo esse construto, esperamos que os itens incluídos no instrumento — como perda de sono, apetite reduzido e baixa energia — estejam relacionados entre si.

Agora, imagine que incluímos no mesmo instrumento um item que não tem relação direta com a depressão (por exemplo, um item sobre empatia). Neste caso, esse item provavelmente não se correlacionará fortemente com os demais. Em síntese, é exatamente esse tipo de padrão que a análise fatorial exploratória busca identificar.

Um exemplo aplicado: o que os padrões de correlação podem revelar

Em seguida, vamos supor que, além dos sintomas já mencionados, decidimos incluir no questionário outros sintomas que acreditamos também estar associados à depressão: agitação, preocupação, dificuldade de concentração e irritabilidade.

Cada retângulo da Figura 2 representa um sintoma medido por meio de um questionário aplicado a centenas de pessoas. Cada coluna representa um grupo de indivíduos, e o preenchimento em cada célula indica a resposta média daquele grupo para o sintoma em questão.

exemplo de itens que se aglutinam em dois conjuntos distintos na análise fatorial, representando fatores depressão e ansiedade.
Figura 2. Representação esquemática de padrões de respostas distintos em diferentes grupos de respondentes. Itens azuis claros representam o fator depressão, enquanto itens azuis escuros representam o fator ansiedade.

Repare que os dados mostram um padrão bastante específico:

  • No grupo 1, os indivíduos tiveram médias baixas nos cinco primeiros itens (os sintomas clássicos de depressão), mas médias altas nos itens novos.
  • No grupo 2, ocorreu o oposto: médias altas nos sintomas clássicos e baixas nos novos.
  • No grupo 3, as médias foram altas em ambos os conjuntos de itens.
  • No grupo 4, as médias foram um pouco abaixo em todos os itens.

Esse padrão sugere que há, pelo menos, dois conjuntos distintos de sintomas. Logo, é possível que existam dois fatores latentes explicando a estrutura desses dados: um fator relacionado à depressão e outro à ansiedade.

No início do estudo, nossa expectativa era que todas as variáveis formassem um único fator. Contudo, a análise fatorial exploratória nos mostrou algo diferente — e esse é o seu maior valor: ela serve como um primeiro passo para confirmar ou revisar nossas hipóteses iniciais.

Com isso, fica clara a função da AFE: identificar a estrutura interna de um instrumento, indicando como os itens se agrupam e que construtos podem estar sendo medidos.

Etapas principais da análise fatorial exploratória

Realizar uma AFE envolve diferentes etapas, cada uma com decisões importantes. Em seguida, apresentamos as mais relevantes.

Escolha da matriz de correlação

A análise fatorial começa com uma matriz de correlação entre as variáveis. É a partir dessa matriz que vamos entender como se dá a relação entre os itens. Portanto, todas as decisões sobre como fazer uma correlação se aplicam aqui.

Em psicometria, como os dados geralmente são ordinais, recomenda-se o uso da correlação policórica. Usar correlações de Pearson pode levar a distorções, uma vez que esse tipo de correlação é adequado para variáveis contínuas.

Retenção fatorial

Após decidir o tipo de matriz de correlação, é necessário aplicar uma técnica para extração dos fatores. É isto que vai te ajudar a decidir qual é o melhor número de fatores para o seu instrumento.

Determinar quantos fatores devem ser retidos é crucial, pois não queremos reter fatores espúrios, nem tampouco omitir fatores teoricamente relevantes para a nossa área de pesquisa. Para isso, recomenda-se o uso de métodos robustos como:

  • Análise paralela de Horn: neste método, geramos matrizes de dados aleatórios com as mesmas dimensões da matriz original, mas com valores fixos de correlação entre as variáveis. O número de fatores a serem retidos é determinado pela comparação dos autovalores (eigenvalues) obtidos para cada conjunto de dados. Este método utiliza matrizes de correlações de Pearson para obter as matrizes aleatórias.
  • Análise paralela (optimal implementation): também é um método baseado em simulação que usa dados aleatórios para criar um conjunto de autovalores (eigenvalues) que podem ser comparados com os autovalores (eigenvalues) reais da matriz de correlação. No entanto, aqui usamos o mesmo tipo de correlação usado na matriz de correlação dos dados originais.
  • Método Hull: pode-se dizer que o este método utiliza uma abordagem iterativa, começando com um modelo de um fator e adicionando gradualmente mais fatores até que o critério de retenção seja satisfeito.

Rotação fatorial

Após determinar o número de fatores, o próximo passo é aplicar uma rotação. Em síntese, a rotação fatorial visa tornar os resultados mais interpretáveis, fazendo com que os itens carreguem fortemente em apenas um fator.

Existem dois tipos principais de rotação fatorial — muito embora esses tipos se subdividam em métodos específicos. Na rotação ortogonal, assumimos que não há correlação entre os fatores. Por outro lado, na rotação oblíqua, permitimos que haja correlação entre os fatores.

Sendo assim, a rotação ortogonal estipula, a priori, que não há correlação entre os fatores (r = 0), gerando, portanto, fatores totalmente independentes uns dos outros. Entretanto, esse pressuposto pouco plausível em pesquisas de ciências humanas e da saúde, onde as dimensões de um construto tendem a se relacionar entre si. 

O adequado, na maioria dos casos, é uma rotação oblíqua. Existem diversos métodos de rotação, mas muitos tendem a ser igualmente bons: oblimin, quartimin, promax etc.

Saiba mais: O que é rotação fatorial?

análise fatorial e rotação fatorial.

Interpretação dos resultados da análise fatorial: cargas fatoriais

Após a rotação, o foco passa a ser a interpretação dos dados. O principal valor a observar são as cargas fatoriais, que indicam o quanto cada fator explica cada variável observada.

Essas cargas variam de –1 a +1. Valores absolutos mais próximos de 1 indicam maior influência do fator sobre a variável; valores próximos de zero indicam influência fraca. Para decidir se uma variável pertence a um fator, adota-se um ponto de corte — geralmente 0,30 em módulo, embora valores como 0,40 ou 0,50 também sejam comuns.

A Tabela 1 mostra as cargas fatoriais de um instrumento de avaliação dos cinco grandes fatores de personalidade (Big Five). No entanto, nossa análise revelou seis fatores, e não cinco. Os quatro primeiros se alinham ao esperado — os nomes das variáveis refletem os fatores originais, como C1 a C5 para “conscienciosidade”.

Fator 1Fator 2Fator 3Fator 4Fator 5Fator 6
A1   -0.619  
A2   0.721  
A3   0.584  
A4    0.398  
A5    0.399  
C1  0.579   
C2  0.747   
C3  0.587   
C4  -0.631  
C5  -0.580   
E1 -0.740    
E2 -0.740    
E3 0.422   
E4 0.576    
E5 0.503    
N10.901     
N20.926     
N30.739     
N40.462    
N50.494     
O1    0.573 
O2     0.519
O3    0.624 
O4    0.396 
O5     0.575
Tabela 1. Cargas fatoriais dos itens nos fatores, após análise fatorial exploratória.

Por outro lado, os Fatores 5 e 6 fogem do padrão previsto. Ambos envolvem itens de “abertura à experiência”, mas divididos em dois grupos: O1, O3 e O4 formam um fator, enquanto O2 e O5 formam outro. Em contextos reais, essa divisão indicaria a necessidade de revisar os itens, reler a literatura e investigar se há justificativa teórica para a separação.

Interpretação dos resultados da análise fatorial: comunalidades e variância explicada

Anteriormente, discutimos as cargas fatoriais. Mas elas não são as únicas métricas relevantes para avaliar o produto de uma análise fatorial exploratória. Outras métricas importantes de interpretarmos são as comunalidades e a variância explicada do modelo final.

Primeirmente, as comunalidades nos indicam o quanto cada variável observada é explicada por todos os fatores. Ela também tem valor entre –1 a +1 e pode indicar que uma variável não tem variância comum explicada por nenhum dos outros fatores.

Já a variância explicada nos informa o quanto de variância nos cada fator explica. Portanto, se um fator possui variância explicada de 0,54, podemos dizer que ele explica 54% da variação daquelas variáveis.

Conclusão

Neste post, introduzimos de forma abrangente a análise fatorial exploratória. Embora este seja um assunto complexo, ele é de extrema importância para psicometristas. Como ela se baseia em muitos conhecimentos prévios e tem cálculos complexos, não se cobre de entender tudo de uma vez, e nem em entender tudo a partir deste artigo. Mas eu espero que tenha sido uma boa introdução e uma visão geral do processo.

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

banner da Psicometria Online Academy.

Referências

Damásio, B. F. (2012). Uso da análise fatorial exploratória em psicologia. Avaliação Psicológica, 11(2), 213–228.

Laros, J. A. (2004). O uso da análise fatorial: Algumas diretrizes para pesquisadores. In L. Pasquali (Org.), Análise fatorial para pesquisadores (pp. 141–160). Vozes.

Como citar este post

Damásio, B. (2021, 17 de maio). O que é análise fatorial exploratória? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-analise-fatorial-exploratoria/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

0 0 Votos
Classificação do artigo
Inscrever-se
Notificar de
guest

2 Comentários
mais antigos
mais recentes Mais votado
Feedbacks embutidos
Ver todos os comentários
trackback
2 anos atrás

[…] estão mais fortemente relacionadas a cada fator, tornando a interpretação dos resultados da Análise Fatorial Exploratória, por exemplo, mais fácil e intuitiva. […]

trackback
2 anos atrás

[…] sobre o surgimento do modelo dos fatores comuns e da análise fatorial em nosso artigo sobre Análise Fatorial Exploratória (AFE), sugiro que você leia este artigo para entender o insight que nos trouxe até […]

Posts sugeridos

Por que a invariância de medição é importante?

Comunalidade vs. singularidade: entendendo as diferenças

Como interpretar a SRMR e o RMSEA em uma análise fatorial confirmatória?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

O que é correlação de Spearman?

Postados recentemente

O que são efeitos principais e efeitos de interação?

Regularização: o personal trainer da Machine Learning

Quais são as diferenças entre os delineamentos intrassujeitos e entressujeitos?

Efeito teto e efeito chão: o que são e por que eles importam?

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias