O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é e como calcular a variância média extraída?

Marcos Lima

maio 2, 2025

Neste post, falaremos sobre a variância média extraída, um indicador da fidedignidade dos escores de um instrumento. Primeiramente, definiremos o indicador e apresentaremos sua fórmula. Em seguida, relacionaremos a variância média extraída com o conceito de fidedignidade da teoria clássica dos testes. Por fim, nós apresentaremos um exemplo detalhado de como usar as informações fornecidas por uma análise fatorial confirmatória para computar as variâncias médias extraídas dos fatores do modelo.

O que é variância média extraída?

A variância média extraída (VME) — ou average variance extracted (AVE) — é um indicador estatístico utilizado principalmente na validação de construtos latentes em modelos de mensuração.

Introduzida por Fornell e Larcker (1981), a VME mede a proporção de variância capturada por um construto em relação à variância atribuída ao erro de mensuração. Ou seja, ela indica o quanto os indicadores realmente refletem o construto que deveriam medir.

A VME é fundamental para avaliar a fidedignidade dos escores. Quanto maior a VME, mais confiança temos de que os indicadores estão captando bem o construto latente subjacente.

banner da NAOPARE.

Qual é a fórmula da variância média extraída?

Em seguida, introduzimos a fórmula da VME (Fornell & Larcker, 1981, Equação 11; Valentini & Damásio, 2016, Equação 3):

fórmula da variância média extraída.

onde λi é a carga fatorial padronizada do item i, θii é a variância residual do item i, e k é o total de itens em um fator.

Em outras palavras, somamos os quadrados das cargas fatoriais e dividimos o valor obtido pela soma dos quadrados das cargas mais a soma das variâncias residuais.

Uma maneira intuitiva — e matematicamente equivalente — de pensar na fórmula anterior é considerando que, tipicamente, temos a seguinte relação entre as cargas fatoriais padronizadas e as variâncias residuais de uma análise fatorial confirmatória: λi2 + θii = 1 (note que esse é exatamente o termo de uma iteração do denominador da fórmula da VME).

Uma vez que nossa variável indexadora i vai de 1 até k, o denominador resultará no próprio valor de k — o número de indicadores carregando em um dado fator na análise fatorial confirmatória. Sendo assim, a fórmula a seguir é conceitualmente equivalente à anterior (Valentini & Damásio, 2016, Equação 4):

fórmula alternativa da variância média extraída.

Em outras palavras, essa fórmula deixa explícito que a VME consiste na média dos quadrados das cargas fatoriais padronizadas — o que é totalmente consistente com a expressão variância média extraída.

O valor da VME varia entre 0 e 1. Um valor acima de 0,50 é geralmente considerado aceitável, pois indica que mais da metade da variância dos indicadores é explicada pela variável latente e que as cargas fatoriais são, em média, 0,70 (Valentini & Damásio, 2016).

Como o conceito de variância média extraída se relaciona com a teoria clássica dos testes?

Embora Fornell e Larcker (1981) argumentem que a variância média extraída é uma medida de validade convergente, Valentini e Damásio (2016) contra-argumentam, de forma convincente, que ela é, na verdade, um índice de fidedignidade — que eles chamam de precisão no artigo original.

A teoria clássica dos testes (TCT) propõe que o escore observado (X) é a soma do escore verdadeiro (T) e um erro de mensuração (E). Desse modo, no contexto da TCT, a fidedignidade dos escores é definida como a proporção da variância nos escores observados que consistem em escores verdadeiros. Formalmente, temos a seguinte representação conceitual (Bandalos, 2018):

representação conceitual da fidedignidade.

onde σ2T se refere à variância do escore verdadeiro e σ2X, à variância do escore observado. Uma vez que σ2X = σ2T + σ2E, onde σ2E se refere à variância residual, a conceitualização acima pode ser reexpressa da seguinte maneira:

representação alternativa conceitual da fidedignidade.

Logo, quanto menor a variância residual (σ2E), maior a fidedignidade dos escores. Sendo assim, a VME se alinha com os princípios da TCT, ao distinguir a variância que é atribuída à variável latente daquela causada por erro de mensuração.

Desse modo, a VME mostra diretamente a quantidade de variância explicada pelo fator relativa à quantidade de variância decorrente de erro de medida — o que ajuda a validar a estrutura fatorial dos instrumentos (i.e., validade baseada na estrutura interna).

Portanto, a VME complementa as análises clássicas de fidedignidade, oferecendo uma perspectiva mais robusta sobre a qualidade psicométrica de um conjunto de itens.

Exemplo de cálculo da variância média extraída

O banco de dados

Unsworth et al. (2005) administraram três tarefas de capacidade de memória de trabalho (operation span, automated operation span e reading span) e duas tarefas de inteligência fluida (matrizes avançadas progressivas de Raven [Raven] e rotated blocks) a 296 participantes.

Infelizmente, os autores não disponibilizaram publicamente os dados da pesquisa, nem apresentaram a matriz de correlações de todas as medidas para o banco de dados completo. No entanto, em uma etapa de teste–reteste da pesquisa, eles apresentaram a matriz de correlações para uma subamostra de 78 participantes (Tabela 1).

Tabela 1. Matriz de correlações das medidas para a amostra teste–reteste.

Em seguida, usaremos os valores da Tabela 1 para demonstrar o cálculo da variância média extraída. Contudo, vale salientar que, uma vez que a matriz de correlações da Tabela 1 não representa os dados completos, nossas análises reproduzem apenas aproximadamente os resultados reportados por Unsworth et al. (2005).

Ajuste de modelo aos dados usando análise fatorial confirmatória

A fim de obtermos os valores necessários para o cálculo da variância média extraída, é necessário ajustarmos um modelo de análise fatorial confirmatória aos dados, de modo a obtermos as cargas fatoriais padronizadas e as variâncias residuais.

Para isso, usaremos o pacote lavaan, do R. Primeiramente, carregaremos o pacote, criaremos um objeto do tipo matrix para armazenar nossa matriz de correlações e definiremos nosso tamanho amostral.

# Instala e carrega o lavaan
install.packages("lavaan")
library(lavaan)

# Define a matriz de correlação
# e o tamanho da amostra
unsworth <- matrix(c(
  1.000, 0.499, 0.453, 0.710, 0.411, 0.306, 
  0.499, 1.000, 0.831, 0.603, 0.363, 0.224,
  0.453, 0.831, 1.000, 0.627, 0.387, 0.264,
  0.710, 0.603, 0.627, 1.000, 0.403, 0.147,
  0.411, 0.363, 0.397, 0.403, 1.000, 0.387,
  0.306, 0.224, 0.264, 0.147, 0.387, 1.000
  ),
  nrow = 6,
  byrow = TRUE,
  dimnames = list(c("ospan", "aospan", "retest_aospan",
                    "rspan", "raven", "rotated_blocks"),
                  c("ospan", "aospan", "retest_aospan",
                    "rspan", "raven", "rotated_blocks")))
)

# Define o tamanho da amostra
# (similar a Unsworth et al., 2005)
sample_size <- 78

Em seguida, definiremos nosso modelo de análise fatorial confirmatória. O operador =~ especifica as variáveis observadas ospan, aospan e rspan para a variável latente memoria_de_trabalho, bem como as variáveis observadas raven e rotated_blocks para a variável latente inteligencia_fluida.

# Definir o modelo de AFC
model <- '
  memoria_de_trabalho =~ ospan + aospan + rspan
  inteligencia_fluida =~ raven + rotated_blocks
'

Por fim, ajustamos nosso modelo aos dados.

# Ajustar o modelo aos dados
fit <- cfa(model,
           sample.cov = unsworth,
           sample.nobs = sample_size)

Calculando a variância média extraída de cada fator

Para consultar as saídas, executamos o código a seguir.

# Verifica os resultados
summary(fit, fit.measures = TRUE, standardized = TRUE)

A Figura 1 apresenta trechos selecionados da saída do código anterior. Indicamos onde, nessa saída, aparecem as cargas fatoriais padronizadas e as variâncias residuais.

saida análise fatorial confirmatória no lavaan.
Figura 1. Parte da saída das medidas resumo da análise fatorial confirmatória.

Seria possível escrever uma função para calcular automaticamente a variância média extraída diretamente no R. No entanto, isso foge do escopo deste post. Ao invés disso, mostraremos quais valores da saída anterior usamos para calcular essa medida de fidedignidade.

As cargas fatoriais padronizadas e as variâncias residuais dos indicadores de capacidade de memória de trabalho, contidas na Figura 1, são reapresentadas na Figura 2.

estimativas do fator capacidade memória de trabalho.
Figura 2. Cargas fatoriais padronizadas, cargas fatoriais padronizadas ao quadrado e variâncias residuais dos indicadores de capacidade de memória de trabalho.

Com base nesses valores, podemos calcular a variância média extraída:

cálculo da variância média extraída para o fator capacidade de mémoria de trabalho.

Já a Figura 3 apresenta as cargas fatoriais padronizadas e as variâncias residuais dos indicadores de inteligência fluida.

estimativas do fator inteligência fluida.
Figura 3. Cargas fatoriais padronizadas, cargas fatoriais padronizadas ao quadrado e variâncias residuais dos indicadores de inteligência fluida.

Com base nesses valores, podemos calcular a variância média extraída:

cálculo da variância média extraída para o fator inteligência fluida.

Interpretando os valores de variância média extraída

Em nosso exemplo, obtivemos VME de 0,62 para o fator capacidade de memória de trabalho, enquanto a VME para o fator inteligência fluida foi de 0,47.

Como regra geral, espera-se uma variância média extraída superior a 0,50 como um indicador de ajuste adequado do modelo aos dados. Ou seja, o valor de VME foi satisfatório para o fator capacidade de memória de trabalho, mas não para o fator inteligência fluida.

Um possível ponto de questionamento em nosso exemplo é o baixo número de indicadores por fator. No entanto, salientamos que a escolha de um modelo com poucos indicadores foi feita devido ao caráter didático deste tutorial.

Além disso, vale ressaltar que a variância média extraída não é afetada pelo número de itens (Valentini & Damásio, 2016). Sendo assim, o valor inadequado de VME para o fator inteligência fluida se deve possivelmente à baixa carga fatorial do rotated blocks (λ = 0,447), que puxou para baixo o valor da VME.

Conclusão

Neste post, falamos sobre a variância média extraída. Gostou desse conteúdo? Aproveite e se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades.

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Bandalos, D. L. (2018). Measurement theory and applications for the social sciences. The Guilford Press.

Fornell, C., & Larcker, D. F. (1981). Evaluating structural equations models with unobservable variables and measurement error. Journal of Marketing, 18(1), 39–50. https://doi.org/10.2307/3151312

Unsworth, N., Heitz, R. P., Schrock, J. C., & Engle, R. W. (2005). An automated version of the operation span task. Behavior Research Methods, 37(3), 498–505. https://doi.org/10.3758/BF03192720

Valentini, F., & Damásio, B. F. (2016). Variância média extraída e confiabilidade composta: Indicadores de precisão. Psicologia: Teoria e Pesquisa, 32(2), Article e322225. https://doi.org/10.1590/0102-3772e322225

Como citar este post

Lima, M. (2025, 2 de maio). O que é e como calcular a variância média extraída? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/variancia-media-extraida

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Compreendendo os índices de validade de conteúdo

Índice de validade de conteúdo

Validade baseada na estrutura interna

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

Qual é a diferença entre R e RStudio?

Postados recentemente

O que é path analysis?

Modelagem por equações estruturais e análise de caminho

Modelagem por equações estruturais no R: conceitos e aplicações

Compreendendo os índices de validade de conteúdo

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias