O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Compreendendo a confiabilidade por duas metades (split-half reliability)

Marcos Lima

jan 1, 2025

Em teoria da medida, a confiabilidade (ou fidedignidade) se refere à consistência das mensurações em diferentes condições. A fim de estimar a confiabilidade dos escores obtidos em pesquisas, psicometristas desenvolveram vários métodos. Neste post, nosso objetivo é apresentar a confiabilidade por duas metades. Além disso, também descreveremos como calculá-la e quais são suas principais limitações.

O que é confiabilidade por duas metades?

A confiabilidade por duas metades (split-half reliability) é um método estatístico que avalia a consistência interna dos escores de um instrumento de mensuração. Em outras palavras, ela avalia em que medida os itens de uma tarefa ou instrumento avaliam consistentemente o mesmo construto ou traço latente.

Por exemplo, na tarefa de Stroop, os participantes veem palavras representando nomes de cores. Essas palavras são exibidas em diferentes cores (e.g., palavra AZUL na cor azul). Os participantes devem identificar, rápida e precisamente, a cor da palavra, ou seja, ignorando o texto apresentado (Figura 1).

Figura 1. Representação esquemática de tentativas da tarefa de Stroop, onde c representa tentativas congruentes, enquanto i representa tentativas incongruentes.

Suponha que cada participante realizou 500 tentativas na tarefa de Stroop. Nesse caso, queremos estimar a confiabilidade do desempenho dos participantes na tarefa de Stroop.

Eis um exemplo envolvendo instrumento de autorrelato: o Brief Loquaciousness and Interpersonal Responsiveness Test (BLIRT) é um teste, composto por oito itens, que avalia em que medida uma pessoa responde às demais de forma rápida e efusiva (e.g., “Se eu tenho algo a dizer, não hesito em dizer”). Os respondentes avaliam os itens em uma escala de cinco pontos, de 1 (Discordo totalmente) a 5 (Concordo totalmente).

Ao aplicar a técnica da confiabilidade por duas metades, estimamos a consistência interna de metade dos escores do instrumento. A fim de estimarmos a consistência do teste como um todo, aplicamos um fator de correção à estimativa original.

banner da NAOPARE.

Como calcular a confiabilidade por duas metades?

Em seguida, mostraremos as etapas envolvidas no cálculo da confiabilidade por duas metades.

Coletando dados

Primeiramente, coletamos dados. Por exemplo, podemos aplicar a tarefa de Stroop ou um instrumento de autorrelato (BLIRT) em uma amostra de participantes.

Dividindo os itens da tarefa ou instrumento em duas metades

Em seguida, dividimos os itens da tarefa ou instrumento em duas metades equivalentes. Por exemplo, no caso da tarefa de Stroop, a primeira metade da tarefa poderia representar um subconjunto de itens, enquanto a segunda metade da tarefa poderia representar outro subconjunto (Figura 2).

divisão por duas metades, exemplo 1.
Figura 2. Exemplo de divisão de duas metades na tarefa de Stroop.

Já no caso do BLIRT, poderíamos dividir os itens em ímpares e pares (Figura 3).

divisão por duas metades, exemplo 2.
Figura 3. Exemplo de divisão de duas metades no BLIRT.

Pontuando as duas metades

Depois disso, precisamos pontuar cada metade dos itens, para cada participante. Por exemplo, na tarefa de Stroop, podemos calcular, para cada participante da amostra, o percentual de acertos na primeira metade e na segunda metade da tarefa de Stroop. Desse modo, nosso banco de dados terá duas colunas adicionais, conforme ilustra a Figura 4.

cálculo das duas metades, banco de dados 1.
Figura 4. Banco de dados com os percentuais de acertos das duas metades da tarefa de Stroop.

No caso de instrumentos de autorrelato, é importante que todos os itens tenham a mesma orientação. Por exemplo, no caso do BLIRT, o item “Se eu tenho algo a dizer, não hesito em dizer” é positivamente orientado, pois alguém com maior propensão a ser responsivo aos outros tenderá a concordar mais com essa afirmação.

Em contrapartida, o item “Frequentemente, levo um tempo para descobrir como me expressar” é negativamente orientado, pois alguém com maior propensão a ser responsivo aos outros tenderá a discordar mais dessa afirmação.

No BLIRT, os itens 2, 3, 5, 7 e 8 são pontuados de forma reversa. Desse modo, precisamos ajustá-los para que eles fiquem na mesma direção que os demais itens. A solução é simples: basta calcular escoreajustado = 6 – escoreoriginal para os itens com orientação reversa, de modo a ancorarmos todos os itens na mesma direção.

Em seguida, calculamos o escore total do BLIRT para as duas metades. Podemos calcular o escore total com base na soma ou na média dos itens que compõem cada metade. Na Figura 5, ilustramos o cálculo usando a média.

cálculo das duas metades, banco de dados 2.
Figura 5. Banco de dados com os percentuais de acertos das duas metades do BLIRT.

Calculando a confiabilidade por duas metades

Na próxima etapa, calculamos o coeficiente de correlação entre os escores obtidos nas duas metades. Tipicamente, usamos técnicas como as correlações de Pearson ou de Spearman para essa finalidade.

Por exemplo, usando o banco de dados de Hayes e Coutts (2020), calculamos os escores totais com base nos itens ímpares e pares, separadamente, e, para fins ilustrativos, plotamos esses escores na Figura 6.

diagrama de dispersão dos escores para cálculo da confiabilidade por duas metades.
Figura 6. Diagrama de dispersão relacionando os escores totais ímpares e pares do BLIRT.

A Figura 6 sugere uma relação linear positiva entre os escores totais ímpares e pares, o que seria esperado em uma situação em que há confiabilidade dos escores. Essa impressão visual é corroborada estatisticamente por meio do cálculo da correlação entre as duas metades do instrumento, r = 0,65.

Aplicando a correção de Spearman–Brown à estimativa de confiabilidade por duas metades

Contudo, não estamos interessados na confiabilidade da metade do instrumento, mas sim na confiabilidade do instrumento como um todo. Para esse fim, usamos a a correção de Spearman–Brown (ou fórmula da profecia de Spearman–Brown), uma correção que visa predizer qual seria a correlação se o nosso teste tivesse outro comprimento.

A correção de Spearman–Brown é dada por:

fórmula da profecia de Spearman-Brown.

onde k representa a razão entre o número de itens no instrumento novo e no instrumento original, r representa a correlação original entre as duas metades e r* representa a correlação prevista com a mudança no número de itens.

No caso particular em que usamos a correção de Spearman–Brown na confiabilidade por duas metades, queremos estimar a confiabilidade para o dobro da metade dos itens (i.e., para o instrumento completo). Logo, k = 2. Aplicado aos nossos dados, temos:

Desse modo, nossa estimativa de consistência interna com base no método da confiabilidade por duas metades é de r = 0,79. Uma vez que esse valor é maior que 0,70, concluiríamos que nossa estimativa de confiabilidade foi aceitável.

Limitações da confiabilidade por duas metades

Anteriormente, dissemos que o método da confiabilidade por duas metades exige que os itens da tarefa ou instrumento sejam divididos em duas metades equivalentes. No entanto, demos pouca atenção ao termo em negrito, de modo que as divisões que sugerimos (i.e., 1ª metade vs. 2ª metade; itens ímpares vs. itens pares) foram um tanto arbitrárias.

De fato, uma das críticas do método consiste na dificuldade em garantir a equivalência entre as duas metades. Considere, por exemplo, a tarefa de Stroop: suponha que, devido à longa duração da tarefa, os participantes se cansem na segunda metade do teste.

Nesse caso, as estimativas de confiabilidade serão atenuadas porque não há equivalência entre os desempenhos nas duas metades da tarefa. Um problema análogo ocorreria, por exemplo, em testes cognitivos (e.g., de inteligência) em que a dificuldade dos itens é crescente ao longo da tarefa.

Em segundo lugar, é difícil determinar como devemos dividir os itens para aplicar a técnica da confiabilidade por duas metades. Por exemplo, no caso do BLIRT, com oito itens:

Isto é, existem 35 formas distintas de dividirmos os oito itens do BLIRT em duas metades. Mais importante, diferentes divisões podem retornar estimativas de confiabilidade distintas. Por exemplo, a Figura 7 apresenta a distribuição de estimativas para as 35 duas metades possíveis do BLIRT, que variaram entre 0,67 e 0,83.

histograma de estimativas da fidedignidade por duas metades usando diferentes divisões do teste.
Figura 7. Distribuição de estimativas de fidedignidade por duas metades do BLIRT.

Desse modo, pode ser problemático se basear apenas em uma estimativa que depende do método de divisão dos itens. Portanto, embora a confiabilidade por duas metades possa ser uma ferramenta útil para avaliar a consistência interna de tarefas e de instrumentos, os investigadores devem ter ciência de suas limitações.

Conclusão

Neste post, você aprendeu sobre a confiabilidade por duas metades, como calculá-lá e quais suas limitações. Esperamos que o conteúdo do post tenha sido útil!

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Hayes, A. F., Coutts, J. J. (2020). Use omega rather than Cronbach’s alpha for estimating reliability. But… Communication Methods and Measures, 14(1), 1–24. https://doi.org/10.1080/19312458.2020.1718629

Pasquali, L. (2003). Psicometria: Teoria dos testes na psicologia e na educação. Editora Vozes.

Zanon, C., & Hauck-Filho, N. (2015) Fidedignidade. In C. S. Hutz, D. R. Bandeira, & C. M. Trentini (Orgs.), Psicometria (pp. 85–96). Artmed.

Como citar este post

Lima, M. (2025, 1 de janeiro). Compreendendo a confiabilidade por duas metades (split-half reliability). Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/compreendendo-a-confiabilidade-duas-metades-split-half-reliability/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Compreendendo os índices de validade de conteúdo

Índice de validade de conteúdo

Validade baseada na estrutura interna

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

Qual é a diferença entre R e RStudio?

Postados recentemente

Modelagem por equações estruturais no R: conceitos e aplicações

Compreendendo os índices de validade de conteúdo

Índice de validade de conteúdo

O que são médias marginais?

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias