O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é fidedignidade das formas paralelas?

Marcos Lima

dez 15, 2025

fidedignidade (ou confiabilidade) dos escores diz respeito ao quão replicáveis ou consistentes esses escores são. Neste post, nós abordaremos um dos quatro tipos clássicos de fidedignidade discutidos em livros-texto: a fidedignidade das formas paralelas.

O que são formas paralelas em testes psicológicos?

Suponha que uma enfermeira queira medir a altura de crianças em uma pediatria. Para esse fim, ela utiliza dois estadiômetros (Figura 1): primeiro afere a altura da criança em um deles e, em seguida, repete o processo no outro.

metáfora para a fidedignidade das formas paralelas.
Figura 1. Ilustração de um estadiômetro.

Nesse exemplo, podemos pensar nos dois estadiômetros como formas paralelas de uma medida. Eles são paralelos porque aferem a mesma grandeza, a altura, com instrumentos equivalentes.

De maneira semelhante, formas paralelas (ou alternadas) representam versões diferentes, porém equivalentes, de um mesmo teste psicológico. Por exemplo, imagine dois instrumentos que avaliam habilidades matemáticas, cada um com 50 questões, que preservam estrutura, domínio de conteúdo e nível de dificuldade (Figura 2).

representação da fidedignidade das formas paralelas.
Figura 2. Ilustração das formas paralelas de um instrumento.

Ao criar formas paralelas, buscamos desenvolver instrumentos que sejam aproximadamente equivalentes em termos de:

  1. Distribuição geral do domínio de conteúdo — isto é, cada forma precisa refletir, na mesma proporção, as áreas ou competências descritas na matriz de referência (por exemplo, 30% álgebra, 40% geometria, 30% estatística).
  2. Formatos dos itens — por exemplo, todos de múltipla escolha com quatro alternativas.
  3. Procedimentos de administração — instruções equivalentes, mesmo tempo para resposta e critérios de correção idênticos.

Como construir as formas paralelas de um teste?

Para construir formas paralelas, é necessário começar por um banco amplo de itens que representem o domínio de conteúdo.

Em seguida, devemos amostrar itens para as duas formas de modo sistemático, equilibrando dificuldade, discriminação, formato de resposta, extensão do item e cobertura de conteúdo. Essa seleção pode ser aleatória ou controlada (por exemplo, podemos emparelhar itens com dificuldade semelhante e alocando cada item do par a uma forma distinta).

Além disso, testes-piloto são extremamente úteis, pois permitem ajustar desequilíbrios de dificuldade e revisar itens problemáticos antes da montagem final das formas.

Finalmente, é crucial padronizar instruções, tempo de aplicação e ambiente. Os Standards for Educational and Psychological Testing enfatizam que formas paralelas devem compartilhar os mesmos procedimentos administrativos, pois diferenças sistemáticas na aplicação introduzem variações indevidas.

banner da Psicometria Online Academy.

Quais são os critérios para que duas formas sejam realmente paralelas?

Antes de mais nada, cabe uma distinção entre os termos formas paralelas e testes paralelos. Formas paralelas consistem em versões distintas e altamente equivalentes, ainda que imperfeitas, usadas em aplicações reais (paralelismo não estrito). Elas ajudam a evitar cola, reduzir efeitos de prática (e.g., memorização) e preservar a segurança do teste.

Em contrapratida, testes paralelos consistem em uma construção teórica formal da Teoria Clássica dos Testes (TCT). Contudo, esse paralelismo estrito raramente é alcançado na prática.

Segundo a TCT, dois testes são paralelos quando:

  1. Medem o mesmo construto.
  2. Têm escores verdadeiros idênticos para cada indivíduo.
  3. Apresentam erros aleatórios independentes com a mesma variância.
  4. Seguem a relação linear:

relação linear entre escores observados de formas paralelas.

Ou seja, a equação anterior se reduz a Xj = Xi. Essas condições implicam que as versões terão mesmas médias observadas, mesmas variâncias e mesmas correlações com quaisquer variáveis externas, pois os escores observados são perfeitamente lineares entre si (Figura 3).

paralelismo estrito entre formas paralelas.
Figura 3. Ilustração do conceito de paralelismo estrito.

Em síntese, quando temos testes paralelos, tanto faz se João respondeu à forma A ou à forma B, pois elas são intercambiáveis. Ou seja, os valores esperados para João, em ambos os testes, representam a mesma quantidade.

Na prática, quase nunca produzimos testes paralelos no sentido estrito. O que chamamos de formas paralelas corresponde a um paralelismo aproximado, suficiente para fins educacionais e clínicos, embora não atenda às exigências matemáticas da definição formal da TCT.

Como calcular a fidedignidade das formas paralelas?

Para calcular a fidedignidade das formas paralelas, aplicamos as duas versões do teste sequencialmente, na mesma ocasião (Figura 2), e calculamos a correlação (por exemplo, de Pearson) entre seus escores. Esse coeficiente representa a equivalência empírica entre os escores obtidos nas formas paralelas.

Além disso, essa abordagem possui um benefício teórico importante. Em condições de paralelismo, a correlação entre as duas formas equivale à proporção da variância dos escores observados atribuída aos escores verdadeiros, que corresponde exatamente à definição clássica de fidedignidade na TCT.

Por exemplo, suponha que aplicamos as formas A e B de nosso instrumento de habilidades matemáticas em 10 respondentes. Em seguida, plotamos os escores desses 10 respondentes em um gráfico de dispersão e correlacionamos as duas medidas (Figura 4).

correlação entre escores de formas paralelas de um instrumento.
Figura 4. Ilustração do cálculo da fidedignidade das formas paralelas.

A correlação de Pearson (r = 0,95) indica que, para fins práticos, os escores baseados nas duas formas A e B do instrumento são equivalentes.

Quais são as vantagens e desvantagens da fidedignidade das formas paralelas?

A fidedignidade das formas paralelas oferece algumas vantagens. Primeiramente, ela reduz efeitos de prática (e.g., memorização), já que o respondente não revê o mesmo conjunto de itens. Desse modo, o uso de formas alternadas diminuem chances de treinamento ou fraude (Zanon & Hauck Filho, 2015). Além disso, como já vimos, a estimativa de fidedignidade obtida por esse método se alinha diretamente ao conceito teórico da TCT.

Contudo, existem desvantagens importantes. Primeiramente, a estimativa reflete o conceito teórico de fidedignidade se alinha ao conceito teórico da TCT somente sob o pressuposto de paralelismo estrito. Se as formas não forem suficientemente paralelas, a fidedignidade estimada pode subestimar a fidedignidade verdadeira.

Além disso, a construção de formas paralelas exige bancos extensos de itens, processos cuidadosos de pré-teste e verificações psicométricas constantes. Por exemplo, se queremos avaliar habilidades matemáticas com 50 itens, precisaremos pelo menos do dobro de itens para o caso em que temos duas formas alternadas.

Isso implica custos financeiros e de tempo, o que pode ser impeditivo em contextos clínicos, educacionais ou organizacionais com recursos limitados. Assim, é preciso balancear custo, tempo e necessidade real antes de optar por esse tipo de fidedignidade.

Qual é a diferença entre a fidedignidade das formas paralelas e outros tipos de fidedignidade?

A fidedignidade das formas paralelas difere de outros métodos porque avalia equivalência entre versões distintas do teste.

Na fidedignidade teste–reteste, por exemplo, o foco é a estabilidade temporal, uma vez que há um intervalo entre as duas testagens. Entretanto, esse método sofre com efeitos de prática e mudanças reais no traço latente. Já as formas paralelas controlam esses efeitos porque utilizam itens diferentes e mensurações em uma única aplicação.

Por outro lado, a fidedignidade das duas metades envolve a aplicação de um único teste, em um único momento do tempo. Em seguida, o teste é dividido em duas metades (e.g., itens ímpares vs. pares). A correlação entre elas, ajustada pela fórmula de Spearman–Brown, estima a fidedignidade. Entretanto, as metades raramente são equivalentes em conteúdo ou dificuldade.

Finalmente, a consistência interna (e.g., alfa de Cronbach) estima a homogeneidade dos itens, ou seja, se as respostas dos diferentes respondentes para os itens segue um padrão. Vale ressaltar que um instrumento pode produzir respostas com alta consistência interna, mas com baixa estabilidade temporal.

Em síntese, a escolha entre esses métodos depende diretamente do objetivo psicométrico: estabilidade temporal, equivalência estrutural ou homogeneidade dos itens.

Testes paralelos na TRI?

Embora a TCT tenha desenvolvido o conceito de testes paralelos, a Teoria de Resposta ao Item (TRI) não depende dessa noção. Isso ocorre porque a TRI opera em nível de item, com parâmetros calibrados em uma escala comum, permitindo que diferentes conjuntos de itens gerem escores comparáveis sem exigirem paralelismo estrito.

Na TRI, versões diferentes de um teste podem medir o mesmo traço latente mesmo sem serem paralelas. Isso acontece, por exemplo, no Exame Nacional do Ensino Médio (ENEM): cada caderno de prova é construído com itens calibrados previamente, e os escores dos participantes são colocados na mesma escala por meio de procedimentos de ligação (linking) e equalização (equating).

Assim, a equivalência surge não de médias e variâncias iguais entre as formas, mas da calibração dos itens e da equalização das escalas.

De certo modo, há uma semelhança funcional entre paralelismo (TCT) e equalização (TRI). Em ambos os casos, queremos que versões distintas dos instrumentos sejam intercambiáveis. Entretanto, é crucial destacar que, na TRI, a equivalência emerge de modelos matemáticos aplicados aos itens, enquanto na TCT ela depende de igualdade estrutural entre formas completas.

Consequentemente, podemos afirmar que o conceito de formas paralelas faz sentido apenas na TCT. Na TRI, falamos de escalas equivalentes, não de paralelismo estrito. Para saber mais sobre a TRI, recomendamos nossos posts sobre o tema.

banner da Psicometria Online Academy.

Referências

American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (2014). Standards for educational and psychological testing. American Educational Research Association.

Bandalos, D. L. (2018). Measurement theory and applications for the social sciences. The Guilford Press.

Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3rd ed.). McGraw-Hill Inc.

Rogers, W. M. (2022). Parallel forms reliability. In B. B. Frey (Ed.), The SAGE encyclopedia of research design (2nd ed., pp. 1155–1157). SAGE Publications, Inc.

Zanon, C., & Hauck Filho, N. (2015). Fidedignidade. In C. S. Hutz, D. R. Bandeira, & C. M. Trentini (Eds.), Psicometria (pp. 85–95). Artmed.

Como citar este post

Lima, M. (2025, 15 de dezembro). O que é fidedignidade das formas paralelas? Blog Psicometria Online. https://blog.psicometriaonline.com.br/o-que-e-fidedignidade-das-formas-paralelas

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

0 0 Votos
Classificação do artigo
Inscrever-se
Notificar de
guest

0 Comentários
mais antigos
mais recentes Mais votado
Feedbacks embutidos
Ver todos os comentários

Posts sugeridos

O que é e para que serve a fórmula de Spearman-Brown?

O que é o alfa de Cronbach em psicometria?

O que são os coeficientes de consistência interna KR-20 e KR-21?

Conteúdo

Mais lidos

Análise de moderação: como identificar potenciais variáveis moderadoras?

Modelagem por equações estruturais no R: conceitos e aplicações

O que são variáveis ​​independentes e dependentes?

O que é correlação de Pearson?

Postados recentemente

Qual é a diferença entre explicação e predição?

O que é o teste de esfericidade de Bartlett?

AFE não é horóscopo: o fim do “olhômetro” na Análise Fatorial

O que é o teste de Wald-Wolfowitz?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias