A fidedignidade (ou confiabilidade) dos escores diz respeito ao quão replicáveis ou consistentes esses escores são. Neste post, nós abordaremos um dos quatro tipos clássicos de fidedignidade discutidos em livros-texto: a fidedignidade das formas paralelas.
O que são formas paralelas em testes psicológicos?
Suponha que uma enfermeira queira medir a altura de crianças em uma pediatria. Para esse fim, ela utiliza dois estadiômetros (Figura 1): primeiro afere a altura da criança em um deles e, em seguida, repete o processo no outro.

Nesse exemplo, podemos pensar nos dois estadiômetros como formas paralelas de uma medida. Eles são paralelos porque aferem a mesma grandeza, a altura, com instrumentos equivalentes.
De maneira semelhante, formas paralelas (ou alternadas) representam versões diferentes, porém equivalentes, de um mesmo teste psicológico. Por exemplo, imagine dois instrumentos que avaliam habilidades matemáticas, cada um com 50 questões, que preservam estrutura, domínio de conteúdo e nível de dificuldade (Figura 2).

Ao criar formas paralelas, buscamos desenvolver instrumentos que sejam aproximadamente equivalentes em termos de:
- Distribuição geral do domínio de conteúdo — isto é, cada forma precisa refletir, na mesma proporção, as áreas ou competências descritas na matriz de referência (por exemplo, 30% álgebra, 40% geometria, 30% estatística).
- Formatos dos itens — por exemplo, todos de múltipla escolha com quatro alternativas.
- Procedimentos de administração — instruções equivalentes, mesmo tempo para resposta e critérios de correção idênticos.
Como construir as formas paralelas de um teste?
Para construir formas paralelas, é necessário começar por um banco amplo de itens que representem o domínio de conteúdo.
Em seguida, devemos amostrar itens para as duas formas de modo sistemático, equilibrando dificuldade, discriminação, formato de resposta, extensão do item e cobertura de conteúdo. Essa seleção pode ser aleatória ou controlada (por exemplo, podemos emparelhar itens com dificuldade semelhante e alocando cada item do par a uma forma distinta).
Além disso, testes-piloto são extremamente úteis, pois permitem ajustar desequilíbrios de dificuldade e revisar itens problemáticos antes da montagem final das formas.
Finalmente, é crucial padronizar instruções, tempo de aplicação e ambiente. Os Standards for Educational and Psychological Testing enfatizam que formas paralelas devem compartilhar os mesmos procedimentos administrativos, pois diferenças sistemáticas na aplicação introduzem variações indevidas.

Quais são os critérios para que duas formas sejam realmente paralelas?
Antes de mais nada, cabe uma distinção entre os termos formas paralelas e testes paralelos. Formas paralelas consistem em versões distintas e altamente equivalentes, ainda que imperfeitas, usadas em aplicações reais (paralelismo não estrito). Elas ajudam a evitar cola, reduzir efeitos de prática (e.g., memorização) e preservar a segurança do teste.
Em contrapratida, testes paralelos consistem em uma construção teórica formal da Teoria Clássica dos Testes (TCT). Contudo, esse paralelismo estrito raramente é alcançado na prática.
Segundo a TCT, dois testes são paralelos quando:
- Medem o mesmo construto.
- Têm escores verdadeiros idênticos para cada indivíduo.
- Apresentam erros aleatórios independentes com a mesma variância.
- Seguem a relação linear:

Ou seja, a equação anterior se reduz a Xj = Xi. Essas condições implicam que as versões terão mesmas médias observadas, mesmas variâncias e mesmas correlações com quaisquer variáveis externas, pois os escores observados são perfeitamente lineares entre si (Figura 3).

Em síntese, quando temos testes paralelos, tanto faz se João respondeu à forma A ou à forma B, pois elas são intercambiáveis. Ou seja, os valores esperados para João, em ambos os testes, representam a mesma quantidade.
Na prática, quase nunca produzimos testes paralelos no sentido estrito. O que chamamos de formas paralelas corresponde a um paralelismo aproximado, suficiente para fins educacionais e clínicos, embora não atenda às exigências matemáticas da definição formal da TCT.
Como calcular a fidedignidade das formas paralelas?
Para calcular a fidedignidade das formas paralelas, aplicamos as duas versões do teste sequencialmente, na mesma ocasião (Figura 2), e calculamos a correlação (por exemplo, de Pearson) entre seus escores. Esse coeficiente representa a equivalência empírica entre os escores obtidos nas formas paralelas.
Além disso, essa abordagem possui um benefício teórico importante. Em condições de paralelismo, a correlação entre as duas formas equivale à proporção da variância dos escores observados atribuída aos escores verdadeiros, que corresponde exatamente à definição clássica de fidedignidade na TCT.
Por exemplo, suponha que aplicamos as formas A e B de nosso instrumento de habilidades matemáticas em 10 respondentes. Em seguida, plotamos os escores desses 10 respondentes em um gráfico de dispersão e correlacionamos as duas medidas (Figura 4).

A correlação de Pearson (r = 0,95) indica que, para fins práticos, os escores baseados nas duas formas A e B do instrumento são equivalentes.
Quais são as vantagens e desvantagens da fidedignidade das formas paralelas?
A fidedignidade das formas paralelas oferece algumas vantagens. Primeiramente, ela reduz efeitos de prática (e.g., memorização), já que o respondente não revê o mesmo conjunto de itens. Desse modo, o uso de formas alternadas diminuem chances de treinamento ou fraude (Zanon & Hauck Filho, 2015). Além disso, como já vimos, a estimativa de fidedignidade obtida por esse método se alinha diretamente ao conceito teórico da TCT.
Contudo, existem desvantagens importantes. Primeiramente, a estimativa reflete o conceito teórico de fidedignidade se alinha ao conceito teórico da TCT somente sob o pressuposto de paralelismo estrito. Se as formas não forem suficientemente paralelas, a fidedignidade estimada pode subestimar a fidedignidade verdadeira.
Além disso, a construção de formas paralelas exige bancos extensos de itens, processos cuidadosos de pré-teste e verificações psicométricas constantes. Por exemplo, se queremos avaliar habilidades matemáticas com 50 itens, precisaremos pelo menos do dobro de itens para o caso em que temos duas formas alternadas.
Isso implica custos financeiros e de tempo, o que pode ser impeditivo em contextos clínicos, educacionais ou organizacionais com recursos limitados. Assim, é preciso balancear custo, tempo e necessidade real antes de optar por esse tipo de fidedignidade.
Qual é a diferença entre a fidedignidade das formas paralelas e outros tipos de fidedignidade?
A fidedignidade das formas paralelas difere de outros métodos porque avalia equivalência entre versões distintas do teste.
Na fidedignidade teste–reteste, por exemplo, o foco é a estabilidade temporal, uma vez que há um intervalo entre as duas testagens. Entretanto, esse método sofre com efeitos de prática e mudanças reais no traço latente. Já as formas paralelas controlam esses efeitos porque utilizam itens diferentes e mensurações em uma única aplicação.
Por outro lado, a fidedignidade das duas metades envolve a aplicação de um único teste, em um único momento do tempo. Em seguida, o teste é dividido em duas metades (e.g., itens ímpares vs. pares). A correlação entre elas, ajustada pela fórmula de Spearman–Brown, estima a fidedignidade. Entretanto, as metades raramente são equivalentes em conteúdo ou dificuldade.
Finalmente, a consistência interna (e.g., alfa de Cronbach) estima a homogeneidade dos itens, ou seja, se as respostas dos diferentes respondentes para os itens segue um padrão. Vale ressaltar que um instrumento pode produzir respostas com alta consistência interna, mas com baixa estabilidade temporal.
Em síntese, a escolha entre esses métodos depende diretamente do objetivo psicométrico: estabilidade temporal, equivalência estrutural ou homogeneidade dos itens.
Testes paralelos na TRI?
Embora a TCT tenha desenvolvido o conceito de testes paralelos, a Teoria de Resposta ao Item (TRI) não depende dessa noção. Isso ocorre porque a TRI opera em nível de item, com parâmetros calibrados em uma escala comum, permitindo que diferentes conjuntos de itens gerem escores comparáveis sem exigirem paralelismo estrito.
Na TRI, versões diferentes de um teste podem medir o mesmo traço latente mesmo sem serem paralelas. Isso acontece, por exemplo, no Exame Nacional do Ensino Médio (ENEM): cada caderno de prova é construído com itens calibrados previamente, e os escores dos participantes são colocados na mesma escala por meio de procedimentos de ligação (linking) e equalização (equating).
Assim, a equivalência surge não de médias e variâncias iguais entre as formas, mas da calibração dos itens e da equalização das escalas.
De certo modo, há uma semelhança funcional entre paralelismo (TCT) e equalização (TRI). Em ambos os casos, queremos que versões distintas dos instrumentos sejam intercambiáveis. Entretanto, é crucial destacar que, na TRI, a equivalência emerge de modelos matemáticos aplicados aos itens, enquanto na TCT ela depende de igualdade estrutural entre formas completas.
Consequentemente, podemos afirmar que o conceito de formas paralelas faz sentido apenas na TCT. Na TRI, falamos de escalas equivalentes, não de paralelismo estrito. Para saber mais sobre a TRI, recomendamos nossos posts sobre o tema.

Referências
American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (2014). Standards for educational and psychological testing. American Educational Research Association.
Bandalos, D. L. (2018). Measurement theory and applications for the social sciences. The Guilford Press.
Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3rd ed.). McGraw-Hill Inc.
Rogers, W. M. (2022). Parallel forms reliability. In B. B. Frey (Ed.), The SAGE encyclopedia of research design (2nd ed., pp. 1155–1157). SAGE Publications, Inc.
Zanon, C., & Hauck Filho, N. (2015). Fidedignidade. In C. S. Hutz, D. R. Bandeira, & C. M. Trentini (Eds.), Psicometria (pp. 85–95). Artmed.
Como citar este post
Lima, M. (2025, 15 de dezembro). O que é fidedignidade das formas paralelas? Blog Psicometria Online. https://blog.psicometriaonline.com.br/o-que-e-fidedignidade-das-formas-paralelas
