Neste post, discutimos o conceito de pareamento (matching) e seu papel no controle de variáveis em pesquisas científicas. Primeiramente, nós revisitaremos o conceito de designação aleatória. Em seguida, nós abordaremos uma situação em que essa técnica pode falhar, situação na qual o pareamento é relevante. Nós então apresentaremos o pareamento em três delineamentos de pesquisa, descreveremos suas desvantagens e, por fim, responderemos a perguntas frequentes sobre a técnica.
O que é designação aleatória?
A designação aleatória — ou alocação aleatória — consiste em atribuir os participantes às condições de um experimento de forma randômica. Seu principal objetivo é criar grupos comparáveis e, por conseguinte, nos permitir fazer inferências causais.
Por exemplo, um psicólogo experimental quer examinar se a memória para palavras comuns do português varia em função de serem concretas (e.g., nariz, copo, gato) ou abstratas (e.g., medo, sono, ódio). Ele recruta os participantes para a pesquisa e, por meio de um algoritmo no computador, cada participante é sorteado para ver uma lista de palavras concretas ou uma lista de palavras abstratas (Figura 1).

Em nosso exemplo, cada indivíduo tem a mesma probabilidade de ser designado a um dos grupos (concreto ou abstrato). Como consequência, diferenças sistemáticas entre os grupos tendem a desaparecer, ao menos em média.
Agora, suponha que os participantes se recordem, em média, de 65% das palavras na condição concreta, mas 45% das palavras na condição abstrata. Se essas diferenças forem estatisticamente significativas, podemos ficar confiantes de que as diferenças na variável dependente (recordação) se devem à manipulação da variável independente (concretude da palavra). Certo?
Em seguida, veremos que esse nem sempre é o caso.
Uma importante limitação da designação aleatória
A designação aleatória nos desenhos de grupos independentes visa eliminar explicações alternativas para os resultados. Em outras palavras, quando o pesquisador observa uma diferença entre grupos, ele deseja ser capaz de atribuí-la à variável independente.
No entanto, nem sempre a designação aleatória é possível ou desejável. Por exemplo, em algumas áreas de conhecimento, pesquisadores têm acesso a um número limitado de participantes. Isso é comum em estudos longitudinais em psicologia do desenvolvimento, em pesquisas com populações clínicas raras ou em estudos neuropsicológicos com pacientes que apresentam lesões cerebrais específicas.
Em tais casos, a designação aleatória pode ser incapaz de produzir grupos comparáveis. Nesse contexto, o pareamento surge como uma estratégia alternativa ou complementar de controle.
Suponha que, por limitações de tempo e de dinheiro, recrutamos apenas oito participantes em nosso estudo de memória. Além disso, suponha que a habilidade cognitiva geral dos participantes costume se relacionar com a capacidade de memória. Na Figura 2, valores maiores indicam maior habilidade cognitiva geral.

Com um número pequeno de participantes, podemos ficar razoavelmente confiantes de que a técnica de designação aleatória não funcionará para criar grupos comparáveis. Por exemplo, usando um sorteio dos participantes, é possível obtermos grupos relativamente discrepantes em termos de habilidade cognitiva (Figura 3).

Isso acarreta um problema de validade interna: caso a recordação seja superior na condição concreta, não teremos mais segurança de que tais efeitos se devem à concretude das palavras — uma vez que os grupos também diferem em termos de habilidade cognitiva.
A mensagem principal é a de que, em certas situações, a designação aleatória deve ser combinada com outros procedimentos a fim de obtermos grupos comparáveis.
O que é pareamento (matching)?
O pareamento (matching) consiste em formar blocos ou subconjuntos de participantes semelhantes em características relevantes para o estudo. Desse modo, em vez de confiar apenas na designação aleatória, o pesquisador controla explicitamente variáveis que poderiam confundir os resultados.
De forma intuitiva, pense no “match” do Tinder. O aplicativo tenta aproximar pessoas com perfis semelhantes, ainda que o resultado nem sempre seja perfeito. Da mesma forma, no pareamento científico, a ideia é aumentar a compatibilidade entre participantes antes da comparação — felizmente, sem encontros constrangedores.
Para aplicarmos o procedimento de pareamento, precisamos, antes de mais nada, mensurar a variável de pareamento. Em geral, essa variável é uma medida da variável dependente, como a habilidade de memória dos participantes.
De maneira alternativa, a variável de pareamento pode ser uma medida que não é exatamente a variável dependente, mas que, do ponto de vista teórico ou empírico, relaciona-se com a variável dependente. Por exemplo, em nosso experimento sobre memória, a altura dos participantes provavelmente não é uma boa variável de pareamento, mas a habilidade cognitiva geral, sim.
Exemplo da implementação da técnica de pareamento
Após obtermos os escores dos participantes na variável de pareamento (Figura 2), nós ordenamos os participantes em ordem crescente (ou decrescente) de escores nessa variável (Figura 4).

Por fim, nós pareamos os participantes em blocos, e designamos aleatoriamente os participantes de um mesmo bloco às diferentes condições experimentais. Por exemplo, os participantes com escores 1 e 2 serão designados a diferentes condições experimentais (Figura 5).

O mesmo será feito para os participantes com escores 4 e 5; com escores 7 e 8; e com escores 9 e 10. Note que isso impede que os grupos sejam compostos por participantes de apenas um extremo do continuum da variável de pareamento. Ao final, podemos obter grupos equivalentes em termos da variável de pareamento (Figura 6).

Note que designação aleatória e pareamento não são técnicas mutuamente excludentes. No exemplo anterior, a designação aleatória está presente, mas ocorre após o pareamento dos participantes. Além disso, o pareamento pode ser feito com base em uma única variável, como em nosso exemplo, ou com base em múltiplas variáveis simultaneamente, como idade, escolaridade e nível socioeconômico.
Consequentemente, o pareamento reduz variabilidade irrelevante entre grupos e aumenta a precisão das comparações.
O pareamento nos desenhos de grupos pareados
Nos desenhos de grupos pareados, o pesquisador forma pares ou blocos de participantes semelhantes antes da alocação às condições. Em seguida, dentro de cada bloco, os indivíduos são designados a grupos diferentes, muitas vezes de forma aleatória. Na seção anterior, nosso exemplo representou um desenho de grupos pareados.
Esse procedimento é particularmente comum em ensaios clínicos randomizados. Por exemplo, pesquisadores podem parear pacientes por idade ou gravidade da doença e, somente depois, randomizar o tratamento dentro de cada par. Dessa forma, o estudo combina controle ativo com os benefícios da randomização.
Além disso, o pareamento nesse tipo de delineamento aumenta eficiência estatística. Em amostras pequenas, isso pode ser decisivo. Ainda assim, é importante lembrar que o pareamento faz parte do desenho do estudo, não apenas da etapa analítica.

O pareamento nos desenhos de grupos naturais
Em muitas situações de pesquisa, queremos comparar variáveis que não são genuinamente manipuladas. As ciências sociais, comportamentais e da saúde estão repletas desses casos. Por exemplo, podemos querer comparar homens e mulheres, introvertidos e extrovertidos, bebês prematuros e nascidos a termo, pessoas neurodivergentes e neurotípicas, etc.
Nesses casos, a variável independente é uma variável de diferenças individuais — também chamada de variável do sujeito, ou, ainda, de variável selecionada. Estudos que adotam esse tipo de comparação são denominados de desenhos de grupos naturais.
Nos desenhos de grupos naturais, a lógica do pareamento é um pouco diferente. Aqui, os grupos já existem antes da pesquisa, e o pesquisador não pode designar participantes às condições de forma aleatória.
Por exemplo, não é possível randomizar pessoas para serem neurodivergentes ou neurotípicas. Nesses casos, o pareamento tenta minimizar ou eliminar diferenças iniciais entre os grupos, tornando-os mais comparáveis.
Como isso é feito? Na prática, criamos critérios de inclusão de participantes de modo que eles tenham a maior similaridade possível em termos de variáveis relevantes para a pesquisa. O objetivo é que a única diferença remanescente seja a da variável cujos efeitos pretendemos investigar.
Para cada participante de um grupo natural, tentamos parear outro participante com características equivalentes em termos de idade, escolaridade, nível socioeconômico e outras variáveis relevantes. Aqui, a designação é não aleatória, mas nominal, pois a variável de diferenças individuais (e.g., ser neurodivergente ou neurotípico) é quem define o grupo ao qual cada participante pertence (Figura 7).

Ainda assim, como não há designação aleatória, o controle é necessariamente incompleto. Portanto, embora o pareamento melhore a qualidade das comparações, ele não elimina completamente explicações alternativas. Por isso, em tais desenhos, as conclusões devem ser interpretadas com cautela.
O pareamento em estudos observacionais
Em estudos observacionais, vieses de seleção podem comprometer a validade dos achados. Em tais casos, precauções adicionais são necessárias, sobretudo se o objetivo for investigar relações causais sem experimentação. Nesses delineamentos, o pesquisador observa exposições e desfechos tal como ocorrem no mundo real.
Por exemplo, pesquisadores podem investigar se a adoção de uma dieta vegana está associada à incidência de uma doença anos mais tarde, comparando indivíduos veganos e não veganos pareados em variáveis como idade, atividade física e consumo de álcool (Figura 8).

Nesse contexto, o pareamento busca aproximar um cenário contrafactual plausível. Por exemplo, pesquisadores podem comparar indivíduos expostos e não expostos a um fator, pareando-os em variáveis relevantes antes da análise.
Além disso, o pareamento é muito comum em epidemiologia e em ciências sociais. Ele reduz viés de seleção e melhora a comparabilidade entre grupos. No entanto, como sempre, o método só controla variáveis observadas, o que limita a força das inferências causais.
Quais são as desvantagens do pareamento?
Apesar de suas vantagens, o pareamento apresenta limitações importantes. Primeiramente, ele pode levar à exclusão de participantes que não encontram pares adequados, reduzindo o tamanho efetivo da amostra.
Além disso, a qualidade do pareamento depende diretamente das variáveis escolhidas. Se o pesquisador omitir uma variável de pareamento relevante, o viés permanece. Em outras palavras, parear “mal” pode ser tão problemático quanto não parear.
Por fim, o pareamento pode ser operacionalmente complexo, especialmente quando envolve muitas variáveis de pareamento. A depender da duração das tarefas de pareamento que precisaremos aplicar, sua adoção pode se tornar proibitiva, devido a limitações temporais e financeiras do estudo.
F.A.Q. sobre pareamento (matching)
Quais são os principais pressupostos do pareamento?
Antes de mais nada, o pareamento só controla variáveis observadas e mensuradas. Além disso, ele pressupõe que as variáveis de pareamento escolhidas sejam relevantes para o desfecho. Caso contrário, o controle será ilusório.
Qual a diferença entre o pareamento clássico (matching) e o propensity score matching (PSM)?
No pareamento clássico, pesquisadores igualam diretamente variáveis específicas, como idade ou habilidade cognitiva geral. Já o propensity score matching (PSM) consiste em um procedimento estatístico, onde o pareamento ocorre com base em uma probabilidade estimada de pertencer ao grupo, o que facilita o controle quando há muitas covariáveis.
Em termos práticos, o PSM reduz múltiplas covariáveis a uma única dimensão — a propensão — facilitando a criação de grupos comparáveis em estudos observacionais.
Dados pareados exigem testes estatísticos de medidas repetidas?
Não necessariamente. O pareamento no desenho não garante dependência estatística entre os casos. Portanto, testes de medidas repetidas (como teste t pareado) só são apropriados quando há correlação intrapar substantiva, como em delineamentos de medidas repetidas ou dados diádicos (e.g., de gêmeos).
O pareamento precisa sempre ser em pares?
Não. O termo pareamento é uma conveniência da tradução para o português. O termo original em inglês, matching, alude à ideia de correspondência entre unidades amostrais. Ou seja, isso não pressupõe que a correspondência é entre pares de observações.
Desse modo, pesquisadores podem formar trios, quartetos ou blocos maiores. O princípio central é maximizar a similaridade dentro do bloco, independentemente do seu tamanho.

Referências
Cozby, P. C., & Bates, S. C. (2018). Methods in behavioral research (13th ed.). McGraw-Hill Education.
Goodwin, C. J., & Goodwin, K. A. (2013). Research in psychology: Methods and design (7th ed.). John Wiley & Sons, Inc.
Kantowitz, B. H., Roediger, H. L., III, & Elmers, D. G. (2009). Experimental psychology (9th ed.). Wadsworth Cengage Learning.
Kazdin, A. E. (2016). Research design in clinical psychology (5th ed.). Pearson.
Schaefer, B. M., & Figueiredo Filho, D. B. (2023). Deu match? Uma introdução às técnicas de pareamento. Revista Brasileira de Ciências Sociais, 38(111), Article e3811039. https://doi.org/10.1590/3811039/2023
Shaughnessy, J. J., Zechmeister, E. B., & Zechmeister, J. S. (2012). Research methods in psychology (9th ed.). McGraw-Hill.
Como citar este post
Lima, M. (2026, 2 de fevereiro). O que é pareamento (matching)? Blog Psicometria Online. https://blog.psicometriaonline.com.br/o-que-e-pareamento-matching
