Neste post, exploraremos o teste t de Yuen, uma variante robusta do teste t de Student. Primeiramente, explicaremos o que é esse teste e qual pergunta de pesquisa ele busca responder. Em seguida, apresentaremos sua lógica de funcionamento, mostrando por que ele é considerado um teste estatístico robusto. Depois, discutiremos suas vantagens, versões e alternativas. Por fim, indicaremos softwares que permitem executá-lo facilmente.
O que é o teste t de Yuen?
O teste t de Yuen é uma versão robusta do teste t clássico. Ele compara médias entre dois grupos, mas reduz a influência de valores extremos (outliers) ao usar médias aparadas (trimmed means).
De modo simples, a média aparada é a média aritmética calculada após removermos uma porcentagem dos valores mais baixos e mais altos da distribuição. Essa técnica impede que valores muito discrepantes distorçam nossa estimativa de tendência central.
Por exemplo, considere as cinco notas: 2, 8, 9, 9 e 10. A média aritmética é 7,6, mas esse número está abaixo de quatro das cinco notas, pois o valor extremo 2 “puxa” a média para baixo. Se removermos a menor (2) e a maior (10) notas, a média das restantes (8, 9, 9) será 8,66 — essa é a média aparada (Figura 1).

No caso do teste t, iremos aparar os dados de dois grupos distintos, visando comparar esses grupos. Tipicamente, o teste t de Yuen remove 20% dos menores e 20% dos maiores valores de cada grupo.
Em seguida, ele aplica o teste t de Welch sobre os dados aparados. Conceitualmente, o teste parte dos dados do painel esquerdo da Figura 2, exclui os valores extremos (marcados com “x”, no painel direito) e executa um teste t sobre os dados remanescentes.

Assim, o teste usa médias “ajustadas” e se torna mais resistente a violações da normalidade e da homocedasticidade.
Em síntese, as hipóteses nula e alternativa do teste t de Yuen são as seguintes:
- Hipótese nula (H0): as médias aparadas dos dois grupos são iguais.
- Hipótese alternativa (H1): as médias aparadas dos dois grupos não são iguais.
Qual é a lógica do teste t de Yuen?
A lógica do teste t de Yuen está em reduzir o peso dos valores extremos e, ao mesmo tempo, aumentar a confiabilidade da inferência estatística. Ele combina dois conceitos fundamentais: médias aparadas e variâncias winsorizadas.
Parte I: entendendo o raciocínio do teste t de Yuen
Suponha que queremos comparar dois grupos (A e B) em uma variável dependente qualquer. A Tabela 1 resume os escores dos participantes.
| Grupo | Escores brutos |
| A | 77, 87, 88, 114, 151, 176, 210, 219, 246, 253, 262, 296, 299, 306, 428, 515, 666, 1.310, 2.611 |
| B | 59, 106, 174, 207, 219, 237, 313, 365, 458, 497, 515, 529, 557, 615, 625, 645, 973, 1.065, 3.215 |
Primeiramente, definimos o nível de truncamento (e.g., γ = 0,20). Isso significa remover 20% dos valores de cada extremidade, em cada grupo. Se há 19 participantes por grupo, eliminamos três valores inferiores e três superiores (20% de 19 dá 3,8 casos, mas arredondamos o valor para baixo).
Em seguida, calculamos as médias aparadas, usando apenas os valores centrais da Tabela 1. Também calculamos as médias winsorizadas, substituindo os valores aparados pelos escores mais próximos a eles, mas que não foram aparados.
Por exemplo, nós substituímos os três menores valores do Grupo A (77, 87 e 88) por 114, e os três maiores valores (666, 1.310 e 2.611) por 515. Desse modo, para calcularmos as médias winsorizadas, usaremos os dados da Tabela 2.
| Grupo | Escores após winsorização |
| A | 114, 114, 114, 114, 151, 176, 210, 219, 246, 253, 262, 296, 299, 306, 428, 515, 515, 515, 515 |
| B | 207, 207, 207, 207, 219, 237, 313, 365, 458, 497, 515, 529, 557, 615, 625, 645, 645, 645, 645 |
Parte 2: Como ocorre o cálculo do teste t de Yuen
Após winsorizar os dados, calculamos a variância winsorizada. Em síntese, ela é semelhante à variância clássica, mas se baseia na média winsorizada.
Em seguida, o teste ajusta essa variância usando dois coeficientes — q1 e q2 — que compensam o truncamento. Esses coeficientes garantem que a variabilidade estimada não fique subestimada após o corte dos valores extremos.
Antes de seguirmos com o teste t de Yuen, vejamos a fórmula do teste t de Welch:

Onde Ms, s2s e ns representam as médias, as variâncias e os tamanhos amostrais, respectivamente. Os subscritos 1 e 2 são os índices dos grupos sendo comparados.
Em síntese, o teste t de Yuen aplica o teste t de Welch, mas pluga valores ligeiramente distintos na fórmula dele. No lugar das médias, ele usa as médias aparadas; no lugar das variâncias clássicas, ele usa as variâncias winsorizadas ajustadas; e, por fim, no lugar dos tamanhos amostrais, ele usa os tamanhos amostrais efetivos (após o truncamento).
Parte 3: Realizando o teste de hipótese
Assim, por meio do teste t de Yuen, obtemos uma estatística t adaptada aos dados aparados, com graus de liberdade igualmente corrigidos. Se o valor obtido for grande o suficiente (em módulo), então rejeitaremos H0.
Mas o quanto é “grande o suficiente”? Para isso, precisamos olhar para a distribuição t com o mesmo número de graus de liberdade (gl) de nosso teste — em nosso exemplo, gl = 23,05. A Figura 3 ilustra essa distribuição, indicando que precisamos obter uma estatística t de pelo menos ±2,03 para que o valor caia nas regiões de rejeição da hipótese nula.

Em resumo, o teste t de Yuen funciona como uma lente que “enxerga” o comportamento central dos grupos, sem ser enganada pelos extremos. Ele é considerado um teste estatístico robusto, pois mantém melhor o controle do erro do Tipo I frente a dados com outliers e distribuições assimétricas, ao mesmo tempo em que preserva um poder estatístico razoável para detectar diferenças reais entre os grupos.
Quais as vantagens do teste t de Yuen?
O teste t de Yuen tem várias vantagens quando os pressupostos clássicos dos testes t são violados:
- Robustez: como ignora parte dos valores extremos, resiste melhor a outliers e a distribuições assimétricas.
- Menor sensibilidade à heterocedasticidade: em muitos casos, ele tolera variâncias desiguais entre grupos.
- Maior poder estatístico em dados “complicados”: evita resultados enganosos ou perdas de poder quando há dados extremos.
- Aplicabilidade prática: é útil em contextos de psicologia, psicometria ou ciências sociais, onde dados atípicos são frequentes.
Além disso, o teste mantém o raciocínio inferencial tradicional (comparar médias), o que facilita sua interpretação — em comparação, por exemplo, a alternativas não paramétricas, como o testes de Mann–Whitney e de Wilcoxon.
Teste t de Yuen: amostras independentes vs. amostras dependentes
Até aqui, consideramos apenas amostras independentes — ou seja, grupos distintos de participantes. No entanto, o teste t de Yuen também possui uma versão para amostras dependentes, que analisa pares correlacionados (como medidas pré e pós ou dados diádicos).
A versão dependente é análoga ao teste t pareado tradicional, mas usa médias aparadas e variâncias winsorizadas adaptadas ao pareamento. Dessa forma, ela considera a correlação dentro de cada par e mantém a robustez frente a outliers.
Em síntese, as duas versões do teste t de Yuen compartilham a mesma filosofia: reduzir a influência dos extremos e estimar diferenças médias de forma mais confiável.

Onde executar o teste t de Yuen?
Mas, afinal, onde executar o teste t de Yuen?
Atualmente, o teste ainda não está disponível em softwares como SPSS ou JASP. Entretanto, ele pode ser facilmente executado no jamovi e no R.
No jamovi, basta instalar o módulo Walrus. Os testes estão disponíveis sob os rótulos Robust Independent Samples T-Test e Robust Paired Samples T-Test (Figura 4).

A Figura 5 apresenta as saídas do teste t de Yuen (parte superior), bem como dos testes ts de Student e de Welch (parte inferior). Os testes se baseiam nos dados da Tabela 1. A versão de Yuen detectou diferenças significativas entre os Grupos A e B (note que o t empírico foi maior que o valor crítico de 2,03, que vimos anteriormente). Em contrapartida, os demais testes falharam em rejeitar a hipótese nula.

Por outro lado, no R, você pode acessar o pacote WRS2, que possui uma coleção de métodos estatísticos robustos desenvolvidos por Rand Wilcox (veja, e.g., Wilcox, 2010). A função yuen executa teste t independente para médias aparadas, enquanto a função yuend faz o mesmo para a versão dependente do teste t.
A título de exemplo, o bloco de códigos a seguir mostra como realizar o teste t de Yuen para amostras independentes.
# instala e carrega pacote
install.packages("WRS2")
library(WRS2)
# cria dados da Tabela 1
escores <- c(# grupo A
77, 87, 88, 114, 151, 176, 210, 219, 246, 253,
262, 296, 299, 306, 428, 515, 666, 1310, 2611,
# grupo B
59, 106, 174, 207, 219, 237, 313, 365, 458, 497, 515,
529, 557, 615, 625, 645, 973, 1065, 3215)
grupos <- c(rep("A", length(escores) / 2), rep("B", length(escores) / 2))
# coloca dados em um data.frame
data <- data.frame(grupos, escores)
# e executa o teste t de Yuen
WRS2::yuen(escores ~ grupos, data)
As linhas 2–3 instalam e carregam o pacote, enquanto a linha 18 executa o teste em formato de fórmula. As demais apenas criam os dados usados no exemplo.
A Figura 6 mostra os resultados a seguir, indicando resultados idênticos àqueles apresentados no jamovi.

Conclusão
Gostou desse conteúdo? Então aproveite e se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades!
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Delacre, M., Lakens, D., & Leys, C. (2017). Why psychologists should by default use Welch t-test instead of Student’s t-test. International Review of Social Psychology, 30(1), 92–101. https://doi.org/10.5334/irsp.82
Wilcox, R. R. (2010). Fundamentals of modern statistical methods: Substantially improving power and accuracy (2nd ed.). Springer. https://doi.org/10.1007/978-1-4419-5525-8
Wilcox, R. R., & Kesselman, H. J. (2003). Modern robust data analysis methods: Measures of central tendency. Psychological Methods, 8(3), 254–274. https://doi.org/10.1037/1082-989X.8.3.254
Yuen K. K. (1974). The two-sample trimmed t for unequal population variances. Biometrika, 61(1), 165–170. https://doi.org/10.1093/biomet/61.1.165
Como citar este post
Lima, M. (2025, 7 de outubro). O que é e como funciona o teste t de Yuen? Blog Psicometria Online. https://blog.psicometriaonline.com.br/teste-t-de-yuen
