O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é e como funciona o teste t de Yuen?

Marcos Lima

out 7, 2025

Neste post, exploraremos o teste t de Yuen, uma variante robusta do teste t de Student. Primeiramente, explicaremos o que é esse teste e qual pergunta de pesquisa ele busca responder. Em seguida, apresentaremos sua lógica de funcionamento, mostrando por que ele é considerado um teste estatístico robusto. Depois, discutiremos suas vantagens, versões e alternativas. Por fim, indicaremos softwares que permitem executá-lo facilmente.

O que é o teste t de Yuen?

O teste t de Yuen é uma versão robusta do teste t clássico. Ele compara médias entre dois grupos, mas reduz a influência de valores extremos (outliers) ao usar médias aparadas (trimmed means).

De modo simples, a média aparada é a média aritmética calculada após removermos uma porcentagem dos valores mais baixos e mais altos da distribuição. Essa técnica impede que valores muito discrepantes distorçam nossa estimativa de tendência central.

Por exemplo, considere as cinco notas: 2, 8, 9, 9 e 10. A média aritmética é 7,6, mas esse número está abaixo de quatro das cinco notas, pois o valor extremo 2 “puxa” a média para baixo. Se removermos a menor (2) e a maior (10) notas, a média das restantes (8, 9, 9) será 8,66 — essa é a média aparada (Figura 1).

média aritmética tradicional vs. média aparada.
Figura 1. Média tradicional e média aparada.

No caso do teste t, iremos aparar os dados de dois grupos distintos, visando comparar esses grupos. Tipicamente, o teste t de Yuen remove 20% dos menores e 20% dos maiores valores de cada grupo.

Em seguida, ele aplica o teste t de Welch sobre os dados aparados. Conceitualmente, o teste parte dos dados do painel esquerdo da Figura 2, exclui os valores extremos (marcados com “x”, no painel direito) e executa um teste t sobre os dados remanescentes.

ilustrando da lógica do teste t de Yuen.
Figura 2. Representação esquemática da lógica do teste t de Yuen.

Assim, o teste usa médias “ajustadas” e se torna mais resistente a violações da normalidade e da homocedasticidade.

Em síntese, as hipóteses nula e alternativa do teste t de Yuen são as seguintes:

  • Hipótese nula (H0): as médias aparadas dos dois grupos são iguais.
  • Hipótese alternativa (H1): as médias aparadas dos dois grupos não são iguais.

Qual é a lógica do teste t de Yuen?

A lógica do teste t de Yuen está em reduzir o peso dos valores extremos e, ao mesmo tempo, aumentar a confiabilidade da inferência estatística. Ele combina dois conceitos fundamentais: médias aparadas e variâncias winsorizadas.

Parte I: entendendo o raciocínio do teste t de Yuen

Suponha que queremos comparar dois grupos (A e B) em uma variável dependente qualquer. A Tabela 1 resume os escores dos participantes.

GrupoEscores brutos
A77, 87, 88, 114, 151, 176, 210, 219, 246, 253, 262, 296, 299, 306, 428, 515, 666, 1.310, 2.611
B59, 106, 174, 207, 219, 237, 313, 365, 458, 497, 515, 529, 557, 615, 625, 645, 973, 1.065, 3.215
Tabela 1. Dados hipotéticos para comparação de dois grupos independentes (baseado em Wilcox, 2010, p. 77). Valores em negrito serão excluídos para cálculo de média aparada de 20%.

Primeiramente, definimos o nível de truncamento (e.g., γ = 0,20). Isso significa remover 20% dos valores de cada extremidade, em cada grupo. Se há 19 participantes por grupo, eliminamos três valores inferiores e três superiores (20% de 19 dá 3,8 casos, mas arredondamos o valor para baixo).

Em seguida, calculamos as médias aparadas, usando apenas os valores centrais da Tabela 1. Também calculamos as médias winsorizadas, substituindo os valores aparados pelos escores mais próximos a eles, mas que não foram aparados.

Por exemplo, nós substituímos os três menores valores do Grupo A (77, 87 e 88) por 114, e os três maiores valores (666, 1.310 e 2.611) por 515. Desse modo, para calcularmos as médias winsorizadas, usaremos os dados da Tabela 2.

GrupoEscores após winsorização
A114, 114, 114, 114, 151, 176, 210, 219, 246, 253, 262, 296, 299, 306, 428, 515, 515, 515, 515
B207, 207, 207, 207, 219, 237, 313, 365, 458, 497, 515, 529, 557, 615, 625, 645, 645, 645, 645
Tabela 2. Dados hipotéticos para comparação de dois grupos independentes (baseado em Wilcox, 2010, p. 77). Valores em negrito foram winsorizados.

Parte 2: Como ocorre o cálculo do teste t de Yuen

Após winsorizar os dados, calculamos a variância winsorizada. Em síntese, ela é semelhante à variância clássica, mas se baseia na média winsorizada.

Em seguida, o teste ajusta essa variância usando dois coeficientes — q1 e q2 — que compensam o truncamento. Esses coeficientes garantem que a variabilidade estimada não fique subestimada após o corte dos valores extremos.

Antes de seguirmos com o teste t de Yuen, vejamos a fórmula do teste t de Welch:

fórmula do teste t de Welch.

Onde Ms, s2s e ns representam as médias, as variâncias e os tamanhos amostrais, respectivamente. Os subscritos 1 e 2 são os índices dos grupos sendo comparados.

Em síntese, o teste t de Yuen aplica o teste t de Welch, mas pluga valores ligeiramente distintos na fórmula dele. No lugar das médias, ele usa as médias aparadas; no lugar das variâncias clássicas, ele usa as variâncias winsorizadas ajustadas; e, por fim, no lugar dos tamanhos amostrais, ele usa os tamanhos amostrais efetivos (após o truncamento).

Parte 3: Realizando o teste de hipótese

Assim, por meio do teste t de Yuen, obtemos uma estatística t adaptada aos dados aparados, com graus de liberdade igualmente corrigidos. Se o valor obtido for grande o suficiente (em módulo), então rejeitaremos H0.

Mas o quanto é “grande o suficiente”? Para isso, precisamos olhar para a distribuição t com o mesmo número de graus de liberdade (gl) de nosso teste — em nosso exemplo, gl = 23,05. A Figura 3 ilustra essa distribuição, indicando que precisamos obter uma estatística t de pelo menos ±2,03 para que o valor caia nas regiões de rejeição da hipótese nula.

distribuição t.
Figura 3. Distribuição t com 23,05 graus de liberdade (assumindo α = 0,05, bicaudal).

Em resumo, o teste t de Yuen funciona como uma lente que “enxerga” o comportamento central dos grupos, sem ser enganada pelos extremos. Ele é considerado um teste estatístico robusto, pois mantém melhor o controle do erro do Tipo I frente a dados com outliers e distribuições assimétricas, ao mesmo tempo em que preserva um poder estatístico razoável para detectar diferenças reais entre os grupos.

    Quais as vantagens do teste t de Yuen?

    O teste t de Yuen tem várias vantagens quando os pressupostos clássicos dos testes t são violados:

    • Robustez: como ignora parte dos valores extremos, resiste melhor a outliers e a distribuições assimétricas.
    • Menor sensibilidade à heterocedasticidade: em muitos casos, ele tolera variâncias desiguais entre grupos.
    • Maior poder estatístico em dados “complicados”: evita resultados enganosos ou perdas de poder quando há dados extremos.
    • Aplicabilidade prática: é útil em contextos de psicologia, psicometria ou ciências sociais, onde dados atípicos são frequentes.

    Além disso, o teste mantém o raciocínio inferencial tradicional (comparar médias), o que facilita sua interpretação — em comparação, por exemplo, a alternativas não paramétricas, como o testes de Mann–Whitney e de Wilcoxon.

    Teste t de Yuen: amostras independentes vs. amostras dependentes

    Até aqui, consideramos apenas amostras independentes — ou seja, grupos distintos de participantes. No entanto, o teste t de Yuen também possui uma versão para amostras dependentes, que analisa pares correlacionados (como medidas pré e pós ou dados diádicos).

    A versão dependente é análoga ao teste t pareado tradicional, mas usa médias aparadas e variâncias winsorizadas adaptadas ao pareamento. Dessa forma, ela considera a correlação dentro de cada par e mantém a robustez frente a outliers.

    Em síntese, as duas versões do teste t de Yuen compartilham a mesma filosofia: reduzir a influência dos extremos e estimar diferenças médias de forma mais confiável.

    banner da NAOPARE.

    Onde executar o teste t de Yuen?

    Mas, afinal, onde executar o teste t de Yuen?

    Atualmente, o teste ainda não está disponível em softwares como SPSS ou JASP. Entretanto, ele pode ser facilmente executado no jamovi e no R.

    No jamovi, basta instalar o módulo Walrus. Os testes estão disponíveis sob os rótulos Robust Independent Samples T-Test e Robust Paired Samples T-Test (Figura 4).

    pacote Walrus do jamovi para teste t de Yuen.
    Figura 4. Screenshot da janela do módulo Walrus, no jamovi.

    A Figura 5 apresenta as saídas do teste t de Yuen (parte superior), bem como dos testes ts de Student e de Welch (parte inferior). Os testes se baseiam nos dados da Tabela 1. A versão de Yuen detectou diferenças significativas entre os Grupos A e B (note que o t empírico foi maior que o valor crítico de 2,03, que vimos anteriormente). Em contrapartida, os demais testes falharam em rejeitar a hipótese nula.

    teste t de Yuen para amostras independentes no jamovi.
    Figura 5. Testes ts de Yuen, de Student e de Welch no jamovi.

    Por outro lado, no R, você pode acessar o pacote WRS2, que possui uma coleção de métodos estatísticos robustos desenvolvidos por Rand Wilcox (veja, e.g., Wilcox, 2010). A função yuen executa teste t independente para médias aparadas, enquanto a função yuend faz o mesmo para a versão dependente do teste t.

    A título de exemplo, o bloco de códigos a seguir mostra como realizar o teste t de Yuen para amostras independentes.

    # instala e carrega pacote
    install.packages("WRS2")
    library(WRS2)
    
    # cria dados da Tabela 1
    escores <- c(# grupo A
                77, 87, 88, 114, 151, 176, 210, 219, 246, 253,
                262, 296, 299, 306, 428, 515, 666, 1310, 2611, 
                # grupo B
                59, 106, 174, 207, 219, 237, 313, 365, 458, 497, 515,
                529, 557, 615, 625, 645, 973, 1065, 3215)
    grupos <- c(rep("A", length(escores) / 2), rep("B", length(escores) / 2))
    
    # coloca dados em um data.frame
    data <- data.frame(grupos, escores)
    
    # e executa o teste t de Yuen
    WRS2::yuen(escores ~ grupos, data)
    

    As linhas 2–3 instalam e carregam o pacote, enquanto a linha 18 executa o teste em formato de fórmula. As demais apenas criam os dados usados no exemplo.

    A Figura 6 mostra os resultados a seguir, indicando resultados idênticos àqueles apresentados no jamovi.

    teste t de Yuen para amostras independentes no R.
    Figura 6. Resultados do teste t de Yuen para amostras independentes no R.

    Conclusão

    Gostou desse conteúdo? Então aproveite e se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades!

    Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

    Referências

    Delacre, M., Lakens, D., & Leys, C. (2017). Why psychologists should by default use Welch t-test instead of Student’s t-test. International Review of Social Psychology, 30(1), 92–101. https://doi.org/10.5334/irsp.82

    Wilcox, R. R. (2010). Fundamentals of modern statistical methods: Substantially improving power and accuracy (2nd ed.). Springer. https://doi.org/10.1007/978-1-4419-5525-8

    Wilcox, R. R., & Kesselman, H. J. (2003). Modern robust data analysis methods: Measures of central tendency. Psychological Methods8(3), 254–274. https://doi.org/10.1037/1082-989X.8.3.254

    Yuen K. K. (1974). The two-sample trimmed t for unequal population variances. Biometrika61(1), 165–170. https://doi.org/10.1093/biomet/61.1.165

    Como citar este post

    Lima, M. (2025, 7 de outubro). O que é e como funciona o teste t de Yuen? Blog Psicometria Online. https://blog.psicometriaonline.com.br/teste-t-de-yuen

    Bruno Figueiredo Damásio

    Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

    Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

    Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

    Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

    Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

    Compartilhe sua opinião sobre este post

    Deixe um comentário

    O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

    Posts sugeridos

    O que significa soma dos quadrados, em estatística?

    O que é modelo linear geral?

    O que é o tamanho de efeito em linguagem comum (common language effect size)?

    Conteúdo

    Mais lidos

    O que é correlação de Pearson?

    Teste t de Student

    O que é o teste de Shapiro-Wilk?

    O que é correlação de Spearman?

    Postados recentemente

    O que significa soma dos quadrados, em estatística?

    Como inverter itens no SPSS?

    O algoritmo k-means clustering

    Tudo que você precisa saber sobre inversão de itens de instrumentos de autorrelato

    Deseja se tornar completamente independente na análise dos seus dados?

    Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

    Categorias