A média aparada é uma medida de tendência central robusta a valores extremos e a distribuições com caudas pesadas. Neste post, você aprenderá, em linhas gerais, como funciona o cálculo da média aparada, quais são as duas principais regras para aparar dados e quais são suas vantagens na análise estatística e na inferência robusta.
O que é uma média aparada?
A média aparada (trimmed mean) — ou média truncada (truncated mean) — é uma forma ajustada de média que reduz o impacto de valores atípicos. Em síntese, ao invés de incluir todas as observações, o pesquisador descarta uma parte dos menores e maiores valores da amostra antes de calcular a média aparada.
Implicitamente, esse conceito aparece em competições esportivas. Nos saltos ornamentais e na ginástica artística, as notas mais altas e mais baixas dos jurados são eliminadas para gerar uma pontuação mais justa.
Por exemplo, imagine uma atleta com as notas 7,2, 9,2, 8,8, 9,6 e 9,1. A média aritmética é 8,78, mas, ao removermos a menor (7,2) e a maior (9,6) nota, obtemos uma média aparada de 9,03 — uma estimativa mais equilibrada do desempenho real.
Em resumo, a média aparada ocupa uma posição intermediária entre a média aritmética e a mediana. À medida que removemos uma fração maior dos valores nas extremidades, o resultado se aproxima da mediana — que, por sinal, representa o caso limite da aparagem.
De modo semelhante, a média interquartílica é uma variação da média aparada, pois considera apenas os valores entre o primeiro e o terceiro quartis. Nesse caso, cerca de 25% das observações em cada ponta são excluídas, com a média aparada representando os 50% dos valores centrais.
Portanto, ao ajustar o percentual aparado, o pesquisador controla o equilíbrio entre sensibilidade e robustez, tornando a técnica valiosa em situações com ruído ou alta variabilidade.

Principais regras para calcular a média aparada
Existem duas maneiras principais para calcular a média aparada, a saber, a regra baseada em porcentagem e a regra baseada desvio-padrão. Ambas visam reduzir o efeito de valores extremos, mas utilizam critérios diferentes.
Em seguida, veremos cada uma dessas regras.
Regra baseada em porcentagem
Na regra baseada em porcentagem, o pesquisador define uma porcentagem fixa de exclusão de observações. Por exemplo, ao aparar 10%, removem-se 10% dos menores e 10% dos maiores valores, calculando a média aritmética com base nos 80% casos remanescentes.
Para ilustrar, considere o conjunto de dados da Figura 1, apresentados em ordem crescente.

A média aritmética de 15,7 está acima de oito dos 10 escores. Isso ocorre porque os dois últimos escores são substancialmente diferentes dos demais. Consequentemente, a média é influenciada por essas observações.
Uma solução é excluirmos um valor de cada extremidade e recalcularmos a média com base nos demais valores, o que resulta em uma média aparada de 10% (Figura 2).

A média caiu de 15,7 para 7. Ou seja, o impacto do valor extremo que excluímos foi reduzido. No entanto, cinco dos oito escores (62,5%) ainda estão abaixo da média. Isso sugere que o novo escore máximo (22) ainda impacta a média. Desse modo, podemos aparar mais um escore em cada ponta e computar a média aparada de 20% (Figura 3).

Agora, a média caiu de 7 para 5,33, indicando um valor mais representativo dos dados. Se seguíssemos neste processo, poderíamos chegar a uma média aparada de 40%, que, em nosso exemplo, seria o caso mais extremo de aparagem, a saber, a mediana (Figura 4).

Essa abordagem é intuitiva e muito usada em relatórios estatísticos, pois mantém o controle direto sobre o percentual de dados excluídos em cada cauda da distribuição.
Regra baseada em desvio-padrão
A segunda forma de calcular a média aparada usa o desvio-padrão como referência. Nesse caso, excluem-se valores fora de um número pré-definido de desvios-padrões. Essa técnica é útil quando se deseja padronizar a aparagem entre amostras.
Por exemplo, essa regra é bastante usada em experimentos com tempos de reação (Ratcliff, 1993). Uma vez que tempos de reação são naturalmente truncados em zero e tendem a apresentar assimetria positiva, algumas tentativas com respostas muito lentas (e.g., por lapsos atencionais) distorcem a média.
Considere os dados de tempos de reação de um participante hipotético (Figura 5), que seguem uma distribuição exponencial.

Esse participante tem tempo médio de 0,97 s (DP = 0,97). A regra de ±2,5 desvios-padrões indica, portanto, que devemos excluir valores abaixo de 0,97 – 2,5 × 0,97 = –1,46 s, e acima de 0,97 + 2,5 × 0,97 = 3,40 s. No entanto, como tempos de reação nunca são negativos, excluíremos apenas as tentativas com tempos de reação acima de 3,40 s.
O cálculo da média aparada, portanto, se baseará apenas nos tempos de reação abaixo de 3,40 s (Figura 6, região azul).

Após a aparagem, a média cai de 0,97 s para 0,88 s (uma queda de 90 ms). Ademais, observe que o desvio-padrão também diminuiu — de 0,97 s para 0,79 s —, uma consequência direta de mantermos nos dados apenas valores mais homogêneos.
Essa regra é mais adaptável em amostras heterogêneas, pois leva em conta a variabilidade interna dos dados. Contudo, há uma limitação: os valores extremos afetam tanto a média quanto o desvio-padrão, que são as próprias estatísticas que usamos para definir o critério de aparagem — um ponto crítico destacado por Field (2017).
Quais são as vantagens de usar a média aparada?
A média aparada apresenta várias vantagens. Primeiramente, ela reduz a influência de outliers, tornando as análises mais estáveis e confiáveis. Além disso, ela mantém as principais propriedades estatísticas da média, facilitando comparações e interpretações entre estudos.
Para ilustrar, considere uma simulação com 20 observações de uma distribuição normal-padrão (M = 0, DP = 1). Calculamos a média aritmética e a média aparada de 20% — isto é, excluímos oito das 20 observações — e repetimos o procedimento 5 mil vezes. A Figura 7 apresenta as distribuições amostrais de ambas as médias.

A variabilidade de cada curva, representada pelo erro-padrão (EP), indica a precisão com que um estimador se aproxima da média populacional. Os resultados mostram EP = 0,23 para a média aritmética e EP = 0,24 para a média aparada — uma diferença mínima, mesmo com menos dados utilizados.
Outra vantagem é a robustez. Mesmo diante de erros de medição ou distribuições com caudas pesadas, a média aparada mantém bom desempenho.
Para demonstrar, considere uma distribuição normal contaminada (Wilcox & Keselman, 2003), composta por 90% de casos controle (M = 0, DP = 1) e 10% de casos clínicos (M = 0, DP = 10). Repetindo o mesmo procedimento de 5 mil amostragens, a Figura 8 revela que o EP da média aparada foi de 0,27, enquanto o da média aritmética atingiu 0,74. Assim, ao eliminarmos valores extremos, obtemos estimativas muito mais consistentes.

Por fim, a média aparada — e a aparagem, de forma mais ampla — estão subjacentes aos chamados métodos estatísticos robustos, que buscam manter o controle dos erros dos Tipos I e II mesmo quando violamos pressupostos estatísticos.
Em síntese, a média aparada melhora a precisão, a robustez e a confiabilidade das análises.
Trimming na inferência estatística
Na inferência estatística, o termo trimming (ou aparagem de dados) tem papel importante em métodos estatísticos robustos. Nesses casos, pesquisadores aplicam a média aparada dentro de testes e estimativas para reduzir o impacto de observações atípicas.
Por exemplo, o teste t de média aparada (trimmed mean t-test) é uma variação robusta do teste t tradicional (Yuen, 1974; Yuen & Dixon, 1973). Ele substitui as médias comuns pelas médias aparadas, aumentando assim a resistência do teste a violações de normalidade e presença de valores extremos.
Além disso, o trimming pode ser aplicado em regressões e intervalos de confiança, melhorando a estabilidade das estimativas. Dessa forma, pesquisadores obtêm resultados mais confiáveis, mesmo quando os pressupostos clássicos da estatística são apenas parcialmente atendidos.
Portanto, o uso de aparagem na inferência estatística amplia a aplicabilidade dos métodos, tornando-os mais realistas diante da variabilidade natural dos dados.
Conclusão
Gostou desse conteúdo? Então aproveite e se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades!
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referências
Ratcliff, R. (1993). Methods for dealing with reaction time outliers. Psychological Bulletin, 114(3), 510–532. https://doi.org/10.1037/0033-2909.114.3.510
Sladekova, M., & Field, A. P. (2025). Robust statistical methods and the credibility movement of psychological science. PeerJ, 13, Article e20043. https://doi.org/10.7717/peerj.20043
Wilcox, R. R., & Kesselman, H. J. (2003). Modern robust data analysis methods: Measures of central tendency. Psychological Methods, 8(3), 254–274. https://doi.org/10.1037/1082-989X.8.3.254
Yuen K. K. (1974). The two-sample trimmed t for unequal population variances. Biometrika, 61(1), 165–170. https://doi.org/10.1093/biomet/61.1.165
Yuen, K. K., & Dixon, W. J. (1973). The approximate behaviour and performance o the two-sample trimmed t. Biometrika, 60(2), 369–374. https://doi.org/10.1093/biomet/60.2.369
Como citar este post
Lima, M. (2025, 6 de outubro). O que é e para que serve a média aparada? Blog Psicometria Online. https://blog.psicometriaonline.com.br/o-que-e-e-para-que-serve-a-media-aparada
