Neste post, falaremos sobre o desvio absoluto mediano, uma medida estatística robusta de dispersão. Primeiramente, revisaremos um método tradicional de detecção de outliers, sua lógica e principais desvantagens. Em seguida, introduziremos o desvio absoluto mediano como uma alternativa ao método tradicional, apresentando suas principais vantagens. Por fim, apresentaremos um exemplo numérico que visa elucidar como a estatística é computada.
Este post se baseou no artigo de Leys et al. (2013). Recomendamos que o leitor interessado em se aprofundar no tema consulte o texto original.
Método tradicional de detecção de outliers: média ± 3 DP
Primeiramente, o que são outliers? Um outlier — ou observação atípica — corresponde a um valor extremo em uma variável ou a um padrão que se distancia substancialmente dos demais. Esses valores podem distorcer nossas análises e inferências.
A abordagem mais comum para detectar outliers se baseia no pressuposto de que os dados seguem uma distribuição normal. Nesse contexto, valores extremos são definidos como aqueles que se afastam mais de três desvios-padrão em relação à média — média + 3 DP (eventualmente, o valor 3 pode ser substituído por outro critério).
Essa regra se apoia em uma propriedade da curva normal: cerca de 99,7% dos dados devem estar dentro do intervalo média ± 3 DP. Portanto, valores fora desse intervalo seriam considerados raros, ou seja, outliers. A Figura 1 indica os percentuais de valores esperados em diferentes faixas da distribuição normal.

Essa técnica é simples e amplamente difundida em estudos quantitativos. Por essas razões, muitos pesquisadores continuam a utilizá-la em diferentes áreas do conhecimento.
No entanto, essa aparente simplicidade esconde fragilidades importantes, especialmente em situações em que o pressuposto de normalidade não se sustenta.
Saiba mais: O que são outliers e como detectá-los?

Quais são as desvantagens do método da média ± 3 DP?
Apesar de ser popular, o critério da média ± 3 DP apresenta limitações sérias. A primeira e mais grave delas é que tanto a média quanto o desvio-padrão são altamente sensíveis a valores extremos.
Isso significa que, paradoxalmente, o próprio outlier que desejamos identificar pode influenciar a média e o desvio-padrão, mascarando sua própria presença. Como consequência, o método pode falhar exatamente quando mais precisamos dele.
Considere os seguintes escores: 1, 3, 3, 6, 8, 10, 10 e 1000. Aqui, a média é 130,13 e o desvio-padrão é 328,80. Com esses valores, um escore será considerado extremo se:

Em síntese, nenhum escore ultrapassa o limite de média ± 3 DP, apesar de o escore 1000 ser visivelmente discrepante em comparação aos demais.
Além disso, esse método depende fortemente do pressuposto de normalidade da distribuição. Quando os dados não seguem essa forma, o intervalo calculado deixa de ser confiável. Ou seja, os percentuais de valores esperados em diferentes regiões da distribuição normal-padrão só vaem se a distribuição for genuinamente normal.
Por fim, em amostras pequenas, a imprecisão aumenta ainda mais. Nesse caso, basta um único valor atípico para comprometer toda a análise. Portanto, a detecção de outliers com base em média e desvio-padrão tende a ser ineficaz justamente nos contextos mais críticos.

O que é o desvio absoluto mediano?
O desvio absoluto mediano (em inglês, median absolute deviation, MAD) é uma medida estatística robusta de dispersão, sendo mais resiliente à presença de outliers que a média e o desvio-padrão.
Eis a fórmula do desvio absoluto mediano:

Onde:
- medianaj(xj) é a mediana da série original.
- xi são as observações originais.
- medianai é a mediana dos desvios absolutos em relação à mediana original.
- b é uma constante de ajuste, definida como b = 1,4826, na distribuição normal. Se os dados seguirem outra distribuição, então b = 1 / Q3, onde Q3 é o escore associado ao quartil 3 (percentil 75) da distribuição.
Podemos decompor a fórmula anterior nas seguintes etapas:
- Ordenamos os dados e encontramos a mediana.
- Subtraímos essa mediana de cada observação e tomamos o valor absoluto.
- Ordenamos os desvios absolutos resultantes.
- Calculamos a mediana desses desvios.
- Multiplicamos pela constante b (ajustada à distribuição; tipicamente, b = 1,4826).
Quais são as vantagens do desvio absoluto mediano?
Em estatística, chamamos de robusto o estimador que mantém resultados confiáveis mesmo quando os dados violam pressupostos, como os de normalidade ou de ausência de outliers. A média e o desvio-padrão, por exemplo, não são robustos — até mesmo um único valor extremo pode distorcer ambos.
Uma medida usada para quantificar a robustez de um estimador é ponto de ruptura (breakdown point), que indica a proporção máxima de dados que pode ser corrompida sem invalidar o estimador. Quanto maior esse ponto, mais resistente (robusta) é a medida.
O desvio absoluto mediano possui ponto de ruptura de 50%, o mais alto possível para medidas de dispersão. Isso significa que, mesmo com metade dos dados alterados, o MAD ainda pode fornecer uma estimativa válida. A razão é simples: ele depende da mediana, que compartilha essa mesma resistência.
Por exemplo, considere a série 2, 4, 6, 8, 10, cuja mediana é 6. Se substituirmos o 10 por infinito, a mediana continuará sendo 6. Se fizermos o mesmo com o valor 8, a mediana segue sendo 6. Somente ao alterarmos mais da metade da amostra, a mediana (e, por consequência, o MAD) deixa de fornecer um valor válido. A média, por outro lado, torna-se indefinida já com o primeiro valor infinito.
Além disso, o desvio absoluto mediano independe do tamanho da amostra. Isso ocorre porque a mediana e os desvios absolutos não dependem da quantidade de dados, mas sim da posição relativa dos valores. Em contrapartida, a média e estatísticas relacionadas são menos sensíveis a valores extremos conforme o tamanho amostral aumenta.
Por fim, o desvio absoluto mediano não pressupõe normalidade dos dados. Desse modo, em contextos com outliers ou com outras distribuições (e.g., com assimetria positiva, como em estudos envolvendo tempos de reação), o desvio absoluto mediano fornece uma medida de dispersão mais robusta.
Cálculo passo a passo do desvio absoluto mediano
Considere os dados introduzidos previamente: 1, 3, 3, 6, 8, 10, 10, 1000. Nesse conjunto, os valores centrais são 6 e 8. Logo, a mediana será a média dos dois valores centrais, ou seja, (6 + 8) / 2 = 7.
Em seguida, calculamos os desvios absolutos dos escores originais em relação à mediana:
| Escore (xi) | |(xi – medianaj(xj)| |
| 1 | |1 – 7| = 6 |
| 3 | |3 – 7| = 4 |
| 3 | |3 – 7| = 4 |
| 6 | |6 – 7| = 1 |
| 8 | |8 – 7| = 1 |
| 10 | |10 – 7| = 3 |
| 10 | |10 – 7| = 3 |
| 1000 | |1000 – 7| = 993 |
Depois, ordenamos os desvios absolutos obtidos em uma série ascendente, 1, 1, 3, 3, 4, 4, 6, 993, e calcularemos sua mediana. O valor obtido está entre o quarto e quinto valores, isto é, (3 + 4) / 2 = 3,5. Multiplicando pela nossa constante, b = 1,4826, teremos:

Por fim, podemos detectar os outliers da amostra com base em algum critério. Por exemplo:

Calculando o termo à esquerda da fórmula acima, temos:
| Escore (xi) | [(xi – medianaj(xj)] / MAD |
| 1 | (1 – 7) / 5,1891 = 1,16 |
| 3 | (3 – 7) / 5,1891 = 0,77 |
| 3 | (3 – 7) / 5,1891 = 0,77 |
| 6 | (6 – 7) / 5,1891 = 0,19 |
| 8 | (8 – 7) / 5,1891 = 0,19 |
| 10 | (10 – 7) / 5,1891 = 0,58 |
| 10 | (10 – 7) / 5,1891 = 0,58 |
| 1000 | (1000 – 7) / 5,1891 = 191,36 |
Em síntese, com base nesses cálculos, o escore 1000 desvia substancialmente do limiar de 2,5 pontos estabelecido como nosso critério de outlier (veja o cálculo em negrito na tabela anterior).
Conclusão
Gostou desse conteúdo? Então aproveite e se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades!
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referência
Leys, C., Ley, C., Klein, O., Bernard, P., & Licata, L. (2013). Detecting outliers: Do not use standard deviation around the mean, use absolute deviation around the median. Journal of Experimental Social Psychology, 49, 764–766. https://doi.org/10.1016/j.jesp.2013.03.013
Como citar este post
Lima, M. (2025, 22 de agosto). O que é e para que serve o desvio absoluto mediano? Blog Psicometria Online. https://blog.psicometriaonline.com.br/o-que-e-e-para-que-serve-o-desvio-absoluto-mediano/
