O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Medidas de tendência central: média, mediana e moda

Marcos Lima

mar 16, 2023

As medidas de tendência central são usadas para resumir os dados em torno de um valor típico da amostra. Essas medidas consistem em uma parte fundamental da estatística descritiva, isto é, quando almejamos sumarizar e dar sentido aos dados que temos em mãos.

Neste post, vamos explorar as medidas de tendência central que são tipicamente usadas em análises quantitativas de dados. Iremos descrever as três medidas mais comuns: a média, a mediana e a moda.

Para que servem as medidas de tendência central?

As medidas de tendência central, também chamadas de medidas de centralidade, são estatísticas descritivas que têm a função de resumir os dados em termos de um valor central ou típico. Essas medidas servem para descrever os dados de forma mais simples, pois seria muito custoso caracterizar a amostra observação por observação.

Por exemplo, se você coletou a idade de 100 participantes, é mais simples resumir essa variável por meio de um único valor do que enumerar os valores informados por cada participante. Assim, tais medidas são componentes fundamentais da estatística descritiva.

A seguir, veremos como calcular e como interpretar as três principais medidas de tendência central que você precisa conhecer.

Como calcular as principais medidas de tendência central?

Como calcular a média?

A média aritmética (ou, simplesmente, média) é a medida de tendência central mais usada em pesquisas quantitativas. Ela é definida como a soma de todos os valores dos dados dividida pelo número total de observações:

onde xi representa o valor da observação i, e N representa o número de observações na amostra. Desse modo, se quiséssemos descrever a idade média de uma amostra de pessoas, poderíamos somar todas as idades e dividir essa soma pelo número de pessoas na amostra.

Por exemplo, cinco crianças têm as seguintes idades: 4, 10, 8, 2 e 6 anos. Aplicando a equação da média, teríamos:

Podemos interpretar, portanto, que a idade média das cinco crianças é de 6 anos.

No exemplo anterior, a média expressa exatamente a idade de uma das crianças. Mas considere o caso a seguir, em que acrescentamos alguém com 12 anos à amostra anterior:

Agora, a média ainda representa a tendência nos dados, mesmo não sendo um valor presente nos próprios dados. Note que a média expressa um “ponto de equilíbrio” na distribuição de valores.

Como calcular a mediana?

A mediana é a medida de tendência central que corresponde ao valor que divide o conjunto de dados em duas partes iguais. Nessa divisão, metade dos valores é menor ou igual à mediana, e a outra metade, maior ou igual à mediana.

Para calcular a mediana, primeiro identificamos o número de casos, N, em uma amostra. Em seguida, ordenamos os valores em sequência crescente e identificamos o valor que está no posto (ou posição) central da sequência.

Se o número de casos da amostra é ímpar, então o posto central será dado por (N + 1) / 2, e a mediana será o valor associado a esse posto. Por outro lado, se o número de casos da amostra é par, então teremos dois postos centrais, N / 2 e (N + 1) / 2. Nesse caso, a mediana será a média aritmética dos valores associados a esses postos.

Um pouco abstrato? Então vamos usar os mesmos exemplos da seção anterior para entendermos melhor o conceito. No primeiro exemplo, quando o número de casos é ímpar, temos:

Neste exemplo, N = 5, portanto, o posto da mediana é (5 + 1) / 2 = 3. Logo, o valor da mediana está associado ao posto 3, correspondendo à idade de 6 anos.

No segundo exemplo, quando o número de casos é par, temos:

Neste segundo exemplo, N = 6, portanto, os postos medianos são 3 e 4, associados aos valores 6 e 8, respectivamente. A média desses valores é (6 + 8) / 2 = 7. Logo, o valor da mediana corresponde à idade de 7 anos.

Como calcular a moda?

Apesar de ser a medida de tendência central menos utilizada, a moda é bastante útil em certas situações. Ela representa o valor mais comum em um conjunto de dados, ou seja, o valor que aparece com maior frequência.

Para calcular a moda, basta contar quantas vezes cada valor aparece e selecionar o valor que aparece com maior frequência. Por exemplo, considere o conjunto de cinco observações a seguir:

Nesse exemplo, a moda seria 4, pois esse valor é o que ocorre com maior frequência (duas vezes). Vale ressaltar que uma amostra pode ser: (a) amodal: quando não possui moda; (b) bimodal: quando possui dois valores modais; e (c) multimodal: quando possui mais do que dois valores modais.

Qual é a relação entre as diferentes medidas de tendência central?

Em geral, os valores da média, mediana e moda tendem a ser iguais (ou muito próximos) em distribuições de dados simétricas. A Figura 1 representa esse cenário. Quando os valores das três medidas coincidem, o centro da distribuição é tanto o ponto de equilíbrio dos dados (média), o ponto que divide os dados em duas partes iguais (mediana) e o ponto mais frequente (moda).

medidas de tendência central em distribuição simétrica.
Figura 1. Relação entre média, mediana e moda na distribuição simétrica.

O cenário tende a ser diferente em distribuições assimétricas. Em distribuições positivamente assimétricas (Figura 2), o valor da moda tende a ser menor que o da mediana que, por sua vez, tende a ser menor que o da média.

moda, mediana e média em distribuição com assimetria positiva.
Figura 2. Relação entre média, mediana e moda na distribuição positivamente assimétrica.

Por outro lado, em distribuições negativamente assimétricas (Figura 3), o valor da média tende a ser menor que o da mediana que, por sua vez, tende a ser menor que o da moda. Isso ocorre porque, em ambos os casos, a média está sendo “atraída” pelos valores extremos, ficando mais inclinada naquela direção.

média, mediana e moda em distribuição com assimetria negativa.
Figura 3. Relação entre média, mediana e moda na distribuição negativamente assimétrica.

Qual medida de tendência central reportar?

A média é útil para resumir dados simétricos ao redor do centro. Outra vantagem da média em relação às demais medidas é que todas as observações de um conjunto de dados contribuem em seu cálculo.

No entanto, uma das desvantagens da média é que ela é sensível a valores extremos. Esse impacto ocorre sobretudo em conjuntos de dados menores, em que o valor extremo exerce um poder de atração mais forte sobre a média (veja novamente as Figuras 2 e 3, em que a média foi “puxada” para a direção das caudas das distribuições).

A mediana, por sua vez, não sofre tanto impacto de valores extremos. Isso ocorre porque a mediana transforma as observações em postos como etapa intermediária em seu cálculo. Por exemplo, considere os dados a seguir:

Nesses dados, temos um valor extremo, a saber, a idade de 100 anos. A média é sensível a esse valor extremo (M = 24), que pouco efeito exerce sobre a mediana (Mdn = 6). Desse modo, a mediana é particularmente útil para resumir conjuntos de dados assimétricos ou que contém valores extremos.

No entanto, uma desvantagem comum à média e à mediana é que elas não podem ser calculadas para variáveis nominais, tais como sexo e religião. Isso acontece porque essas variáveis não representam quantidade e, por isso, não podem sequer ser ordenadas da menor para a maior.

Sendo assim, quando o objetivo é resumir os valores obtidos pela amostra usando variáveis nominais, a única medida de tendência central que dispomos é a moda. Ela indica a categoria mais frequente no banco de dados.

Note que a categoria modal, embora seja, por definição, a categoria típica dos dados, nem sempre representa genuinamente uma categoria “central”, do ponto de vista da distribuição dos dados.

Conclusão

Neste post, exploramos três medidas de tendência central: a média, a mediana e a moda. A escolha da medida mais apropriada em cada situação depende do conjunto de dados e do tipo de distribuição que temos em mãos.

Reforçamos, contudo, que as medidas de tendência central costumam ser apresentadas juntamente com uma ou mais medidas de dispersão, visando fornecer uma melhor compreensão dos padrões existentes nos dados.

Gostou desse conteúdo? Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.

Howell, D. C. (2013). Describing and exploring data. In D. C. Howell, Statistical methods for psychology (8th ed., pp. 15–62). Cengage Wadsworth Learning.

Como citar este post

Lima, M. (2023, 16 de março). Medidas de tendência central: Média, mediana e moda. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/medidas-de-tendencia-central-media-mediana-e-moda/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais.

Compartilhe sua opinião sobre este post

2 respostas

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Por que aprender a programar em R?

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Explorando as etapas da análise de dados

Conteúdo

Mais lidos

O que é regressão linear simples?

O que é correlação de Spearman?

Como criar gráficos no R com o ggplot2?

O que é correlação de Pearson?

Postados recentemente

Como criar gráficos no R com o ggplot2?

Quais pacotes usar na análise fatorial exploratória no R?

Como reestruturar o formato do banco de dados no R?

Como juntar bancos de dados no R com o dplyr?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

 

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

 

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Compartilhe sua opinião sobre este post

Posts sugeridos

Por que aprender a programar em R?

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Explorando as etapas da análise de dados

Categorias