O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Assimetria e curtose: um guia completo

Marcos Lima

dez 12, 2024

As análises estatísticas frequentemente requerem uma profunda compreensão da distribuição de dados. Nesse contexto, dois conceitos fundamentais que você deve compreender são assimetria e curtose.

Essas medidas nos ajudam a descrever a forma de uma distribuição de dados, fornecendo insights valiosos sobre a sua natureza. Neste post, explicaremos ambos os conceitos, oferecendo definições e exemplos para garantir uma compreensão completa sobre o tema.

banner da Psicometria Online Academy.

O que é assimetria?

Definição de assimetria

A assimetria é uma medida de falta de “equilíbrio” de uma distribuição em relação à sua média. Embora pareça tautológico dizer que “assimetria é uma medida de assimetria”, isso acontece porque usamos a mesma palavra para nos referirmos a dois termos distintos do inglês. O conceito asymmetry se refere ao espalhamento dos dados, se homogêneo ou não, ao redor da média; por outro lado, a medida skewness se refere à quantificação do grau de assimetria nos dados. Neste post, o termo assimetria será usado para se referir tanto ao conceito quanto à medida.

Por exemplo, considere o caso da conhecida distribuição normal. Ela consiste em uma distribuição contínua e simétrica, isto é, cujos escores se distribuem de maneira igual ao redor da média. Isso significa que o lado direito da distribuição é uma imagem espelhada do lado esquerdo, conforme ilustra a distribuição normal teórica da Figura 1.

representação da distribuição gaussiana.
Figura 1. Distribuição normal teórica.

Embora tenhamos exemplificado uma distribuição simétrica utilizando a distribuição normal, é importante notar que existem diversas distribuições de probabilidade que são simétricas, como a distribuição t de Student, a distribuição uniforme e a distribuição de Cauchy, para citar três exemplos.

Classificação quanto à assimetria

Quanto à assimetria, conjuntos de dados podem receber uma de três classificações, a saber, assimetria negativa, simetria e assimetria positiva (Figura 2).

assimetria e curtose: representação de diferentes classificações de skewness.
Figura 2. Distribuições com assimetria negativa, simetria e assimetria positiva. Linhas pontilhadas indicam posições relativas da média, da mediana e da moda ao longo da distribuição.

Primeiramente, na assimetria negativa, a cauda esquerda da distribuição é mais longa que a direita (Figura 2, painel esquerdo). Na assimetria negativa, a cauda mais longa aponta na direção dos números negativos da reta real.

Por exemplo, suponha que administramos uma tarefa fácil em uma pesquisa. Desse modo, a maioria dos participantes teve desempenho elevado, enquanto uma minoria obteve escores relativamente baixos.

Em segundo lugar, temos a classificação de simetria, que, como vimos anteriormente, consiste em dados que se distribuem igualmente acima e abaixo da média (Figura 2, painel central).

Muitos fenômenos naturais tendem a se distribuir de maneira simétrica (mais especificamente, seguindo a distribuição normal). Por exemplo, a altura de uma população é bem descrita por uma distribuição normal, onde as frequências de alturas diminuem gradativamente conforme os valores se afastam (para mais ou para menos) da média.

Por fim, na assimetria positiva, a cauda direita da distribuição é mais longa que a esquerda (Figura 2, painel direito). Na assimetria positiva, a cauda mais longa aponta na direção dos números positivos da reta real.

Por exemplo, a renda populacional tem assimetria positiva, pois a maioria da população recebe salários menores, enquanto uma parcela minoritária tem rendas extramemente elevadas.

O que é curtose?

Definição de curtose

A curtose avalia a “caudalidade” do conjunto de dados, ou seja, o quanto há dados concentrados mais nas extremidades da distribuição.

Desse modo, a curtose avalia como os dados se dispersam entre o centro e as caudas de uma distribuição, com valores maiores indicando que uma distribuição de dados pode ter caudas “pesadas”, isto é, que possuem muitas observações.

Por exemplo, podemos ter conjuntos de dados que são simétricos, mas que possuem diferentes graus de espalhamento. Mantidas as médias constantes, o conjunto de dados com com maior variância (ou desvio-padrão) tende a se afastar mais da média, em média.

No entanto, essas medidas de variabilidade não visam quantificar especificamente a quantidade de escores nas caudas, mas sim ao longo de toda a distribuição. Para avaliarmos a caudalidade, usaremos o coeficiente de curtose.

Classificação quanto à curtose

Quanto à curtose, conjuntos de dados podem receber uma de três classificações, a saber, leptocúrtica, mesocúrtica e platicúrtica (Figura 3).

assimetria e curtose: representação de diferentes classificações de curtose.
Figura 3. Distribuições leptocúrtica, mesocúrtica e platicúrtica.

Primeiramente, em uma distribuição mesocúrtica, dizemos que não há excesso de curtose (Figura 3, linha verde). Esse é o caso da já discutida distribuição normal.

Já em uma distribuição leptocúrtica, a distribuição tem excesso positivo de curtose, com caudas mais pesadas (Figura 3, linha vermelha). Em outras palavras, há mais outliers em uma distribuição leptocúrtica do que esperaríamos em uma distribuição normal. Por exemplo, a distribuição t com poucos graus de liberdade é leptocúrtica, pois ela tem caudas mais pesadas que uma distribuição normal.

Por fim, em uma distribuição platicúrtica, a distribuição tem excesso negativo de curtose, em comparação com a distribuição normal. Um exemplo é a distribuição uniforme, onde os diferente valores são equiprováveis.

Testando a normalidade, incluindo assimetria e curtose

No caso da assimetria, coeficientes negativos indicam assimetria negativa, enquanto coeficientes positivos indicam assimetria positiva. Valores iguais a 0 indicam simetria similar à distribuição normal.

Por outro lado, em relação à curtose, distribuições mesocúrticas têm curtose igual a 0, enquanto distribuições leptocúrticas e platicúrticas têm coeficientes positivos e negativos, respectivamente.

Mas quais valores indicam excesso de assimetria e de curtose? Tabachnick e Fidell (2014) apresentam testes de hipóteses para avaliar assimetria e normalidade. Field (2017) também ensina esses testes que, basicamente, envolvem dividir os coeficientes (de assimetria ou de curtose) por seus respectivos erros-padrões.

De todo modo, Tabachnick e Fidell (2014) recomendam níveis de significância mais conservadores em tais testes (alfa de 0,01 ou de 0,001), mas apenas quando as amostras são pequenas ou moderadas.

No entanto, quando os tamanhos amostrais aumentam substancialmente, testes de hipótese tendem a rejeitar a hipótese nula (de ausências de assimetria e de excesso de curtose) mesmo com desvios pouco importantes. Por esse motivo, Tabachnick e Fidell (2014) recomendam análises gráficas com amostras maiores (e.g., P-P plot, Q-Q plot).

Conclusão

Neste post, você aprendeu os conceitos de assimetria e de curtose, bem como suas representações gráficas. Além disso, demos exemplos das diferentes classificações de assimetria e de curtose. Gostou desse conteúdo? Então aproveite e se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades!

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.

Tabachnick, B. G., & Fidell, L. S. (2014). Using multivariate statistics (6th ed.). Pearson Education Limited.

Como citar este post

Lima, M. (2024, 12 de dezembro). Assimetria e curtose: Um guia completo. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/assimetria-e-curtose-um-guia-completo/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Respostas de 2

  1. Prezado Bruno.

    Obrigado pelo seu post informativo sobre a curtose. Gostaria apenas de apontar que a figura que você colocou para diferenciar as distribuições mesocúrticas, leptocúrticas e platicúrticas está com as setas invertidas. Segundo sua definição no texto, a curva que deveria ter a seta de platicúrtica é a mais alongada em torno do valor central, ou seja, com poucas caudas. Em todo caso, obrigado pelo seu trabalho… bem didático e esclarecedor.

    1. Olá, Filipe. Agradecemos o comentário. Estamos atualizando posts antigos, de modo a acrescentar mais exemplos. Nós substituímos a figura que você comentou e trouxemos mais exemplos para tentar esclarecer as diferenças quanto aos desvios de curtose. Por exemplo, comparamos agora a distribuição normal à distribuição t, quando falamos de distribuições leptocúrticas. Mais uma vez, muito obrigado pela contribuição!

      Equipe Psicometria Online.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Reamostragem e o método bootstrap

Como lidar com os pressupostos da análise de variância (ANOVA)?

Diagnóstico de multicolinearidade

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

Qual é a diferença entre R e RStudio?

Postados recentemente

Modelagem por equações estruturais no R: conceitos e aplicações

Compreendendo os índices de validade de conteúdo

Índice de validade de conteúdo

O que são médias marginais?

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias