A distribuição normal é uma distribuição de probabilidade contínua e simétrica em ambos os lados da média, de modo que o lado direito é uma imagem espelhada do esquerdo. É a mais familiar das distribuições de probabilidade e também uma das mais importantes em estatística.
A maioria dos valores de dados nesta distribuição tendem a se agrupar em torno da média. As caudas são assintóticas, o que significa que, teoricamente, se estende de – infinito a + infinito, sem tocar o eixo horizontal.
Para uma distribuição perfeitamente normal, a média, mediana e moda terão o mesmo valor, visualmente representados pelo pico da curva.
Também é frequentemente chamada de curva de sino porque o gráfico de sua densidade de probabilidade se parece com um sino. É também conhecida como distribuição gaussiana, em homenagem ao matemático alemão Carl Gauss que a descreveu pela primeira vez.
Qual é a utilidade da distribuição normal?
Na natureza, muitos dados contínuos, exibem essa curva em forma de sino quando compilados e representados graficamente. Por exemplo, se selecionássemos aleatoriamente 100 indivíduos, esperaríamos ver essa distribuição para muitas variáveis contínuas, como altura, pressão arterial e quociente de inteligência.
Muitos testes estatísticos dependem dessa distribuição, como os testes paramétricos. Para usá-los, nossos dados devem apresentar distribuição normal. Caso isso não aconteça, deveremos corrigir essa falta de normalidade ou usar testes não paramétricos.
Uma das estatísticas descritivas interessantes que podemos usar ao termos uma curva normal é o escore z.
O que é o Escore Z derivado da curva normal?
O escore Z é uma transformação dos dados obtidos, transformados em termos de desvio-padrão (DP). Esse escore estima o quanto o sujeito está ‘acima’ ou ‘abaixo’ dos escores amostrais. Por exemplo, se um caso tem escore Z = 2, ele está 2 DP acima da média. Se o escore Z do caso é -1,25, ele está 1,25 DP abaixo da média.
Conforme pode ser visto na imagem abaixo, 68% dos dados se encontram entre +-1 DP, 95% em +- 2DP e 99,7% entre +-3 DP.
Em um teste de inteligência, por exemplo, cujos dados populacionais sejam normalmente distribuídos, caso um sujeito tenha escore Z = 2,00, poderíamos dizer que ele estaria 2,00 DP acima da média. Pela regra da tabela normativa, ele estaria acima de 95% da população, nos níveis de inteligencia conforme mensurado pelo teste.
Para ver a tabela completa do escore z, clique aqui.
Como posso verificar a normalidade dos meus dados no SPSS?
O SPSS realiza dois testes de normalidade: Shapiro–Wilk e Kolmogorov–Smirnov. Estes testes avaliam se a distribuição dos nossos dados, se desviam de uma distribuição normal modelo.
Se o teste é não-significativo (p > 0,05), nos informa que os dados da amostra não diferem significativamente de uma distribuição normal modelo (isto é, eles podem ser normais). Por outro lado, se o teste é significativo (p < 0,05), a distribuição em questão é significativamente diferente de uma distribuição normal (isto é, ela é não-normal).
Para implementar os testes de Kolmogorov Smirnov e Shapiro-Wilk no SPSS, clique em Analisar –> Estatísticas Descritivas –> Explorar.
Posteriormente, transfira a variável, ou as variáveis, de interesse ao quadro “Lista de Variáveis Dependentes” e marque a opção “Gráficos de Normalidade com Testes” na aba “Gráficos”.
A tabela Testes de Normalidade dos resultados nos proporcionará as estatísticas de ambos os testes, os graus de liberdade (que devem ser iguais ao tamanho da amostra) e os valores da significância. Lembre que um valor significativo (p < 0,05) indica um desvio da normalidade.
Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
3 respostas