Se você costuma ler artigos científicos, então provavelmente já se deparou com os termos estatística descritiva e estatística inferencial. Mas o que são esses dois conjuntos de análises? Para que servem? Quais suas diferenças? Neste post, vamos explicar de forma simples o que são e quais as principais diferenças entre a estatística descritiva e a estatística inferencial.
O que é estatística descritiva?
A estatística descritiva é usada para caracterizar e sintetizar os dados. Seus principais objetivos são identificar padrões, tendências e outras características relevantes presentes nos dados coletados.
Por exemplo, após medir os níveis de estresse de uma amostra, podemos estar interessados em saber qual é a tendência dos dados. No geral, a amostra está ou não estressada? Os escores de estresse da amostra são homogêneos ou heterogêneos? Os valores mínimo e máximo observados são consistentes com a escala de mensuração que usamos?
Para responder a esses tipos de perguntas, usamos diferentes estatísticas descritivas, tais como medidas de tendência central, de dispersão e de posição. Ao usar estatísticas descritivas, nosso foco está em caracterizar o comportamento dos dados que temos em mãos, sem, contudo, estender nossas conclusões para além do conjunto de dados examinado.
Retomando o exemplo anterior, podemos calcular a ansiedade média da amostra, o escore modal de estresse (isto é, o nível de estresse mais frequente) e a variabilidade dos escores de estresse da amostra. Além disso, também podemos calcular os escores mínimo e máximo.
Eventualmente, os valores mínimos e máximo nos ajudam a identificar erros de tabulação no banco de dados. Por exemplo, suponha que o escore máximo em nossa amostra tenha sido 55, quando a escala de estresse deveria produzir apenas escores entre 0 e 10. Nesse caso, precisaríamos inspecionar um pouco mais os dados, para identificar e corrigir o erro.
Quais são as principais estatísticas descritivas que você precisa conhecer?
Existe uma série de termos importantes quando o assunto é estatística descritiva. No entanto, vale reforçar que essas estatísticas irão fazer alusão apenas à própria amostra, sem tentar realizar inferências para outras amostras ou populações. A seguir, apresentamos um resumo sobre os principais conceitos de estatística descritiva.
- Média: consiste no somatório de todos os valores numéricos de um conjunto de dados dividido pela soma pelo total de valores. Representa o “ponto de equilíbrio” ou a localização central dos dados;
- Mediana: é o valor que divide um conjunto de dados ordenados em duas partes iguais. Quando o número de observações é ímpar, a mediana é o valor central da sequência ordenada dos dados; quando o número de observações é par, é a média dos dois valores centrais. A mediana é menos sensível a valores extremos do que a média;
- Moda: é o valor que aparece com maior frequência em um conjunto de dados. Pode ser útil para identificar categorias ou valores que são particularmente comuns;
- Desvio-padrão: mede a dispersão ou variabilidade dos valores em um conjunto de dados em relação à média. Um desvio-padrão baixo indica que os valores tendem a estar próximos da média, enquanto um desvio-padrão alto indica maior dispersão dos dados;
- Variância: semelhante ao desvio-padrão, quantifica a dispersão dos dados, mas faz isso elevando ao quadrado as diferenças entre cada valor e a média, fornecendo uma medida da variabilidade em termos quadráticos;
- Erro-padrão: mede a precisão com que a média de uma amostra estima a média populacional. Um erro-padrão menor indica uma estimativa mais precisa da média da população.
O que é estatística inferencial?
A estatística inferencial dedica-se à extrapolação de conclusões acerca de uma população maior. Ela utiliza métodos estatísticos para testar hipóteses e estimar parâmetros, possibilitando assim inferências sobre características da população a partir da análise de amostras.
Por exemplo, será que os níveis de estresse diferem entre indivíduos que moram próximos (menos de 5 km) e distantes (mais de 25 km) do aeroporto? É possível, por exemplo, que os ruídos sonoros contribuam para os níveis de estresse de moradores residindo a diferentes distâncias do aeroporto. Nesse cenário, poderíamos realizar um teste t de amostras independentes para testar essa hipótese, a partir dos dados de nossa amostra.
Quais são os principais conceitos de estatística inferencial que você precisa conhecer?
Em estatística inferencial frequentista, existem pelo menos dois conceitos fundamentais que você precisa conhecer, a saber, o teste de hipóteses e a inferência baseada no valor de p.
Testes de hipóteses: são procedimentos que permitem tomar decisões sobre a população com base em amostras de dados. Por exemplo, nós inicialmente assumimos uma hipótese nula de que não existem diferenças nos níveis de estresse de indivíduos que moram próximos ou distantes do aeroporto.
Após assumirmos que a hipótese nula é verdadeira, usamos um modelo estatístico para estimar a probabilidade de obtermos dados similares, ou mais extremos, que aqueles que obtivemos em nosso estudo, considerando a hipótese nula verdadeira. No exemplo anterior, esse modelo estatístico se baseia na distribuição t, derivada da estatística obtida no teste t para grupos independentes.
Valor de p (valor de probabilidade): é uma medida que indica a probabilidade de observar o resultado encontrado, ou resultados mais extremos, sob a suposição de que a hipótese nula é verdadeira. Em nosso exemplo do estresse, resultado corresponde à estatística t calculada com base nos dados de nossa amostra.
Podemos pensar no valor de p como uma medida do quão surpreendente é o resultado que obtivemos, se a hipótese nula for verdadeira. Um valor de p baixo (tipicamente < 0,05) sugere que nosso resultado é improvável e, portanto, surpreendente. Com base nesse valor, tomamos uma decisão de rejeição ou não rejeição acerca da hipótese nula. Tipicamente, valores de p < 0,05 são usados como referência para decidir pela rejeição da hipótese nula.
Qual é a diferença entre estatística descritiva e estatística inferencial?
A principal diferença entre a estatística descritiva e estatística inferencial reside na abordagem dos dados: enquanto a estatística descritiva concentra-se na descrição e síntese das características dos dados coletados, a estatística inferencial ocupa-se com a generalização dessas observações para populações maiores, permitindo a formulação de inferências e previsões.
No entanto, os dois tipos de estatísticas são essenciais para a condução de pesquisas científicas rigorosas e para a tomada de decisões informadas em variadas disciplinas, incluindo economia, medicina e psicologia. Desse modo, é mais conveniente pensarmos que as duas famílias de estatísticas andam de mãos dadas visando as melhores interpretações e conclusões que podem ser feitas a partir dos dados.
O argumento anterior sugere que uma mesma pesquisa inclui tanto estatísticas descritivas quanto inferenciais. Um exemplo cotidiano envolve pesquisas de intenção de voto. Tais pesquisas visam atingir objetivos descritivos e inferenciais.
Em termos descritivos, pesquisas de intenção de voto sumarizam as preferências dos eleitores da amostra, por meio dos percentuais de intenção de voto depositados em cada candidato. Em termos inferenciais, fazem alegações sobre o comportamento de voto dos eleitores, visando estimar, com certo grau de confiança, qual seria o provável desfecho da eleição, caso ela ocorresse no presente momento.
De maneira similar, em um teste de diferenças de grupos, costuma-se apresentar medidas de centralidade e de dispersão dos dados, como médias e desvios-padrões dos níveis de estresse nos grupos que moram próximos e distantes do aeroporto, mas também estatísticas inferenciais, como estatística t, valor de p e medidas de tamanho de efeito.
Conclusão
Neste post, explicamos de forma simples o que são e quais as principais diferenças entre a estatística descritiva e a estatística inferencial. Conhecendo agora as definições e distinções entre a estatística descritiva e inferencial, incentivamos a aplicação prática desses conhecimentos na análise de dados, promovendo uma compreensão mais aprofundada e crítica dos fenômenos estudados.
Gostou desse conteúdo? Aproveite e se inscreva em nosso canal do YouTube para seguir por dentro do mund.
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referência
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Como citar este post
Lima, M. (2023, 21 de março). Estatística descritiva e estatística inferencial: O que são e quais as diferenças? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/estatistica-descritiva-e-estatistica-inferencial-o-que-sao-e-quais-as-diferencas/