Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

O que é valor de p?

Neste post, vou abordar a definição do que é o valor de p, o que significa quando o valor-p é menor que 0,05, como interpretá-lo. Também selecionei algumas alternativas ao valor-p e como reportar esses valores em um artigo científico.

Vamos lá!

O que é o valor de p (p-value)?

Para a cartilha oficial da ASA, “a p-value is the probability under a specified statistical model that a statistical summary of the data would be equal to or more extreme than its observed value” (Wasserstein & Lazar, 2016, p. 131). Do ponto de vista histórico, é atribuída a Ronald Fisher sua criação, em 1925 (Fischer, 1992).

Operacionalmente, a abordagem mais frequente para este tipo de análise envolve a aplicação de um teste de hipóteses. Inicialmente, definimos a hipótese nula, que pressupõe a ausência de diferença estatística significativa entre os grupos, e a hipótese alternativa, que sugere a existência dessa diferença.

Tomando, por exemplo, um estudo que analisa a relação entre gênero e salário, a hipótese nula sugeriria que não há diferença salarial entre homens e mulheres, ao passo que a hipótese alternativa indicaria que, em média, os homens têm uma renda superior.

Após isso, escolhemos um teste estatístico adequado para gerar uma estatística de teste, representando numericamente a discrepância entre os grupos. Se a hipótese nula for verdadeira, esperaríamos um valor baixo para a estatística de teste, embora exista uma chance pequena de este valor ser alto apenas por variações aleatórias. Com a estatística de teste calculada, ela nos serve de base para determinar o valor-p.

Comumente, adota-se o limiar de 0,05 para refutar a hipótese nula. Um valor-p mais baixo indica uma maior discrepância entre os resultados observados e o que seria esperado sob a hipótese nula, presumindo que esta seja verdadeira. Essa discrepância levanta dúvidas sobre a validade da hipótese nula, sugerindo que talvez ela não seja plausível.

Agora atenção: Um valor de p de 0,05 não indica que a hipótese nula tem uma probabilidade de 5% de estar correta. Isso porque o cálculo do p-valor já assume que a hipótese nula é verdadeira, logo, não pode indicar se ela é correta ou não.

Além disso, o p-valor pequeno não necessariamente implica na presença de um efeito grande/importante e p-valor alto também não é sinônimo de falta de importância ou ausência de efeito.

Por exemplo, em amostras muito pequenas, apenas efeitos de grande magnitude tendem a ser detectados. Em amostras excessivamente grandes, qualquer efeito será detectado, independentemente do tamanho.

O que significa quando o valor-p é menor que 0,05?

A comunidade científica adota tipicamente três limiares principais: 1%, 5% e 10%. Comumente, o termo “significância estatística” está associado a um valor-p menor que 0,05. Esse patamar foi estabelecido de forma arbitrária, refletindo as preferências de Fisher em 1992.

Se o valor-p for menor ou igual a 0,05, você rejeita a hipótese nula e conclui que há evidências suficientes para apoiar a hipótese alternativa. Entretanto, se o valor-p é maior que 0,05, a hipótese nula não é rejeitada. Isso implica que não há evidências suficientes para afirmar a hipótese alternativa.

Um nível de significância (alfa) é um limiar que você estabelece antes de realizar um teste estatístico. Ele determina a probabilidade que você está disposto a aceitar de obter um resultado falso positivo ou rejeitar a hipótese nula quando ela é verdadeira.

A escolha de um nível de significância depende de vários fatores, como:

  • A importância da questão de pesquisa.
  • As consequências de cometer um erro de falso positivo ou falso negativo.
  • O conhecimento prévio ou expectativas sobre o fenômeno.
  • O tamanho da amostra e a variabilidade dos dados.

Em geral, você deve escolher um nível de significância mais baixo (como 0,01 ou 0,001) se:

  • A questão de pesquisa for muito importante ou tiver implicações sérias.
  • Você desejar minimizar o risco de cometer um erro de falso positivo.
  • Você tiver fortes evidências ou razões para acreditar que a hipótese nula é falsa.
  • Você tiver um tamanho de amostra grande e baixa variabilidade nos seus dados.

Quais são algumas limitações dos valores-p?

Os valores-p são úteis para testar hipóteses e avaliar a significância estatística, mas possuem limitações importantes que devem ser consideradas:

  1. Os valores-p são influenciados pelo tamanho da amostra e pela variabilidade dos dados. Um tamanho de amostra grande ou baixa variabilidade pode fazer com que uma pequena diferença ou efeito pareça estatisticamente significativo, mesmo que não seja significativo na prática. Por outro lado, um tamanho de amostra pequeno ou alta variabilidade pode ocultar a significância estatística de uma grande diferença ou efeito.
  2. Os valores-p não fornecem informações sobre a direção, magnitude ou efeito da diferença. É necessário analisar as estatísticas descritivas (como médias, medianas etc.) e o tamanho do efeito (como Cohen’s d, R-quadrado etc.) para compreender a natureza e a importância da diferença ou efeito.
  3. Os valores-p não esclarecem sobre causalidade ou mecanismos envolvidos na diferença ou efeito. Considerações adicionais, como o desenho da pesquisa, variáveis confundidoras e validade externa, são necessárias para inferências causais e para explicar como e por que ocorreu a diferença ou efeito.
  4. Os valores-p são sensíveis a múltiplos testes. Realizar muitos testes com o mesmo conjunto de dados ou explorar muitas variáveis sem uma hipótese clara aumenta a chance de encontrar um resultado estatisticamente significativo por acaso, conhecido como descoberta falsa ou erro tipo I. É preciso ajustar o nível de significância ou usar outros métodos (como a correção de Bonferroni, controle da taxa de descoberta falsa etc.) para múltiplos testes e exploração de dados.

Quais são algumas alternativas aos valores-p?

Existem outras maneiras de testar hipóteses e avaliar a significância estatística além dos valores-p, como:

  1. Estatísticas Bayesianas: Esta abordagem utiliza conhecimentos e crenças prévios sobre o fenômeno para atualizar a probabilidade das hipóteses com base nos dados observados. Em vez de um valor-p, utiliza uma probabilidade posterior ou um fator de Bayes para comparar as hipóteses e medir a força das evidências.
  2. Intervalos de confiança: Esta abordagem usa um intervalo de valores que contém o parâmetro verdadeiro da população com um certo nível de confiança (como 95% ou 99%). Em vez de um valor-p, utiliza um intervalo de confiança para estimar a incerteza e precisão da diferença ou efeito.
  3. Tamanho de efeito: Vários cientistas consideram o valor-p como o dado mais crucial em seus relatórios. Contudo, é essencial dar mais atenção ao tamanho do efeito. É recomendável não apresentar o valor-p de maneira isolada, mas sim acompanhá-lo com a média de cada grupo, a diferença observada, o intervalo de confiança de 95% e, após isso, o valor-p.

Como relatar um valor-p?

Ao relatar um valor-p, você deve seguir estas orientações:

  • Utilize o sinal de igual (=) se o valor-p for exato, ou use o sinal de menor que (<) se o valor-p for arredondado ou truncado. Por exemplo, p = 0,034 ou p < 0,001.
  • Use duas ou três casas decimais para o valor-p, a menos que seja muito pequeno ou grande. Por exemplo, p = 0,05 ou p = 0,0004, mas não p = 0,0500 ou p = 0,00000004.
  • Não use zero como um valor-p, pois é impossível observar um valor-p exatamente zero. Em vez disso, use um número muito pequeno, como p < 0,001 ou p < 2,2e-16 (o menor número que o R pode representar).
  • Use palavras ou frases como “estatisticamente significativo” ou “não estatisticamente significativo”.
  • Inclua os graus de liberdade (df) e a estatística do teste (como t, F, qui-quadrado, etc.) junto com o valor-p, se aplicável. Por exemplo, t(98) = -3,45, p = 0,001.
  • Relate o tamanho do efeito (como Cohen’s d, R-quadrado, etc.), o intervalo de confiança (IC) e o valor-p. Essas medidas fornecem mais informações sobre a magnitude e precisão da diferença ou efeito. Por exemplo, d = -0,69, IC 95% [-1,03, -0,35], p = 0,001.

Conclusão

Ao relatar os resultados de um estudo, é crucial não apenas focar no valor-p, mas também considerar o tamanho do efeito, o intervalo de confiança e a precisão dos resultados. Entender e interpretar corretamente estes elementos permite uma avaliação mais precisa e confiável das descobertas de um estudo.

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referências

Figueiredo Filho, D. ., & Silva, L. (2022). A significância estatística e o uso do p-valor em presquisas na saúde: recomendações práticas. Interfaces Científicas – Saúde E Ambiente9(1), 230–239. https://doi.org/10.17564/2316-3798.2022v9n1p230-239

Fisher, R. A (1992). Statistical methods for research workers. In: KOTZ, S.; JOHNSON, N. L. (ed.). Breakthroughs in statistics: methodology and distribution. Springer Series in Statistics. New York, NY: Springer, 1992

Wasserstein, R. L. & Lazar, N. A. (2016). The ASA statement on p-values: context, process, and purpose. Am Stat, 70 (2). 129-133.

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Covariância e correlação

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de dados, entender a relação entre

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de dados. Embora ambos compartilhem o

Explorando as etapas da análise de dados

Explorando as etapas da análise de dados

No vasto universo da análise de dados, encontramos duas vertentes cruciais: as estatísticas descritivas e as estatísticas inferenciais. Cada uma desempenha um papel distintivo na interpretação e compreensão de conjuntos

Breve check list para escrita de artigo acadêmico

Breve check list para escrita de artigo acadêmico

Você está pronto para embarcar em uma jornada de descoberta acadêmica? Seja você um pesquisado experiente ou iniciante, ter um guia para escrever um artigo de pesquisa é essencial para

O que são médias marginais?

O que são médias marginais?

Ao começar com estatísticas descritivas tradicionais, como as médias brutas, reconhecemos a necessidade de ir além, considerando possíveis viéses decorrentes de variações no número de observações e covariâncias. A pergunta-chave

Covariância e correlação

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de dados, entender a relação entre

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de dados. Embora ambos compartilhem o

Explorando as etapas da análise de dados

Explorando as etapas da análise de dados

No vasto universo da análise de dados, encontramos duas vertentes cruciais: as estatísticas descritivas e as estatísticas inferenciais. Cada uma desempenha um papel distintivo na interpretação e compreensão de conjuntos

Breve check list para escrita de artigo acadêmico

Breve check list para escrita de artigo acadêmico

Você está pronto para embarcar em uma jornada de descoberta acadêmica? Seja você um pesquisado experiente ou iniciante, ter um guia para escrever um artigo de pesquisa é essencial para

O que são médias marginais?

O que são médias marginais?

Ao começar com estatísticas descritivas tradicionais, como as médias brutas, reconhecemos a necessidade de ir além, considerando possíveis viéses decorrentes de variações no número de observações e covariâncias. A pergunta-chave

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.