O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Regressão logística: pseudo R²

Alex França

ago 13, 2023

Neste post, falaremos sobre o que é o pseudo R² na regressão logística. Primeiramente, revisaremos brevemente a regressão logística. Em seguida, explicaremos o conceito e mostraremos as principais variantes, bem como suas interpretações. Por fim, forneceremos dicas práticas para avaliar a qualidade do modelo.

O que é regressão logística?

A regressão logística é uma técnica essencial para modelar variáveis dependentes binárias, isto é, aquelas que possuem apenas duas categorias (e.g., vivo vs. morto; aprovado vs. reprovado; com diagnóstico vs. sem diagnóstico).

Em contraste com a regressão linear, que gera valores contínuos, a regressão logística estima a probabilidade de ocorrência de uma das categorias. Isso garante que a saída esteja entre 0 e 1, permitindo interpretação probabilística.

O termo “logística” vem da função logística, que converte qualquer valor real em um valor entre 0 e 1, facilitando a modelagem de probabilidades.

ebook Análises Bi e Multivariadas.

Pseudo R² na regressão logística

Diferentemente da regressão linear, onde o R² (coeficiente de determinação) avalia diretamente a proporção de variância explicada, na regressão logística precisamos de um índice alternativo: o pseudo R².

Em síntese, esse índice busca capturar a qualidade do ajuste, embora não seja equivalente ao coeficiente de determinação tradicional da regressão linear.

Variantes do pseudo R²

Existem diferentes formas de calcular o pseudo R², sendo elas conhecidas pelos nomes de seus proponentes. Em seguida, apresentamos as principais variantes:

  • Pseudo R² de Cox & Snell: baseia-se na log-verossimilhança máxima para o modelo completo. Ele nunca alcança o valor máximo de 1, o que pode ser considerado uma desvantagem.
  • Pseudo R² de Nagelkerke: é uma versão ajustada do índice de Cox e Snell, escalonada para ter um intervalo entre 0 e 1.
  • Pseudo R² de McFadden: é talvez o índice mais conhecido. Calcula-se como a razão entre a log-verossimilhança do modelo nulo (sem preditores) e a log-verossimilhança do modelo proposto. Valores próximos a 0 indicam que o modelo não melhora a previsão em comparação com o modelo nulo.
  • Pseudo R² de Tjur: o índice de Tjur é calculado como o valor absoluto da diferença entre o valor médio previsto para todos os casos com zero e o valor médio previsto para todos os casos com um.

banner do canal da Psicometria Online no YouTube.

Como interpretar os pseudo R²s?

Primeiramente, o índice da regressão logística não é interpretado como um coeficiente de determinação. Em outras palavras, enquanto esse índice de 0,8 ou 0,9 na regressão linear é frequentemente visto como excelente, na regressão logística, um pseudo R² nessas faixas pode ser muito raro.

Não existe um valor “ótimo” ou absoluto: para a interpretação do pseudo R², pode-se adotar uma perspectiva de que valores próximos de zero indicam pouca diferença entre o modelo básico (sem variáveis independentes) e o modelo calculado.

Por outro lado, valores mais próximos de um denotam uma maior discrepância entre o modelo base e o sugerido pelo estudo.

Em termos claros, um pseudo R² = 0 mostra que as variáveis escolhidas não trazem clareza adicional à variação da variável alvo.

Enquanto um índice igual a 1 sugere que essas variáveis traçam com precisão a flutuação de Y, é importante ser mais flexível ao avaliar o modelo logístico em comparação ao linear quando se trata da variância explicada pelo R².

Além disso, o pesquisador deve analisar o modelo de forma global. Por exemplo, ele pode checar a tabela de classificação (classification table), de modo a verificar os percentuais de acertos para casos com e sem o desfecho de interesse. Essa saída é interessante pois fornece uma medida da capacidade preditiva do modelo.

Conclusão

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

banner da Psicometria Online Academy.

Como citar este post

França, A. (2023, 13 de agosto). Regressão logística: Pseudo R². Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/regressao-logistica-pseudo-r2/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

0 0 Votos
Classificação do artigo
Inscrever-se
Notificar de
guest

1 Comentário
mais antigos
mais recentes Mais votado
Feedbacks embutidos
Ver todos os comentários
EUGENIO PACELLE QUEIROZ MADEIRA
EUGENIO PACELLE QUEIROZ MADEIRA
2 anos atrás

Muito interessante a apresentação das ideias.

Posts sugeridos

O que é um mapa de calor de correlação?

O que é separação completa na regressão logística?

O que é um gráfico de dispersão?

Conteúdo

Mais lidos

Análise de moderação: como identificar potenciais variáveis moderadoras?

Modelagem por equações estruturais no R: conceitos e aplicações

O que são variáveis ​​independentes e dependentes?

O que é correlação de Pearson?

Postados recentemente

O que é um mapa de calor de correlação?

Redução de dimensionalidade

O que é pareamento (matching)?

O que é separação completa na regressão logística?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias