Neste post, falaremos sobre o que é o pseudo R² na regressão logística. Primeiramente, revisaremos brevemente a regressão logística. Em seguida, explicaremos o conceito e mostraremos as principais variantes, bem como suas interpretações. Por fim, forneceremos dicas práticas para avaliar a qualidade do modelo.
O que é regressão logística?
A regressão logística é uma técnica essencial para modelar variáveis dependentes binárias, isto é, aquelas que possuem apenas duas categorias (e.g., vivo vs. morto; aprovado vs. reprovado; com diagnóstico vs. sem diagnóstico).
Em contraste com a regressão linear, que gera valores contínuos, a regressão logística estima a probabilidade de ocorrência de uma das categorias. Isso garante que a saída esteja entre 0 e 1, permitindo interpretação probabilística.
O termo “logística” vem da função logística, que converte qualquer valor real em um valor entre 0 e 1, facilitando a modelagem de probabilidades.

Pseudo R² na regressão logística
Diferentemente da regressão linear, onde o R² (coeficiente de determinação) avalia diretamente a proporção de variância explicada, na regressão logística precisamos de um índice alternativo: o pseudo R².
Em síntese, esse índice busca capturar a qualidade do ajuste, embora não seja equivalente ao coeficiente de determinação tradicional da regressão linear.
Variantes do pseudo R²
Existem diferentes formas de calcular o pseudo R², sendo elas conhecidas pelos nomes de seus proponentes. Em seguida, apresentamos as principais variantes:
- Pseudo R² de Cox & Snell: baseia-se na log-verossimilhança máxima para o modelo completo. Ele nunca alcança o valor máximo de 1, o que pode ser considerado uma desvantagem.
- Pseudo R² de Nagelkerke: é uma versão ajustada do índice de Cox e Snell, escalonada para ter um intervalo entre 0 e 1.
- Pseudo R² de McFadden: é talvez o índice mais conhecido. Calcula-se como a razão entre a log-verossimilhança do modelo nulo (sem preditores) e a log-verossimilhança do modelo proposto. Valores próximos a 0 indicam que o modelo não melhora a previsão em comparação com o modelo nulo.
- Pseudo R² de Tjur: o índice de Tjur é calculado como o valor absoluto da diferença entre o valor médio previsto para todos os casos com zero e o valor médio previsto para todos os casos com um.

Como interpretar os pseudo R²s?
Primeiramente, o índice da regressão logística não é interpretado como um coeficiente de determinação. Em outras palavras, enquanto esse índice de 0,8 ou 0,9 na regressão linear é frequentemente visto como excelente, na regressão logística, um pseudo R² nessas faixas pode ser muito raro.
Não existe um valor “ótimo” ou absoluto: para a interpretação do pseudo R², pode-se adotar uma perspectiva de que valores próximos de zero indicam pouca diferença entre o modelo básico (sem variáveis independentes) e o modelo calculado.
Por outro lado, valores mais próximos de um denotam uma maior discrepância entre o modelo base e o sugerido pelo estudo.
Em termos claros, um pseudo R² = 0 mostra que as variáveis escolhidas não trazem clareza adicional à variação da variável alvo.
Enquanto um índice igual a 1 sugere que essas variáveis traçam com precisão a flutuação de Y, é importante ser mais flexível ao avaliar o modelo logístico em comparação ao linear quando se trata da variância explicada pelo R².
Além disso, o pesquisador deve analisar o modelo de forma global. Por exemplo, ele pode checar a tabela de classificação (classification table), de modo a verificar os percentuais de acertos para casos com e sem o desfecho de interesse. Essa saída é interessante pois fornece uma medida da capacidade preditiva do modelo.
Conclusão
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Como citar este post
França, A. (2023, 13 de agosto). Regressão logística: Pseudo R². Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/regressao-logistica-pseudo-r2/

Muito interessante a apresentação das ideias.