--- title: "Regressão logística: pseudo R²" url: https://www.blog.psicometriaonline.com.br/regressao-logistica-pseudo-r2 canonical: https://www.blog.psicometriaonline.com.br/regressao-logistica-pseudo-r2 language: pt-BR published: 2023-08-13T23:43:24.000Z updated: 2026-03-30T13:56:48.213Z modified: 2026-03-30T13:56:48.213Z author: "Alex França" categories: ["Análises bi e multivariadas"] tags: ["regressão"] description: "Entenda o que é pseudo R² na regressão logística, conheça versões como Cox‑Snell, Nagelkerke, McFadden e Tjur, e aprenda a interpretá-las." source: Blog Psicometria Online --- # Regressão logística: pseudo R² > Neste post, falaremos sobre o que é o pseudo R² na regressão logística. Primeiramente, revisaremos brevemente a regressão logística. Em seguida, explicaremos o conceito e mostraremos as principais variantes, bem como suas interpretações. Por fim, forneceremos dicas práticas para avaliar a qualidade... Neste post, falaremos sobre o que é o **pseudo *R*²** na regressão logística. Primeiramente, revisaremos brevemente a regressão logística. Em seguida, explicaremos o conceito e mostraremos as principais variantes, bem como suas interpretações. Por fim, forneceremos dicas práticas para avaliar a qualidade do modelo. ## O que é regressão logística? A [regressão logística](/o-que-e-regressao-logistica) é uma técnica essencial para modelar variáveis dependentes binárias, isto é, aquelas que possuem apenas duas categorias (e.g., vivo vs. morto; aprovado vs. reprovado; com diagnóstico vs. sem diagnóstico). Em contraste com a regressão linear, que gera valores contínuos, a regressão logística estima a probabilidade de ocorrência de uma das categorias. Isso garante que a saída esteja entre 0 e 1, permitindo interpretação probabilística. O termo “logística” vem da função logística, que converte qualquer valor real em um valor entre 0 e 1, facilitando a modelagem de probabilidades. ## Pseudo *R*² na regressão logística Diferentemente da regressão linear, onde o ***R*²** ([coeficiente de determinação](/entenda-o-que-e-o-coeficiente-de-determinacao-na-regressao-linear)) avalia diretamente a proporção de variância explicada, na regressão logística precisamos de um índice alternativo: o **pseudo *R*²**. Em síntese, esse índice busca capturar a qualidade do ajuste, embora não seja equivalente ao coeficiente de determinação tradicional da regressão linear. ## Variantes do pseudo *R*² Existem diferentes formas de calcular o pseudo *R*², sendo elas conhecidas pelos nomes de seus proponentes. Em seguida, apresentamos as principais variantes: - **Pseudo *R*² de Cox & Snell**: baseia-se na log-verossimilhança máxima para o modelo completo. Ele nunca alcança o valor máximo de 1, o que pode ser considerado uma desvantagem. - **Pseudo *R*² de Nagelkerke**: é uma versão ajustada do índice de Cox e Snell, escalonada para ter um intervalo entre 0 e 1. - **Pseudo *R*² de McFadden**: é talvez o índice mais conhecido. Calcula-se como a razão entre a log-verossimilhança do modelo nulo (sem preditores) e a log-verossimilhança do modelo proposto. Valores próximos a 0 indicam que o modelo não melhora a previsão em comparação com o modelo nulo. - **Pseudo *R*² de Tjur:** o índice de Tjur é calculado como o valor absoluto da diferença entre o valor médio previsto para todos os casos com zero e o valor médio previsto para todos os casos com um. ## Como interpretar os pseudo *R*²s? Primeiramente, o índice da regressão logística não é interpretado como um coeficiente de determinação. Em outras palavras, enquanto esse índice de 0,8 ou 0,9 na [regressão linear](/o-que-e-regressao-linear-multipla) é frequentemente visto como excelente, na regressão logística, um pseudo *R*² nessas faixas pode ser muito raro. Não existe um valor “ótimo” ou absoluto: para a interpretação do pseudo *R*², pode-se adotar uma perspectiva de que valores próximos de zero indicam pouca diferença entre o modelo básico (sem variáveis independentes) e o modelo calculado. Por outro lado, valores mais próximos de um denotam uma maior discrepância entre o modelo base e o sugerido pelo estudo. Em termos claros, um pseudo *R*² = 0 mostra que as variáveis escolhidas não trazem clareza adicional à variação da variável alvo. Enquanto um índice igual a 1 sugere que essas variáveis traçam com precisão a flutuação de *Y*, é importante ser mais flexível ao avaliar o modelo logístico em comparação ao linear quando se trata da variância explicada pelo *R*². Além disso, o pesquisador deve analisar o modelo de forma global. Por exemplo, ele pode checar a tabela de classificação (*classification table*), de modo a verificar os percentuais de acertos para casos com e sem o desfecho de interesse. Essa saída é interessante pois fornece uma medida da capacidade preditiva do modelo. ## Conclusão Se você precisa aprender análise de dados, então faça parte da [**Psicometria Online Academy**](https://academy-po.psicometriaonline.com.br/?utm_source=blog&utm_medium=organico&utm_campaign=&utm_term=&utm_content=post), a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura [**aqui**](https://academy-po.psicometriaonline.com.br/?utm_source=blog&utm_medium=organico&utm_campaign=&utm_term=&utm_content=post) e nunca mais passe trabalho sozinho(a). ## Como citar este post > **Como citar este artigo:** França, A. (2023, 13 de agosto). Regressão logística: Pseudo r². *Blog Psicometria Online*. https://www.blog.psicometriaonline.com.br/regressao-logistica-pseudo-r2