---
title: "Regressão logística: pseudo R²"
url: https://www.blog.psicometriaonline.com.br/regressao-logistica-pseudo-r2
canonical: https://www.blog.psicometriaonline.com.br/regressao-logistica-pseudo-r2
language: pt-BR
published: 2023-08-13T23:43:24.000Z
updated: 2026-03-30T13:56:48.213Z
modified: 2026-03-30T13:56:48.213Z
author: "Alex França"
categories: ["Análises bi e multivariadas"]
tags: ["regressão"]
description: "Entenda o que é pseudo R² na regressão logística, conheça versões como Cox‑Snell, Nagelkerke, McFadden e Tjur, e aprenda a interpretá-las."
source: Blog Psicometria Online
---
# Regressão logística: pseudo R²

> Neste post, falaremos sobre o que é o pseudo R² na regressão logística. Primeiramente, revisaremos brevemente a regressão logística. Em seguida, explicaremos o conceito e mostraremos as principais variantes, bem como suas interpretações. Por fim, forneceremos dicas práticas para avaliar a qualidade...

Neste post, falaremos sobre o que é o **pseudo *R*²** na regressão logística. Primeiramente, revisaremos brevemente a regressão logística. Em seguida, explicaremos o conceito e mostraremos as principais variantes, bem como suas interpretações. Por fim, forneceremos dicas práticas para avaliar a qualidade do modelo.

## O que é regressão logística?

A [regressão logística](/o-que-e-regressao-logistica) é uma técnica essencial para modelar variáveis dependentes binárias, isto é, aquelas que possuem apenas duas categorias (e.g., vivo vs. morto; aprovado vs. reprovado; com diagnóstico vs. sem diagnóstico).

Em contraste com a regressão linear, que gera valores contínuos, a regressão logística estima a probabilidade de ocorrência de uma das categorias. Isso garante que a saída esteja entre 0 e 1, permitindo interpretação probabilística.

O termo “logística” vem da função logística, que converte qualquer valor real em um valor entre 0 e 1, facilitando a modelagem de probabilidades.

## Pseudo *R*² na regressão logística

Diferentemente da regressão linear, onde o ***R*²** ([coeficiente de determinação](/entenda-o-que-e-o-coeficiente-de-determinacao-na-regressao-linear)) avalia diretamente a proporção de variância explicada, na regressão logística precisamos de um índice alternativo: o **pseudo *R*²**.

Em síntese, esse índice busca capturar a qualidade do ajuste, embora não seja equivalente ao coeficiente de determinação tradicional da regressão linear.

## Variantes do pseudo *R*²

Existem diferentes formas de calcular o pseudo *R*², sendo elas conhecidas pelos nomes de seus proponentes. Em seguida, apresentamos as principais variantes:

-   **Pseudo *R*² de Cox & Snell**: baseia-se na log-verossimilhança máxima para o modelo completo. Ele nunca alcança o valor máximo de 1, o que pode ser considerado uma desvantagem.
    
-   **Pseudo *R*² de Nagelkerke**: é uma versão ajustada do índice de Cox e Snell, escalonada para ter um intervalo entre 0 e 1.
    
-   **Pseudo *R*² de McFadden**: é talvez o índice mais conhecido. Calcula-se como a razão entre a log-verossimilhança do modelo nulo (sem preditores) e a log-verossimilhança do modelo proposto. Valores próximos a 0 indicam que o modelo não melhora a previsão em comparação com o modelo nulo.
    
-   **Pseudo *R*² de Tjur:** o índice de Tjur é calculado como o valor absoluto da diferença entre o valor médio previsto para todos os casos com zero e o valor médio previsto para todos os casos com um.
    

## Como interpretar os pseudo *R*²s?

Primeiramente, o índice da regressão logística não é interpretado como um coeficiente de determinação. Em outras palavras, enquanto esse índice de 0,8 ou 0,9 na [regressão linear](/o-que-e-regressao-linear-multipla) é frequentemente visto como excelente, na regressão logística, um pseudo *R*² nessas faixas pode ser muito raro.

Não existe um valor “ótimo” ou absoluto: para a interpretação do pseudo *R*², pode-se adotar uma perspectiva de que valores próximos de zero indicam pouca diferença entre o modelo básico (sem variáveis independentes) e o modelo calculado.

Por outro lado, valores mais próximos de um denotam uma maior discrepância entre o modelo base e o sugerido pelo estudo.

Em termos claros, um pseudo *R*² = 0 mostra que as variáveis escolhidas não trazem clareza adicional à variação da variável alvo.

Enquanto um índice igual a 1 sugere que essas variáveis traçam com precisão a flutuação de *Y*, é importante ser mais flexível ao avaliar o modelo logístico em comparação ao linear quando se trata da variância explicada pelo *R*².

Além disso, o pesquisador deve analisar o modelo de forma global. Por exemplo, ele pode checar a tabela de classificação (*classification table*), de modo a verificar os percentuais de acertos para casos com e sem o desfecho de interesse. Essa saída é interessante pois fornece uma medida da capacidade preditiva do modelo.

## Conclusão

Se você precisa aprender análise de dados, então faça parte da [**Psicometria Online Academy**](https://academy-po.psicometriaonline.com.br/?utm_source=blog&utm_medium=organico&utm_campaign=&utm_term=&utm_content=post), a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura [**aqui**](https://academy-po.psicometriaonline.com.br/?utm_source=blog&utm_medium=organico&utm_campaign=&utm_term=&utm_content=post) e nunca mais passe trabalho sozinho(a).

## Como citar este post

> **Como citar este artigo:** França, A. (2023, 13 de agosto). Regressão logística: Pseudo r². *Blog Psicometria Online*. https://www.blog.psicometriaonline.com.br/regressao-logistica-pseudo-r2