O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Alex França

nov 5, 2023

Neste post, vamos explorar os principais tipos de regressão logística: binária, ordinal e multinomial. Primeiramente, entenderemos o que caracteriza cada tipo e quando aplicá-los. Além disso, veremos suas suposições essenciais. Por fim, apresentaremos uma tabela-resumo indicando qual modelo escolher em cada situação.

Quando usar os diferentes tipos de regressão logística?

A regressão logística é usada a fim de modelar a probabilidade de ocorrência de um evento, quando a variável dependente é categórica. Enquanto a regressão linear prevê valores contínuos, a logística estima probabilidades, úteis em tomadas de decisão (por exemplo: crédito aprovado ou não, escolha de produto, nível de satisfação).

No entanto, existem diferentes tipos de variáveis categóricas. Por exemplo, variáveis categóricas podem ser dicotômicas (dois níveis) ou politômicas (três ou mais níveis). Além disso, podemos classificá-las como sendo nominais (não existe ordem significativa entre os níveis da variável) ou ordinais (existe uma ordem significativa entre os níveis da variável).

Em síntese, os diferentes tipos de regressão logística dependem basicamente do número de categorias na variável dependente e da existência ou não de uma ordem significativa dessas categorias. Em seguida, veremos os tipos de regressões logística, a depender das características da variável dependente.

Saiba mais: O que é regressão logística?

banner do post sobre regressão logística.

Regressão logística binária

A regressão logística binária é a mais conhecida, sendo apropriada quando a variável dependente tem exatamente duas categorias (ex.: sim/não, aprovado/reprovado). Em síntese, ela estima a probabilidade do evento ocorrer, usando a função logística para gerar saídas entre 0 e 1.

Pressupostos:

  • Variável dependente dicotômica.
  • Variáveis independentes contínuas ou categóricas.
  • Observações independentes.
  • Ausência de multicolinearidade entre as variáveis independentes.

Por exemplo, estudantes que se dedicam exclusivamente ao curso têm maior probabilidade de concluir o ensino superior em quatro anos (sim/não), quando comparados a estudantes que estudam concomitantemente ao ensino superior? Esse tipo de questão pode ser investigada por meio de regressão logística binária.

tipo de regressão logística: binária.

Regressão logística ordinal

Na regressão logística ordinal, temos uma variável dependente com três ou mais categorias com ordem natural (e.g., níveis de satisfação). Ela considera a hierarquia entre categorias ao estimar probabilidades acumuladas.

Pressupostos:

  • Variável dependente ordinal.
  • Variáveis independentes contínuas ou categóricas.
  • Observações independentes.

Por exemplo, podemos querer investigar se a escolaridade dos pais (número de anos de estudo) e o tipo de escola (privada, pública) predizem a frequência com que os filhos leem por prazer (nunca, às vezes, sempre).

Note que a frequência aqui foi operacionalizada como uma variável ordinal: uma criança que lê por prazer às vezes o faz mais que uma criança que nunca lê por prazer, enquanto que uma que sempre lê por prazer o faz com maior frequência que uma que lê apenas às vezes por prazer. Sendo assim, aqui podemos usar a regressão logística ordinal.

tipo de regressão logística: ordinal.

Regressão logística multinomial

Por fim, na regressão logística multinomial, a variável dependente tem três ou mais categorias sem ordem lógica (e.g., marcas, partidos). Ela estima probabilidades separadas para cada categoria, comparando-as a uma categoria de referência.

Pressupostos:

  • Variável dependente nominal com ≥ 3 categorias.
  • Observações independentes.
  • Ausência de multicolinearidade entre as variáveis independentes.

Por exemplo, em um cenário de tomada de decisão moral, será que a empatia e o nível de impulsividade dos participantes podem prever o tipo de julgamento realizado (neutro, utilitarista ou deontológico)? Nesse caso, temos uma variável dependente com três categorias sem uma ordem natural entre elas, o que caracteriza um modelo multinomial.

Portanto, podemos aplicar uma regressão logística multinomial para comparar, por exemplo, a probabilidade de um julgamento utilitarista em relação ao julgamento neutro, bem como a probabilidade de um julgamento deontológico também em relação ao julgamento neutro.

tipo de regressão logística: multinomial.

Comparação entre os tipos de regressão logística

Em resumo, a diferença fundamental entre as diferentes regressões logísticas está no tipo de variável dependente, tal como sumarizamos na Tabela 1.

Tipo de variável dependenteNúmero de categoriasOrdem presente?
Binária2Não se aplica
Ordinal≥ 3Sim
Multinomial≥ 3Não
Tabela 1. Tipos de regressão logística.

Se a variável tiver apenas duas categorias, opte pela regressão logística binária. Quando houver três ou mais categorias com uma ordem clara, a melhor escolha será a regressão logística ordinal. Por fim, se a variável dependente tiver três ou mais categorias sem nenhuma ordem natural, utilize a regressão logística multinomial.

Com base nessa lógica, fica mais fácil selecionar o modelo adequado para responder à sua pergunta de pesquisa.

Conclusão

Gostou deste conteúdo? Então aproveite e também se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades.

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Como citar este post

França, A. (2023, 5 de novembro). Diferença entre as regressões logísticas: binária, ordinal e multinomial. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/tipos-de-regressao-logistica

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

O que é a distância de Cook?

O que é regressão de Poisson?

O que é path analysis?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

O que é correlação de Spearman?

Postados recentemente

Diferenças entre modelos lineares e modelos lineares generalizados (GLMs)

Como calcular o alfa de Cronbach e o ômega de McDonald no JASP?

Diagnóstico de multicolinearidade

Você precisa conhecer o FACTOR

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias