Neste post, vamos explorar os principais tipos de regressão logística: binária, ordinal e multinomial. Primeiramente, entenderemos o que caracteriza cada tipo e quando aplicá-los. Além disso, veremos suas suposições essenciais. Por fim, apresentaremos uma tabela-resumo indicando qual modelo escolher em cada situação.
Quando usar os diferentes tipos de regressão logística?
A regressão logística é usada a fim de modelar a probabilidade de ocorrência de um evento, quando a variável dependente é categórica. Enquanto a regressão linear prevê valores contínuos, a logística estima probabilidades, úteis em tomadas de decisão (por exemplo: crédito aprovado ou não, escolha de produto, nível de satisfação).
No entanto, existem diferentes tipos de variáveis categóricas. Por exemplo, variáveis categóricas podem ser dicotômicas (dois níveis) ou politômicas (três ou mais níveis). Além disso, podemos classificá-las como sendo nominais (não existe ordem significativa entre os níveis da variável) ou ordinais (existe uma ordem significativa entre os níveis da variável).
Em síntese, os diferentes tipos de regressão logística dependem basicamente do número de categorias na variável dependente e da existência ou não de uma ordem significativa dessas categorias. Em seguida, veremos os tipos de regressões logística, a depender das características da variável dependente.
Saiba mais: O que é regressão logística?
Regressão logística binária
A regressão logística binária é a mais conhecida, sendo apropriada quando a variável dependente tem exatamente duas categorias (ex.: sim/não, aprovado/reprovado). Em síntese, ela estima a probabilidade do evento ocorrer, usando a função logística para gerar saídas entre 0 e 1.
Pressupostos:
- Variável dependente dicotômica.
- Variáveis independentes contínuas ou categóricas.
- Observações independentes.
- Ausência de multicolinearidade entre as variáveis independentes.
Por exemplo, estudantes que se dedicam exclusivamente ao curso têm maior probabilidade de concluir o ensino superior em quatro anos (sim/não), quando comparados a estudantes que estudam concomitantemente ao ensino superior? Esse tipo de questão pode ser investigada por meio de regressão logística binária.
Regressão logística ordinal
Na regressão logística ordinal, temos uma variável dependente com três ou mais categorias com ordem natural (e.g., níveis de satisfação). Ela considera a hierarquia entre categorias ao estimar probabilidades acumuladas.
Pressupostos:
- Variável dependente ordinal.
- Variáveis independentes contínuas ou categóricas.
- Observações independentes.
Por exemplo, podemos querer investigar se a escolaridade dos pais (número de anos de estudo) e o tipo de escola (privada, pública) predizem a frequência com que os filhos leem por prazer (nunca, às vezes, sempre).
Note que a frequência aqui foi operacionalizada como uma variável ordinal: uma criança que lê por prazer às vezes o faz mais que uma criança que nunca lê por prazer, enquanto que uma que sempre lê por prazer o faz com maior frequência que uma que lê apenas às vezes por prazer. Sendo assim, aqui podemos usar a regressão logística ordinal.
Regressão logística multinomial
Por fim, na regressão logística multinomial, a variável dependente tem três ou mais categorias sem ordem lógica (e.g., marcas, partidos). Ela estima probabilidades separadas para cada categoria, comparando-as a uma categoria de referência.
Pressupostos:
- Variável dependente nominal com ≥ 3 categorias.
- Observações independentes.
- Ausência de multicolinearidade entre as variáveis independentes.
Por exemplo, em um cenário de tomada de decisão moral, será que a empatia e o nível de impulsividade dos participantes podem prever o tipo de julgamento realizado (neutro, utilitarista ou deontológico)? Nesse caso, temos uma variável dependente com três categorias sem uma ordem natural entre elas, o que caracteriza um modelo multinomial.
Portanto, podemos aplicar uma regressão logística multinomial para comparar, por exemplo, a probabilidade de um julgamento utilitarista em relação ao julgamento neutro, bem como a probabilidade de um julgamento deontológico também em relação ao julgamento neutro.
Comparação entre os tipos de regressão logística
Em resumo, a diferença fundamental entre as diferentes regressões logísticas está no tipo de variável dependente, tal como sumarizamos na Tabela 1.
Tipo de variável dependente | Número de categorias | Ordem presente? |
Binária | 2 | Não se aplica |
Ordinal | ≥ 3 | Sim |
Multinomial | ≥ 3 | Não |
Se a variável tiver apenas duas categorias, opte pela regressão logística binária. Quando houver três ou mais categorias com uma ordem clara, a melhor escolha será a regressão logística ordinal. Por fim, se a variável dependente tiver três ou mais categorias sem nenhuma ordem natural, utilize a regressão logística multinomial.
Com base nessa lógica, fica mais fácil selecionar o modelo adequado para responder à sua pergunta de pesquisa.
Conclusão
Gostou deste conteúdo? Então aproveite e também se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades.
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Como citar este post
França, A. (2023, 5 de novembro). Diferença entre as regressões logísticas: binária, ordinal e multinomial. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/tipos-de-regressao-logistica