O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Tutorial: Como fazer uma Regressão Logística

Alex França

nov 25, 2022

Vamos aprender a fazer uma Regressão Logística mais fácil do que no Excel usando um software 100% gratuito.

No exemplo a seguir vamos realizar uma regressão logística binária, utilizando duas variáveis independentes: prescrição de exercícios (sim/não) e níveis de estresse (alto escore = alto nível de estresse). A variável dependente é a ocorrência ou não (1 ou 0) de um segundo ataque do coração, criando assim um modelo de regressão logística. Os dados são originados do banco de dados do JASP, você pode baixar clicando aqui e faz parte do livro (manual) do JASP, o qual você também pode fazer o download na própria página do JASP.

Abra o banco de dados Heart Attack.csv no Jasp. Ele contém 4 colunas de dados, a variável ID do paciente, a variável 2nd heart attack – eles tiveram um segundo ataque cardíaco (sim/não), Exercise prescription – se foram prescritos exercícios (sim/não) e Stress level – seus níveis de estresse (alto valor = alto tensão).
Vá no módulo Regressão e escolha Regressão Logística. Coloque a variável de resultado (2nd heart attack) na variável dependente, adicione os níveis de estresse (Stress level) às covariáveis e prescrição de exercícios (Exercise prescription) a fatores. Deixe o método de entrada de dados como enter.

Perceba que o JASP, de modo automático, já exibe o output. Porém, vamos clicar em Estatísticas. Nas opções de estatísticas, vamos selecionar estimativas, odds ratios, matriz de confusão, sensibilidade e especificidade.

Vamos agora entender o output. A primeira tabela é o resumo do modelo.

O resumo do modelo mostra que o H1 (com as menores escores AIC e BIC) sugere uma relação significativa (x2 (37) = 21.257, p <0,001) entre o resultado (2º ataque cardíaco) e as variáveis preditores (prescrição de exercícios e níveis de estresse ). R2 de McFadden = 0,383. Sugere -se que um intervalo de 0,2 a 0,4 indique um bom ajuste do modelo.

Agora vamos interpretar a tabela dos coeficientes.

Tanto o nível de estresse quanto a prescrição do exercício são variáveis preditivas significativas (p = 0,031 e 0,022, respectivamente). Os valores mais importantes na tabela de coeficientes são os odds ratios. Para o preditor contínuo, uma razão de chances superior a 1 sugere uma relação positiva, enquanto <1 implica uma relação negativa.

Isso sugere que os níveis de alto estresse estão significativamente relacionados a uma maior probabilidade de ter um segundo ataque cardíaco. Ter uma intervenção do exercício está relacionado a uma probabilidade significativamente reduzida de um segundo ataque cardíaco. O odds ratio de 0,13 pode ser interpretado como tendo apenas 13% de probabilidade de um segundo ataque cardíaco se estiver submetido a uma intervenção do exercício.

Na sequência, podemos analisar a matriz de confusão, isto é, vamos fazer um diagnostico de performance da nossa regressão logística.

A matriz de confusão mostra onde a concordância (sim/sim) ou desacordo (sim/não) ocorreu entre os previstos e observados que os 15 casos negativos e positivos verdadeiros foram previstos pelo modelo enquanto o erro, falsos negativos e positivos, foram encontrados em 5 casos. Isso é confirmado nas métricas de desempenho em que tanto a sensibilidade (% dos casos que tiveram o resultado corretamente previam) e a especificidade (% dos casos corretamente previstos como não ter o resultado (ou seja, negativos verdadeiros) são 75%.

Como reportar os resultados de uma Regressão Logística?

A regressão logística foi realizada para verificar os efeitos do estresse e da intervenção do exercício na probabilidade de os participantes terem um segundo ataque cardíaco. O modelo de regressão logística foi estatisticamente significativo, χ2 (37) = 21.257, p <0,001. O modelo classificou corretamente 75,0% dos casos. O estresse crescente foi associado a uma probabilidade aumentada de um 2º ataque cardíaco, mas o estresse decrescente foi associado a uma redução na probabilidade. A presença de um programa de intervenção do exercício reduziu a probabilidade de um segundo ataque cardíaco para 13%.

Esperamos que tenha ficado claro como realizar uma regressão logística.

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Compartilhe sua opinião sobre este post

Uma resposta

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Qual é a diferença entre covariância e correlação?

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Conteúdo

Mais lidos

O que é regressão linear simples?

O que é correlação de Pearson?

O que é o teste de Shapiro-Wilk?

Teste t de Student

Postados recentemente

Curso R para Iniciantes

Como criar gráficos no R com o ggplot2?

Quais pacotes usar na análise fatorial exploratória no R?

Como reestruturar o formato do banco de dados no R?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

 

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

 

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Compartilhe sua opinião sobre este post

Posts sugeridos

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Qual é a diferença entre covariância e correlação?

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Categorias