O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

O que devo saber sobre o poder preditivo da Regressão Linear

Alex França

jun 7, 2022

Na regressão linear usamos relações lineares entre uma variável dependente (alvo) e uma ou mais variáveis independentes (preditores) para assim explicar o desfecho. Para regressão linear, sua variável
dependente (a coisa que você está tentando explicar ou prever) precisa ser uma variável contínua.

Linear Regression vs Multiple Regression: Know the Difference - SDS Club

A regressão linear é o método comumente usado dentro de análises preditivas (arvores de decisão, machine learning, forescast,etc.), por isso que muitos pesquisadores usam o  termo analise preditiva.
Típico da literatura estatística, você encontrará diferentes autores usando termos diferentes ao descrever a regressão linear ou múltipla – muito confuso para um pesquisador experiente, quanto mais para um
iniciante na área! Talvez esse seja o maior impasse sobre o caráter preditivo da regressão.

Mas devemos ter em mente que esse poder preditivo tem limitações:
Devemos usar o modelo apenas para fazer previsões dentro do intervalo de dados usado para estimar o modelo de regressão. E também, usar o modelo apenas para fazer previsões para a população amostrada.

Vou te dar um exemplo simples mas prático:
Suponha que um médico colete dados de altura (em polegadas) e peso (em libras) em 50 pacientes. Ele então ajusta um modelo de regressão linear simples usando “peso” como variável preditora e “altura” como variável de resposta. A equação de regressão ajustada é a seguinte:
Altura = 32,7830 + 0,2001*(peso)
Depois de verificar se as suposições do modelo de regressão linear são atendidas, o médico conclui que o modelo se ajusta bem aos dados. Ele pode então usar o modelo para prever a altura de novos pacientes com base em seu peso. Por exemplo, suponha que um novo paciente pesa 170 libras. Usando o modelo, poderíamos prever que esse paciente teria uma altura de 66,8 polegadas:
Altura = 32,7830 + 0,2001*(170) = 66,8 polegadas

Agora sobre ter cuidado com a predição:

Por exemplo, suponha que ajustamos um modelo de regressão usando a variável preditora “peso” e o peso dos indivíduos na amostra que usamos para estimar que o modelo variou entre 120 libras e 180 libras. Seria inválido usar o modelo para estimar a altura de um indivíduo que pesava 200 libras porque isso está fora do intervalo da variável preditora que usamos para estimar o modelo. É possível que a relação entre peso e altura seja diferente fora da faixa de 120 a 180 libras, portanto, não devemos usar o modelo para estimar a altura de um indivíduo que pesa 200 libras.

De maneira geral, a regressão linear pode ser usada para abordar uma variedade de questões de pesquisa. Ele pode dizer o quão bem um conjunto de variáveis ​​é capaz de explicar um resultado específico. Por exemplo, você pode estar interessado em explorar quão bem um conjunto de subescalas em um teste de inteligência é capaz de prever o desempenho em uma tarefa específica, lembrando do que falei ali em cima. A regressão linear também fornecerá informações sobre o modelo como um todo (todas as subescalas) e a contribuição relativa de cada uma das variáveis ​​que compõem o modelo (subescalas individuais). Como extensão disso, a regressão linear permitirá testar se a adição de uma variável (por exemplo, motivação) contribui para a capacidade explicativa do modelo, além das variáveis ​​já incluídas no modelo.

Se por um lado, na regressão linear, exploramos uma técnica para avaliar o impacto de um conjunto de preditores em uma variável dependente, por outro existem muitas situações de pesquisa em que variável dependente de interesse é categórica (por exemplo, ganhar/perder; falhar/passar; morto/vivo; doente/não doente). Por outro lado, a regressão linear não é adequada quando você tem variáveis ​​dependentes categóricas, sendo mais adequado nesses casos a regressão logística binária (para variáveis categóricas dicotômicas) ou a regressão logística multinominal/polinomial (para variáveis categóricas politõmicas – com mais de duas categorias).

Espero que esse post tenha sido útil!

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Conteúdo

Mais lidos

Glossário de Análise Fatorial Exploratória

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Covariância e correlação

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Postados recentemente

Glossário de Análise Fatorial Exploratória

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Covariância e correlação

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Alex França

Posts sugeridos

Como lidar com os pressupostos da Análise de Variância (ANOVA)?

Nesse post, iremos te ensinar a lidar, de modo metodologicamente adequado com os pressupostos da análise de variância (ANOVA), quando eles não são acatados. O…

psicometriaonline

abr 6, 2024

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de…

Alex França

fev 18, 2024

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de…

Alex França

fev 11, 2024

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.