O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que devo saber sobre o poder preditivo da regressão linear?

Alex França

jun 7, 2022

Na regressão linear usamos relações lineares entre uma variável dependente (alvo) e uma ou mais variáveis independentes (preditores) para assim explicar o desfecho. Para regressão linear, sua variável
dependente (a coisa que você está tentando explicar ou prever) precisa ser uma variável contínua.

Linear Regression vs Multiple Regression: Know the Difference - SDS Club

A regressão linear é o método comumente usado dentro de análises preditivas (arvores de decisão, machine learning, forescast,etc.), por isso que muitos pesquisadores usam o  termo analise preditiva.
Típico da literatura estatística, você encontrará diferentes autores usando termos diferentes ao descrever a regressão linear ou múltipla – muito confuso para um pesquisador experiente, quanto mais para um
iniciante na área! Talvez esse seja o maior impasse sobre o caráter preditivo da regressão.

Mas devemos ter em mente que esse poder preditivo tem limitações:
Devemos usar o modelo apenas para fazer previsões dentro do intervalo de dados usado para estimar o modelo de regressão. E também, usar o modelo apenas para fazer previsões para a população amostrada.

Vou te dar um exemplo simples mas prático:
Suponha que um médico colete dados de altura (em polegadas) e peso (em libras) em 50 pacientes. Ele então ajusta um modelo de regressão linear simples usando “peso” como variável preditora e “altura” como variável de resposta. A equação de regressão ajustada é a seguinte:
Altura = 32,7830 + 0,2001*(peso)
Depois de verificar se as suposições do modelo de regressão linear são atendidas, o médico conclui que o modelo se ajusta bem aos dados. Ele pode então usar o modelo para prever a altura de novos pacientes com base em seu peso. Por exemplo, suponha que um novo paciente pesa 170 libras. Usando o modelo, poderíamos prever que esse paciente teria uma altura de 66,8 polegadas:
Altura = 32,7830 + 0,2001*(170) = 66,8 polegadas

Agora sobre ter cuidado com a predição:

Por exemplo, suponha que ajustamos um modelo de regressão usando a variável preditora “peso” e o peso dos indivíduos na amostra que usamos para estimar que o modelo variou entre 120 libras e 180 libras. Seria inválido usar o modelo para estimar a altura de um indivíduo que pesava 200 libras porque isso está fora do intervalo da variável preditora que usamos para estimar o modelo. É possível que a relação entre peso e altura seja diferente fora da faixa de 120 a 180 libras, portanto, não devemos usar o modelo para estimar a altura de um indivíduo que pesa 200 libras.

De maneira geral, a regressão linear pode ser usada para abordar uma variedade de questões de pesquisa. Ele pode dizer o quão bem um conjunto de variáveis ​​é capaz de explicar um resultado específico. Por exemplo, você pode estar interessado em explorar quão bem um conjunto de subescalas em um teste de inteligência é capaz de prever o desempenho em uma tarefa específica, lembrando do que falei ali em cima. A regressão linear também fornecerá informações sobre o modelo como um todo (todas as subescalas) e a contribuição relativa de cada uma das variáveis ​​que compõem o modelo (subescalas individuais). Como extensão disso, a regressão linear permitirá testar se a adição de uma variável (por exemplo, motivação) contribui para a capacidade explicativa do modelo, além das variáveis ​​já incluídas no modelo.

Se por um lado, na regressão linear, exploramos uma técnica para avaliar o impacto de um conjunto de preditores em uma variável dependente, por outro existem muitas situações de pesquisa em que variável dependente de interesse é categórica (por exemplo, ganhar/perder; falhar/passar; morto/vivo; doente/não doente). Por outro lado, a regressão linear não é adequada quando você tem variáveis ​​dependentes categóricas, sendo mais adequado nesses casos a regressão logística binária (para variáveis categóricas dicotômicas) ou a regressão logística multinominal/polinomial (para variáveis categóricas politõmicas – com mais de duas categorias).

Conclusão

Espero que esse post tenha sido útil!

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Como citar este post

França, A. (2022, 7 de junho). O que devo saber sobre o poder preditivo da regressão linear? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-devo-saber-sobre-o-poder-preditivo-da-regressao-linear/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Uma resposta

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

O que são médias marginais?

O que é regressão logística?

O que é análise multivariada de variância (MANOVA)?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

Qual é a diferença entre R e RStudio?

Postados recentemente

Modelagem por equações estruturais no R: conceitos e aplicações

Compreendendo os índices de validade de conteúdo

Índice de validade de conteúdo

O que são médias marginais?

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias