Na regressão linear usamos relações lineares entre uma variável dependente (alvo) e uma ou mais variáveis independentes (preditores) para assim explicar o desfecho. Para regressão linear, sua variável
dependente (a coisa que você está tentando explicar ou prever) precisa ser uma variável contínua.
A regressão linear é o método comumente usado dentro de análises preditivas (arvores de decisão, machine learning, forescast,etc.), por isso que muitos pesquisadores usam o termo analise preditiva.
Típico da literatura estatística, você encontrará diferentes autores usando termos diferentes ao descrever a regressão linear ou múltipla – muito confuso para um pesquisador experiente, quanto mais para um
iniciante na área! Talvez esse seja o maior impasse sobre o caráter preditivo da regressão.
Mas devemos ter em mente que esse poder preditivo tem limitações:
Devemos usar o modelo apenas para fazer previsões dentro do intervalo de dados usado para estimar o modelo de regressão. E também, usar o modelo apenas para fazer previsões para a população amostrada.
Vou te dar um exemplo simples mas prático:
Suponha que um médico colete dados de altura (em polegadas) e peso (em libras) em 50 pacientes. Ele então ajusta um modelo de regressão linear simples usando “peso” como variável preditora e “altura” como variável de resposta. A equação de regressão ajustada é a seguinte:
Altura = 32,7830 + 0,2001*(peso)
Depois de verificar se as suposições do modelo de regressão linear são atendidas, o médico conclui que o modelo se ajusta bem aos dados. Ele pode então usar o modelo para prever a altura de novos pacientes com base em seu peso. Por exemplo, suponha que um novo paciente pesa 170 libras. Usando o modelo, poderíamos prever que esse paciente teria uma altura de 66,8 polegadas:
Altura = 32,7830 + 0,2001*(170) = 66,8 polegadas
Agora sobre ter cuidado com a predição:
Por exemplo, suponha que ajustamos um modelo de regressão usando a variável preditora “peso” e o peso dos indivíduos na amostra que usamos para estimar que o modelo variou entre 120 libras e 180 libras. Seria inválido usar o modelo para estimar a altura de um indivíduo que pesava 200 libras porque isso está fora do intervalo da variável preditora que usamos para estimar o modelo. É possível que a relação entre peso e altura seja diferente fora da faixa de 120 a 180 libras, portanto, não devemos usar o modelo para estimar a altura de um indivíduo que pesa 200 libras.
De maneira geral, a regressão linear pode ser usada para abordar uma variedade de questões de pesquisa. Ele pode dizer o quão bem um conjunto de variáveis é capaz de explicar um resultado específico. Por exemplo, você pode estar interessado em explorar quão bem um conjunto de subescalas em um teste de inteligência é capaz de prever o desempenho em uma tarefa específica, lembrando do que falei ali em cima. A regressão linear também fornecerá informações sobre o modelo como um todo (todas as subescalas) e a contribuição relativa de cada uma das variáveis que compõem o modelo (subescalas individuais). Como extensão disso, a regressão linear permitirá testar se a adição de uma variável (por exemplo, motivação) contribui para a capacidade explicativa do modelo, além das variáveis já incluídas no modelo.
Se por um lado, na regressão linear, exploramos uma técnica para avaliar o impacto de um conjunto de preditores em uma variável dependente, por outro existem muitas situações de pesquisa em que variável dependente de interesse é categórica (por exemplo, ganhar/perder; falhar/passar; morto/vivo; doente/não doente). Por outro lado, a regressão linear não é adequada quando você tem variáveis dependentes categóricas, sendo mais adequado nesses casos a regressão logística binária (para variáveis categóricas dicotômicas) ou a regressão logística multinominal/polinomial (para variáveis categóricas politõmicas – com mais de duas categorias).
Conclusão
Espero que esse post tenha sido útil!
Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Como citar este post
França, A. (2022, 7 de junho). O que devo saber sobre o poder preditivo da regressão linear? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-devo-saber-sobre-o-poder-preditivo-da-regressao-linear/
Uma resposta