O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

O que é regressão linear?

Bruno Damásio

fev 14, 2021

Regressão linear é um conjunto de técnicas que se baseiam em uma ideia comum: estimar o valor de uma variável Y através dos valores de uma ou mais variáveis Xn. Ou seja, esse conjunto de técnicas visa prever o valor de uma variável com base em outras variáveis.

Em síntese, a variável que será predita pode ser chamada de variável de resultado, variável dependente ou desfecho. Por outro lado, as variáveis utilizadas para realizar a previsão são conhecidas como variáveis preditoras ou variáveis independentes.

Tipos de regressões lineares

Antes de mais nada, você deve saber que existem dois tipos básicos de regressões lineares. Em seguida, veremos brevemente cada uma delas.

Regressão linear simples

Primeiramente, na regressão linear simples, estamos lidando com uma variável de resultado e apenas uma variável preditora. Sua fórmula pode ser expressa por:

equação da reta.

Onde Y se refere à variável de resultado (o que queremos prever) e x1 se refere à variável preditora (o que usamos para prever os valores da varíavel de resultados).

Na regressão linear simples, nosso objetivo é descobrir os valores dos coeficientes b0 e b1 que maximizam o ajuste do modelo aos dados. O b0, também chamado de intercepto, expressa o valor previsto para Y quando x1 = 0. O valor de b1, por sua vez, também chamado de inclinação da reta, expressa a força da relação linear entre as variáveis.

Por exemplo, podemos querer prever a nota em uma prova de matemática em função do tempo de estudo:

exemplo de regressão linear simples.

Saiba mais: O que é regressão linear simples?

capa do post sobre regressão linear simples.

Regressão linear múltipla

Por outro lado, na regressão linear múltipla, estamos lidando com uma variável de resultado e com múltiplas variáveis preditoras. Sua fórmula pode ser expressa por:

equação da regressão linear múltipla.

Onde Y se refere à variável de resultado, x1, x2, …, xn se referem às variáveis preditoras, b0 se refere ao intercepto e b1, b2, …, bn aos coeficientes dos preditores inseridos no modelo.

Por exemplo, podemos estender nosso cenário anterior, tentando prever a nota em uma prova de matemática em função do tempo de estudo, do número de faltas na disciplina e autoeficácia do estudante em matemática:

exemplo de regressão com diversos preditores.

Veja também: O que é regressão linear múltipla?

capa do post sobre regressão linear múltipla.

Quais são os usos da regressão linear?

A regressão linear é útil para diversos objetivos e aplicações. Em primeiro lugar, como já mencionamos, ela pode ser utilizada para prever o resultado de uma variável com base em outras variáveis. Além disso, a regressão linear é uma ferramenta eficaz para descrever tendências ao longo do tempo. Isso significa que, com os dados corretos, é possível fazer projeções de valores futuros.

Outro uso importante é o de identificar quais variáveis são boas preditoras de um resultado. Dessa forma, conseguimos entender melhor a relação entre diferentes fatores, o que é essencial em diversas áreas da ciência e do mercado.

Veja abaixo alguns exemplos práticos de como a regressão linear pode ser aplicada:

  • Prever o resultado de um teste de inteligência com base nas notas escolares e idade do estudante;
  • Projetar o preço futuro de um produto com base no histórico de preços anteriores;
  • Investigar se variáveis como insônia, humor e falta de apetite são bons preditores do escore em um teste de depressão.

Além disso, vale destacar que muitas técnicas estatísticas mais avançadas são, na verdade, extensões da regressão linear. É o caso, por exemplo, da regressão logística, da regressão de Poisson, da mediação e da moderação, e da modelagem por equações estruturais, entre muitas outras.

Quais são os pressupostos da regressão linear?

A regressão linear tem uma série de pressupostos:

  • Linearidade: as variáveis preditoras e a variável de resultado devem estar linearmente relacionadas.
  • Homocedasticidade (ou homogeneidade das variâncias): os erros (ou resíduos) devem ter variância constante, independentemente dos valores da variável preditora. Violamos esse pressuposto quando há mais (ou menos) erro em determinados níveis da variável preditora.
  • Independência dos erros: os erros devem ser independentes entre si. Isso significa que o erro associado a uma observação não pode estar relacionado ao erro de outra.
  • Não multicolinearidade: as variáveis preditoras não devem apresentar correlação quase perfeita entre si.
  • Baixa endogeneidade: os valores das variáveis preditoras não devem estar contaminados por erros de medida. Apesar desse pressuposto não ser muito realístico para a Psicometria, é importante lembrar que a presença de erro de medida nas preditoras pode gerar estimativas inconsistentes e superestimar os coeficientes de regressão.

Conclusão

Neste post, você aprendeu mais sobre a regressão linear. Gostou desse conteúdo? Então aproveite e também se inscreva em nosso canal do YouTube para ficar por dentro de todas as nossas novidades!

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Como citar este post

Damásio, B. (2021, 14 de fevereiro). O que é regressão linear? Blog Psicometria Online. blog.psicometriaonline.com.br/o-que-e-regressao-linear/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

O que é path analysis?

O que são médias marginais?

O que é regressão logística?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

Qual é a diferença entre R e RStudio?

Postados recentemente

Exploratória ou confirmatória: qual análise fatorial usar?

Análise fatorial exploratória: o que é, para que serve e quais os principais procedimentos?

Entenda o que é escala Likert

O que são dados faltantes?

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias