O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Entenda o que é o coeficiente de determinação na regressão linear

Marcos Lima

mar 2, 2023

Introdução: O que é o coeficiente de determinação?

O coeficiente de determinação é uma medida estatística utilizada a fim de avaliar a qualidade do ajuste de um modelo de regressão. Também conhecido como R² (R ao quadrado), essa métrica varia de 0 a 1.

Quando o R² é igual a 0, isso indica que o modelo não explica qualquer variação dos dados. Por outro lado, um R² igual a 1 indica que o modelo explica toda a variação dos dados. Em outras palavras, o coeficiente de determinação representa a proporção da variabilidade na variável dependente que é explicada pelas variáveis independentes incluídas no modelo. De maneira similar, se multiplicarmos seu valor por 100, ele expressa a variabilidade explicada em termos percentuais.

canal da Psicometria Online no YouTube.

Como o coeficiente de determinação avalia a qualidade do modelo? Um exemplo prático

O valor de R² estima o grau de ajuste do modelo aos dados observados. Em outras palavras, ele estima em que medida os valores previstos da variável dependente pelo modelo se aproximam dos valores observados no banco de dados.

Vejamos isso por meio de um exemplo. Suponha que queremos entender como a altura de uma pessoa está relacionada ao seu peso. Após coletarmos dados, notamos que há uma forte correlação entre essas variáveis (r = 0,75, Figura 1).

diagrama de dispersão.
Figura 1. Diagrama de dispersão relacionando as variáveis altura e peso.

Em seguida, desejamos avaliar se a altura dos participantes prediz o peso deles. Para isso, ajustamos um modelo de regressão linear simples, a fim de predizer o peso com base na altura. Os dados são apresentados na Figura 2, com a linha de melhor ajuste indicando os valores previstos de peso em função dos valores observados de altura.

diagrama de dispersão e coeficiente de determinação.
Figura 2. Diagrama de dispersão relacionando as variáveis altura e peso, com linha de melhor ajuste da regressão linear.

Note que, no caso da regressão linear simples, o R² é simplesmente o quadrado do r de Pearson, isto é, R² = 0,75² = 0,56. Se o R2 for próximo de 1, então concluímos que o modelo se ajusta bem aos dados e que a altura explica uma grande porcentagem do peso. Por outro lado, se o R2 for próximo de 0, isso significa que o modelo não se ajusta bem aos dados e que a altura não explica muitas das variações do peso.

Em nosso exemplo, o R² = 0,56. Multiplicado por 100, concluímos que a altura explica 56% da variância dos escores de peso dos participantes de nosso estudo.

Quais são as vantagens do coeficiente de determinação na regressão linear?

Uma das principais vantagens do coeficiente de determinação é que ele é fácil de interpretar e pode ser aplicado em diferentes contextos, como economia, ciência política, psicologia e outras áreas.

Além disso, o R² permite comparar diferentes modelos: quanto maior o R², melhor tende a ser o ajuste do modelo aos dados — desde que sejam modelos com o mesmo número de preditores.

No entanto, o coeficiente de determinação não leva em conta a complexidade do modelo, o que pode levar à superestimação da qualidade do ajuste. Por isso, muitas vezes é mais apropriado utilizar o R² ajustado.

Qual é a diferença entre R² e R² ajustado?

O R² expressa a proporção da variabilidade da variável dependente explicada pelas variáveis independentes. No entanto, o R² aumenta conforme inserimos mais preditores inserimos no modelo.

Sendo assim, R² ajustado surge como uma alternativa que leva em consideração o número de preditores incluídos no modelo. Em outras palavras, o R² ajustado penaliza modelos com muitas variáveis irrelevantes, sendo uma métrica mais confiável quando se deseja avaliar a qualidade do ajuste sem inflar artificialmente os resultados em decorrência de um modelo mais complexo (i.e., com mais variáveis independentes).

banner da Psicometria Online Academy.

Referência

Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.

Como citar este post

Lima, M. (2023, 2 de março). Entenda o que é o coeficiente de determinação na regressão linear. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/entenda-o-que-e-o-coeficiente-de-determinacao-na-regressao-linear/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

0 0 Votos
Classificação do artigo
Inscrever-se
Notificar de
guest

3 Comentários
mais antigos
mais recentes Mais votado
Feedbacks embutidos
Ver todos os comentários
José da Silva Duarte Amaral
José da Silva Duarte Amaral
1 ano atrás

Quero saber para que serve a Regra de Matemática : (II = a = a 3.14 // R2 = Raio ao quadrado // Será para se conseguir saber a Área de um Círculo ?…

José da Silva Duarte Amaral
José da Silva Duarte Amaral
1 ano atrás

// Pi = a : 3.14 // R2 = a : Raio ao quadrado

Posts sugeridos

O que é o teste de Wald-Wolfowitz?

Teste de esfericidade de Mauchly: o que é e para que serve?

O que é um mapa de calor de correlação?

Conteúdo

Mais lidos

Análise de moderação: como identificar potenciais variáveis moderadoras?

Modelagem por equações estruturais no R: conceitos e aplicações

O que são variáveis ​​independentes e dependentes?

O que é correlação de Pearson?

Postados recentemente

Qual é a diferença entre explicação e predição?

O que é o teste de esfericidade de Bartlett?

AFE não é horóscopo: o fim do “olhômetro” na Análise Fatorial

O que é o teste de Wald-Wolfowitz?

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias