O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Entenda o que é o coeficiente de determinação na regressão linear

Marcos Lima

mar 2, 2023

Introdução: O que é o coeficiente de determinação?

O coeficiente de determinação é uma medida estatística utilizada a fim de avaliar a qualidade do ajuste de um modelo de regressão. Também conhecido como R² (R ao quadrado), essa métrica varia de 0 a 1.

Quando o R² é igual a 0, isso indica que o modelo não explica qualquer variação dos dados. Por outro lado, um R² igual a 1 indica que o modelo explica toda a variação dos dados. Em outras palavras, o coeficiente de determinação representa a proporção da variabilidade na variável dependente que é explicada pelas variáveis independentes incluídas no modelo. De maneira similar, se multiplicarmos seu valor por 100, ele expressa a variabilidade explicada em termos percentuais.

banner da Psicometria Online Academy.

Como o coeficiente de determinação avalia a qualidade do modelo? Um exemplo prático

O valor de R² estima o grau de ajuste do modelo aos dados observados. Em outras palavras, ele estima em que medida os valores previstos da variável dependente pelo modelo se aproximam dos valores observados no banco de dados.

Vejamos isso por meio de um exemplo. Suponha que queremos entender como a altura de uma pessoa está relacionada ao seu peso. Após coletarmos dados, notamos que há uma forte correlação entre essas variáveis (r = 0,75, Figura 1).

diagrama de dispersão.
Figura 1. Diagrama de dispersão relacionando as variáveis altura e peso.

Em seguida, desejamos avaliar se a altura dos participantes prediz o peso deles. Para isso, ajustamos um modelo de regressão linear simples, a fim de predizer o peso com base na altura. Os dados são apresentados na Figura 2, com a linha de melhor ajuste indicando os valores previstos de peso em função dos valores observados de altura.

diagrama de dispersão e coeficiente de determinação.
Figura 2. Diagrama de dispersão relacionando as variáveis altura e peso, com linha de melhor ajuste da regressão linear.

Note que, no caso da regressão linear simples, o R² é simplesmente o quadrado do r de Pearson, isto é, R² = 0,75² = 0,56. Se o R2 for próximo de 1, então concluímos que o modelo se ajusta bem aos dados e que a altura explica uma grande porcentagem do peso. Por outro lado, se o R2 for próximo de 0, isso significa que o modelo não se ajusta bem aos dados e que a altura não explica muitas das variações do peso.

Em nosso exemplo, o R² = 0,56. Multiplicado por 100, concluímos que a altura explica 56% da variância dos escores de peso dos participantes de nosso estudo.

Quais são as vantagens do coeficiente de determinação na regressão linear?

Uma das principais vantagens do coeficiente de determinação é que ele é fácil de interpretar e pode ser aplicado em diferentes contextos, como economia, ciência política, psicologia e outras áreas.

Além disso, o R² permite comparar diferentes modelos: quanto maior o R², melhor tende a ser o ajuste do modelo aos dados — desde que sejam modelos com o mesmo número de preditores.

No entanto, o coeficiente de determinação não leva em conta a complexidade do modelo, o que pode levar à superestimação da qualidade do ajuste. Por isso, muitas vezes é mais apropriado utilizar o R² ajustado.

Qual é a diferença entre R² e R² ajustado?

O R² expressa a proporção da variabilidade da variável dependente explicada pelas variáveis independentes. No entanto, o R² aumenta conforme inserimos mais preditores inserimos no modelo.

Sendo assim, R² ajustado surge como uma alternativa que leva em consideração o número de preditores incluídos no modelo. Em outras palavras, o R² ajustado penaliza modelos com muitas variáveis irrelevantes, sendo uma métrica mais confiável quando se deseja avaliar a qualidade do ajuste sem inflar artificialmente os resultados em decorrência de um modelo mais complexo (i.e., com mais variáveis independentes).

Conclusão

Neste post, você aprendeu mais sobre o coeficiente de determinação. Gostou desse conteúdo? Então aproveite e também se inscreva em nosso canal do YouTube para ficar por dentro de todas as nossas novidades!

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referência

Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.

Como citar este post

Lima, M. (2023, 2 de março). Entenda o que é o coeficiente de determinação na regressão linear. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/entenda-o-que-e-o-coeficiente-de-determinacao-na-regressao-linear/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Respostas de 3

  1. Quero saber para que serve a Regra de Matemática : (II = a = a 3.14 // R2 = Raio ao quadrado // Será para se conseguir saber a Área de um Círculo ?…

    1. José, não sei se entendi teu comentário. A fórmula da área do círculo é dada por A = πr², onde π (pi) é uma constante matemática, 3,1415…, e r é o raio do círculo. Essa fórmula indica que a área do círculo e o quadrado do raio (r²) são diretamente proporcionais por uma constante π. No entanto, devo dizer que o R² sobre o qual falamos neste post é um termo da estatística, e não tem relação com o r² da geometria.

      Equipe Psicometria Online.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

O que significa soma dos quadrados, em estatística?

O que é modelo linear geral?

O que é o tamanho de efeito em linguagem comum (common language effect size)?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

O que é correlação de Spearman?

Postados recentemente

O que significa soma dos quadrados, em estatística?

Como inverter itens no SPSS?

O algoritmo k-means clustering

Tudo que você precisa saber sobre inversão de itens de instrumentos de autorrelato

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias