Introdução: O que é o coeficiente de determinação?
O coeficiente de determinação é uma medida estatística utilizada a fim de avaliar a qualidade do ajuste de um modelo de regressão. Também conhecido como R² (R ao quadrado), essa métrica varia de 0 a 1.
Quando o R² é igual a 0, isso indica que o modelo não explica qualquer variação dos dados. Por outro lado, um R² igual a 1 indica que o modelo explica toda a variação dos dados. Em outras palavras, o coeficiente de determinação representa a proporção da variabilidade na variável dependente que é explicada pelas variáveis independentes incluídas no modelo. De maneira similar, se multiplicarmos seu valor por 100, ele expressa a variabilidade explicada em termos percentuais.

Como o coeficiente de determinação avalia a qualidade do modelo? Um exemplo prático
O valor de R² estima o grau de ajuste do modelo aos dados observados. Em outras palavras, ele estima em que medida os valores previstos da variável dependente pelo modelo se aproximam dos valores observados no banco de dados.
Vejamos isso por meio de um exemplo. Suponha que queremos entender como a altura de uma pessoa está relacionada ao seu peso. Após coletarmos dados, notamos que há uma forte correlação entre essas variáveis (r = 0,75, Figura 1).

Em seguida, desejamos avaliar se a altura dos participantes prediz o peso deles. Para isso, ajustamos um modelo de regressão linear simples, a fim de predizer o peso com base na altura. Os dados são apresentados na Figura 2, com a linha de melhor ajuste indicando os valores previstos de peso em função dos valores observados de altura.

Note que, no caso da regressão linear simples, o R² é simplesmente o quadrado do r de Pearson, isto é, R² = 0,75² = 0,56. Se o R2 for próximo de 1, então concluímos que o modelo se ajusta bem aos dados e que a altura explica uma grande porcentagem do peso. Por outro lado, se o R2 for próximo de 0, isso significa que o modelo não se ajusta bem aos dados e que a altura não explica muitas das variações do peso.
Em nosso exemplo, o R² = 0,56. Multiplicado por 100, concluímos que a altura explica 56% da variância dos escores de peso dos participantes de nosso estudo.
Quais são as vantagens do coeficiente de determinação na regressão linear?
Uma das principais vantagens do coeficiente de determinação é que ele é fácil de interpretar e pode ser aplicado em diferentes contextos, como economia, ciência política, psicologia e outras áreas.
Além disso, o R² permite comparar diferentes modelos: quanto maior o R², melhor tende a ser o ajuste do modelo aos dados — desde que sejam modelos com o mesmo número de preditores.
No entanto, o coeficiente de determinação não leva em conta a complexidade do modelo, o que pode levar à superestimação da qualidade do ajuste. Por isso, muitas vezes é mais apropriado utilizar o R² ajustado.
Qual é a diferença entre R² e R² ajustado?
O R² expressa a proporção da variabilidade da variável dependente explicada pelas variáveis independentes. No entanto, o R² aumenta conforme inserimos mais preditores inserimos no modelo.
Sendo assim, R² ajustado surge como uma alternativa que leva em consideração o número de preditores incluídos no modelo. Em outras palavras, o R² ajustado penaliza modelos com muitas variáveis irrelevantes, sendo uma métrica mais confiável quando se deseja avaliar a qualidade do ajuste sem inflar artificialmente os resultados em decorrência de um modelo mais complexo (i.e., com mais variáveis independentes).
Conclusão
Neste post, você aprendeu mais sobre o coeficiente de determinação. Gostou desse conteúdo? Então aproveite e também se inscreva em nosso canal do YouTube para ficar por dentro de todas as nossas novidades!
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referência
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Como citar este post
Lima, M. (2023, 2 de março). Entenda o que é o coeficiente de determinação na regressão linear. Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/entenda-o-que-e-o-coeficiente-de-determinacao-na-regressao-linear/

Respostas de 3
Quero saber para que serve a Regra de Matemática : (II = a = a 3.14 // R2 = Raio ao quadrado // Será para se conseguir saber a Área de um Círculo ?…
José, não sei se entendi teu comentário. A fórmula da área do círculo é dada por A = πr², onde π (pi) é uma constante matemática, 3,1415…, e r é o raio do círculo. Essa fórmula indica que a área do círculo e o quadrado do raio (r²) são diretamente proporcionais por uma constante π. No entanto, devo dizer que o R² sobre o qual falamos neste post é um termo da estatística, e não tem relação com o r² da geometria.
Equipe Psicometria Online.
// Pi = a : 3.14 // R2 = a : Raio ao quadrado