--- title: "O que são resíduos, em estatística?" url: https://www.blog.psicometriaonline.com.br/o-que-sao-residuos-em-estatistica canonical: https://www.blog.psicometriaonline.com.br/o-que-sao-residuos-em-estatistica language: pt-BR published: 2025-09-09T16:30:36.000Z updated: 2026-03-30T13:49:07.844Z modified: 2026-03-30T13:49:07.844Z author: "Marcos Lima" categories: ["Análises bi e multivariadas"] tags: ["pressupostos estatísticos"] description: "Saiba o que são resíduos na estatística, como calculá-los e por que sua análise é essencial para validar modelos e interpretar dados." source: Blog Psicometria Online --- # O que são resíduos, em estatística? > Neste post, abordaremos o conceito estatístico de resíduos. Primeiramente, descreveremos o que são modelos estatísticos. Em seguida, definiremos resíduos e mostraremos como é simples calculá-los. Depois, diferenciaremos os conceitos de resíduos e de erros. Por fim, discutiremos por que os resíduos s... Neste post, abordaremos o conceito estatístico de **resíduos**. Primeiramente, descreveremos o que são modelos estatísticos. Em seguida, definiremos resíduos e mostraremos como é simples calculá-los. Depois, diferenciaremos os conceitos de resíduos e de erros. Por fim, discutiremos por que os resíduos são importantes, como interpretar o gráfico de resíduos e erros comuns ao lidar com os resíduos. ## O que são modelos estatísticos? Modelos são representações. Em síntese, os modelos visam abstrair algum aspecto da realidade, capturando, de forma simplificada, alguns elementos relevantes de um dado fenômeno, ao mesmo tempo em que ignora aspectos irrelevantes da situação em questão. Por exemplo, a Figura 1 apresenta as estações da Linha 3 – Vermelha do Metrô de SP. Esse mapa mostra a ordem das estações, mas ignora as distâncias relativas entre elas. Com base nisso, alguém que embarque no Brás e pretenda desembarcar no Tatuapé saberá que passará por duas estações antes de chegar ao seu destino final. ![](/uploads/2025-09_Linha-vermelha-metro-SP.png) *Figura 1. Mapa da Linha 3 – Vermelha (Palmeiras-Barra Funda a Corinthians-Itaquera) – do Metrô SP.* De maneira similar, os **modelos estatísticos** também são representações. Em particular, eles consistem em representações matemáticas que descrevem relações entre variáveis. Eles nos permitem resumir padrões nos dados, testar hipóteses e realizar predições. Em outras palavras, são instrumentos essenciais para transformar dados brutos em conhecimento. Por exemplo, um pesquisador pode utilizar um modelo de [regressão linear múltipla](/o-que-e-regressao-linear-multipla) para predizer a pressão arterial com base na idade e no índice de massa corporal de pacientes. Nesse caso, o modelo estima valores esperados para a pressão com base nas variáveis explicativas inseridas no modelo. No entanto, como os dados reais contêm variações aleatórias, erros de mensuração e influências não observadas, os modelos raramente conseguem prever os valores exatos observados. Assim, surge a necessidade de avaliar essas discrepâncias, e é justamente aí que entram os resíduos. ## O que são resíduos? **Resíduos** são as diferenças entre os valores observados nos dados e os valores previstos pelo modelo estatístico. Em termos simples, eles indicam o quanto o modelo erra ao tentar representar a realidade. Por exemplo, a Figura 2 apresenta um diagrama de dispersão mostrando a relação entre tempo de caminhada (min) e distância percorrida (km) durante as compras de 10 pessoas. A reta preta representa as distâncias percorridas tais como previstas por um modelo de [regressão linear simples](/o-que-e-regressao-linear-simples), enquanto as linhas pontilhadas representam as discrepâncias entre os valores observados e previstos pelo modelo em termos de distâncias percorridas. ![diagrama de dispersão entre duas variáveis, com resíduos apresentados perpendicularmente ao eixo x. ](/uploads/2025-09_residuos-do-modelo-de-regressao.jpg) *Figura 2. Diagrama de dispersão ilustrando a relação entre tempo de caminhada (min) e distância percorrida (km). Dados baseados em Field (2017, Capítulo 8).* Vamos entender melhor o que os resíduos significam destacando, na Figura 3, duas observações da representação anterior. ![diagrama de dispersão com resíduos. ](/uploads/2025-09_residuos-destacados.jpg) *Figura 3. Diagrama de dispersão destacando duas observações (Maria e Neusa).* Em suas compras, Maria caminhou durante 103 min, percorrendo 5,81 km. No entanto, o modelo de regressão previu que ela caminharia 3,38 km. A linha pontilhada indica que o modelo **subestimou** a distância percorrida por Maria. Por outro lado, Neusa caminhou 160 min, totalizando 3,15 km. O modelo de regressão previu, para esse tempo de caminhada, uma distância percorrida de 4,75 km. Em outras palavras, o modelo **superestimou** a distância percorrida por Neusa. ## Como os resíduos são calculados? Calcular os resíduos é simples, mas exige atenção. Em modelos estatísticos, cada observação possui um valor **observado** (real) e um valor **previsto** — isto é, **estimado** ou **ajustado** pelo modelo. O resíduo é simplesmente a diferença entre os valores observados e previstos: ![como calcular resíduos: fórmula.](/uploads/2025-09_residuos-formula.jpg) Ou seja, para cada participante *i*, subtrai-se o valor estimado (*Y*\-chapéu) do valor observado (*Y*). Representamos o resíduo pela letra *e*, pois ele também é conhecido como **erro** — outros sinônimos incluem **desvios** e **discrepâncias**. Esse processo é repetido para todas as observações da amostra. Para deixar isso mais claro, veja a Figura 4. ![dados com escores observados de X e Y e valores previstos de Y.](/uploads/2025-09_valores-observados-e-esperados.jpg) *Figura 4. Tabela com os escores de Maria e de Neusa.* Na Figura 4, apresentamos os dois casos destacados da Figura 3. As colunas tempo (*X*) e distância (*Y*) consistem em valores reais, isto é, observados na pesquisa. Em contrapartida, a coluna predição (*Y*\-chapéu) consiste em valores estimados, isto é, nos valores previstos pelo modelo de regressão — correspondentes à reta preta das Figuras 2–3. Como dissemos anteriormente, calcular os resíduos consiste simplesmente em subtrair valores observados e previstos de *Y*. Desse modo, para Maria, temos: ![cálculo dos resíduos: exemplo 1.](/uploads/2025-09_residuo-maria.jpg) Ou seja, **o modelo subestimou em 2,43 km** a distância percorrida por Maria. Já para Neusa, temos o seguinte resíduo: ![cálculo dos resíduos: exemplo 2.](/uploads/2025-09_residuo-neusa.jpg) Ou seja, **o modelo superestimou em 1,60 km** a distância percorrida por Neusa. Os valores obtidos consistem nas distâncias, na vertical, da reta do modelo e os pontos de Maria e de Neusa (Figura 3). Vale destacar que, embora o cálculo seja simples, sua interpretação exige cuidado. Resíduos grandes podem indicar um erro pontual, mas também podem sugerir que o modelo está mal especificado. Por isso, não basta apenas calcular — é preciso interpretar. ## Qual é a diferença entre resíduos e erros? Anteriormente, dissemos que representamos resíduos pela letra *e*. Em muitas situações, os termos *resíduos* e *erros* são usados de maneira intercambiável. No entanto, em alguns contextos, os termos são utilizados para se referir a conceitos estatísticos distintos. Por isso, é relevante fazer uma diferenciação entre eles. Os dois conceitos estão relacionados à discrepância entre um valor observado e algum outro valor. O que difere entre os conceitos é o ponto de referência usado para aferir o grau de discrepância. **Erros** são as diferenças entre os valores observados e os valores *verdadeiros*, que são desconhecidos. Por exemplo, esse termo aparece na [Teoria Clássica dos Testes](/vantagens-da-tri-sobre-a-teoria-classica-dos-testes). Como não temos acesso ao valor verdadeiro, não conseguimos calcular diretamente o erro. **Resíduos**, por outro lado, são as diferenças entre os valores observados e os valores *estimados* pelo modelo. Portanto, os resíduos são estimativas observáveis do quanto o nosso modelo se afastou dos dados empíricos. Essa distinção é fundamental. Enquanto os erros pertencem ao mundo teórico, os resíduos pertencem ao mundo empírico. Consequentemente, usamos os resíduos para inferir, indiretamente, o comportamento dos erros. ## Por que os resíduos são importantes na análise quantitativa de dados? Os resíduos desempenham papel central na validação de modelos estatísticos. Por exemplo, podemos usá-los para avaliar se nossos modelos fazem um bom trabalho em predizer nossa variável dependente. A Figura 5 ilustra essa ideia, apresentando três modelos idênticos, mas que têm diferentes graus de resíduos ao tentarem predizer *Y*. ![comparação de diferentes graus de resíduos. ](/uploads/2025-09_comparacao-residuos.jpg) *Figura 5. Modelos com resíduos grandes, intermediários e pequenos.* Os resíduos são utilizados para calcularmos o [coeficiente de determinação](/entenda-o-que-e-o-coeficiente-de-determinacao-na-regressao-linear) (*R*2), que indica a proporção de variância explicada por nosso modelo — valores maiores indicam maior poder preditivo do modelo. Nos painéis da Figura 5, temos, da esquerda para a direita, *R*2s = 0,20, 0,69 e 0,98. Quanto maiores os resíduos, mais o modelo erra ao predizer a variável dependente. Além disso, os resíduos nos ajudam a verificar se os pressupostos do modelo foram atendidos — o que é essencial para garantir que os resultados da análise sejam confiáveis. Por exemplo, um dos pressupostos da regressão linear é que os resíduos têm variância constante ([homocedasticidade](/como-verificar-a-homogeneidade-de-variancia-na-regressao-linear)). Se essa condição não for satisfeita, os testes estatísticos podem produzir resultados enganosos. Por fim, a análise de resíduos pode revelar padrões não capturados pelo modelo. Quando isso acontece, é um sinal de que o modelo precisa ser ajustado ou complementado com novas variáveis. Portanto, ignorar os resíduos significa correr o risco de tirar conclusões equivocadas a partir dos dados. Sendo assim, ao avaliar seus modelos, inspecionar os resíduos é uma etapa indispensável. ## Como interpretar gráficos de resíduos? Gráficos de resíduos são ferramentas visuais poderosas para diagnosticar problemas nos modelos. O gráfico mais comum é o de resíduos versus valores previstos — ou alguma versão padronizada deste gráfico —, que mostra se há algum padrão sistemático nas diferenças entre observado e estimado pelo modelo. Idealmente, os resíduos devem estar distribuídos aleatoriamente em torno de zero. Caso contrário, padrões como curvaturas ou funis podem indicar problemas. Por exemplo, um formato em “V” sugere heterocedasticidade, enquanto uma curva sugere a existência de uma relação não linear não captada pelo modelo (Figura 6). ![gráfico de resíduos versus valores previstos, exemplo 1.](/uploads/2025-09_grafico-de-residuos.jpg) *Figura 6. Gráfico de resíduos versus valores previstos. A curvatura no gráfico sugere alguma relação não linear importante, mas que deixou de ser modelada no modelo de regressão.* A Figura 7 mostra o gráfico de resíduos versus valores previstos com base em nosso exemplo da caminhada nas compras. Para fins didáticos, destacamos os resíduos de Maria e de Neusa, que calculamos anteriormente. ![gráfico de resíduos versus valores previstos, exemplo 2.](/uploads/2025-09_grafico-residuos-vs-ajustados-1.jpg) *Figura 7. Gráfico de resíduos versus valores previstos com base no exemplo da caminhada nas compras.* Note que Maria e Neusa apresentam os maiores resíduos no gráfico, ou seja, são os casos em que o modelo mais errou em suas predições. Outros gráficos úteis incluem o [histograma](/como-escolher-o-grafico-certo-para-seus-dados) de resíduos (para avaliar se os resíduos se distribuem normalmente ao redor de zero) e o gráfico *Q-Q* (para comparar a distribuição dos resíduos com uma normal teórica). Portanto, interpretar esses gráficos permite identificar falhas no modelo e, consequentemente, aprimorar a análise. ## Erros comuns ao lidar com resíduos estatísticos Um erro frequente é simplesmente ignorar os resíduos após ajustar um modelo. Muitos analistas confiam excessivamente nos coeficientes e nos [valores de *p*](/o-que-e-valor-de-p), sem avaliar se o modelo atende aos pressupostos básicos. Além disso, os coeficientes apenas indicam a relação prevista entre as variáveis independentes e a dependente. No entanto, um modelo linear pode fazer um trabalho inferior a outro modelo (e.g., quadrático) em prever a variável dependente (Figura 8). ![modelos linear e quadrático.](/uploads/2025-09_comparacao-linear-quadratico.jpg) *Figura 8. Exemplo ilustrando a superioridade de um modelo quadrático, em comparação ao modelo linear, para capturar o relacionamento não linear entre X e Y.* Outro equívoco comum é interpretar resíduos grandes como necessariamente problemáticos. Às vezes, um resíduo alto é esperado devido à variabilidade natural dos dados. Por isso, o contexto da análise deve sempre ser considerado. Além disso, algumas pessoas utilizam gráficos de resíduos incorretamente, interpretando padrões onde eles são inexistentes. Isso pode levar a ajustes desnecessários no modelo e a conclusões erradas. Portanto, é fundamental ter uma abordagem cuidadosa e sistemática ao trabalhar com resíduos. Interpretá-los corretamente é uma habilidade essencial para qualquer pessoa que deseje realizar análises estatísticas de qualidade. ## Conclusão Gostou desse conteúdo? Se você precisa aprender análise de dados, então faça parte da [**Psicometria Online Academy**](https://academy-po.psicometriaonline.com.br/?utm_source=blog&utm_medium=organico&utm_campaign=&utm_term=&utm_content=post), a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura [**aqui**](https://academy-po.psicometriaonline.com.br/?utm_source=blog&utm_medium=organico&utm_campaign=&utm_term=&utm_content=post) e nunca mais passe trabalho sozinho(a). ## Referências Field, A. (2017). *Discovering statistics using IBM SPSS Statistics* (5th ed.). Sage. Tabachnick, B. G., & Fidell, L. S. (2007). *Experimental designs using ANOVA*. Duxbury. ## Como citar este post > **Como citar este artigo:** Lima, M. (2025, 9 de setembro). O que são resíduos, em estatística? *Blog Psicometria Online*. https://www.blog.psicometriaonline.com.br/o-que-sao-residuos-em-estatistica