Neste post, aprenderemos sobre o gráfico de dispersão, uma representação visual amplamente utilizada em análises quantitativas de dados. Primeiramente, explicaremos o que é esse gráfico, para que ele serve e quando utilizá-lo. Em seguida, detalharemos sua anatomia básica. Depois disso, discutiremos como interpretá-lo. Por fim, exploraremos variações, representações derivadas e aplicações práticas do gráfico de dispersão.
O que é, para que serve e quando usar um gráfico de dispersão?
O gráfico de dispersão — também chamado de diagrama de dispersão — é uma representação visual que mostra a relação entre duas variáveis quantitativas. Por exemplo, a Figura 1 ilustra uma relação hipotética entre o tempo de caminhada e a distância percorrida durante as compras.

Esse tipo de gráfico serve para investigar associações, padrões e tendências entre variáveis. Em particular, pesquisadores o utilizam para avaliar correlação estatística e para examinar se relações entre variáveis diferem em função de categorias, como grupos experimentais.
Portanto, você deve usar esse gráfico sempre que quiser explorar a relação entre duas variáveis numéricas. Ele é útil tanto para comunicar resultados quanto para análise exploratória, etapa na qual ajuda a verificar pressupostos de modelos estatísticos.
Além disso, o gráfico de dispersão facilita a identificação de outliers, erros de tabulação e possíveis relações não lineares entre variáveis.

Anatomia de um gráfico de dispersão
A fim de entendermos a anatomia de um gráfico de dispersão, considere os dados hipotéticos de 10 participantes apresentados na Tabela 1, que descrevem tempo de caminhada (em minutos) e distância percorrida (em quilômetros).
| Participante | Tempo (min) | Distância (km) |
| 1 | 11 | 2,25 |
| 2 | 140 | 2,91 |
| 3 | 160 | 3,15 |
| 4 | 183 | 4,86 |
| 5 | 245 | 7,76 |
| 6 | 15 | 0,26 |
| 7 | 30 | 0,64 |
| 8 | 37 | 2,19 |
| 9 | 65 | 3,20 |
| 10 | 103 | 5,81 |
O gráfico de dispersão é construído sobre um plano cartesiano. Nesse plano, o eixo horizontal (eixo x ou abscissa) representa uma variável, enquanto o eixo vertical (eixo y ou ordenada), perpendicular ao primeiro, representa outra (Figura 2).

Embora frequentemente os eixos comecem em zero, isso não é obrigatório. Por exemplo, em dados como temperatura ou saldo bancário, valores negativos podem ser necessários.
Cada ponto do gráfico corresponde a um par de valores (xi, yi), no qual o índice i identifica uma observação do banco de dados. Assim, cada ponto pode representar um participante, uma cidade ou qualquer outra unidade de análise.
Na Figura 3, plotamos os 10 participantes da Tabela 1. O Participante 5 é destacado para ilustrar que suas coordenadas no gráfico (245 min, 7,76 km) correspondem exatamente aos valores da tabela.

Como interpretar um gráfico de dispersão?
Para interpretarmos um gráfico de dispersão, devemos observar o padrão formado pelos pontos. Primeiramente, avalie a força da relação. Pontos próximos de uma linha imaginária indicam associações mais fortes, enquanto pontos muito espalhados sugerem relações fracas.
Em seguida, avaliamos a direção da relação. Em primeiro lugar, as relações negativas apresentam pontos que tendem a se organizar do canto superior esquerdo para o inferior direito. Por outro lado, as relações positivas mostram o padrão oposto.
A Figura 4 ilustra essas ideias ao ortogonalizar força da relação (nas linhas) e direção da relação (nas colunas).

Assim, a interpretação de um gráfico de dispersão envolve compreender simultaneamente quão forte é a associação e em que direção ela ocorre.

O que um gráfico de dispersão permite visualizar?
O gráfico de dispersão permite visualizar relações entre variáveis de forma intuitiva. Dessa maneira, ele facilita a avaliação preliminar da linearidade entre variáveis, um pressuposto central em diversos modelos estatísticos.
Por exemplo, a Figura 5 adiciona uma reta de regressão (linha de melhor ajuste), que resume a relação linear média entre as variáveis.

Além disso, o gráfico de dispersão é útil para inspecionar outliers bivariados, isto é, observações com combinações atípicas de valores. A Figura 6 ilustra esse uso, destacando o outlier bivariado na cor vermelha.

Eis um terceiro exemplo: o gráfico também é útil para sugerir (ou ilustrar) possíveis agrupamentos existentes nos dados. Por exemplo, os dados da Figura 7 não estão rotulados.

Após aplicação de uma técnica chamada de análise de cluster, podemos obter um resultado similar ao da Figura 8, na qual as cores dos pontos identificam diferentes clusters.

Os resultados sugerem que há um grupo de estudantes que estuda pouco, mas ainda assim obtém boas notas (pontos amarelos), enquanto outro grupo precisa estudar mais para atingir o mesmo desempenho (pontos azuis). Por fim, um terceiro grupo, mesmo estudando mais que os demais grupos, obtém um desempenho inferior (pontos roxos).
Assim, os padrões ilustrados pelo gráfico de dispersão, junto à clusterização, podem gerar hipóteses sobre diferentes perfis, como estudantes com estratégias distintas de estudo e desempenho.
Variações do gráfico de dispersão
Gráfico de dispersão agrupado
Uma variação comum é o gráfico de dispersão agrupado, no qual os pontos são diferenciados por cores ou símbolos conforme uma variável categórica. Por exemplo, poderíamos distinguir participantes por sexo ou grupo experimental.
A Figura 9 ilustra essa customização, com observações do Grupo A (laranja) e do Grupo B (azul).

Embora as Variáveis 1 e 2 apresentem relações positivas nos dois grupos, pode ser relevante testar se essas relações diferem entre os grupos. Isso pode ser examinado formalmente por meio de análises de moderação, e ilustrado por meio de gráfico de dispersão.
A Figura 10 adiciona retas de regressão específicas por grupo, bem como faixas de confiança, que representam o conjunto de intervalos de confiança da média estimada para a Variável 2 ao longo do domínio da Variável 1.

Em síntese, os resultados da Figura 10 sugerem que as relações entre as Variáveis 1 e 2 são similares entre os dois grupos, diferindo apenas em termos de seus interceptos, mas não de suas inclinações.
Gráfico de dispersão 3-D
Uma segunda variante é o gráfico de dispersão 3-D. Como o próprio nome sugere, essa representação incorpora uma terceira variável quantitativa, geralmente representada pela profundidade, no eixo z.
Por exemplo, a Figura 11 mostra a relação entre três variáveis. O plano de regressão, ilustrado na cor rosa, é uma generalização da reta de regressão para o caso de uma regressão linear múltipla, e indica os valores previstos de Y em função de diferentes valores observados de X1 e X2.

Matriz de gráficos de dispersão
Por fim, outra variação comum é a matriz de gráficos de dispersão, que exibe relações bivariadas entre múltiplos pares de variáveis simultaneamente.
Por exemplo, na Figura 12, observamos gráficos bivariados fora da diagonal principal e distribuições univariadas na diagonal, com agrupamento por espécies de flores (representadas por diferentes cores).

Essa representação é útil para sumarizarmos as distribuições univariadas e bivariadas das variáveis, o que nos fornece informações preliminares acerca dos padrões das medidas coletadas.
Representações visuais derivadas do gráfico de dispersão
Diversas representações gráficas derivam diretamente do gráfico de dispersão. Por exemplo, o gráfico Q-Q (ou Q-Q plot; Figura 13) é uma representação amplamente utilizada para avaliar a aderência dos dados a distribuições teóricas, como a distribuição normal.

Outro exemplo é o gráfico de Bland–Altman (Figura 14), usado para avaliar a concordância e os vieses entre dois métodos de mensuração de um mesmo construto teórico.

Na literatura de metanálise, uma representação derivada do gráfico de dispersão é o gráfico de funil (Figura 15), que é usado para investigar vieses de publicação em sínteses metanalíticas.

Por fim, o gráfico de bolhas (ou bubble plot) incorpora uma terceira variável quantitativa, mas sem com isso recorrer a uma terceira dimensão. Ao invés disso, o gráfico de bolhas expressa essa terceira variável por meio do tamanho relativo dos pontos, aqui denominados de bolhas (Figura 16).

Os exemplos anteriores não são exaustivos. Eles indicam apenas que o gráfico de dispersão é fundamental na análise quantitativa de dados, pois ele serve como base para inúmeras visualizações analíticas.
Conclusão
Em síntese, o gráfico de dispersão é uma ferramenta fundamental para explorar relações entre variáveis quantitativas. Ao longo deste post, vimos sua definição, anatomia, interpretação e variações. Assim, dominar os usos, a interpretação e a criação desse tipo de gráfico ampliam substancialmente a qualidade de suas análises quantitativas de dados.

Referências
Crawley, M. J. (2013). Graphics. In M. J. Crawley (Ed.), The R book (2nd, pp. 189–243). John Wiley & Sons, Ltd. https://doi.org/10.1002/9781118448908
Field, A. (2017). Discovering statistics using IBM SPSS Statistics (5th ed.). SAGE.
Field, A., Miles, J., & Field, Z. (2012). Exploring data with graphs. In A. Field, J. Miles, & Z. Field (Eds.), Discovering statistics using R (pp. 116–165). SAGE.
Gu, F., & Kingston, N. M. (2022). Scatterplot. In B. B. Frey (Ed.), The SAGE encyclopedia of research design (2nd, pp. 1466–1470). SAGE.
Como citar este post
Lima, M. (2026, 26 de janeiro). O que é um gráfico de dispersão? Blog Psicometria Online. https://blog.psicometriaonline.com.br/o-que-e-um-grafico-de-dispersao
