Aqui no blog, já falamos bastante sobre regressão linear, em suas variantes simples e múltipla. A fim de aumentar nossa compreensão sobre a família de modelos de regressão, neste post, falaremos sobre a regressão de Poisson.
Primeiramente, explicaremos o que é a distribuição de Poisson e por que ela é relevante para esse tipo de modelo. Em seguida, apresentaremos os principais usos da regressão de Poisson, ilustrando com exemplos práticos. Finalmente, discutiremos os pressupostos que precisam ser atendidos para que o modelo funcione adequadamente, além de sugerir alternativas para situações em que esses pressupostos não são observados.
O que é distribuição de Poisson?
A distribuição de Poisson é um modelo probabilístico utilizado para descrever a frequência com que eventos discretos ocorrem em um intervalo fixo de tempo ou espaço, desde que esses eventos sejam raros, independentes e ocorram a uma taxa constante.
Ela é amplamente aplicada em situações como, por exemplo, o número de chamadas recebidas por uma central de atendimento por hora ou a quantidade de acidentes em um cruzamento ao longo de uma semana.
Em síntese, caracterizamos o comportamento de uma distribuição de Poisson por meio de um único parâmetro, λ (lambda), que representa a taxa média de ocorrência dos eventos. Na Figura 1, apresentamos um exemplo de uma distribuição de Poisson com λ = 3, o que indica que, em média, três eventos ocorrem por unidade de tempo ou espaço.

A Figura 1 modela a incidência de falhas em máquinas industriais durante um turno de trabalho em uma indústria. Supondo ser a indústria grande, com muitas máquinas, e que as falhas consistem em eventos raros e independentes, uma média de três falhas por dia pode ser modelada com a distribuição de Poisson.
O que é a regressão de Poisson?
A regressão de Poisson é uma técnica estatística usada quando queremos prever o valor de uma variável de resultado obtida por meio de contagens ou tabelas de contingência.
Esse tipo de variável representa a frequência com que certos eventos ocorrem. Por outro lado, as variáveis preditoras podem assumir qualquer formato — contínuas, binárias ou categóricas.
Mas o que são variáveis de contagem? Em síntese, variáveis de contagem são aquelas que consistem na frequência de eventos discretos, isto é, que só podem assumir valores inteiros não nulos — 0, 1, 2, 3, etc.
Por exemplo, a quantidade de gols em uma partida de futebol, o número de nascimentos em uma maternidade e o número de crises de ansiedade autodeclaradas por um paciente ao longo de uma semana são todos casos de variáveis de contagem. Evidentemente, decidir se tais variáveis são genuinamente independentes (i.e., se marcar um gol ou ter uma crise de ansiedade independe de gols prévios ou crises de ansiedade anteriores) é uma questão à parte do status de variável de contagem.

Quando usar a regressão de Poisson?
Utilizamos a regressão de Poisson sempre que a variável de resultado representa uma contagem de eventos. Para ilustrar, vejamos um exemplo:
- Variável de resultado: número de homens que realizam o exame de toque retal para detecção precoce de câncer de próstata em uma Unidade Básica de Saúde (UBS) por semana.
- Variáveis preditoras:
- Existência de campanha psicoeducativa ativa naquela semana.
- Faixa etária média dos pacientes atendidos.
- Número de profissionais disponíveis para realizar o exame.
Ou seja, usamos a regressão de Poisson para estimar o número de exames de detecção precoce de câncer de próstata com base em características observadas em uma UBS semana a semana.
Vale lembrar que, nos modelos de regressão, a variável de resultado também é chamada de variável dependente, enquanto as variáveis preditoras também são conhecidas como variáveis independentes.
Outros exemplos de usos da regressão de Poisson
Como já sabemos, podemos utilizar a regressão de Poisson quando a variável de resultado é uma contagem de eventos. A Tabela 1 fornece mais exemplos de uso dessa técnica.
| Exemplo | Variável de resultado | Variáveis preditoras |
| 1 | Número de vezes que alunos entregam tarefas com atraso em um semestre. | Escore em escala de organização pessoal; Participação média em aulas; Carga horária de atividades extracurriculares. |
| 2 | Número de faltas a sessões de psicoterapia em três meses. | Distância da residência até o consultório; Escore de motivação para tratamento; Grau de insight clínico (avaliado pelo terapeuta). |
| 3 | Número de erros cometidos em teste de Stroop. | Idade; Escore em escala de impulsividade; Diagnóstico de TDAH (sim/não). |
Quais são os pressupostos da regressão de Poisson?
Para que a regressão de Poisson produza resultados válidos, alguns pressupostos precisam ser atendidos:
- Independência dos eventos: cada ocorrência da variável de contagem deve ser independente das demais. Por exemplo, o diagnóstico de uma doença em uma pessoa não deve influenciar diretamente o diagnóstico em outra, o que pode ser um problema no caso de doenças infecciosas.
- Equidispersão: a distribuição de Poisson assume que a média e a variância dos dados são iguais ao parâmetro λ. No entanto, quando a variância supera a média — fenômeno conhecido como sobredispersão — ou há muitos zeros nos dados, o modelo padrão não é mais adequado.
Nesses casos, alternativas como o modelo de regressão binomial negativa ou modelos zero-inflacionados podem oferecer soluções mais precisas. Além disso, se as variáveis de resultado forem contínuas ou categóricas, talvez outros tipos de regressão sejam mais apropriados. Por isso, recomendamos também a leitura de nossos posts sobre regressão linear (simples e múltipla), regressão logística e regressões ordinal e multinomial.

Como citar este post
Damásio, B. (2025, 2 de junho). O que é regressão de Poisson? Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/o-que-e-regressao-de-poisson/
