Neste post, vamos entender o que são modelos lineares e modelos lineares generalizados. Primeiramente, revisaremos os modelos lineares. Em seguida, explicaremos o conceito de função de ligação. Nós depois descreveremos os modelos lineares generalizados. Por fim, daremos alguns exemplos dos dois tipos de modelos.
O que são modelos lineares?
Modelos lineares (ou modelos lineares gerais) são técnicas estatísticas que assumem que a variável dependente é contínua e que os resíduos do modelo seguem uma distribuição normal. Além disso, pressupõe-se que a relação entre as variáveis independentes e dependentes seja linear.
Várias técnicas estatísticas ensinadas em cursos introdutórios — como os testes t, as as análises de variância e as regressões lineares — podem ser concebidas como modelos lineares.
Em síntese, os principais pressupostos dos modelos lineares incluem:
- Normalidade dos resíduos.
- Homocedasticidade (variância constante).
- Linearidade.
- Independência das observações.
Por exemplo, imagine uma pesquisa onde queremos prever o nível de estresse (variável dependente contínua) com base nas horas de sono e capacidade de regulação emocional (variáveis independentes, também contínuas).
Nesse contexto, podemos usar uma regressão linear múltipla para estimar as contribuições desses preditores em prever o nível de estresse. Aqui, a regressão linear múltipla é uma instância do modelo linear.

O que é função de ligação?
Nos modelos lineares tradicionais, como a regressão linear, a relação entre variáveis independentes e a dependente é direta e proporcional — representada por uma linha reta.
Contudo, esse pressuposto nem sempre é adequado. Ao prever uma probabilidade, restrita ao intervalo [0, 1], uma linha reta pode sugerir valores fora desses limites. Já ao prever uma contagem, como o número de nascimentos, o modelo pode retornar valores fracionários (e.g., 2,7 nascimentos), o que não faz sentido. É aí que entra a função de ligação.
Mas afinal, o que ela faz? A função de ligação é uma transformação matemática que conecta a média esperada da variável dependente (a saída do modelo) com a combinação linear dos preditores. Em outras palavras, ela permite que a saída do modelo respeite as restrições naturais dos dados.
Por exemplo:
- Em um modelo com variável dependente binária, usamos a função logit, que transforma probabilidades [0, 1] em uma escala contínua ]–∞, +∞[, permitindo uma modelagem linear dos dados.
- Em modelos de contagem (como o número de eventos), a função log é comumente usada, pois garante que a predição nunca seja negativa.
A Figura 1 ilustra essas ideias, apresentando as três funções de ligação mais comumente utilizadas em modelos estatísticos. Cada uma delas mapeia a combinação linear dos preditores (o lado direito de uma equação) à saída do modelo, isto é, ao valor previsto de Y.

Didaticamente, pense na função de ligação como uma ponte: ela adapta a saída do modelo para que faça sentido com o tipo de dado que você está estudando. Sem essa ponte, os modelos poderiam gerar previsões absurdas — como um número negativo de pessoas, ou uma chance de algo acontecer acima de 100%.
O que são modelos lineares generalizados (GLM)?
Nos modelos lineares, assumimos que os erros (resíduos) seguem distribuição normal, com média zero e variância constante. Além disso, a função de ligação usada é a identidade — ou seja, a combinação linear dos preditores já representa diretamente o valor esperado da variável dependente.
Por exemplo, considere o modelo:

Suponha que temos os coeficientes b0 = 0, b1 = 0,25 e b2 = 0,5. Para um participante com X1 = 4 e X2 = 1,5, teremos:

Como a função de ligação é identidade, não transformamos esse valor — ele já é a predição final do modelo. Logo, o valor previsto de Y = 1,75.
Por outro lado, os modelos lineares generalizados expandem essa estrutura ao permitir que a variável dependente siga outras distribuições, como binomial, Poisson, gama etc. Além disso, utilizam funções de ligação específicas que conectam a média da variável dependente à combinação linear dos preditores.
Por exemplo, no caso da função de ligação logit, teríamos:

O valor do expoente já foi calculado anteriormente, e sabemos que é 1,75. Plugando este valor na função de ligação logit, temos:

Logo, a probabilidade de Y = 1 para o participante com X1 = 4 e X2 = 1,5, dados b0 = 0, b1 = 0,25 e b2 = 0,5, é de 0,852, um valor que, adequadamente, está entre 0 e 1.
Principais pontos dos modelos lineares generalizados:
- Aceitam distribuições não normais.
- Incorporam função de ligação (identidade, logit, log etc.).
- Mantêm premissas sobre independência, mas não exigem homocedasticidade.
Por exemplo, estudando tempo de recuperação pós-cirurgia (variável dependente contínua assimétrica), pode-se usar um modelo linear generalizado com distribuição gama e função de ligação log para modelar a relação entre gravidade da cirurgia e variável demográfica.
Exemplos práticos dos modelos lineares e modelos lineares generalizados
Em seguida, mostramos uma série de exemplos de modelos na Tabela 1. O primeiro deles, denominado Linear, faz parte da família de modelos lineares, com distribuição normal e função de ligação identidade. Os demais, por sua vez, consistem em modelos lineares generalizados, com outras distribuições e funções de ligação, apropriadas à natureza dos dados.
| Modelo | VD | VI | Distribuição | Função de ligação | Finalidade |
| Linear | Pressão arterial | Idade, IMC | Normal | Identidade | Análise de tendência linear |
| GLM binomial | Probabilidade de aprovação em concurso | Horas de estudo, autoestima | Binomial | Logit | Predição da variável dependente binária |
| GLM Poisson | Número de faltas em uma disciplina | Renda, apoio familiar | Poisson | Log | Contagem de eventos esperados |
| GLM gama | Tempo de recuperação pós-cirurgia | Idade, gravidade da cirurgia | Gama | Log | Modelagem de dados assimétricos |
| GLM multinomial | Tipo de resposta moral (neutra, utilitarista, deontológica) | Empatia, impulsividade | Multinomial | Logit | Predição de categoria não ordenada |
Em outras palavras, se sua variável dependente for contínua, normalmente distribuída e linearmente relacionada às preditoras, utilize um modelo linear.
Por outro lado, se a variável dependente for binária, de contagem ou assimétrica, com distribuição não normal, opte por um modelo linear generalizado. Desse modo, você garante um modelo mais adequado aos seus dados e mais confiável nos resultados.
Conclusão
Gostou deste conteúdo? Então aproveite e também se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades.
Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).
Referência
Melo, M. B., Daldegan-Bueno, D., Oliveira, M. G. M., & Souza, A. L. (2022). Beyond ANOVA and MANOVA for repeated measures: Advantages of generalized estimate equations and generalized linear mixed models and its use in neuroscience research. European Journal of Neuroscience, 56, 6089–6098. https://doi.org/10.1111/ejn.15858
Como citar este post
Lima, M. (2025, 27 de junho). Diferenças entre modelos lineares e modelos lineares generalizados (GLMs). Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/diferencas-entre-modelos-lineares-e-modelos-lineares-generalizados-glms/
