--- title: "Diferenças entre modelos lineares e modelos lineares generalizados (GLMs)" url: https://www.blog.psicometriaonline.com.br/diferencas-entre-modelos-lineares-e-modelos-lineares-generalizados-glms canonical: https://www.blog.psicometriaonline.com.br/diferencas-entre-modelos-lineares-e-modelos-lineares-generalizados-glms language: pt-BR published: 2025-06-27T16:02:21.000Z updated: 2026-03-31T18:39:36.461Z modified: 2026-03-31T18:39:36.461Z author: "Marcos Lima" categories: ["Modelos lineares generalizados"] tags: ["regressão"] description: "Descubra as diferenças entre modelos lineares e modelos lineares generalizados, incluindo exemplos, aplicações e quando usar cada abordagem." source: Blog Psicometria Online --- # Diferenças entre modelos lineares e modelos lineares generalizados (GLMs) > Neste post, vamos entender o que são modelos lineares e modelos lineares generalizados. Primeiramente, revisaremos os modelos lineares. Em seguida, explicaremos o conceito de função de ligação. Nós depois descreveremos os modelos lineares generalizados. Por fim, daremos alguns exemplos dos dois tipo... Neste post, vamos entender o que são *modelos lineares* e *modelos lineares generalizados*. Primeiramente, revisaremos os modelos lineares. Em seguida, explicaremos o conceito de função de ligação. Nós depois descreveremos os modelos lineares generalizados. Por fim, daremos alguns exemplos dos dois tipos de modelos. ## O que são modelos lineares? **Modelos lineares** (ou modelos lineares gerais) são técnicas estatísticas que assumem que a [variável dependente](/o-que-sao-variaveis-independentes-e-dependentes) é contínua e que os resíduos do modelo seguem uma [distribuição normal](/distribuicao-normal). Além disso, pressupõe-se que a relação entre as variáveis independentes e dependentes seja linear. Várias técnicas estatísticas ensinadas em cursos introdutórios — como os testes *t*, as as análises de variância e as regressões lineares — podem ser concebidas como modelos lineares. Em síntese, os principais pressupostos dos modelos lineares incluem: - Normalidade dos resíduos. - Homocedasticidade (variância constante). - Linearidade. - Independência das observações. Por exemplo, imagine uma pesquisa onde queremos prever o nível de estresse (variável dependente contínua) com base nas horas de sono e capacidade de regulação emocional (variáveis independentes, também contínuas). Nesse contexto, podemos usar uma [regressão linear múltipla](/o-que-e-regressao-linear-multipla) para estimar as contribuições desses preditores em prever o nível de estresse. Aqui, a regressão linear múltipla é uma instância do modelo linear. ## O que é função de ligação? Nos modelos lineares tradicionais, como a regressão linear, a relação entre variáveis independentes e a dependente é direta e proporcional — representada por uma linha reta. Contudo, esse pressuposto nem sempre é adequado. Ao prever uma probabilidade, restrita ao intervalo \[0, 1\], uma linha reta pode sugerir valores fora desses limites. Já ao prever uma contagem, como o número de nascimentos, o modelo pode retornar valores fracionários (e.g., 2,7 nascimentos), o que não faz sentido. É aí que entra a função de ligação. Mas afinal, o que ela faz? A **função de ligação** é uma transformação matemática que **conecta a média esperada da variável dependente (a saída do modelo)** com a **combinação linear dos preditores**. Em outras palavras, ela permite que a saída do modelo respeite as restrições naturais dos dados. Por exemplo: - Em um modelo com [variável dependente binária](/o-que-e-regressao-logistica), usamos a **função logit**, que transforma probabilidades \[0, 1\] em uma escala contínua \]–∞, +∞\[, permitindo uma modelagem linear dos dados. - Em modelos de contagem (como o número de eventos), a **função log** é comumente usada, pois garante que a predição nunca seja negativa. A Figura 1 ilustra essas ideias, apresentando as três funções de ligação mais comumente utilizadas em modelos estatísticos. Cada uma delas mapeia a combinação linear dos preditores (o lado direito de uma equação) à saída do modelo, isto é, ao valor previsto de *Y*. ![](/uploads/1774362349907-502962387.webp) *Figura 1. Ilustração de três funções de ligação.* Didaticamente, pense na função de ligação como **uma ponte**: ela adapta a saída do modelo para que faça sentido com o tipo de dado que você está estudando. Sem essa ponte, os modelos poderiam gerar previsões absurdas — como um número negativo de pessoas, ou uma chance de algo acontecer acima de 100%. ## O que são modelos lineares generalizados (GLM)? Nos modelos lineares, assumimos que os erros (resíduos) seguem distribuição normal, com média zero e variância constante. Além disso, a função de ligação usada é a identidade — ou seja, a combinação linear dos preditores já representa diretamente o valor esperado da variável dependente. Por exemplo, considere o modelo: ![](/uploads/1774362371643-805959543.webp) Suponha que temos os coeficientes *b*0 = 0, *b*1 = 0,25 e *b*2 = 0,5. Para um participante com *X*1 = 4 e *X*2 = 1,5, teremos: ![](/uploads/1774362386945-653068413.webp) Como a função de ligação é identidade, não transformamos esse valor — ele já é a predição final do modelo. Logo, o valor previsto de *Y* = 1,75. Por outro lado, os **modelos lineares generalizados** expandem essa estrutura ao permitir que a variável dependente siga outras distribuições, como binomial, Poisson, gama etc. Além disso, utilizam funções de ligação específicas que conectam a média da variável dependente à combinação linear dos preditores. Por exemplo, no caso da função de ligação logit, teríamos: ![](/uploads/1774362403249-32975361.webp) O valor do expoente já foi calculado anteriormente, e sabemos que é 1,75. Plugando este valor na função de ligação logit, temos: ![](/uploads/1774362415235-543744104.webp) Logo, a probabilidade de *Y* = 1 para o participante com *X*1 = 4 e *X*2 = 1,5, dados *b*0 = 0, *b*1 = 0,25 e *b*2 = 0,5, é de 0,852, um valor que, adequadamente, está entre 0 e 1. Principais pontos dos modelos lineares generalizados: - Aceitam distribuições não normais. - Incorporam função de ligação (identidade, logit, log etc.). - Mantêm premissas sobre independência, mas não exigem homocedasticidade. Por exemplo, estudando tempo de recuperação pós-cirurgia (variável dependente contínua assimétrica), pode-se usar um modelo linear generalizado com distribuição gama e função de ligação log para modelar a relação entre gravidade da cirurgia e variável demográfica. ## Exemplos práticos dos modelos lineares e modelos lineares generalizados Em seguida, mostramos uma série de exemplos de modelos na Tabela 1. O primeiro deles, denominado **Linear**, faz parte da família de modelos lineares, com distribuição normal e função de ligação identidade. Os demais, por sua vez, consistem em modelos lineares generalizados, com outras distribuições e funções de ligação, apropriadas à natureza dos dados. Modelo VD VI Distribuição Função de ligação Finalidade Linear Pressão arterial Idade, IMC Normal Identidade Análise de tendência linear GLM binomial Probabilidade de aprovação em concurso Horas de estudo, autoestima Binomial Logit Predição da variável dependente binária GLM Poisson Número de faltas em uma disciplina Renda, apoio familiar Poisson Log Contagem de eventos esperados GLM gama Tempo de recuperação pós-cirurgia Idade, gravidade da cirurgia Gama Log Modelagem de dados assimétricos GLM multinomial Tipo de resposta moral (neutra, utilitarista, deontológica) Empatia, impulsividade Multinomial Logit Predição de categoria não ordenada *Tabela 1. Exemplos de modelos lineares e modelos lineares generalizados. GLM = modelo linear generalizado (generalized linear model).* Em outras palavras, se sua variável dependente for contínua, normalmente distribuída e linearmente relacionada às preditoras, utilize um modelo linear. Por outro lado, se a variável dependente for binária, de contagem ou assimétrica, com distribuição não normal, opte por um modelo linear generalizado. Desse modo, você garante um modelo mais adequado aos seus dados e mais confiável nos resultados. ## Conclusão Gostou deste conteúdo? Então aproveite e também se inscreva em nosso canal do [**YouTube**](https://youtube.com/c/psicometriaonline?sub_confirmation=1) para ficar por dentro de nossas novidades. Se você precisa aprender análise de dados, então faça parte da [**Psicometria Online Academy**](https://academy-po.psicometriaonline.com.br/?utm_source=blog&utm_medium=organico&utm_campaign=&utm_term=&utm_content=post), a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura [**aqui**](https://academy-po.psicometriaonline.com.br/?utm_source=blog&utm_medium=organico&utm_campaign=&utm_term=&utm_content=post) e nunca mais passe trabalho sozinho(a). ## Referência Melo, M. B., Daldegan-Bueno, D., Oliveira, M. G. M., & Souza, A. L. (2022). Beyond ANOVA and MANOVA for repeated measures: Advantages of generalized estimate equations and generalized linear mixed models and its use in neuroscience research. *European Journal of Neuroscience*, *56*, 6089–6098. https://doi.org/10.1111/ejn.15858 ## Como citar este post > **Como citar este artigo:** Lima, M. (2025, 27 de junho). Diferenças entre modelos lineares e modelos lineares generalizados (GLMs). *Blog Psicometria Online*. https://www.blog.psicometriaonline.com.br/diferencas-entre-modelos-lineares-e-modelos-lineares-generalizados-glms