O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Diferenças entre modelos lineares e modelos lineares generalizados (GLMs)

Marcos Lima

jun 27, 2025

Neste post, vamos entender o que são modelos lineares e modelos lineares generalizados. Primeiramente, revisaremos os modelos lineares. Em seguida, explicaremos o conceito de função de ligação. Nós depois descreveremos os modelos lineares generalizados. Por fim, daremos alguns exemplos dos dois tipos de modelos.

O que são modelos lineares?

Modelos lineares (ou modelos lineares gerais) são técnicas estatísticas que assumem que a variável dependente é contínua e que os resíduos do modelo seguem uma distribuição normal. Além disso, pressupõe-se que a relação entre as variáveis independentes e dependentes seja linear.

Várias técnicas estatísticas ensinadas em cursos introdutórios — como os testes t, as as análises de variância e as regressões lineares — podem ser concebidas como modelos lineares.

Em síntese, os principais pressupostos dos modelos lineares incluem:

  • Normalidade dos resíduos.
  • Homocedasticidade (variância constante).
  • Linearidade.
  • Independência das observações.

Por exemplo, imagine uma pesquisa onde queremos prever o nível de estresse (variável dependente contínua) com base nas horas de sono e capacidade de regulação emocional (variáveis independentes, também contínuas).

Nesse contexto, podemos usar uma regressão linear múltipla para estimar as contribuições desses preditores em prever o nível de estresse. Aqui, a regressão linear múltipla é uma instância do modelo linear.

banner da NAOPARE.

O que é função de ligação?

Nos modelos lineares tradicionais, como a regressão linear, a relação entre variáveis independentes e a dependente é direta e proporcional — representada por uma linha reta.

Contudo, esse pressuposto nem sempre é adequado. Ao prever uma probabilidade, restrita ao intervalo [0, 1], uma linha reta pode sugerir valores fora desses limites. Já ao prever uma contagem, como o número de nascimentos, o modelo pode retornar valores fracionários (e.g., 2,7 nascimentos), o que não faz sentido. É aí que entra a função de ligação.

Mas afinal, o que ela faz? A função de ligação é uma transformação matemática que conecta a média esperada da variável dependente (a saída do modelo) com a combinação linear dos preditores. Em outras palavras, ela permite que a saída do modelo respeite as restrições naturais dos dados.

Por exemplo:

  • Em um modelo com variável dependente binária, usamos a função logit, que transforma probabilidades [0, 1] em uma escala contínua ]–∞, +∞[, permitindo uma modelagem linear dos dados.
  • Em modelos de contagem (como o número de eventos), a função log é comumente usada, pois garante que a predição nunca seja negativa.

A Figura 1 ilustra essas ideias, apresentando as três funções de ligação mais comumente utilizadas em modelos estatísticos. Cada uma delas mapeia a combinação linear dos preditores (o lado direito de uma equação) à saída do modelo, isto é, ao valor previsto de Y.

funções de ligação para modelos lineares e modelos lineares generalizados.
Figura 1. Ilustração de três funções de ligação.

Didaticamente, pense na função de ligação como uma ponte: ela adapta a saída do modelo para que faça sentido com o tipo de dado que você está estudando. Sem essa ponte, os modelos poderiam gerar previsões absurdas — como um número negativo de pessoas, ou uma chance de algo acontecer acima de 100%.

O que são modelos lineares generalizados (GLM)?

Nos modelos lineares, assumimos que os erros (resíduos) seguem distribuição normal, com média zero e variância constante. Além disso, a função de ligação usada é a identidade — ou seja, a combinação linear dos preditores já representa diretamente o valor esperado da variável dependente.

Por exemplo, considere o modelo:

modelos lineares: equação de regressão múltipla.

Suponha que temos os coeficientes b0 = 0, b1 = 0,25 e b2 = 0,5. Para um participante com X1 = 4 e X2 = 1,5, teremos:

predição de um modelo de regressão hipotético.

Como a função de ligação é identidade, não transformamos esse valor — ele já é a predição final do modelo. Logo, o valor previsto de Y = 1,75.

Por outro lado, os modelos lineares generalizados expandem essa estrutura ao permitir que a variável dependente siga outras distribuições, como binomial, Poisson, gama etc. Além disso, utilizam funções de ligação específicas que conectam a média da variável dependente à combinação linear dos preditores.

Por exemplo, no caso da função de ligação logit, teríamos:

modelos lineares generalizados: modelo logístico.

O valor do expoente já foi calculado anteriormente, e sabemos que é 1,75. Plugando este valor na função de ligação logit, temos:

valor previsto em modelo logístico.

Logo, a probabilidade de Y = 1 para o participante com X1 = 4 e X2 = 1,5, dados b0 = 0, b1 = 0,25 e b2 = 0,5, é de 0,852, um valor que, adequadamente, está entre 0 e 1.

Principais pontos dos modelos lineares generalizados:

  • Aceitam distribuições não normais.
  • Incorporam função de ligação (identidade, logit, log etc.).
  • Mantêm premissas sobre independência, mas não exigem homocedasticidade.

Por exemplo, estudando tempo de recuperação pós-cirurgia (variável dependente contínua assimétrica), pode-se usar um modelo linear generalizado com distribuição gama e função de ligação log para modelar a relação entre gravidade da cirurgia e variável demográfica.

Exemplos práticos dos modelos lineares e modelos lineares generalizados

Em seguida, mostramos uma série de exemplos de modelos na Tabela 1. O primeiro deles, denominado Linear, faz parte da família de modelos lineares, com distribuição normal e função de ligação identidade. Os demais, por sua vez, consistem em modelos lineares generalizados, com outras distribuições e funções de ligação, apropriadas à natureza dos dados.

ModeloVDVIDistribuiçãoFunção de
ligação
Finalidade
LinearPressão arterialIdade, IMCNormalIdentidadeAnálise de tendência linear
GLM binomialProbabilidade de aprovação em concursoHoras de estudo, autoestimaBinomialLogitPredição da variável dependente binária
GLM PoissonNúmero de faltas em uma disciplinaRenda, apoio familiarPoissonLogContagem de eventos esperados
GLM gamaTempo de recuperação pós-cirurgiaIdade, gravidade da cirurgiaGamaLogModelagem de dados assimétricos
GLM multinomialTipo de resposta moral (neutra, utilitarista, deontológica)Empatia, impulsividadeMultinomialLogitPredição de categoria não ordenada
Tabela 1. Exemplos de modelos lineares e modelos lineares generalizados. GLM = modelo linear generalizado (generalized linear model).

Em outras palavras, se sua variável dependente for contínua, normalmente distribuída e linearmente relacionada às preditoras, utilize um modelo linear.

Por outro lado, se a variável dependente for binária, de contagem ou assimétrica, com distribuição não normal, opte por um modelo linear generalizado. Desse modo, você garante um modelo mais adequado aos seus dados e mais confiável nos resultados.

Conclusão

Gostou deste conteúdo? Então aproveite e também se inscreva em nosso canal do YouTube para ficar por dentro de nossas novidades.

Se você precisa aprender análise de dados, então faça parte da Psicometria Online Academy, a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

Referência

Melo, M. B., Daldegan-Bueno, D., Oliveira, M. G. M., & Souza, A. L. (2022). Beyond ANOVA and MANOVA for repeated measures: Advantages of generalized estimate equations and generalized linear mixed models and its use in neuroscience research. European Journal of Neuroscience, 56, 6089–6098. https://doi.org/10.1111/ejn.15858

Como citar este post

Lima, M. (2025, 27 de junho). Diferenças entre modelos lineares e modelos lineares generalizados (GLMs). Blog Psicometria Online. https://www.blog.psicometriaonline.com.br/diferencas-entre-modelos-lineares-e-modelos-lineares-generalizados-glms/

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

0 0 Votos
Classificação do artigo
Inscrever-se
Notificar de
guest

0 Comentários
mais antigos
mais recentes Mais votado
Feedbacks embutidos
Ver todos os comentários

Posts sugeridos

O que são modelos lineares generalizados?

O que é regressão de Poisson?

O que é regressão logística?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

O que é correlação de Spearman?

Postados recentemente

O que são efeitos principais e efeitos de interação?

Regularização: o personal trainer da Machine Learning

Quais são as diferenças entre os delineamentos intrassujeitos e entressujeitos?

Efeito teto e efeito chão: o que são e por que eles importam?

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias