--- title: "O que é o procedimento de Benjamini-Hochberg?" url: https://www.blog.psicometriaonline.com.br/procedimento-de-benjamini-hochberg canonical: https://www.blog.psicometriaonline.com.br/procedimento-de-benjamini-hochberg language: pt-BR published: 2025-07-29T17:42:32.000Z updated: 2026-03-30T13:49:10.237Z modified: 2026-03-30T13:49:10.237Z author: "Marcos Lima" categories: ["Análises bi e multivariadas"] tags: ["teste de hipótese"] description: "Entenda o procedimento de Benjamini-Hochberg, como ele controla a taxa de falsa descoberta e ajusta valores p em comparações múltiplas." source: Blog Psicometria Online --- # O que é o procedimento de Benjamini-Hochberg? > Neste post, falaremos sobre o procedimento de Benjamini-Hochberg e sua importância na análise de dados. Primeiramente, explicaremos o conceito de taxa de falsa descoberta. Em seguida, discutiremos como ela difere da taxa de erro da família dos testes. Depois, mostraremos a finalidade do procedimento... Neste post, falaremos sobre o **procedimento de Benjamini-Hochberg** e sua importância na análise de dados. Primeiramente, explicaremos o conceito de taxa de falsa descoberta. Em seguida, discutiremos como ela difere da taxa de erro da família dos testes. Depois, mostraremos a finalidade do procedimento e como ele funciona na prática. Por fim, apresentaremos um exemplo aplicado e concluiremos com os principais aprendizados. ## O que é taxa de falsa descoberta no procedimento de Benjamini-Hochberg? A fim de compreendermos o objetivo do procedimento de Benjamini-Hochberg, é fundamental entendermos o que ele controla: a **taxa de falsa descoberta (*false dicovery rate*, FDR)**. Em síntese, a taxa de falsa descoberta representa a proporção de hipóteses nulas incorretamente rejeitadas entre todas as rejeições feitas. Ou seja, em um conjunto de testes de hipótese, sempre haverá falsos positivos, e a taxa de falsa descoberta é a medida usada para quantificar e controlar esse risco. ### Falsas descobertas: o erro do Tipo I Considere uma pesquisa com imageamento por ressonância magnética funcional (fMRI). Nesse tipo de pesquisa, o *scanner* captura imagens do cérebro que, para análise, são divididas em **voxels** (pixels tridimensionais que representam pequenas unidades de volume cerebral; Figura 1). ![functional magnetic ressonance imaging.](/uploads/2025-07_fmri-voxel.jpg) *Figura 1. Scanner de imageamento por ressonância magnética funcional (esquerda) e representação esquemática do conceito de voxel (direita). A representação à direita foi obtida da Wikipédia, sob a Creative Commons Attribution-Share Alike 2.5 Generic license.* Suponha que usamos um *scanner* cuja resolução é capaz de dividir o cérebro em 100 mil voxels. Nosso objetivo é comparar a atividade cerebral de pacientes com transtorno de ansiedade generalizada (TAG) com a de um grupo controle, buscando identificar regiões com atividade neural diferencial entre esses grupos. Para simplificar, faremos duas suposições (implausíveis, mas úteis, para fins didáticos): 1. A atividade de cada voxel é independente da atividade dos demais voxels. 2. Em 90 mil voxels (90%), **não há diferença** entre pacientes com TAG e controles (hipótese nula verdadeira). Se coletarmos dados de 25 pacientes em cada grupo e realizarmos 90 mil [testes *t* para amostras independentes](/teste-t-para-amostras-independentes) (um para cada um dos voxels onde não há diferença entre grupos), então obteremos uma distribuição uniforme de valores *p* (Figura 2). ![distribuição de valores ps sob a hipótese nula verdadeira.](/uploads/2025-07_procedimento-de-benjamini-hochberg-01.jpg) *Figura 2. Distribuição de valores p quando a hipótese nula é verdadeira. Linha pontilhada vertical representa um nível de significância de 0,05.* A distribuição da Figura 2 indica que, quando a hipótese nula é verdadeira, todos os valores *p* são igualmente prováveis. Além disso, com nível de significância de 0,05, cerca de 5% dos testes *t* rejeitarão incorretamente a hipótese nula — caracterizando **falsas descobertas**, **falsos positivos** ou [**erros do Tipo I**](/o-que-e-erro-do-tipo-i). ### Taxa de rejeição correta da hipótese nula: o poder estatístico Anteriormente, assumimos que nosso *scanner* divide o cérebro em 100 mil voxels, entre os quais 90 mil deles não produzem atividade neural diferencial entre pacientes com TAG e o grupo controle. Em seguida, consideraremos os 10 mil voxels restantes (10%). Suponha que, neles, o grupo com TAG apresenta uma **hiperativação** em relação ao grupo controle, com [efeito de magnitude média](/o-que-e-tamanho-de-efeito) (*d* = 0,50). Mantendo o mesmo número de participantes e conduzindo 10 mil testes *t* para amostras independentes, obteremos uma distribuição assimétrica de valores *p* (Figura 3). ![distribuição de valores ps sob a hipótese nula falsa.](/uploads/2025-07_procedimento-de-benjamini-hochberg-02.jpg) *Figura 3. Distribuição de valores p quando a hipótese nula é falsa (d = 0,50, efeito médio). Linha pontilhada vertical representa um nível de significância de 0,05.* Quando a hipótese nula é falsa, valores *p* pequenos costumam ser mais prováveis do que valores próximos de 1. Além disso, em nosso exemplo, com nível de significância de 0,05, rejeitaremos corretamente a hipótese nula falsa em 41,4% dos testes (i.e., valores à esquerda da linha pontilhada vertical da Figura 3). Esse percentual corresponde ao [**poder estatístico**](/qual-a-importancia-do-poder-estatistico): a probabilidade de detectar um efeito verdadeiro, dada uma amostra (*n* = 25 por grupo) e tamanho de efeito (*d* = 0,50) fixos. ### Juntando tudo: a taxa de falsa descoberta do procedimento de Benjamini-Hochberg As Figuras 2 e 3 permitem identificar claramente se um [valor *p*](/o-que-e-valor-de-p) vem de uma hipótese verdadeira ou falsa. Entretanto, em dados reais, não sabemos de antemão quais hipóteses são verdadeiras ou falsas — é justamente por isso que realizamos pesquisas científicas e testes estatísticos. A Figura 4 empilha os histogramas dos dois cenários anteriores, mantendo as mesmas cores distintas. Em cenários reais, porém, não conseguiríamos distinguir visualmente quais valores *p* são falsos positivos. ![distribuição conjunta de valores ps sob as hipóteses nulas verdadeira e falsa.](/uploads/2025-07_procedimento-de-benjamini-hochberg-03.jpg) *Figura 4. Distribuição de valores p considerando simultaneamente hipóteses nulas verdadeiras e falsas.* *Linha pontilhada vertical representa um nível de significância de 0,05.* ### Um zoom nos valores *p*s estatisticamente significativos Na Figura 4, temos 4.140 valores *p* significativos vindos de hipóteses nulas falsas, mas 4.503 significativos vindos de hipóteses nulas verdadeiras. Em outras palavras, sem qualquer correção, cerca de 52% dos nossos resultados significativos seriam falsas descobertas. A Figura 4 divide os valores *p* de 0 a 1 em 20 faixas de 0,05 cada. Em seguida, a Figura 5 apresenta um zoom da primeira faixa da Figura 4 (i.e., os resultados estatisticamente significativos), dividindo os valores *p* de 0 até 0,05, em faixas de 0,0025 cada. ![distribuição conjunta de valores ps significativos sob as hipóteses nulas verdadeira e falsa.](/uploads/2025-07_procedimento-de-benjamini-hochberg-04.jpg) *Figura 5. Distribuição de valores p < 0,05, considerando simultaneamente hipóteses nulas verdadeiras e falsas.* *Linha pontilhada vertical representa um nível de significância de 0,05.* Observe que, mesmo entre os valores *p*s significativos, há uma maior concentração de valores *p*s menores que 0,01, sobretudo entre aqueles oriundos de uma hipótese nula falsa. Em resumo, quando realizamos vários testes simultâneos, aumentamos a chance de falsos positivos. A taxa de falsa descoberta quantifica esse problema e mostra que, sem correção, até metade dos resultados significativos pode ser falsa. O procedimento de Benjamini-Hochberg atua exatamente nesse ponto: ele ajusta os valores *p*, fazendo com que alguns deles, principalmente aqueles mais próximos de 0,05, **deixem de ser considerados significativos**. Dessa forma, reduzimos a proporção de falsas descobertas entre as hipóteses rejeitadas, mantendo um bom equilíbrio entre evitar erros e preservar descobertas verdadeiras. ## Qual é a diferença entre taxa de falsa descoberta e taxa de erro da família dos testes? Quando realizamos comparações múltiplas, é importante controlarmos nossos erros. Por exemplo, a [correção de Bonferroni](/correcao-bonferroni) é usada em testes post hoc da análise de variância (ANOVA). No entanto, a correção de Bonferroni não controla a taxa de falsa descoberta, mas sim a **taxa de erro da família dos testes (FWER)**. A FWER diz respeito à probabilidade de **pelo menos** um erro Tipo I em uma série de testes relacionados. Quando conduzimos vários testes, como nos post hocs de uma ANOVA, nós aumentamos a probabilidade de encontrar efeitos espúrios simplesmente por termos conduzido muitos testes. A relação entre número de testes e probabilidade de pelo menos um erro do Tipo I é apresentada na Figura 6. ![familywise error rate.](/uploads/2025-07_taxa-de-erros-da-familia-dos-testes-01.jpg) *Figura 6. Probabilidade de pelo menos um erro do Tipo I em função do número de testes estatísticos, considerando um nível de significância de 0,05.* Por exemplo, com 10 testes post hoc, há uma probabilidade de 0,40 de obtermos pelo menos um resultado estatisticamente significativo. A Tabela 1 resume as diferenças da taxa de falsa descoberta e da taxa de erro da família dos testes. Característica Taxa de falsa descoberta (FDR) Taxa de erro da família dos testes (FWER) Definição A proporção de hipóteses nulas incorretamente rejeitadas entre todas as rejeições feitas A probabilidade de pelo menos um falso positivo em uma série de testes estatísticos Fórmula (conceitual) FDR = falsos positivos / (falsos positivos + verdadeiros positivos) FWER = *p*(número de falsos positivos ≥ 1) Controle Procedimento de Benjamini-Hochberg: ajusta valores *p* para limitar a proporção de falsos positivos entre as rejeições Correção de Bonferroni: adota um nível de significância mais conservador (diminui probabilidade de erro do Tipo I, mas aumenta a probabilidade de erro do Tipo II) *Tabela 1. Comparativo entre taxa de falsa descoberta e taxa de erro da família do teste.* ## Como funciona o procedimento de Benjamini-Hochberg? O procedimento de Benjamini-Hochberg segue uma sequência simples e eficiente para controlar a taxa de falsa descoberta, ajustando os valores *p*s obtidos: 1. **Ordenar:** liste todos os valores *p* obtidos em ordem crescente. 2. **Indexar:** atribua um índice *i* a cada valor *p*, do menor para o maior. 3. **Ajustar maior valor *p*:** o valor *p* ajustado será igual ao valor *p* original. 4. **Ajustar demais valores *p*s:** o próximo valor *p* ajustado, de posição *i*, será obtido pela seguinte fórmula: ![fórmula do ajuste do valor p no procedimento de Benjamini-Hochberg.](/uploads/2025-07_procedimento-de-benjamini-hochberg-formula-valor-p-ajustado.jpg) Ou seja, multiplicaremos o valor *p* não ajustado pela razão entre número de valores *p* e posição *i* do valor *p* que estamos ajustando. Em seguida, selecionaremos o menor valor entre esse valor ajustado e o valor *p* na posição imediatamente superior (visando garantir a monotonicidade dos valores *p*s ajustados). Por fim, temos o passo 5: 5. **Interpretar valor *p* ajustado:** se *p* é menor que o critério de significância, rejeitar a hipótese nula. Com esses passos, o procedimento de Benjamini-Hochberg faz com que alguns valores *p* originalmente < 0,05 cruzem o critério de significância para a região de não significância, reduzindo a proporção de falsos positivos. ## Exemplo prático do procedimento de Benjamini-Hochberg Considere que, após um efeito principal da ANOVA, conduzimos testes post hoc comparando cinco grupos, par a par, com os seguintes valores *p*s: ![ilustração do procedimento de Benjamini-Hochberg, parte 1.](/uploads/2025-07_valores-p.jpg) Ou seja, na ausência de qualquer ajuste, 8 das 10 comparações em pares indicam diferenças estatisticamente significativas. De modo a aplicar o procedimento de Benjamini-Hochberg, devemos ordenar os valores *p* em sequência crescente e atribuir índices a cada um dos valores *p*s: ![](/uploads/2025-07_valores-p-com-indices.jpg) Em seguida, ajustaremos o maior valor *p*. Nesse caso, o “ajuste” será o próprio valor original. ![ilustração do procedimento de Benjamini-Hochberg, parte 2.](/uploads/2025-07_valor-p-ajustado-1.jpg) Nós então passamos ao ajuste do segundo maior valor *p*. Aplicando a fórmula anteriormente introduzida, teremos: ![ilustração do procedimento de Benjamini-Hochberg, parte 3.](/uploads/2025-07_valor-p-ajustado-2.jpg) Como o menor dos dois valores foi 0,0578, esse será o nosso valor *p* ajustado para o índice *i* = 9: ![ilustração do procedimento de Benjamini-Hochberg, parte 4.](/uploads/2025-07_valor-p-ajustado-3.jpg) Em seguida, repetiremos o mesmo procedimento para o índice *i* = 8. ![ilustração do procedimento de Benjamini-Hochberg, parte 5.](/uploads/2025-07_valor-p-ajustado-4.jpg) Dessa vez, o valor ajustado para *i* = 8 foi maior que o valor ajustado para *i* = 9. Por esse motivo, repetiremos o valor ajustado para o índice *i* = 9, visando manter a relação de monotonicidade entre os valores *p* (i.e., para que não haja inversão de ordenamento de valores *p*s originais e ajustados). ![ilustração do procedimento de Benjamini-Hochberg, parte 6.](/uploads/2025-07_valor-p-ajustado-5.jpg) Em síntese, seguiremos esse mesmo algoritmo até atingirmos o valor *p* de índice *i* = 1. Ao final, teremos todos os valores *p*s ajustados, que serão maiores que os valores *p*s originais. ![ilustração do procedimento de Benjamini-Hochberg, parte 7 (final).](/uploads/2025-07_valor-p-ajustado-6.jpg) Note que, após o procedimento de Benjamini-Hochberg, três valores *p*s passaram da região de significância (*p* < 0,05) para a região de não significância (*p* > 0,05), ou seja, aqueles associados aos índices *i* = {6, 7, 8}. Por conseguinte, o procedimento de Benjamini-Hochberg reduziu os resultados significativos de 8 para 5. Os valores *p*s que mudam da região de significância para a região de não significância são aqueles mais próximos de 0,05. Como vimos anteriormente, dado o caráter uniforme da distribuição de valores *p*s sob a hipótese nula — mas positivamente assimétrico sob a hipótese alternativa —, é mais provável que os valores *p*s que estão mudando de status sejam falsas descobertas. Em síntese, é por meio desse algoritmo simples que o procedimento de Benjamini-Hochberg controla a taxa de falsas descobertas. ## Referências Benjamini, Y., & Hochberg, Y. (1995). Controlling the false discovery rate: A practical and powerful approach to multiple testing. *Journal of the Royal Statistical Society, Series B*, *57*(1), 289–300. https://doi.org/10.1111/j.2517-6161.1995.tb02031.x Field, A., Miles, J., & Field, Z. (2012). *Discovering statistics using R*. Sage. StatQuest with Josh Starmer. (2017, 10 de janeiro). *False Discovery Rates, FDR, clearly explained* \[Vídeo\]. YouTube. https://www.youtube.com/watch?v=K8LQSvtjcEo ## Como citar este post > **Como citar este artigo:** Lima, M. (2025, 29 de julho). O que é o procedimento de benjamini-hochberg? *Blog Psicometria Online*. https://www.blog.psicometriaonline.com.br/procedimento-de-benjamini-hochberg