O seu Blog de Psicometria

Tenha acesso à nossa enciclopédia virtual de conhecimento em Psicometria e Análise de Dados

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Compartilhe nas Redes Sociais

Mineração de regras: descobrindo padrões ocultos nos seus dados

Alessandro Reis

out 15, 2025

Neste post, falaremos sobre uma técnica poderosa para descobrir padrões ocultos em grandes volumes de dados, a saber, a mineração de regras.

Imagine que você precisa descobrir o que acontece com os padrões de citação de artigos científicos ao longo do tempo. Você possui uma vasta base de dados bibliográficos, mas não sabe por onde começar. Como identificar quais artigos são frequentemente citados em conjunto? Ou quais tópicos estão emergindo em áreas específicas? 

Você sabe que há padrões ali, só que eles estão escapando da sua vista… Pois bem, nesse tipo de situação, a mineração de regras de associação pode ser a chave para desvendar esses padrões ocultos.

O que é mineração de regras?

A mineração de regras é uma técnica de Machine Learning que busca identificar relações frequentes entre variáveis em grandes volumes de dados. Em termos simples, essas relações são expressas na forma de regras do tipo “SE… ENTÃO…”, que descrevem associações úteis e recorrentes.

Por exemplo:

SE um artigo é publicado por autores de uma determinada universidade, ENTÃO ele tem maior probabilidade de ser citado por pesquisadores daquela mesma instituição.

Ou então uma regra menos óbvia e mais valiosa de descobrir:

SE um artigo é escrito por tais e tais autores, ENTÃO ele tende a ser citado com frequência por pesquisadores renomados, ENQUANTO o tema do artigo tende a ‘estourar’ até dois anos depois.

Essas regras ajudam a entender comportamentos, tendências e relações subjacentes nos dados. Em outras palavras, é como se pegássemos picaretas e pás e procurássemos ouro escondido em minas escuras.

mineração de dados, metáfora da mina de ouro.

Como funciona a mineração de regras?

O processo de mineração de regras geralmente envolve três etapas principais:

  1. Identificação de conjuntos de itens frequentes: primeiramente, identifica-se quais combinações de itens (ou atributos) aparecem com frequência nos dados. Por exemplo, em um conjunto de artigos, pode-se descobrir que certas palavras-chave costumam ocorrer juntas.
  2. Geração de regras de associação: em seguida, a partir dos conjuntos frequentes, geram-se regras que indicam relações entre os itens. No exemplo da seção anterior, uma regra poderia ser: “SE um artigo contém as palavras-chave ‘machine learning’ e ‘saúde’, ENTÃO ele tem maior probabilidade de ser citado por pesquisadores da área de saúde“.
  3. Avaliação das regras: por fim, as regras geradas são avaliadas quanto à sua utilidade e relevância. Uma série de métricas — apresentadas na próxima seção — nos ajudam a selecionar as associações mais sólidas.

Há diferentes algoritmos para minerar regras. Um dos mais usados é o Apriori, projetado para encontrar conjuntos de itens frequentes em um grande banco de dados, ou seja, combinações de itens que aparecem juntas com certa regularidade.

A lógica central é a propriedade de “antimonotonicidade”: se um conjunto de itens não é frequente, então qualquer conjunto que o contenha também não será frequente. Desse modo, podemos reduzir drasticamente a quantidade de combinações a serem verificadas.

mineração de regras e big data.

Métricas na mineração de regras

Após gerarmos as regras, é essencial avaliá-las de forma objetiva. Para isso, utilizamos métricas que avaliam frequência, força e confiabilidade das associações encontradas (Tabela 1).

MétricaDefiniçãoFórmulaInterpretação
Suporte
(Support)
Frequência com que o conjunto de itens aparece no conjunto de dadosSuporte(A→B) = (transações com A e B) / (total de transações)Quanto maior, mais representativa é a regra
Confiança
(Confidence)
Probabilidade de B ocorrer dado que A ocorreuConfiança(A→B) = Suporte(A∪B) / Suporte(A)Mede a confiabilidade da regra; valores altos indicam forte associação
LiftAvalia a força da associação comparando com a ocorrência aleatória de BLift(A→B) = Confiança(A→B) / Suporte(B)> 1 indica que A aumenta a chance de B; = 1 aleatório; < 1 associação negativa
Convicção
(Conviction)
Relação entre a frequência esperada de falhas e a observadaConvicção(A→B) = (1 – Suporte(B)) / (1 – Confiança(A→B))Quanto maior, mais forte é a dependência de A sobre B
LeverageDiferença entre a frequência observada e esperada se A e B fossem independentes
Leverage(A→B) = Suporte(A∪B) – Suporte(A) × Suporte(B)
Valores positivos indicam associação positiva; zero indica independência
Kulc
(Kulczynski)
Média da probabilidade condicional de A dado B e B dado AKulc(A→B) = 0,5 × [Conf(A→B) + Conf(B→A)]Equilibra a dependência mútua; útil para relações simétricas
Tabela 1. Métricas na mineração de regras.

Cada uma delas cumpre um papel específico: o suporte indica quão representativa é uma regra no conjunto de dados; a confiança mede a probabilidade condicional de uma associação; o lift mostra se a co-ocorrência é maior do que o esperado ao acaso; já a convicção e o leverage ajudam a entender a dependência entre os itens. Por fim, o Kulc permite avaliar simetrias nas relações.

Essas métricas, resumidas na Tabela 1, são fundamentais a fim de distinguir regras realmente úteis daquelas que surgem apenas por acaso.

Aplicações da mineração de regras na pesquisa científica

A mineração de regras tem aplicações valiosas na pesquisa científica e em várias outras áreas do conhecimento. Por exemplo:

  • Análise de dados governamentais: identificar relações frequentes entre compras públicas e possíveis irregularidades (Silveira & Rodriguez, 2022).
  • Estudos de consumo: compreender mudanças nos padrões de compra em uma rede de supermercados durante a pandemia de COVID-19 (Grandi, 2023).
  • Análises clínicas: identificar padrões de sintomas em pacientes com COVID-19, auxiliando análises clínicas (Borges, 2023).
  • Saúde ocupacional: examinar dados sobre câncer relacionado ao trabalho e, desse modo, extrair relações frequentes entre exposição ocupacional e tipos de câncer (Pfeiffer et al., 2024).
  • Ferramentas inovadoras: desenvolver soluções como o RisingMiner, uma ferramenta criada a fim de otimizar a extração de regras de associação, focando na eficiência e relevância das regras geradas (Patricio et al., 2023).

Como se vê, a mineração de regras oferece uma maneira prática e inteligente de explorar grandes conjuntos de dados, revelando relações que poderiam passar despercebidas de outro modo.

Considerações finais

Se você atua em campos que lidam com grandes quantidades de informação — como saúde pública, ciências sociais ou gestão de pessoas —, então a nossa formação em Inteligência Artificial Aplicada a Pesquisas Científicas é para você.

Com técnicas como a mineração de regras, você aprenderá a identificar relações ocultas em grandes volumes de informação, transformando dados dispersos em descobertas relevantes e aplicáveis à sua área de pesquisa.

banner da formação em IA da Psicometria Online.

Referências

Borges, J. L. L. (2023). Aplicando regras de associação para encontrar regras dos sintomas de COVID-19 em diferentes períodos da pandemia [Trabalho de Conclusão de Curso, Universidade Federal do Rio Grande do Norte]. Repositório Institucional da UFRN. https://repositorio.ufrn.br/handle/123456789/53520

Grandi, M. V. R. (2023). Mineração de dados para comparação dos padrões de compras em uma rede de supermercados do oeste do Paraná antes e durante a pandemia de COVID-19. Revista Eletrônica Científica Inovação e Tecnologia, 14(35), 23–31. https://doi.org/10.3895/recit.v14.n35.15532

Patricio, T. S., Magnoni, M. G. M., Ferrareze, M., Serrano, E. C., Castro, A. O., Sá, A. P. S., & Hashimoto, M. S. (2023). Análise da ferramenta RisingMiner para mineração de regras de associação. Observatório de la Economia Latinoamericana, 21(6), 4820–4837. https://doi.org/10.55905/oelv21n6-088

Pfeiffer, B. F., Gralha, S. R., & Ramos, G. S. (2024). Mineração de dados aplicada sobre câncer relacionado ao trabalho. Journal of Health Informatics, 16(1), 1-8. https://doi.org/10.59681/2175-4411.v16.2024.1014

Silveira, R. R., Jr., & Rodriguez, D. L. (2022). Mineração de dados: Um olhar instigante de possibilidades e aplicações para órgãos da administração pública federal. Revista do Serviço Público, 73(3), 451–478. http://repositorio.enap.gov.br/handle/1/7443

Como citar este post

Reis, A. (2025, 15 de outubro). Mineração de regras: Descobrindo padrões ocultos nos seus dados. Blog Psicometria Online. https://blog.psicometriaonline.com.br/mineracao-de-regras-descobrindo-padroes-ocultos-nos-seus-dados

Bruno Figueiredo Damásio

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) e Editor-Associado da Spanish Journal of Psychology, na sub-seção Psicometria e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 5000 citações, nas melhores revistas nacionais e internacionais.

Em 2020, saí da UFRJ para montar a minha formação, a Psicometria Online Academy.

Meu foco é que você se torne um(a) pesquisador(a) de excelência. Clique aqui para conhecer a Academy.

Compartilhe sua opinião sobre este post

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts sugeridos

O algoritmo k-means clustering

Web scraping: raspando dados na internet

Quais são as diferenças entre underfitting e overfitting?

Conteúdo

Mais lidos

O que é correlação de Pearson?

Teste t de Student

O que é o teste de Shapiro-Wilk?

O que é correlação de Spearman?

Postados recentemente

O que significa soma dos quadrados, em estatística?

Como inverter itens no SPSS?

O algoritmo k-means clustering

Tudo que você precisa saber sobre inversão de itens de instrumentos de autorrelato

Deseja se tornar completamente independente na análise dos seus dados?

Junte-se a mais de 22.300 membros e receba conteúdos exclusivos e com prioridade

Categorias