Redução de dimensionalidade
Imagine um chef que recebe uma despensa com cem ingredientes diferentes para preparar um prato simples. Há temperos repetidos, sabores que se anulam e outros que aparecem sempre juntos. Se ele tentar usar tudo, o prato fica confuso, pesado e impossível de entender. Por outro lado, o bom chef faz algo diferente. Ele prova, agrupa […]
O que é modelagem de equações estruturais regularizada?

Imagine um arquiteto encarregado de reformar um prédio antigo. Ele tem plantas incompletas, paredes tortas e várias hipóteses sobre como a estrutura realmente funciona. Se ele tentar reforçar tudo ao mesmo tempo, o prédio fica pesado, caro e instável. Por outro lado, se intervir pouco ou ignorar os pontos críticos, corre o risco de colapso. […]
XGBoost: muitas árvores (de decisão) sem paciência para erros

Imagine um campeonato de culinária em que vários cozinheiros fazem o mesmo prato, um depois do outro. Em um primeiro momento, o primeiro cozinheiro tenta acertar tudo sozinho e falha em vários pontos. O segundo observa os erros do primeiro e tenta corrigi-los. Em seguida, o terceiro aprende com os erros acumulados dos dois anteriores, […]
O que são cadeias de Markov?

Imagine um viajante que anda por uma cidade estranha, mas que tem uma memória curiosa. Ele lembra apenas de onde está agora, mas não se recorda de por onde passou, nem de como chegou ali. Ainda assim, para decidir o próximo passo, ele observa apenas o quarteirão atual e escolhe o seguinte com certas probabilidades. […]
Otimização de modelos: sua máquina mais inteligente

Imagine duas pessoas tentando aprender a fazer um bolo usando exatamente a mesma receita. Ambas têm os mesmos ingredientes, o mesmo forno e o mesmo livro de culinária aberto na mesma página. À primeira vista, portanto, tudo parece idêntico. No entanto, o resultado final pode ser radicalmente diferente. Essa metáfora do preparo de bolo ajuda […]
Aprendizado de máquina? Entenda como as máquinas aprendem

Aprendizado de máquina explicado com um exemplo simples Imagine ensinar alguém a andar de bicicleta. Primeiramente, você pode explicar as regras e mostrar exemplos. No entanto, nada substitui subir na bicicleta, perder o equilíbrio, cair e tentar de novo. A cada tentativa, a pessoa percebe onde errou e, assim, ajusta o corpo, aprendendo a distribuir […]
Lasso e Ridge como formas de regularização

Em um post anterior, falamos da regularização como um personal trainer interessado em manter o cliente, isto é, o modelo, bem fit, bem ajustado. Vamos persistir nessa metáfora de treinamento físico e fitness, então? É que existem diferentes tipos de treinador, a saber, a regularização Lasso (treinador L1) e a Ridge (treinador L2; veja a […]
Regularização: o personal trainer da Machine Learning

Imagine que você decide entrar na academia depois de anos de sedentarismo. Empolgado, quer levantar 120 kg no primeiro dia. No entanto, o treinador olha para você, balança a cabeça e responde: “Se fizer isso agora, vai se machucar — e ainda vai achar que está arrasando, até tentar repetir depois“. No fundo, todo novato […]
Validação cruzada: sem isso, você não faz ciência de dados
Imagine que você está ensinando alguém a dirigir. Se você avaliar essa pessoa apenas no trajeto da própria rua, ela parecerá ótima. Concorda que avaliar apenas dessa forma não parece muito confiável? Ok, mas então como seria uma avaliação mais rica? Por isso, quando você coloca o carro em outra vizinhança — com ladeiras, avenidas […]
O que são Graph Neural Networks?
Imagine uma cidade onde cada pessoa conversa diariamente com seus vizinhos. Ninguém vê a cidade inteira, mas cada morador forma opiniões a partir dessas conversas. Com o passar dos dias, entretanto, as informações vão se espalhando: você já sabe o que pensa o amigo do seu amigo, e depois o primo do amigo do seu […]
O algoritmo k-means clustering

Imagine que você está organizando uma festa e distribui grupos de convidados para mesas, mas sem lugares marcados. Aos poucos, as pessoas se movem até se sentirem confortáveis entre amigos. Depois de algumas rodadas de “mudanças de mesa” e “recontagem de amigos à volta”, o sistema fica estável. Em outras palavras, cada convidado está em […]
Web scraping: raspando dados na internet

Coletar dados em quantidade e qualidade é fundamental para qualquer pesquisa científica. No entanto, e se eles já estiverem disponíveis na internet, apenas esperando que você encontre os instrumentos certos para “raspá-los” e colocá-los na sua tigela de análise? O post de hoje é sobre essa forma de coleta de dados, chamada de web scraping […]
Conheça as redes bayesianas

Introdução às redes bayesianas Entre os métodos de machine learning, hoje destaco as redes bayesianas, que permitem combinar o poder dos grafos com a precisão da probabilidade. Em outras palavras, esses modelos gráfico-probabilísticos representam fenômenos complexos por meio de variáveis interdependentes. Por exemplo, considere o grafo simples a seguir: Em síntese, grama molhada pode ocorrer […]
Modelagem de tópicos: A IA sabe do que você está falando

Imagine uma biblioteca gigante sem catálogo. Você tem milhares de artigos e precisa descobrir quais grandes temas aparecem e como eles evoluem ao longo do tempo. Nesse cenário, a modelagem de tópicos (topic modeling) funciona como um “bibliotecário automático”: ela lê os textos por você — numa velocidade que seria impossível manualmente — e os […]
Mineração de regras: descobrindo padrões ocultos nos seus dados

Neste post, falaremos sobre uma técnica poderosa para descobrir padrões ocultos em grandes volumes de dados, a saber, a mineração de regras. Imagine que você precisa descobrir o que acontece com os padrões de citação de artigos científicos ao longo do tempo. Você possui uma vasta base de dados bibliográficos, mas não sabe por onde […]
