--- title: "Qual é a diferença entre aprendizagem supervisionada e não supervisionada?" url: https://www.blog.psicometriaonline.com.br/aprendizagem-supervisionada-e-nao-supervisionada canonical: https://www.blog.psicometriaonline.com.br/aprendizagem-supervisionada-e-nao-supervisionada language: pt-BR published: 2025-01-22T11:00:00.000Z updated: 2026-03-30T00:36:41.727Z modified: 2026-03-30T00:36:41.727Z author: "Marcos Lima" categories: ["Inteligência artificial"] tags: ["machine learning"] description: "Descubra a diferença entre aprendizagem supervisionada e não supervisionada com exemplos práticos e aplicações em modelos preditivos." source: Blog Psicometria Online --- # Qual é a diferença entre aprendizagem supervisionada e não supervisionada? > Neste post, explicaremos a diferença entre aprendizagem supervisionada e não supervisionada, dois conceitos centrais no campo de machine learning. Primeiramente, apresentaremos o conceito de machine learning. Em seguida, exploraremos os paradigmas de aprendizagem supervisionada e não supervisionada.... Neste post, explicaremos a diferença entre aprendizagem supervisionada e não supervisionada, dois conceitos centrais no campo de *machine learning*. Primeiramente, apresentaremos o conceito de *machine learning*. Em seguida, exploraremos os paradigmas de aprendizagem supervisionada e não supervisionada. Logo depois, discutiremos a principal diferença entre essas duas abordagens. Por fim, listaremos alguns dos algoritmos utilizados em cada paradigma. ## O que é machine learning? [***Machine learning***](/o-que-e-machine-learning), ou **aprendizado de máquina**, é um ramo da inteligência artificial que desenvolve algoritmos capazes de aprender com os dados. Em vez de serem explicitamente programados para realizar uma tarefa específica, esses algoritmos identificam padrões e utilizam esse conhecimento para tomar decisões ou fazer previsões. Um exemplo é o recurso de texto preditivo, presente em aplicativos de mensagens, pois ele extrai padrões no discurso escrito do usuário em interações anteriores. Desse modo, o algoritmo de *machine learning* pode melhorar suas previsões e recomendações conforme o usuário continua a escrever. ## O que são aprendizagem supervisionada e não supervisionada? Na área de *machine learning*, os algoritmos podem ser classificados em diferentes paradigmas. Nas duas próximas seções, descreveremos dois paradigmas. Em seguida, faremos uma diferenciação entre eles. ### O que é aprendizagem supervisionada? Na **aprendizagem supervisionada**, o algoritmo tem acesso às respostas corretas durante o treinamento. Ou seja, o desfecho que o modelo tenta prever já está presente no banco de dados e está devidamente rotulado. A vantagem de ter essas respostas disponíveis é que o algoritmo pode comparar suas predições com o valor correto, ajustando-se a cada iteração para melhorar seu desempenho. Esse processo é muito semelhante ao que ocorre em modelos de regressão linear, nos quais o algoritmo aprende a prever uma variável com base em um conjunto de preditores. Por exemplo, em um modelo de [regressão linear múltipla](/o-que-e-regressao-linear-multipla), o algoritmo tenta estimar o valor da [variável critério](/o-que-sao-variaveis-independentes-e-dependentes) (*Y*1) com base em um conjunto de variáveis preditoras (ou *features*; os *X*s). Genericamente, podemos representar o modelo de regressão linear múltipla com 100 variáveis preditoras por meio da seguinte equação: ![equação da regressão linear múltipla.](/uploads/2024-10_regressao-linear-multipla-equacao-2.jpg) Por exemplo, *Y*1 pode representar satisfação no trabalho, enquanto os *X*s representam variáveis como idade, grau de escolaridade, cargo, relação com a chefia, salário etc. Por fim, os *b*s representam os coeficientes do modelo. O ponto importante é que, durante o treino de algoritmo de aprendizagem supervisionada, o modelo pode comparar o valor previsto da variável critério (*Y*1-chapéu) com o valor observado, disponível no conjunto de dados (*Y*1). Desse modo, o objetivo do algoritmo é selecionar valores ótimos de *b*s que minimizem a discrepância entre *Y*1-chapéu e *Y*1. A Figura 1 ilustra essa ideia, onde o algoritmo estima os valores de *Y*1 (*Y*1-chapéu) e os compara com os valores reais de *Y*1 para ajustar os coeficientes. É nesse sentido que afirmamos que a aprendizagem é “supervisionada”. ![banco de dados para algoritmo de aprendizagem supervisionada.](/uploads/2024-11_machine-learning-problema-de-regressao.jpg) *Figura 1. Exemplo de banco de dados adequado para uma regressão linear múltipla.* ### O que é aprendizagem não supervisionada? Na **aprendizagem não supervisionada**, o algoritmo trabalha com dados sem rótulos ou respostas corretas previamente conhecidas. O objetivo é encontrar padrões ou estruturas dentro dos dados, sem a necessidade de prever uma variável critério específica. Um exemplo desta abordagem é a [clusterização](/o-que-e-clusterizacao), na qual o o objetivo é agrupar casos semelhantes em *clusters*. Imagine, por exemplo, que um banco comercial deseja segmentar seus clientes com base em informações como gastos com cartão de crédito e renda. O algoritmo pode agrupar clientes com comportamentos semelhantes, sem que haja uma variável no banco de dados que identifique explicitamente quais são esses grupos. Na clusterização, o número de grupos não é conhecido. O algoritmo precisa descobrir essa estrutura a partir dos dados, o que torna o processo mais exploratório. Por exemplo, A Figura 2 ilustra essa ideia, onde o algoritmo usa uma série de variáveis *X*1–*X*100 para buscar padrões e segmentá-los em grupos. ![banco de dados para algoritmo de aprendizagem não supervisionada.](/uploads/2024-12_machine-learning-problema-de-clusterizacao-3.jpg) *Figura 2. Exemplo de banco de dados adequado para clusterização.* ### Qual é a diferença entre aprendizagem supervisionada e não supervisionada? Se o nosso objetivo é atribuir um valor numérico a diferentes grupos, estamos diante de um problema de aprendizagem supervisionada ou não supevisionada? A resposta depende intrinsecamente da **existência de rótulos no banco de dados** identificando previamente o grupo ao qual cada observação pertence. Se queremos designar um conjunto de pacientes a grupos previamente conhecidos, como diagnósticos de transtorno de personalidade *borderline*, histriônica ou narcisista, adotamos a aprendizagem supervisionada. Nesse caso, o rótulo do diagnóstico já está no banco de dados, e o algoritmo aprende a associar os pacientes a esses rótulos. Por outro lado, se o objetivo é identificar padrões comportamentais de estudantes com base no uso do Moodle em uma universidade, a informação sobre os grupos não estará disponível nos dados. Aqui, usamos a aprendizagem não supervisionada, em que o algoritmo agrupa os estudantes de acordo com suas características, formando *clusters* que podem ser úteis análises subsequentes. ## Quais são os principais algoritmos de aprendizagem supervisionada e não supervisionada? Na aprendizagem supervisionada, alguns dos algoritmos mais comuns incluem: - **Regressão linear e logística:** amplamente utilizadas para predição de variáveis contínuas e categóricas; - [**Máquinas de vetores de suporte (SVM)**](/support-vector-machine-entenda-o-algoritmo-svm): úteis tanto para classificação quanto para regressão; - ***K*\-vizinhos mais próximos (KNN):** classifica uma observação com base nos *k* pontos de dados mais próximos, utilizando medidas como a distância euclidiana; - **Árvores de decisão**: modelos que funcionam bem para problemas de classificação e regressão; - [**Redes neurais**](/entenda-as-redes-neurais-artificiais): ideais para tarefas complexas de predição, como reconhecimento de padrões e processamento de dados não lineares. Por outro lado, na aprendizagem não supervisionada, destacam-se os seguintes algoritmos: - **Análise de componentes principais**: utilizado para redução de dimensionalidade, sintetizando um conjunto de variáveis em um menor número de componentes; - ***K*\-means**: amplamente utilizado para agrupar dados em *clusters*; - **Clustering aglomerativo:** começa considerando cada observação como um *cluster* e vai mesclando sucessivamente até atingir um critério específico; - **DBSCAN**: um algoritmo de clusterização baseado em densidade, útil para identificar grupos de formas complexas (e.g., não lineares); - **Algoritmos de agrupamento hierárquico:** ajudam a criar hierarquias de agrupamento dentro dos dados. ## Conclusão Se você quer aprender sobre esses algoritmos, então faça parte da nossa formação em [**Inteligência Artificial Aplicada a Pesquisas Científicas**](https://academy-po.psicometriaonline.com.br/?utm_source=blog&utm_medium=organico&utm_campaign=&utm_term=&utm_content=post/). ## Referência Müller, A. C., & Guido, S. (2016). *Introduction to machine learning with Python: A guide for data scientists*. O’Reilly. ## Como citar este post > **Como citar este artigo:** Lima, M. (2025, 22 de janeiro). Qual é a diferença entre aprendizagem supervisionada e não supervisionada? *Blog Psicometria Online*. https://www.blog.psicometriaonline.com.br/aprendizagem-supervisionada-e-nao-supervisionada