Classificadores Bayesianos

O que são classificadores bayesianos?

Classificadores bayesianos são modelos probabilísticos que atribuem uma classe a uma amostra usando o teorema de Bayes. Eles calculam a probabilidade a posteriori de cada classe dado os atributos observados. A classe escolhida é aquela com maior probabilidade posterior (regra de decisão de Bayes). Esses classificadores são generativos: modelam a distribuição conjunta de atributos e classes. Diferentemente de modelos discriminativos, eles podem lidar com dados faltantes naturalmente. O classificador Naive Bayes é o mais famoso, assumindo independência condicional entre atributos. Apesar dessa suposição forte, ele funciona surpreendentemente bem na prática. Classificadores bayesianos também fornecem uma medida de incerteza em cada predição. Isso é crucial em aplicações críticas como diagnóstico médico e detecção de fraudes.

Características fundamentais

Esses classificadores possuem três características principais que os distinguem. Primeiro, eles exigem conhecimento prévio (prior) das probabilidades das classes. Segundo, a verossimilhança é calculada a partir da distribuição dos atributos em cada classe. Terceiro, a decisão é baseada na regra de Bayes com minimização do erro esperado. Eles podem ser paramétricos (assumindo distribuições como normal) ou não-paramétricos (kernel). Além disso, eles são facilmente atualizáveis com novos dados (aprendizado incremental). A complexidade de treinamento é baixa, especialmente no caso Naive Bayes.

Vantagens e aplicações típicas

A principal vantagem é a interpretabilidade e a robustez a ruídos. Eles são usados em filtros de spam, análise de sentimentos e classificação de textos. Também são aplicados em sistemas de recomendação e diagnósticos médicos. Contudo, a suposição de independência pode ser violada em dados reais.

O classificador Naive Bayes é derivado da suposição de que os atributos são independentes dado a classe. Isso simplifica o cálculo: P(classe | atributos) ∝ P(classe) * ∏ P(atributoᵢ | classe). Para atributos contínuos, assume-se frequentemente uma distribuição normal (Gaussian Naive Bayes). Para atributos discretos, usa-se frequências ou suavização de Laplace. A suavização evita probabilidades zero para combinações não vistas no treino. O classificador bayesiano ótimo (sem independência) requer a estimativa da conjunta completa. Isso é inviável para muitas variáveis, daí a popularidade do Naive Bayes. Outra variante é o TAN (Tree-Augmented Naive Bayes), que relaxa a independência. Ele adiciona arestas entre atributos para capturar correlações significativas. Apesar de mais complexo, o TAN melhora a acurácia em muitos conjuntos. Classificadores bayesianos também podem ser usados com prioris não-informativos. Isso é útil quando não se tem conhecimento prévio sobre as classes. A saída probabilística permite definir limiares de confiança para rejeição de decisões. Assim, classificadores bayesianos são ferramentas versáteis e didáticas.

Um exemplo clássico é a classificação de flores Iris (Setosa, Versicolor, Virginica) usando comprimento e largura das pétalas. O Naive Bayes gaussiano separa bem as classes com alta acurácia. A fronteira de decisão é suave e quadrática devido às diferentes variâncias.


Enunciado do exemplo clássico

Implemente um classificador Naive Bayes gaussiano para o dataset Iris (usando apenas duas características: comprimento e largura da pétala). Divida os dados em treino (70%) e teste (30%). Treine o modelo calculando médias e variâncias por classe. Classifique os dados de teste e calcule a acurácia. Plote a fronteira de decisão no espaço 2D e a matriz de confusão.

Este código treina um Naive Bayes gaussiano no dataset Iris com duas características. A fronteira de decisão mostra regiões quadráticas separando as três classes. A matriz de confusão revela o desempenho detalhado do classificador. O modelo também fornece probabilidades para novas amostras. Para iniciantes, este exemplo conecta teoria bayesiana à prática de classificação. Classificadores bayesianos são, portanto, uma porta de entrada para aprendizado supervisionado.

Deixe um comentário