Classificador Bayesiano Optimo

O que é o classificador bayesiano ótimo?

O classificador bayesiano ótimo é o modelo que minimiza a probabilidade de erro de classificação. Ele atribui uma amostra à classe com maior probabilidade a posteriori, dada a evidência. Essa regra é chamada de regra de decisão de Bayes ou MAP (maximum a posteriori). Diferentemente de classificadores heurísticos, ele é matematicamente provado como ótimo. A optimalidade vale para qualquer problema, desde que as distribuições sejam conhecidas. O erro mínimo alcançável é chamado de erro de Bayes ou erro irredutível. Esse erro é devido à sobreposição natural entre as distribuições das classes. Portanto, nenhum outro classificador pode superar o bayesiano ótimo em termos de erro médio. Ele serve como um limite inferior teórico para avaliar outros algoritmos.

Características fundamentais

O classificador bayesiano ótimo possui três características principais que o definem. Primeiro, ele requer o conhecimento completo das distribuições condicionais P(x|classe). Segundo, ele usa a probabilidade a priori P(classe) para cada categoria. Terceiro, a decisão é determinística: escolhe a classe com maior P(classe|x). Ele pode ser generalizado para custos assimétricos (risco de Bayes). Nesse caso, minimiza o risco esperado, não apenas o erro bruto. O classificador ótimo é a base teórica para todos os outros métodos de classificação.

Vantagens e limitações

A principal vantagem é a garantia de desempenho máximo sob o modelo assumido. Ele é usado como referência para validar classificadores aproximados (ex.: SVM, redes neurais). Também é essencial em problemas de decisão com custos desiguais (ex.: diagnósticos). Contudo, na prática, as distribuições verdadeiras são desconhecidas. Portanto, ele é mais um conceito teórico do que um algoritmo implementável diretamente.

O erro de Bayes é calculado integrando a região de sobreposição das distribuições. Para duas classes com distribuições normais de mesma variância, a fronteira é linear. Se as variâncias são diferentes, a fronteira torna-se quadrática (análise discriminante quadrática). O classificador ótimo pode ser visto como um modelo generativo perfeito. Ele não sofre de overfitting porque usa as distribuições verdadeiras, não estimadas. Na prática, usamos aproximações como Naive Bayes ou QDA (Quadratic Discriminant Analysis). Essas aproximações estimam as distribuições a partir dos dados de treino. Quanto melhores as estimativas, mais próximo do ótimo estará o classificador. A teoria do erro de Bayes é fundamental para entender o viés e a variância. Ela mostra que o erro total = erro de Bayes + erro de estimativa + erro de aproximação. Isso guia a escolha entre modelos mais flexíveis (mais viés) ou mais complexos (mais variância). O classificador ótimo também é usado em problemas de detecção de sinais (ROC). A curva ROC traça a taxa de verdadeiros positivos vs. falsos positivos para diferentes limiares. Assim, o classificador bayesiano ótimo é um pilar da teoria da decisão estatística.

Um exemplo clássico é a classificação de duas espécies de flores com base no comprimento da pétala. Suponha que os comprimentos sigam distribuições normais com médias 3 e 5, e desvio 0.5. O ponto de corte ótimo (onde as densidades se cruzam) é a média ponderada pelas priores. Se as priores forem iguais, o corte é (3+5)/2 = 4.0. Esse é o classificador ótimo.


Enunciado do exemplo clássico

Implemente o classificador bayesiano ótimo para um problema de duas classes com distribuições normais conhecidas. Classe 0: X ~ N(μ₀=2, σ₀²=1.5). Classe 1: X ~ N(μ₁=6, σ₁²=2.0). Priores: P(0)=0.6, P(1)=0.4. Calcule a função de decisão analiticamente e plote as densidades, os prioris e a região de decisão. Calcule o erro de Bayes (integral da menor densidade ponderada). Classifique um novo ponto x=4.5 e mostre as probabilidades posteriores.

Este código implementa o classificador ótimo com distribuições normais conhecidas. O ponto de corte é encontrado igualando as densidades ponderadas pelos prioris. A área sombreada em cinza representa o erro de Bayes (sobreposição). As posteriores para o novo ponto mostram a incerteza da classificação. O erro de Bayes calculado é o menor erro possível para esse problema. Para iniciantes, este exemplo conecta teoria estatística à decisão prática. O classificador bayesiano ótimo é, portanto, um referencial teórico fundamental.

Deixe um comentário