Redes Bayesianas para Classificação

O que são redes bayesianas para classificação?

Redes bayesianas para classificação são modelos gráficos probabilísticos que predizem uma variável alvo discreta. Elas representam dependências entre atributos e a classe usando um grafo acíclico direcionado. Cada nó é uma variável, e arestas indicam influência condicional entre elas. A classe geralmente é um nó especial, frequentemente com pais ou filhos. A classificação é feita calculando P(classe | evidência) via inferência na rede. Diferentemente do Naive Bayes, elas permitem dependências entre atributos. Isso aumenta a acurácia quando atributos são correlacionados. Além disso, redes bayesianas podem lidar com dados faltantes e variáveis latentes. Elas são interpretáveis: cada aresta tem um significado causal ou associativo. Portanto, são usadas em diagnósticos, sistemas especialistas e bioinformática.

Características fundamentais

Redes para classificação possuem três características principais que as definem. Primeiro, a estrutura pode ser aprendida a partir dos dados (aprendizado de estrutura). Segundo, a inferência pode ser exata (para redes pequenas) ou aproximada (MCMC). Terceiro, elas fornecem distribuições de probabilidade sobre as classes, não apenas rótulos. Isso é essencial para decisões com custos assimétricos. A classe pode ser um nó raiz (causa) ou um nó folha (efeito). Quando a classe é raiz, o modelo é gerativo (ex.: Naive Bayes). Quando é folha, é discriminativo (ex.: redes de regressão logística bayesiana).

Vantagens e aplicações típicas

A principal vantagem é a flexibilidade para modelar relações complexas entre atributos. Elas são usadas em classificação de textos, imagens e sinais médicos. Também são aplicadas em sistemas de recomendação e detecção de intrusão. Contudo, o aprendizado de estrutura é computacionalmente caro.

O classificador TAN (Tree-Augmented Naive Bayes) é um exemplo prático. Ele adiciona arestas entre atributos para capturar as correlações mais fortes. A estrutura é aprendida usando árvore de máxima extensão ponderada por informação mútua. Outra abordagem é usar redes bayesianas completas com restrição de treewidth. Isso permite inferência exata com complexidade controlada. Na classificação, a variável alvo pode ter múltiplos estados (ex.: doença, estágio). As redes bayesianas também podem integrar conhecimento de especialistas via estrutura manual. Isso é valioso quando os dados são escassos ou ruidosos. A predição é feita por propagação de evidências para o nó classe. Algoritmos como eliminação de variáveis ou amostragem são usados. A saída probabilística permite calibrar a confiança da classificação. Por exemplo, pode-se rejeitar amostras com baixa probabilidade máxima. Redes bayesianas também suportam aprendizado incremental com novos dados. Assim, elas são ferramentas poderosas para classificação robusta e interpretável.

Um exemplo clássico é a classificação de risco de crédito com variáveis: renda, idade, histórico, e empréstimo (classe). A rede modela que renda e idade influenciam histórico, e histórico influencia o risco. Dadas as evidências, a rede calcula P(risco | dados) para decisão de aprovação.


Enunciado do exemplo clássico

Implemente uma rede bayesiana para classificar se um paciente tem gripe (G) ou resfriado (R) com base em: Febre (F), Tosse (T) e Dor de Cabeça (D). Todas binárias. Relações: G e R influenciam F, T e D de forma independente (Naive Bayes com duas classes). Defina CPTs manualmente. Dados de treino: 50 pacientes com rótulos. Calcule a acurácia em 20 novos pacientes (gerados sinteticamente). Plote a estrutura da rede e a matriz de confusão.

Este código implementa uma rede Naive Bayes para classificação com duas classes. A estrutura mostra a classe como nó raiz influenciando todos os sintomas. A matriz de confusão revela o desempenho do modelo nos dados de teste. O modelo estima probabilidades diretamente dos dados de treino. Para iniciantes, este exemplo demonstra como redes bayesianas resolvem classificação. Redes bayesianas para classificação são, portanto, práticas e interpretáveis.

Deixe um comentário