Redes Bayesianas com Variaveis Discretas

O que são redes bayesianas com variáveis discretas?

Redes bayesianas com variáveis discretas são modelos probabilísticos onde cada nó assume valores categóricos finitos. Esses valores podem ser binários (sim/não), ordinais (baixo/médio/alto) ou nominais (cor/forma). Cada nó possui uma tabela de probabilidade condicional (CPT) que lista todas as combinações possíveis. Por exemplo, um nó com 3 pais binários terá 2³ = 8 entradas na sua CPT. A distribuição conjunta é o produto de todas as CPTs, como nas redes contínuas. Contudo, o raciocínio é feito por contagem e soma, não por integrais. Isso torna a inferência exata viável para redes de tamanho moderado. Variáveis discretas são naturais em diagnósticos, classificação e sistemas especialistas. Elas também são mais fáceis de interpretar por seres humanos não-técnicos.

Características fundamentais

Essas redes possuem três características marcantes que as distinguem. Primeiro, as CPTs são matrizes de probabilidade que somam 1 para cada linha. Segundo, a independência condicional é testada por testes qui-quadrado ou mutual information. Terceiro, a inferência pode ser feita por eliminação de variáveis, que é exata. A aprendizagem de parâmetros é feita por máxima verossimilhança (contagens) ou suavização de Laplace. A suavização evita probabilidades zero para combinações não observadas nos dados. Além disso, a estrutura pode ser aprendida por busca gulosa usando BIC ou AIC. Redes discretas são amplamente suportadas por bibliotecas como pgmpy e bnlearn.

Vantagens e aplicações típicas

A principal vantagem é a simplicidade computacional e interpretabilidade. Elas são usadas em sistemas de suporte à decisão médica (ex.: diagnóstico de gripe x covid). Também são aplicadas em filtros de spam, sistemas de recomendação e mineração de dados. Outra vantagem é a facilidade de incorporar conhecimento de especialistas via CPTs. Contudo, o número de parâmetros cresce exponencialmente com o número de pais. Para lidar com isso, usa-se estruturas esparsas ou árvores de decisão nas CPTs.

O tratamento de variáveis discretas é mais antigo e consolidado na literatura. Modelos como o classificador Naive Bayes são um caso especial com um único nó pai. Redes mais complexas podem ter múltiplas camadas de dependência entre variáveis. A inferência por eliminação de variáveis elimina nós não observados por soma. Isso reduz o problema a consultas condicionais simples de ser calculadas. Para redes grandes (dezenas de nós), usa-se amostragem de Gibbs ou MCMC. A amostragem gera aproximações, mas é escalável e fácil de implementar. A suavização de Laplace adiciona pseudocontagens para evitar overfitting. Isso é especialmente importante quando os dados são escassos. Redes bayesianas discretas também podem modelar séries temporais com cadeias de Markov. Nesse caso, cada nó tem arestas do tempo t-1 para t. Elas são usadas em previsão de demanda e análise de séries climáticas. A estrutura pode ser visualizada como um diagrama de influência. Assim, redes discretas são uma ferramenta madura e amplamente aplicada.

Um exemplo clássico é o problema do “Carro Não Liga” com variáveis: Bateria (B), Gasolina (G), Partida (P), e Motor (M). Todas são binárias (boa/ruim, cheia/vazia, etc.). A rede calcula a probabilidade de cada causa dado que o motor não liga. Isso auxilia o mecânico a diagnosticar a falha de forma estruturada.


Enunciado do exemplo clássico

Implemente uma rede bayesiana discreta para o diagnóstico de um motor de carro. Variáveis: Bateria (B: 0=ruim, 1=boa), Gasolina (G: 0=vazia, 1=cheia), Partida (P: 0=não funciona, 1=funciona), Motor (M: 0=não liga, 1=liga). Relações: B e G influenciam P; P influencia M. Defina CPTs manualmente com valores razoáveis. Calcule P(B=0 | M=0) e P(G=0 | M=0) usando inferência exata. Plote a rede graficamente e uma barra com as probabilidades posteriores.

Este código implementa uma rede discreta com inferência por enumeração. A estrutura do grafo mostra a relação causal entre bateria, gasolina, partida e motor. As barras de probabilidade revelam que a bateria ruim é a causa mais provável. A gasolina vazia tem uma probabilidade menor, mas ainda significativa. Para iniciantes, este exemplo demonstra o poder diagnóstico das redes discretas. Elas são, portanto, ferramentas essenciais para sistemas baseados em regras.

Deixe um comentário