Redes Bayesianas

O que são redes bayesianas?

Redes bayesianas são modelos gráficos probabilísticos que representam relações de dependência entre variáveis. Cada nó é uma variável aleatória, e cada aresta direcionada indica influência causal ou condicional. A estrutura é um grafo acíclico direcionado (DAG), que proíbe ciclos de dependência. Cada nó possui uma tabela de probabilidade condicional (CPT) dado seus pais. A rede codifica a distribuição conjunta de todas as variáveis de forma fatorada. Isso reduz drasticamente o número de parâmetros necessários para modelar sistemas complexos. Por exemplo, com 10 variáveis binárias, a tabela conjunta teria 2^10 = 1024 valores. Com uma rede esparsa, esse número cai para poucas dezenas. Portanto, redes bayesianas são eficientes e interpretáveis para inferência sob incerteza.

Características fundamentais

As redes bayesianas possuem três características principais que as definem. Primeiro, elas são baseadas no teorema de Bayes para atualização de crenças. Segundo, a independência condicional é codificada pela estrutura do grafo. Dado seus pais, cada nó é independente de todos os seus não-descendentes. Terceiro, a inferência pode ser exata (por eliminação de variáveis) ou aproximada (MCMC). Elas também permitem aprendizado estrutural (descobrir o grafo) e paramétrico (estimar CPTs). Além disso, lidam naturalmente com dados faltantes usando expectativa-maximização. Redes bayesianas são robustas a overfitting quando prioris são usados.

Vantagens e aplicações típicas

A principal vantagem é a capacidade de raciocínio causal e diagnóstico. Elas são usadas em sistemas de suporte à decisão médica (ex.: diagnóstico de doenças). Também são aplicadas em detecção de falhas, mineração de dados e bioinformática. Outra vantagem é a transparência: cada aresta tem uma interpretação clara. Contudo, aprender a estrutura ótima é um problema NP-difícil em geral. Ainda assim, heurísticas como busca gulosa ou algoritmos genéticos são usadas.

A construção de uma rede bayesiana começa com a definição das variáveis relevantes. Em seguida, o especialista ou algoritmo define as arestas baseadas em dependências. Cada nó tem uma CPT que especifica P(nó | pais) para todas as combinações. A distribuição conjunta é o produto de todas as CPTs: P(X₁,…,Xₙ) = ∏ P(Xᵢ | pais). A inferência responde a perguntas como: qual a probabilidade de doença dado um sintoma? Isso é feito por propagação de crenças em redes com estrutura de árvore. Para redes gerais, usa-se o algoritmo de eliminação de variáveis ou amostragem. A amostragem de Gibbs é comum para aproximações quando o grafo é grande. Redes bayesianas dinâmicas estendem o modelo para séries temporais. Elas incluem arestas entre estados consecutivos, como em filtros de Kalman. Aprendizado de estrutura busca o DAG que melhor explica os dados observados. Medidas como BIC (Bayesian Information Criterion) ou AIC são usadas. A busca é feita por operadores de adição, remoção ou inversão de arestas. Assim, redes bayesianas são ferramentas versáteis para modelagem probabilística.

Um exemplo clássico é a rede de diagnóstico de pneumonia com variáveis: Febre, Tosse, Raio-X, e Doença. A febre e a tosse são sintomas que podem ser causados pela pneumonia. O raio-X é um teste que também depende da doença. A rede permite calcular P(Pneumonia | Febre=True, Tosse=True, Raio-X=Anormal).


Enunciado do exemplo clássico

Implemente uma rede bayesiana para o problema “Chuva” e “Gramado Molhado”. Variáveis: Chuva (R), Irrigação (I), Gramado Molhado (G), e Tempo Nublado (N). Relações: N influencia R; R e I influenciam G (cada um independente). Defina probabilidades condicionais manualmente. Calcule P(G | R=True) e P(R | G=True, I=False) usando inferência exata. Plote a estrutura da rede (grafo) e uma tabela com as probabilidades solicitadas.

Este código implementa uma rede bayesiana manual com inferência por enumeração. A estrutura do grafo mostra as dependências causais entre as variáveis. Os resultados da inferência respondem perguntas condicionais diretamente. A enumeração é exata para redes pequenas, mas escala mal para muitas variáveis. Para iniciantes, este exemplo demonstra a mecânica fundamental das redes bayesianas. Elas são, portanto, uma ferramenta poderosa e didática para raciocínio probabilístico.

Deixe um comentário