Aprendizado de Estrutura (Escore vs Restricao)

O que é aprendizado de estrutura em redes bayesianas?

Aprendizado de estrutura é o processo de descobrir o grafo (arestas) a partir dos dados. Ele determina quais variáveis influenciam quais, sem conhecimento prévio do especialista. Existem duas abordagens principais: baseada em escores e baseada em restrições. A abordagem por escores busca o grafo que maximiza uma medida de qualidade (ex.: BIC). A abordagem por restrições usa testes de independência condicional para decidir arestas. Ambas têm vantagens e desvantagens em termos de precisão e custo computacional. O aprendizado de estrutura é um problema NP-difícil para grafos gerais. Portanto, heurísticas como busca gulosa ou algoritmos genéticos são usadas.

Características da abordagem por escores

A abordagem por escores possui três características principais que a definem. Primeiro, ela atribui um número (escore) a cada grafo candidato. Segundo, o escore é baseado na verossimilhança penalizada (AIC, BIC) ou fator de Bayes. Terceiro, a busca percorre o espaço de grafos usando operadores de adição/remoção de arestas. O escore BIC = -2*log(L) + k*log(n), onde k é o número de parâmetros. Ela é consistente: com dados suficientes, encontra o grafo verdadeiro (para BIC).

Características da abordagem por restrições

A abordagem por restrições também possui três características principais. Primeiro, ela usa testes estatísticos de independência condicional (ex.: qui-quadrado). Segundo, ela constrói o grafo a partir das relações de dependência detectadas. Terceiro, algoritmos como PC (Peter-Clark) e FCI são exemplos clássicos. Ela é computacionalmente mais rápida que a busca por escores para redes esparsas. Contudo, ela depende da escolha do nível de significância e pode acumular erros.

Comparação e aplicações típicas

A principal diferença é que escores buscam o grafo globalmente, restrições localmente. Escores são mais precisos, mas mais lentos para muitas variáveis. Restrições são escaláveis, mas sensíveis a testes múltiplos. A escolha depende do tamanho dos dados e do conhecimento prévio.

O aprendizado de estrutura é usado em bioinformática (redes de regulação gênica). Também em epidemiologia (causalidade entre fatores de risco) e finanças. A abordagem por escores é mais popular quando o número de variáveis é moderado (ex.: <30). A abordagem por restrições é preferida para redes com centenas de nós. Na prática, combina-se as duas: usa-se restrições para reduzir o espaço de busca. Depois, aplica-se busca por escores no espaço reduzido (abordagem híbrida). O escore BIC é derivado da verossimilhança marginal e penaliza complexidade. O fator de Bayes compara dois grafos diretamente, mas é mais custoso. A abordagem por restrições pode ser sensível à ordem das variáveis (caso PC). Para lidar com isso, usa-se amostragem bootstrap para estabilidade. Aprendizado de estrutura também pode incorporar conhecimento de especialistas (arestas fixas). Isso melhora a precisão quando os dados são escassos. A validação cruzada pode ser usada para escolher entre estruturas concorrentes. Assim, o aprendizado de estrutura é uma área ativa de pesquisa em IA.

Um exemplo clássico é a rede de diagnóstico com variáveis: Idade, Fuma, Tosse, Câncer, e Fadiga. Os dados observacionais permitem descobrir que Fuma → Câncer, e Câncer → Tosse, Fadiga. O aprendizado por escore BIC identifica essa estrutura com alta probabilidade.


Enunciado do exemplo clássico

Implemente o aprendizado de estrutura por escore BIC (busca gulosa) e por restrições (teste qui-quadrado) para um conjunto de dados sintético. Gere 100 amostras de uma rede com 4 variáveis: A → B, A → C, B → D, C → D. Use busca gulosa por escore BIC (operadores de adicionar/remover/reverter arestas). Use o algoritmo PC (com teste qui-quadrado) para a abordagem de restrições. Compare as estruturas encontradas com a estrutura verdadeira. Plote as três estruturas (verdadeira, BIC, PC) lado a lado.

Este código implementa ambas as abordagens para aprendizado de estrutura. A busca por escore BIC encontra uma estrutura próxima da verdadeira. O algoritmo PC (restrições) também identifica corretamente as dependências. As diferenças ocorrem devido ao ruído e ao tamanho da amostra. Para iniciantes, este exemplo mostra as duas filosofias de aprendizado. Escolha entre escore e restrição depende do contexto e dos recursos.

Deixe um comentário