Teoria da Decisao Bayesiana

O que é a teoria da decisão bayesiana?

A teoria da decisão bayesiana é um arcabouço matemático para tomar decisões sob incerteza. Ela combina probabilidades (crenças) com custos ou utilidades associados a cada ação. A decisão ótima minimiza o risco esperado, ou maximiza a utilidade esperada. O risco é calculado integrando a perda sobre a distribuição a posteriori dos parâmetros. Diferentemente da abordagem frequentista, ela incorpora conhecimento prévio (prior). A decisão é adaptativa: novos dados atualizam a posteriori e a escolha ótima. Ela é usada em diagnósticos, controle, economia e aprendizado de máquina. A teoria formaliza o princípio de que “a melhor ação depende do que sabemos”. Portanto, ela une estatística, otimização e teoria dos jogos.

Componentes fundamentais da decisão bayesiana

A teoria possui três elementos principais que a estruturam. Primeiro, o espaço de estados (parâmetros ou classes) com distribuição a priori. Segundo, o espaço de ações disponíveis para o decisor. Terceiro, uma função de perda L(θ, a) que mede o custo de tomar ação a quando o estado é θ. A decisão bayesiana escolhe a ação que minimiza o risco posterior: R(a|x) = E[L(θ,a) | x]. Para perda quadrática, a decisão é a média da posteriori. Para perda 0-1 (classificação), a decisão é a moda (MAP).

Vantagens e aplicações típicas

A principal vantagem é a flexibilidade para incorporar custos assimétricos. Ela é usada em diagnósticos médicos (falso negativo tem custo alto). Também em finanças (perda vs. ganho) e em sistemas de recomendação. Contudo, a especificação da função de perda é subjetiva e desafiadora.

A teoria da decisão bayesiana é a base do aprendizado supervisionado probabilístico. No contexto de classificação, a perda 0-1 leva ao classificador MAP. Se a perda for assimétrica, define-se uma matriz de custos. Por exemplo, em detecção de fraudes, o custo de não detectar é muito maior. A decisão ótima pode escolher a classe com menor custo esperado, não a mais provável. A regra de decisão de Bayes minimiza o erro esperado em média. Ela também pode ser usada para seleção de modelos (fator de Bayes). Em problemas de estimação, a perda quadrática produz a média a posteriori. A perda absoluta produz a mediana da posteriori. A teoria também trata de decisões sequenciais com múltiplos estágios. Nesse caso, usa-se programação dinâmica ou processos de decisão de Markov (POMDP). A função de utilidade pode ser não-linear, representando aversão ao risco. A teoria é frequentemente contrastada com a abordagem minimax (pior caso). Assim, a decisão bayesiana é uma ferramenta poderosa e flexível para escolhas racionais.

Um exemplo clássico é o problema do diagnóstico de uma doença rara. A priori: P(doente) = 0.01. Teste com sensibilidade 95% e especificidade 90%. Custos: falso negativo (não tratar doente) = 100, falso positivo (tratar saudável) = 1. A decisão bayesiana calcula o custo esperado de tratar ou não tratar, dado o teste positivo.


Enunciado do exemplo clássico

Implemente a decisão bayesiana para um problema de diagnóstico com custos assimétricos. Prior: P(doente) = 0.02. Teste binário com sensibilidade P(pos|doente)=0.90 e especificidade P(neg|saudável)=0.85. Matriz de custos: C(tratar | saudável) = 10, C(não tratar | doente) = 100, C(tratar | doente) = 0, C(não tratar | saudável) = 0. Calcule o risco esperado de cada ação (tratar vs não tratar) para um resultado positivo e negativo. Plote os riscos como função da probabilidade a priori de doença.

Este código implementa a decisão bayesiana com custos assimétricos. O risco de tratar ou não tratar é calculado para cada resultado do teste. O gráfico mostra como os riscos variam com a probabilidade a priori. A decisão ótima muda conforme a prior e os custos relativos. Para iniciantes, este exemplo conecta probabilidade à tomada de decisão. A teoria da decisão bayesiana é, portanto, essencial para escolhas racionais sob incerteza.

Deixe um comentário