Risco Bayesiano

O que é o risco bayesiano?

O risco bayesiano é o valor esperado da função de perda sob a distribuição a posteriori. Ele mede o custo médio de uma decisão, dado os dados observados e o conhecimento prévio. Matematicamente, R(a|x) = ∫ L(θ, a) * P(θ|x) dθ, onde a é a ação escolhida. A decisão ótima é aquela que minimiza esse risco esperado. O risco bayesiano é uma medida subjetiva, pois depende da perda e do prior. Ele é fundamental para comparar diferentes regras de decisão. Uma regra é chamada de “admissível” se não existe outra com risco menor para todo θ. O risco bayesiano mínimo é o valor da função de perda no ponto ótimo. Ele também é usado para avaliar a qualidade de estimadores pontuais.

Características fundamentais do risco bayesiano

O risco bayesiano possui três características principais que o definem. Primeiro, ele é um número escalar para cada ação possível. Segundo, ele integra a incerteza sobre o parâmetro θ. Terceiro, ele permite comparação direta entre ações concorrentes. A função de perda pode ser quadrática, absoluta, 0-1 ou assimétrica. Cada perda leva a um estimador diferente (média, mediana, moda, etc.). O risco bayesiano é frequentemente usado em problemas de estimação e classificação.

Vantagens e aplicações típicas

A principal vantagem é a incorporação de custos reais na tomada de decisão. Ele é usado em controle de qualidade, diagnóstico e planejamento financeiro. Também é aplicado em aprendizado por reforço e otimização de portfólio. Contudo, a escolha da função de perda pode ser arbitrária e influenciar o resultado.

O risco bayesiano é a base da teoria da decisão estatística. Para perda quadrática, o risco bayesiano é a variância a posteriori. Para perda 0-1, o risco é a probabilidade de erro de classificação. O estimador de Bayes (que minimiza o risco) é ótimo para a perda escolhida. O risco mínimo é chamado de “risco de Bayes” e é um limite inferior. Nenhum outro estimador pode ter risco médio menor (sob o mesmo prior). Isso é análogo ao erro de Bayes em classificação. O risco bayesiano pode ser calculado analiticamente para modelos conjugados. Para modelos complexos, usa-se MCMC para aproximar a integral. O risco também pode ser decomposto em viés² + variância (para perda quadrática). Essa decomposição ajuda a entender o compromisso entre viés e variância. Em problemas de decisão sequencial, o risco é acumulado ao longo do tempo. A programação dinâmica busca minimizar o risco total esperado. Assim, o risco bayesiano é um conceito unificador em estatística e aprendizado.

Um exemplo clássico é estimar a média μ de uma normal com prior normal. A perda quadrática leva à média a posteriori como estimador. O risco bayesiano desse estimador é a variância a posteriori. Quanto mais informativo o prior, menor o risco.


Enunciado do exemplo clássico

Implemente o cálculo do risco bayesiano para estimação da média de uma normal com prior normal. Dados: 10 observações de N(μ, σ²=4). Prior: μ ~ N(0, 1). Perda quadrática. Calcule a média a posteriori e o risco bayesiano (variância a posteriori) para uma amostra específica. Plote o risco como função do tamanho da amostra e como função do parâmetro de precisão do prior.

Este código calcula o risco bayesiano para estimação da média com perda quadrática. O risco é a variância a posteriori, que diminui com mais dados. Prior mais incerto (variância alta) aumenta o risco, pois confia menos no prior. O estimador bayesiano tem risco menor que o MLE quando o prior é informativo. Para perda 0-1, o risco é a probabilidade de erro na decisão. Para iniciantes, este exemplo mostra como o risco quantifica a qualidade da decisão. O risco bayesiano é, portanto, uma métrica fundamental em estatística decisória.

Deixe um comentário