Inferencia Aproximada (MCMC, Gibbs Sampling)

O que é inferência aproximada (MCMC e Gibbs)?

Inferência aproximada por MCMC é uma técnica para amostrar de distribuições complexas sem fórmula fechada. MCMC significa Markov Chain Monte Carlo, que gera uma cadeia de amostras dependentes. A cadeia é construída para convergir para a distribuição alvo (posteriori). Gibbs sampling é um caso especial do MCMC onde cada variável é amostrada condicionalmente. A cada passo, atualiza-se uma variável por vez, usando as demais fixas. Isso é feito quando a distribuição condicional completa é conhecida. Diferentemente da inferência exata, MCMC é escalável para redes com muitas variáveis. Ele não sofre com explosão combinatória, mas produz amostras correlacionadas. Portanto, ele é amplamente usado em problemas de alta dimensão.

Características fundamentais do MCMC

O MCMC possui três características principais que o definem. Primeiro, ele é assintoticamente exato: converge para a verdadeira posteriori com muitas amostras. Segundo, as amostras iniciais (burn-in) são descartadas para eliminar o efeito do início. Terceiro, a autocorrelação entre amostras reduz a eficiência, exigindo thinning. A convergência é monitorada por diagnósticos como o fator de escala de Gelman-Rubin. O MCMC não requer conhecimento da constante de normalização da posteriori. Isso é uma grande vantagem sobre métodos analíticos.

Vantagens e aplicações típicas

A principal vantagem é a capacidade de lidar com modelos hierárquicos e não-lineares. Ele é usado em aprendizado de máquina, econometria e genética populacional. Também é aplicado em análise de imagens e processamento de sinais. Contudo, a convergência pode ser lenta e difícil de diagnosticar.

O algoritmo de Metropolis-Hastings é o MCMC mais geral. Ele propõe um novo estado a partir de uma distribuição de proposta. Aceita-se o novo estado com probabilidade dada pela razão de verossimilhanças. Gibbs sampling é mais eficiente quando as condicionais são fáceis de amostrar. Por exemplo, em modelos com prioris conjugados, as condicionais são distribuições conhecidas. A cadeia de Gibbs amostra cada variável sequencialmente, mantendo as outras fixas. Após um número suficiente de iterações, as amostras representam a posteriori. A média das amostras estima a esperança a posteriori. Intervalos de credibilidade são obtidos dos quantis empíricos das amostras. O MCMC pode ser implementado em bibliotecas como PyMC3 e Stan. Essas ferramentas automatizam a escolha do amostrador e diagnósticos. O usuário só precisa definir o modelo e os dados. A inferência aproximada é a espinha dorsal da estatística bayesiana moderna. Assim, o MCMC é uma ferramenta indispensável para problemas reais.

Um exemplo clássico é estimar a média e variância de uma distribuição normal com dados observados. A posteriori conjunta não tem forma simples, mas as condicionais são normais e gamma inversa. Gibbs sampling amostra média dado variância, e variância dado média, alternadamente. Após algumas milhares de iterações, as amostras convergem para a posteriori verdadeira.


Enunciado do exemplo clássico

Implemente Gibbs sampling para estimar os parâmetros (μ, σ²) de uma normal com dados sintéticos. Gerar 50 dados de N(μ=5, σ²=4). Use prioris: μ ~ N(0, 1000) e σ² ~ Inverse-Gamma(3, 2). As condicionais completas são: μ | dados, σ² ~ N( média ponderada, variância ) e σ² | dados, μ ~ Inverse-Gamma( α + n/2, β + 0.5*Σ(xᵢ-μ)² ). Execute 5000 iterações, descarte os primeiros 1000 (burn-in). Plote as cadeias e os histogramas das amostras para μ e σ².

Este código implementa Gibbs sampling com prioris conjugados. As cadeias mostram a convergência rápida para os valores reais. Os histogramas exibem as distribuições posteriores aproximadas. Os intervalos de credibilidade contêm os valores verdadeiros. Para iniciantes, este exemplo demonstra o poder do MCMC prático. A inferência aproximada é, portanto, essencial para modelos complexos.

Deixe um comentário