Inferência Bayesiana - Área de Trampo

O que é inferência bayesiana?

Inferência bayesiana é o processo de atualizar crenças sobre parâmetros ou hipóteses com base em dados observados. Ela usa o teorema de Bayes como regra fundamental de atualização: P(θ|D) ∝ P(D|θ) * P(θ). Aqui, P(θ) é a crença prévia (prior) antes de ver os dados. P(D|θ) é a verossimilhança, que mede quão prováveis são os dados dado θ. O resultado P(θ|D) é a distribuição a posteriori, que combina prior e dados. Diferentemente da estatística frequentista, ela trata θ como uma variável aleatória. Isso permite quantificar a incerteza diretamente em intervalos de credibilidade. A inferência bayesiana é sequencial: a posterior de hoje é o prior de amanhã. Portanto, ela é naturalmente adaptativa e robusta a amostras pequenas.

Características fundamentais

A inferência bayesiana possui três pilares conceituais que a definem. Primeiro, a escolha do prior é subjetiva, mas pode ser não-informativa (uniforme). Segundo, a verossimilhança encapsula o modelo gerador dos dados observados. Terceiro, a posteriori é atualizada pela regra de Bayes quando novos dados chegam. A inferência exata é possível para modelos conjugados (prior e verossimilhança compatíveis). Para modelos complexos, usam-se métodos aproximados como MCMC ou variational inference. A inferência bayesiana também fornece predições através da distribuição preditiva. Ela integra a incerteza dos parâmetros ao fazer previsões para novos dados.

Vantagens e aplicações típicas

A principal vantagem é a quantificação completa da incerteza em todas as estimativas. Isso é crucial em áreas como medicina, finanças e engenharia de segurança. Além disso, ela permite incorporar conhecimento especialista através do prior. Ela é usada em aprendizado de máquina (regressão bayesiana, redes bayesianas). Também é aplicada em testes A/B, controle de qualidade e otimização bayesiana. Contudo, a escolha do prior pode ser controversa e influenciar os resultados.

A inferência bayesiana é uma das bases da estatística moderna e da IA. Ela contrasta com a abordagem frequentista, que usa apenas a verossimilhança. Na prática, a posteriori é frequentemente resumida por sua média e desvio-padrão. Intervalos de credibilidade de 95% são análogos aos intervalos de confiança, mas mais intuitivos. A inferência preditiva calcula P(D_novo | D) = ∫ P(D_novo | θ) P(θ|D) dθ. Isso naturalmente penaliza modelos complexos (princípio da navalha de Occam). A inferência bayesiana também lida com dados faltantes por imputação probabilística. Métodos de Monte Carlo via cadeias de Markov (MCMC) são amplamente usados. Eles amostram da posteriori sem precisar de formas analíticas fechadas. Bibliotecas como PyMC3 e Stan automatizam esse processo para usuários. A inferência variacional é uma alternativa mais rápida para grandes conjuntos. Ela aproxima a posteriori por uma família paramétrica simples (ex.: normal). A escolha do método depende do tamanho dos dados e da complexidade do modelo. Assim, a inferência bayesiana é flexível, poderosa e cada vez mais acessível.

Um exemplo clássico é estimar a probabilidade de uma moeda dar cara. Antes de jogar, acreditamos que a moeda é justa (prior Beta(1,1) uniforme). Jogamos 10 vezes e observamos 7 caras. A verossimilhança é binomial. A posteriori é Beta(1+7, 1+3) = Beta(8,4), com média 8/12 = 0.667. Esse exemplo ilustra como a crença é atualizada com dados observados.

Enunciado do exemplo clássico

Implemente a inferência bayesiana para estimar a taxa de conversão de um site. Prior: Beta(1,1) (uniforme). Dados: 50 visitantes, 15 conversões. Calcule a posteriori Beta(1+15, 1+35) e plote-a. Calcule a probabilidade de que a taxa de conversão seja > 0.25. Plote também a verossimilhança e o prior no mesmo gráfico para comparação. Use a biblioteca scipy.stats para as distribuições Beta.

import numpy as np  
import matplotlib.pyplot as plt  
from scipy.stats import beta  

# Dados  
n_visitas = 50  
n_conversoes = 15  
# Prior: Beta(1,1) -> uniforme em [0,1]  
alpha_prior = 1  
beta_prior = 1  

# Posterior: Beta(alpha_prior + conversoes, beta_prior + n_visitas - conversoes)  
alpha_post = alpha_prior + n_conversoes  
beta_post = beta_prior + n_visitas - n_conversoes  

# Gerar valores de taxa de conversão (0 a 1)  
x = np.linspace(0, 1, 500)  

# Calcular densidades  
prior_pdf = beta.pdf(x, alpha_prior, beta_prior)  
likelihood = beta.pdf(x, n_conversoes + 1, n_visitas - n_conversoes + 1)  # verossimilhança normalizada (Beta)  
posterior_pdf = beta.pdf(x, alpha_post, beta_post)  

# Calcular P(taxa > 0.25) a posteriori  
prob_maior_25 = 1 - beta.cdf(0.25, alpha_post, beta_post)  
print(f"Probabilidade (taxa > 0.25) = {prob_maior_25:.4f}")  

# Média e intervalo de credibilidade de 95%  
media = alpha_post / (alpha_post + beta_post)  
ic_inf, ic_sup = beta.ppf(0.025, alpha_post, beta_post), beta.ppf(0.975, alpha_post, beta_post)  
print(f"Média posterior: {media:.4f}")  
print(f"IC 95%: [{ic_inf:.4f}, {ic_sup:.4f}]")  

# Plotar  
plt.figure(figsize=(12, 5))  

plt.subplot(1, 2, 1)  
plt.plot(x, prior_pdf, 'g--', linewidth=2, label='Prior Beta(1,1)')  
plt.plot(x, likelihood, 'y--', linewidth=2, label='Verossimilhança (normalizada)')  
plt.plot(x, posterior_pdf, 'b-', linewidth=3, label='Posterior Beta(16,36)')  
plt.fill_between(x, 0, posterior_pdf, where=(x > 0.25), color='red', alpha=0.3, label='P(taxa>0.25)')  
plt.axvline(0.25, color='red', linestyle=':', label='Limiar 0.25')  
plt.xlabel('Taxa de conversão')  
plt.ylabel('Densidade de probabilidade')  
plt.title('Inferência Bayesiana - Taxa de Conversão')  
plt.legend()  
plt.grid(True)  

plt.subplot(1, 2, 2)  
# Mostrar resumo numérico  
texto = (f"Dados: {n_conversoes} conversões em {n_visitas} visitas\n"  
         f"Prior: Beta(1,1)\n"  
         f"Posterior: Beta({alpha_post}, {beta_post})\n"  
         f"Média: {media:.4f}\n"  
         f"IC 95%: [{ic_inf:.3f}, {ic_sup:.3f}]\n"  
         f"P(taxa > 0.25) = {prob_maior_25:.3f}")  
plt.text(0.1, 0.5, texto, fontsize=14, family='monospace',  
         bbox=dict(facecolor='lightyellow', alpha=0.9))  
plt.axis('off')  
plt.title('Resumo da Inferência')  

plt.tight_layout()  
plt.show()

import numpy as np

import matplotlib.pyplot as plt

from scipy.stats import beta

# Dados

n_visitas = 50

n_conversoes = 15

# Prior: Beta(1,1) -> uniforme em [0,1]

alpha_prior = 1

beta_prior = 1

# Posterior: Beta(alpha_prior + conversoes, beta_prior + n_visitas - conversoes)

alpha_post = alpha_prior + n_conversoes

beta_post = beta_prior + n_visitas - n_conversoes

# Gerar valores de taxa de conversão (0 a 1)

x = np.linspace(0, 1, 500)

# Calcular densidades

prior_pdf = beta.pdf(x, alpha_prior, beta_prior)

likelihood = beta.pdf(x, n_conversoes + 1, n_visitas - n_conversoes + 1) # verossimilhança normalizada (Beta)

posterior_pdf = beta.pdf(x, alpha_post, beta_post)

# Calcular P(taxa > 0.25) a posteriori

prob_maior_25 = 1 - beta.cdf(0.25, alpha_post, beta_post)

print(f"Probabilidade (taxa > 0.25) = {prob_maior_25:.4f}")

# Média e intervalo de credibilidade de 95%

media = alpha_post / (alpha_post + beta_post)

ic_inf, ic_sup = beta.ppf(0.025, alpha_post, beta_post), beta.ppf(0.975, alpha_post, beta_post)

print(f"Média posterior: {media:.4f}")

print(f"IC 95%: [{ic_inf:.4f}, {ic_sup:.4f}]")

# Plotar

plt.figure(figsize=(12, 5))

plt.subplot(1, 2, 1)

plt.plot(x, prior_pdf, 'g--', linewidth=2, label='Prior Beta(1,1)')

plt.plot(x, likelihood, 'y--', linewidth=2, label='Verossimilhança (normalizada)')

plt.plot(x, posterior_pdf, 'b-', linewidth=3, label='Posterior Beta(16,36)')

plt.fill_between(x, 0, posterior_pdf, where=(x > 0.25), color='red', alpha=0.3, label='P(taxa>0.25)')

plt.axvline(0.25, color='red', linestyle=':', label='Limiar 0.25')

plt.xlabel('Taxa de conversão')

plt.ylabel('Densidade de probabilidade')

plt.title('Inferência Bayesiana - Taxa de Conversão')

plt.legend()

plt.grid(True)

plt.subplot(1, 2, 2)

# Mostrar resumo numérico

texto = (f"Dados: {n_conversoes} conversões em {n_visitas} visitas\n"

f"Prior: Beta(1,1)\n"

f"Posterior: Beta({alpha_post}, {beta_post})\n"

f"Média: {media:.4f}\n"

f"IC 95%: [{ic_inf:.3f}, {ic_sup:.3f}]\n"

f"P(taxa > 0.25) = {prob_maior_25:.3f}")

plt.text(0.1, 0.5, texto, fontsize=14, family='monospace',

bbox=dict(facecolor='lightyellow', alpha=0.9))

plt.axis('off')

plt.title('Resumo da Inferência')

plt.tight_layout()

plt.show()

Este código demonstra a inferência bayesiana com prior conjugado Beta-Binomial. A posteriori combina o prior uniforme com a verossimilhança dos dados observados. A área sombreada em vermelho mostra a probabilidade de a taxa ser maior que 0.25. O intervalo de credibilidade fornece uma faixa plausível para a taxa real. Para iniciantes, este exemplo ilustra o poder da atualização de crenças. A inferência bayesiana é, portanto, uma ferramenta fundamental para decisão sob incerteza.

Indice

O que é inferência bayesiana?

Características fundamentais

Vantagens e aplicações típicas

Enunciado do exemplo clássico

Deixe um comentário Cancelar resposta