Aprendizado Bayesiano

O que é aprendizado bayesiano?

Aprendizado bayesiano é o processo de atualizar crenças sobre parâmetros ou modelos usando dados observados. Ele combina conhecimento prévio (prior) com a verossimilhança dos dados para obter a distribuição a posteriori. Diferentemente do aprendizado frequencista, ele produz distribuições completas, não estimativas pontuais. O aprendizado é sequencial: a cada novo dado, a posteriori vira o novo prior. Isso permite adaptação contínua e online, sem necessidade de reprocessar todo o histórico. O aprendizado bayesiano também fornece medidas de incerteza (intervalos de credibilidade). Ele é usado em regressão, classificação, agrupamento e seleção de modelos. A abordagem é naturalmente regularizada, evitando overfitting em dados pequenos.

Características fundamentais do aprendizado bayesiano

O aprendizado bayesiano possui três características principais que o distinguem. Primeiro, ele trata todos os parâmetros como variáveis aleatórias com distribuições. Segundo, ele usa o teorema de Bayes como única regra de atualização. Terceiro, ele permite a comparação formal de modelos via fator de Bayes. O aprendizado é baseado em inferência, não em otimização de uma função de perda. Ele incorpora automaticamente o princípio da navalha de Occam (modelos mais simples têm prior maior).

Vantagens e aplicações típicas

A principal vantagem é a robustez a dados escassos e a incerteza quantificada. Ele é usado em medicina, finanças, climatologia e aprendizado de máquina. Também é aplicado em sistemas de recomendação e análise de sobrevivência. Contudo, o custo computacional pode ser alto para modelos complexos.

O aprendizado bayesiano é a base de métodos como regressão linear bayesiana e redes neurais bayesianas. Na regressão linear, a posteriori dos coeficientes é uma distribuição normal (com prior normal conjugado). A predição é feita integrando a incerteza dos coeficientes, resultando em intervalos de previsão. A seleção de modelos é feita por comparação de evidências (verossimilhança marginal). O fator de Bayes é a razão entre as evidências de dois modelos concorrentes. Ele penaliza modelos desnecessariamente complexos, evitando overfitting. O aprendizado bayesiano também é usado em otimização de hiperparâmetros (otimização bayesiana). A cada iteração, um modelo substituto (ex.: Gaussian Process) guia a busca. Em redes neurais, o aprendizado bayesiano (via MCMC ou variação) fornece incerteza nas previsões. Isso é crucial para sistemas de segurança críticos (ex.: veículos autônomos). O aprendizado bayesiano também permite aprendizado ativo: escolher quais dados rotular. A aquisição de dados é guiada pela redução esperada da incerteza. Ele também é usado em aprendizado por reforço para explorar com confiança. Assim, o aprendizado bayesiano é um paradigma flexível e poderoso para ciência de dados.

Um exemplo clássico é a regressão linear com dados de temperatura. Prior nos coeficientes é normal com média zero (regularização). Dados observados atualizam a posteriori, que prediz novas temperaturas com intervalo de credibilidade. O aprendizado bayesiano mostra como a incerteza diminui com mais dados.


Enunciado do exemplo clássico

Implemente a regressão linear bayesiana com prior normal conjugado para um conjunto sintético. Dados: y = 2*x + 1 + ruído N(0, 0.5) para x em [0, 5] com 30 pontos. Prior: coeficiente (inclinação) ~ N(0, 10), intercepto ~ N(0, 10). Calcule a distribuição a posteriori dos coeficientes e faça predições com intervalos de credibilidade. Plote os dados, a reta verdadeira, a predição média e a banda de 95% de credibilidade.

Este código implementa a regressão linear bayesiana com prior conjugado. A média a posteriori dos coeficientes se aproxima dos valores verdadeiros (1,2). A banda de 95% de credibilidade captura a incerteza tanto dos coeficientes quanto do ruído. O gráfico de dispersão dos coeficientes mostra a correlação entre intercepto e inclinação. Para iniciantes, este exemplo demonstra o aprendizado bayesiano prático. O aprendizado bayesiano é, portanto, uma ferramenta poderosa para modelagem preditiva.

Deixe um comentário