VAEs (Variational Autoencoders) aprendem representações latentes probabilísticas e contínuas dos dados. Diferente de autoencoders tradicionais, eles mapeiam entradas para distribuições em vez de pontos fixos. Primeiramente, o codificador produz média e variância de uma distribuição gaussiana. Além disso, o decodificador reconstrói amostras a partir dessa distribuição. Por exemplo, gerar novos dígitos variando estilo e espessura suavemente.
reparametrização e amostragem
O truque de reparametrização permite backpropagation através da amostragem. Primeiramente, amostra ruído ε ~ N(0,1) e transforma z = μ + σ * ε. Além disso, isso mantém o gradiente determinístico enquanto permite estocasticidade. Por exemplo, gera variações contínuas no espaço latente.
espaço latente estruturado
VAEs organizam o espaço latente de forma suave e interpretável. Primeiramente, pontos próximos no espaço latente geram dados semanticamente similares. Além disso, permite interpolação significativa entre diferentes exemplos. Por exemplo, transição suave entre dígitos 3 e 8. É uma propriedade única dos VAEs.
aplicações e características
VAEs são ideais para geração controlada e representações interpretáveis. Primeiramente, usados para geração de imagens, música e moléculas. Além disso, aprendem representações para downstream tasks. Por exemplo, gerar novas estruturas químicas com propriedades desejadas. Para iniciantes, VAEs mostram representações probabilísticas e estruturadas. É uma arquitetura elegante e poderosa.