criando dados sintéticos realistas
Geração de dados é uma área que cria novas amostras sintéticas a partir de dados existentes. Diferente de outros métodos, o objetivo é produzir dados novos que parecem autênticos. Primeiramente, o modelo aprende a distribuição subjacente dos dados originais. Além disso, ele amostra dessa distribuição para gerar novos exemplos. Por exemplo, criar rostos humanos que não existem na realidade. Essa técnica é fundamental para aumentar conjuntos de dados e privacidade.
variational autoencoders (vae)
VAEs combinam autoencoders com abordagem probabilística para geração de dados contínuos. Primeiramente, o codificador mapeia entradas para distribuições latentes, não pontos fixos. Além disso, o decodificador reconstrói amostras a partir dessas distribuições amostradas. Por exemplo, gerar imagens de dígitos manuscritos com variações controladas. Produzem dados coerentes e permitem interpolação suave entre exemplos. São amplamente usados para geração de imagens e representações.
generative adversarial networks (gan)
GANs introduzem um jogo competitivo entre gerador e discriminador para criar dados realistas. Primeiramente, o gerador cria amostras falsas a partir de ruído aleatório. Além disso, o discriminador tenta distinguir amostras reais das geradas. Por exemplo, gerar retratos humanos de pessoas que não existem. Esse treinamento adversário produz dados extremamente realistas e diversos. São estado da arte para geração de imagens, áudio e vídeo.
modelos autorregressivos e difusão
Modelos autorregressivos geram dados sequencialmente prevendo o próximo elemento passo a passo. Primeiramente, modelos como PixelCNN geram imagens pixel por pixel ordenadamente. Além disso, modelos de difusão adicionam ruído gradualmente e aprendem a reverter o processo. Por exemplo, gerar imagens de alta resolução com difusão (DALL-E, Stable Diffusion). Capturam distribuições complexas com alta qualidade de amostragem. São a base dos geradores modernos mais avançados. Para iniciantes, geração de dados mostra como IA pode criar conteúdo original. É uma área que combina criatividade com aprendizado estatístico.