1 – Aprendizado de Maquina
1.3 – Semi Supervisionado
1.3.1 – Propagacao de Rotulos
1.3.3 – Semi Supervisionado apos fine-tuning
o melhor dos dois mundos
Aprendizado semi-supervisionado combina dados rotulados (poucos) com dados não rotulados (muitos). Diferente do supervisionado, ele aproveita grandes volumes de dados não anotados disponíveis. Primeiramente, os poucos exemplos rotulados fornecem direção inicial para o modelo. Além disso, os dados não rotulados ajudam a entender a estrutura subjacente do problema. Por exemplo, classificar imagens com apenas 100 exemplos rotulados e 10.000 não rotulados. Essa abordagem reduz custos de rotulagem mantendo boa precisão. É ideal para cenários onde rotular é caro ou demorado.
principais técnicas e abordagens
Diversas técnicas aproveitam dados não rotulados de maneiras complementares no treinamento. Primeiramente, pseudo-rotulagem usa modelo treinado para gerar rótulos para dados não rotulados. Além disso, consistência regularização incentiva que variações leves produzam saídas similares. Aprendizado auto-supervisionado cria tarefas auxiliares para extrair conhecimento de dados não rotulados. Por exemplo, prever rotações de imagens para aprender características visuais. Métodos baseados em grafos propagam rótulos através de similaridades entre exemplos. Essas técnicas aproveitam o melhor de ambos os mundos.
aplicações práticas no mundo real
Aprendizado semi-supervisionado é amplamente usado onde dados rotulados são escassos. Primeiramente, na medicina, poucos exames rotulados por especialistas, muitos disponíveis não rotulados. Além disso, processamento de linguagem natural aproveita vasto texto não anotado. Visão computacional usa grandes bases de imagens com poucas anotações manuais. Por exemplo, classificar espécies animais com especialistas rotulando apenas uma pequena amostra. Detecção de fraudes combina transações conhecidas com padrões de comportamento não rotulados. Para iniciantes, semi-supervisionado mostra como maximizar recursos quando rótulos são limitados. É uma abordagem prática e eficiente para muitos problemas reais.