1.3 – Semi Supervisionado
1.3.1 – Propagacao de Rotulos
1.3.1.1 – Label Propagation, Label Spreading
espalhando conhecimento pela similaridade
Propagação de rótulos é uma técnica que espalha rótulos de exemplos conhecidos para vizinhos similares. Diferente de métodos tradicionais, ela assume que exemplos próximos no espaço tendem a ter mesmos rótulos. Primeiramente, constrói-se um grafo onde nós são exemplos e arestas representam similaridades. Além disso, os poucos exemplos rotulados funcionam como fontes de informação. Por exemplo, propagar categorias de imagens com base em similaridade visual. O processo itera até que todos os nós recebam rótulos consistentes.
algoritmo de propagação por grafos
O algoritmo constrói uma matriz de afinidade baseada em distâncias entre todos os exemplos. Primeiramente, cria-se um grafo completo ou com k-vizinhos mais próximos. Além disso, as arestas recebem pesos baseados em similaridade (ex: kernel gaussiano). Os rótulos propagam-se iterativamente através das arestas ponderadas. Por exemplo, um ponto rotulado como “gato” influencia fortemente seus vizinhos mais similares. O processo converge para uma distribuição suave de rótulos. É eficaz quando a estrutura de similaridade é significativa.
vantagens e aplicações práticas
Propagação de rótulos é especialmente útil quando classes formam clusters naturais. Primeiramente, requer poucos exemplos rotulados para propagar para grandes conjuntos. Além disso, captura estruturas de dados complexas não lineares. Por exemplo, classificar documentos textuais com base em similaridade semântica. Reconhecimento de imagens pode propagar rótulos por similaridade visual. É sensível à escolha da métrica de similaridade e parâmetros. Para iniciantes, mostra como conhecimento se espalha por estruturas de similaridade. É uma abordagem elegante para aproveitar dados não rotulados.