Label Propagation, Label Spreading

robô gigante

label propagation: propagação rígida

Label Propagation é o método clássico que propaga rótulos mantendo fixos os exemplos rotulados. Primeiramente, constrói-se um grafo de similaridade entre todos os exemplos. Além disso, os rótulos se propagam iterativamente através das arestas ponderadas. Os nós rotulados permanecem inalterados durante todo o processo. Por exemplo, categorizar documentos onde poucos tópicos são conhecidos inicialmente. A matriz de transição define como os rótulos se espalham. Converge para uma atribuição final estável.

label spreading: maior flexibilidade

Label Spreading é uma variação que permite alguma flexibilidade nos rótulos iniciais. Diferente do Label Propagation, ele permite que exemplos rotulados possam mudar. Primeiramente, utiliza uma matriz de similaridade com normalização por grau. Além disso, introduz um parâmetro α que controla quanto os rótulos iniciais influenciam. Por exemplo, corrigir possíveis erros nos dados de treinamento rotulados. É mais robusto a ruído e outliers nos dados. Oferece maior flexibilidade para problemas realistas.

escolha do método adequado

A escolha entre os métodos depende da confiança nos rótulos iniciais disponíveis. Primeiramente, Label Propagation é ideal quando os rótulos iniciais são muito confiáveis. Além disso, Label Spreading é preferido quando há possibilidade de ruído ou erros. O parâmetro α controla trade-off entre rótulos originais e propagação. Por exemplo, dados rotulados manualmente por especialistas favorecem Label Propagation. Dados com anotações menos confiáveis beneficiam-se do Label Spreading. Para iniciantes, ambos mostram como estruturas de grafos propagam conhecimento. São ferramentas essenciais para aprendizado semi-supervisionado.

Propagação de Rotulos

robô gigante

espalhando conhecimento pela similaridade

Propagação de rótulos é uma técnica que espalha rótulos de exemplos conhecidos para vizinhos similares. Diferente de métodos tradicionais, ela assume que exemplos próximos no espaço tendem a ter mesmos rótulos. Primeiramente, constrói-se um grafo onde nós são exemplos e arestas representam similaridades. Além disso, os poucos exemplos rotulados funcionam como fontes de informação. Por exemplo, propagar categorias de imagens com base em similaridade visual. O processo itera até que todos os nós recebam rótulos consistentes.

algoritmo de propagação por grafos

O algoritmo constrói uma matriz de afinidade baseada em distâncias entre todos os exemplos. Primeiramente, cria-se um grafo completo ou com k-vizinhos mais próximos. Além disso, as arestas recebem pesos baseados em similaridade (ex: kernel gaussiano). Os rótulos propagam-se iterativamente através das arestas ponderadas. Por exemplo, um ponto rotulado como “gato” influencia fortemente seus vizinhos mais similares. O processo converge para uma distribuição suave de rótulos. É eficaz quando a estrutura de similaridade é significativa.

vantagens e aplicações práticas

Propagação de rótulos é especialmente útil quando classes formam clusters naturais. Primeiramente, requer poucos exemplos rotulados para propagar para grandes conjuntos. Além disso, captura estruturas de dados complexas não lineares. Por exemplo, classificar documentos textuais com base em similaridade semântica. Reconhecimento de imagens pode propagar rótulos por similaridade visual. É sensível à escolha da métrica de similaridade e parâmetros. Para iniciantes, mostra como conhecimento se espalha por estruturas de similaridade. É uma abordagem elegante para aproveitar dados não rotulados.