1.3 – Semi Supervisionado
1.3.1 – Propagacao de Rotulos
1.3.1.1 – Label Propagation, Label Spreading
label propagation: propagação rígida
Label Propagation é o método clássico que propaga rótulos mantendo fixos os exemplos rotulados. Primeiramente, constrói-se um grafo de similaridade entre todos os exemplos. Além disso, os rótulos se propagam iterativamente através das arestas ponderadas. Os nós rotulados permanecem inalterados durante todo o processo. Por exemplo, categorizar documentos onde poucos tópicos são conhecidos inicialmente. A matriz de transição define como os rótulos se espalham. Converge para uma atribuição final estável.
label spreading: maior flexibilidade
Label Spreading é uma variação que permite alguma flexibilidade nos rótulos iniciais. Diferente do Label Propagation, ele permite que exemplos rotulados possam mudar. Primeiramente, utiliza uma matriz de similaridade com normalização por grau. Além disso, introduz um parâmetro α que controla quanto os rótulos iniciais influenciam. Por exemplo, corrigir possíveis erros nos dados de treinamento rotulados. É mais robusto a ruído e outliers nos dados. Oferece maior flexibilidade para problemas realistas.
escolha do método adequado
A escolha entre os métodos depende da confiança nos rótulos iniciais disponíveis. Primeiramente, Label Propagation é ideal quando os rótulos iniciais são muito confiáveis. Além disso, Label Spreading é preferido quando há possibilidade de ruído ou erros. O parâmetro α controla trade-off entre rótulos originais e propagação. Por exemplo, dados rotulados manualmente por especialistas favorecem Label Propagation. Dados com anotações menos confiáveis beneficiam-se do Label Spreading. Para iniciantes, ambos mostram como estruturas de grafos propagam conhecimento. São ferramentas essenciais para aprendizado semi-supervisionado.