1.1.2.6 – Redes Neurais – Hibridas/Especificas
1.1.2.6.3 – Capsule Networks
preservando hierarquias espaciais
Capsule Networks foram propostas por Geoffrey Hinton como alternativa às CNNs tradicionais. Diferente de CNNs, elas preservam relações espaciais entre partes e objetos na imagem. Primeiramente, cápsulas são grupos de neurônios que representam diferentes propriedades de uma entidade. Além disso, cada cápsula ativa quando detecta sua entidade com certas propriedades. Por exemplo, uma cápsula de rosto pode ativar com orientação e tamanho específicos. Essa abordagem captura hierarquias que CNNs perdem com pooling.
routing por acordo entre cápsulas
O mecanismo de routing por acordo conecta cápsulas em diferentes camadas hierárquicas. Primeiramente, cápsulas de nível inferior enviam previsões para cápsulas de nível superior. Além disso, a conexão se fortalece quando as previsões concordam com a ativação da cápsula superior. Esse processo dinâmico substitui o pooling tradicional das redes convolucionais. Por exemplo, cápsulas de olho e boca podem ativar uma cápsula de rosto. O routing por acordo preserva relações espaciais e estruturais importantes. É a principal inovação das Capsule Networks.
vantagens e desafios atuais
Capsule Networks oferecem vantagens como invariança a transformações e melhor interpretabilidade. Primeiramente, elas reconhecem objetos mesmo com variações de pose e perspectiva. Além disso, exigem menos dados de treinamento que CNNs tradicionais. Por exemplo, podem aprender com conjuntos de dados menores mantendo boa generalização. No entanto, o treinamento é computacionalmente mais caro que CNNs padrão. A complexidade do routing dinâmico limita a escalabilidade para imagens grandes. Para iniciantes, Capsule Networks mostram como preservar estrutura espacial em deep learning. Representam uma direção promissora para além das arquiteturas convolucionais tradicionais.