1.1.2.4 – Redes Neurais – Visao Computacional
1.1.2.4.4 – Arquiteturas CNN Profundas (Deep CNNs)
1.1.2.4.4.5 – GoogLeNet (Inception)
1.1.2.4.4.7 – Vision Transformer (ViT)
1.1.2.4.4.8 – Tecnicas de Treinamento
a primeira rede neural convolucional da história
LeNet-5 foi a primeira rede neural convolucional (CNN) bem-sucedida desenvolvida por Yann LeCun nos anos 1990. Ela revolucionou o reconhecimento de dígitos manuscritos para sistemas de cheques bancários. Primeiramente, a arquitetura introduziu conceitos fundamentais que se tornaram padrão até hoje. Além disso, ela demonstrou que redes neurais podiam aprender características automaticamente sem extração manual. O sucesso comercial da LeNet-5 provou o valor prático do deep learning. É considerada o marco zero das redes neurais convolucionais modernas.
arquitetura clássica do lenet-5
LeNet-5 possui uma arquitetura simples mas eficaz com sete camadas treináveis. Primeiramente, duas camadas convolucionais extraem características progressivamente mais complexas das imagens. Além disso, duas camadas de pooling reduzem a dimensionalidade espacial dos dados. Camadas totalmente conectadas processam as características para classificação final. A ativação usada era tanh, antes da popularização da ReLU moderna. Por exemplo, a rede recebia imagens de 32×32 pixels de dígitos manuscritos. A saída final com 10 neurônios representava os dígitos de 0 a 9.
inovações que marcaram época
LeNet-5 introduziu o compartilhamento de pesos através da operação de convolução. Primeiramente, isso reduziu drasticamente o número de parâmetros comparado a redes totalmente conectadas. Além disso, a rede aprendia filtros que detectavam bordas e curvas automaticamente. O uso de subsampling (pooling) garantia invariância a pequenas translações na imagem. Diferente de abordagens anteriores, não precisava de extração manual de características. Essas inovações permitiram que a rede generalizasse bem para novos exemplos. A arquitetura foi projetada especificamente para processar imagens 2D.
impacto comercial e legado
LeNet-5 foi implantada comercialmente pelo USPS e bancos para reconhecimento de cheques. Primeiramente, o sistema processava milhões de dígitos manuscritos com alta precisão. Além disso, demonstrou que redes neurais podiam substituir sistemas baseados em regras manuais. O sucesso comercial validou o investimento em pesquisa de redes neurais profundas. A arquitetura influenciou diretamente desenvolvimentos posteriores como AlexNet e ResNet. Seus conceitos fundamentais permanecem em todas as CNNs modernas. Para iniciantes, LeNet-5 é o ponto de partida essencial para entender visão computacional. Ela mostra como conceitos simples combinados geram resultados poderosos.