Extração de Características (Feature Extraction)

1.1.2.4 – Redes Neurais – Visao Computacional
1.1.2.4.1 – Extração de Caracteristicas (Feature Extraction)
1.1.2.4.1.1 – Descritores Manuais (Engineered Features)
1.1.2.4.1.2 – Aprendizado de Caracteristicas (Feature Learning)
LEGENDA
Principal
Ramo
Metodo
Problemas
Modelo
Arquitetura

Após segmentar uma imagem, obtemos pixels brutos. Contudo, estes dados são difíceis de interpretar diretamente. Portanto, precisamos extrair características (features) deles. Este processo converte a imagem em números significativos. Consequentemente, um computador pode comparar e classificar objetos com facilidade. A extração de características é um passo intermediário crucial. Ela transforma dados visuais em informações acionáveis. Assim, máquinas conseguem “enxergar” padrões que humanos definem. Esta etapa geralmente antecede a classificação final.

descritores de borda e contorno (boundary descriptors)

As bordas definem a forma externa de um objeto na imagem. Descritores de contorno analisam exclusivamente esta estrutura periférica. O código em cadeia de Freeman é um método clássico. Ele codifica a direção entre pixels vizinhos sequencialmente. Esta técnica é útil para reconhecer silhuetas de objetos. Outro recurso poderoso são os descritores de Fourier. Eles transformam o contorno em frequências. Pode-se usar poucos coeficientes de Fourier para descrever uma forma. Isso é ideal para compressão de dados de borda. Por exemplo, ao reconhecer engrenagens em uma esteira, estes descritores são aplicados. Eles diferenciam uma engrenagem triangular de uma quadrada eficientemente.

descritores de região (region feature descriptors)

Diferente das bordas, os descritores de região analisam a área interna do objeto. A área e o perímetro são medidas básicas e muito úteis. A compacidade é calculada pelo perímetro ao quadrado sobre a área. Uma circunferência possui o menor valor de compacidade. A excentricidade mede o quanto a região alonga-se. Círculos têm excentricidade zero, enquanto elipses longas aproximam-se de um. Essas métricas são invariantes à rotação e translação. Portanto, elas são excelentes para reconhecer formas independente da posição. A textura também é uma característica fundamental de regiões. Matrizes de co-ocorrência de níveis de cinza (GLCM) quantificam a textura. Elas analisam como pares de pixels se organizam espacialmente.

pontos de interesse e descritores locais (keypoints)

Em vez de analisar a forma total, focamos em pontos únicos da imagem. Cantos e bordas proeminentes são exemplos de pontos de interesse. O detector Harris-Stephens é famoso por identificar cantos. Ele encontra regiões onde a intensidade muda drasticamente em todas as direções. Após detectar o ponto, precisamos descrever sua vizinhança. O SIFT (Scale-Invariant Feature Transform) é o padrão para isso. Ele gera vetores de 128 dimensões para cada ponto chave. Estes descritores são invariantes à escala e à rotação. Consequentemente, eles são usados para casamento de imagens (matching). Por exemplo, para costurar várias fotos em um panorama, usa-se o SIFT. Ele encontra os mesmos pontos em ângulos diferentes da cena.

`

Deixe um comentário