AM Supervisionado – Página: 15

Categorias

detecção de bordas (edge detection)

Bordas ocorrem onde a intensidade da imagem muda abruptamente. O gradiente da imagem é a ferramenta matemática para detectá-las. O operador de Sobel é um método clássico e simples. Ele calcula a magnitude do gradiente em cada ponto. Contudo, imagens ruidosas exigem técnicas mais robustas. O detector de Canny é considerado um padrão ouro. Primeiro, ele suaviza a imagem com um filtro Gaussiano. Em seguida, calcula o gradiente e aplica supressão de não-máximos. Finalmente, ele usa limiarização com histerese para ligar bordas. Esta técnica é frequentemente empregada em sistemas de visão industrial. Por exemplo, para inspecionar componentes em uma linha de montagem.

limiarização (thresholding)

A limiarização converte uma imagem em níveis de cinza para binária. Escolhe-se um valor de limite (threshold) para separar objetos do fundo. O método de Otsu calcula este limite automaticamente. Ele maximiza a variância entre as classes de pixels. Esta abordagem funciona bem com histogramas bimodais. Um histograma com dois picos distintos é ideal. Quando a iluminação é não-uniforme, usa-se a limiarização adaptativa. O algoritmo calcula um limite diferente para cada região da imagem. Por exemplo, para ler a placa de um carro em sombra. A limiarização global falharia, mas a adaptativa teria sucesso.

crescimento de região e watershed

O crescimento de região começa com “sementes” (pixels iniciais). Pixels vizinhos similares são agregados a estas sementes iterativamente. A similaridade pode ser baseada em intensidade, cor ou textura. Esta técnica é útil quando os objetos são bem definidos. Por outro lado, o algoritmo watershed (divisor de águas) tem uma abordagem topográfica. Ele interpreta a imagem como um relevo tridimensional. A água “inunda” o relevo a partir dos mínimos locais. Barreiras são construídas onde águas de diferentes bacias se encontram. Estas barreiras formam as bordas dos segmentos. O watershed é excelente para separar objetos que se tocam. Por exemplo, para contar células em uma lâmina de microscopia.

Após segmentar uma imagem, obtemos pixels brutos. Contudo, estes dados são difíceis de interpretar diretamente. Portanto, precisamos extrair características (features) deles. Este processo converte a imagem em números significativos. Consequentemente, um computador pode comparar e classificar objetos com facilidade. A extração de características é um passo intermediário crucial. Ela transforma dados visuais em informações acionáveis. Assim, máquinas conseguem “enxergar” padrões que humanos definem. Esta etapa geralmente antecede a classificação final.

descritores de borda e contorno (boundary descriptors)

As bordas definem a forma externa de um objeto na imagem. Descritores de contorno analisam exclusivamente esta estrutura periférica. O código em cadeia de Freeman é um método clássico. Ele codifica a direção entre pixels vizinhos sequencialmente. Esta técnica é útil para reconhecer silhuetas de objetos. Outro recurso poderoso são os descritores de Fourier. Eles transformam o contorno em frequências. Pode-se usar poucos coeficientes de Fourier para descrever uma forma. Isso é ideal para compressão de dados de borda. Por exemplo, ao reconhecer engrenagens em uma esteira, estes descritores são aplicados. Eles diferenciam uma engrenagem triangular de uma quadrada eficientemente.

descritores de região (region feature descriptors)

Diferente das bordas, os descritores de região analisam a área interna do objeto. A área e o perímetro são medidas básicas e muito úteis. A compacidade é calculada pelo perímetro ao quadrado sobre a área. Uma circunferência possui o menor valor de compacidade. A excentricidade mede o quanto a região alonga-se. Círculos têm excentricidade zero, enquanto elipses longas aproximam-se de um. Essas métricas são invariantes à rotação e translação. Portanto, elas são excelentes para reconhecer formas independente da posição. A textura também é uma característica fundamental de regiões. Matrizes de co-ocorrência de níveis de cinza (GLCM) quantificam a textura. Elas analisam como pares de pixels se organizam espacialmente.

pontos de interesse e descritores locais (keypoints)

Em vez de analisar a forma total, focamos em pontos únicos da imagem. Cantos e bordas proeminentes são exemplos de pontos de interesse. O detector Harris-Stephens é famoso por identificar cantos. Ele encontra regiões onde a intensidade muda drasticamente em todas as direções. Após detectar o ponto, precisamos descrever sua vizinhança. O SIFT (Scale-Invariant Feature Transform) é o padrão para isso. Ele gera vetores de 128 dimensões para cada ponto chave. Estes descritores são invariantes à escala e à rotação. Consequentemente, eles são usados para casamento de imagens (matching). Por exemplo, para costurar várias fotos em um panorama, usa-se o SIFT. Ele encontra os mesmos pontos em ângulos diferentes da cena.

Segmentação de Imagens