Harris – Stephens Corner Detector

programador
1.1.2.4.1 – Extração de Caracteristicas (Feature Extraction)
1.1.2.4.1.1 – Descritores Manuais (Engineered Features)
1.1.2.4.1.1.3 – Harris-Stephens Corner Detector
LEGENDA
Principal
Ramo
Metodo
Problemas
Modelo
Arquitetura

O detector de cantos Harris-Stephens é uma técnica clássica em visão computacional. Harris e Stephens propuseram este método em 1988. Primeiramente, ele identifica pontos onde a intensidade muda em todas as direções. Uma pequena janela desliza sobre a imagem durante a análise. Em regiões planas, a janela não encontra variação significativa. Em bordas, por outro lado, a variação ocorre apenas em uma direção. Em cantos, no entanto, a variação é grande em todas as direções. Portanto, este comportamento caracteriza perfeitamente os cantos. Por exemplo, o detector localiza vértices de edifícios ou quadros. Consequentemente, ele é fundamental para muitas aplicações de visão.

fundamento matemático da matriz harris

Primeiramente, o algoritmo calcula os gradientes da imagem (Ix e Iy). Em seguida, ele constrói a matriz de estrutura (matriz Harris). Esta matriz M é definida localmente para cada pixel. Além disso, ela acumula os produtos dos gradientes na vizinhança. A matriz M possui dois autovalores (λ1 e λ2). Autovalores pequenos indicam uma região plana. Por outro lado, um autovalor grande e outro pequeno indicam uma borda. Dois autovalores grandes, por sua vez, indicam um canto. Portanto, a análise dos autovalores classifica cada ponto. Contudo, calcular autovalores explicitamente é computacionalmente caro. Por isso, o detector usa uma resposta aproximada.

medida de resposta e limiarização

Ao invés dos autovalores, o detector calcula uma medida R. Esta medida usa o determinante e o traço da matriz M. A fórmula é R = det(M) – k * traço(M)². A constante k é tipicamente 0.04 ou 0.06. Valores positivos grandes de R indicam cantos. Em contrapartida, valores negativos indicam bordas. Valores pequenos, por outro lado, indicam regiões planas. Posteriormente, aplica-se um limiar (threshold) à medida R. Pixels com R acima do limiar são candidatos a cantos. Finalmente, uma supressão de não-máximos elimina duplicatas. Este processo garante que cada canto seja detectado apenas uma vez.

aplicações práticas e quando utilizar

O detector Harris-Stephens é amplamente utilizado em várias tarefas. Primeiramente, ele serve para rastreamento de objetos em vídeos. Os cantos são pontos facilmente rastreáveis entre quadros consecutivos. Além disso, ele é usado na montagem de panoramas (image stitching). Os cantos servem como pontos de referência para alinhar as imagens. Sistemas de localização e mapeamento (SLAM) também empregam este detector. Robôs autônomos usam cantos como marcos visuais no ambiente. Outra aplicação importante é na calibração de câmeras. Padrões de xadrez são detectados pelos cantos das quadrículas. Portanto, utilize este detector quando precisar de pontos de interesse repetíveis e bem localizados. Ele é ideal para cenas ricas em textura e cantos geométricos.

MSER (Maximally Stable Extremal Regions)

programador
1.1.2.4.1 – Extração de Caracteristicas (Feature Extraction)
1.1.2.4.1.1 – Descritores Manuais (Engineered Features)
1.1.2.4.1.1.2 – MSER (Maximally Stable Extremal Regions)
LEGENDA
Principal
Ramo
Metodo
Problemas
Modelo
Arquitetura

O MSER funciona como um detector de regiões afim-covariante. Matas e colaboradores propuseram este método em 2002. Primeiramente, o algoritmo busca regiões extremais na imagem. Uma região extremal possui intensidade maior que sua fronteira. O método varia um limiar (threshold) de intensidade continuamente. Conforme o limiar aumenta, novas regiões brancas aparecem. Além disso, regiões estáveis mudam muito pouco de área com o limiar. Portanto, chamamos estas regiões de MSERs. Por exemplo, placas de carros ou letras em documentos formam MSERs. O método também garante invariância a transformações afins. Assim, ele funciona bem sob diferentes pontos de vista.

funcionamento do algoritmo por limiarização

Primeiramente, o algoritmo ordena todos os pixels por intensidade. Ele começa com o limiar mais baixo (preto total). Em seguida, o método aumenta o limiar gradualmente. Novas componentes conexas (regiões brancas) vão surgindo. O sistema rastreia cada região através dos níveis de intensidade. Além disso, a área de cada região é monitorada continuamente. Uma região é estável quando sua área varia pouco. A estabilidade mede a derivada da área em relação ao limiar. Consequentemente, o algoritmo seleciona regiões com variação mínima como MSERs. Por fim, ele repete este processo para a imagem original e seu negativo. Dessa forma, detectamos tanto regiões claras quanto escuras.

propriedades de invariância e robustez

O MSER possui propriedades de invariância muito úteis. Primeiramente, ele garante invariância a transformações afins da imagem. Isto significa que funciona mesmo com mudanças de perspectiva. Além disso, o método apresenta robustez considerável a ruído gaussiano. Pequenas flutuações de intensidade não afetam a detecção. O algoritmo também assegura invariância a transformações monotônicas de intensidade. Consequentemente, mudanças de iluminação não prejudicam os resultados. Por exemplo, sombras ou reflexos não eliminam as regiões estáveis. Portanto, o MSER é ideal para imagens com iluminação não-uniforme. Ele se destaca especialmente em aplicações de visão outdoor e robótica móvel.

aplicações práticas do mser

O MSER tem ampla utilização em tarefas de correspondência de imagens. Por exemplo, ele ajuda a casar fotos de um mesmo local sob diferentes ângulos. Na recuperação de informação visual, o MSER indexa regiões de interesse. Sistemas de reconhecimento de texto também se beneficiam deste método. Letras e caracteres tipicamente formam MSERs estáveis. Além disso, sistemas de localização e mapeamento (SLAM) usam o MSER. Robôs autônomos reconhecem pontos de referência com a ajuda deste detector. A detecção de placas de trânsito representa outra aplicação clássica. Portanto, o MSER constitui uma ferramenta versátil e consolidada. Ele combina simplicidade conceitual com alta performance prática.