AISI: Script de identificação de imagens similares
8 de fevereiro de 2014 • por Labic
AISI – Automatic Identifier of Similar Images
04/02/2014
Com a extração e análise de um grande banco de imagens, um problema comum é em relação a imagens idênticas. Durante a extração das imagens da web, as mesmas podem ter sido compartilhadas por diversas pessoas, fazendo com que elas se encontrem em links diferentes. Por consequência, poderá causar um erro nas estatísticas de frequência dessas imagens, pois os softwares as consideram diferentes simplesmente por estarem em links distintos.
Sendo assim, foi necessário o desenvolvimento de um script que solucionasse esse problema, e então foi criado o algoritmo AISI, ( ‘’Automatic Identifier of Similar Images’’), traduzido para o português como ‘’Identificador de Imagens Similares’’. Este script foi criado pelo aluno de iniciação científica Vitor Pereira Almeida, com orientação do Prof. Dr. Patrick Marques Ciarelli, em conjunto com o Labic.
O script foi desenvolvido no software Matlab (Matrix Laboratory), com o objetivo de identificar imagens similares dentro de um banco de imagens através da comparação entre cada uma delas a partir de suas características numéricas extraídas (como a média da saturação de cada imagem, média das variâncias, média dos histogramas de cada camada de cor, RGB).
Logo, depois de obtido essas características, as imagens são comparadas uma a uma, sendo possível a identificação de imagens similares. O algoritmo tem como saída um arquivo texto em formato ‘‘txt.’’ contendo o nome e a numeração de cada imagem variando entre 1 e o tamanho do banco de dados. As numerações que se repetirem correspondem às imagens semelhantes.
Comentários