Resumo: Este trabalho tem por finalidade apresentar um sistema para a classificação automática de espécies de pássaros baseado em características acústicas e visuais extraídas a partir do canto dos pássaros. As características visuais foram extraídas de espectrogramas gerados a partir dos cantos, enquanto as características acústicas foram extraídas diretamente do áudio. Descritores de textura foram usados para descrever o conteúdo do espectrograma, visto que este é o principal conteúdo visual encontrado neste tipo de imagem. Os operadores de textura utilizados foram Local Binary Pattern (LBP), Local Phase Quantization (LPQ), Robust Local Binary Pattern (RLBP), Gray-Scale Level Co- ccurrence Matrix (GLCM) e Filtros de Gabor. As características acústicas, por sua vez, foram descritas utilizando Rhythm Histogram (RH), Rhythm Patterns (RP) e Statistical Spectrum Descriptor (SSD). Com o objetivo de realizar comparações mais precisas, os experimentos realizados utilizaram uma base de dados similar a utilizada em outros trabalhos. Na etapa de classificação, foi utilizado o classificador SVM e os resultados finais foram alcançados utilizando uma validação cruzada de 10 folds.
Abstract: This work aims at presenting a system for automatic bird species classification based on acoustic and visual features extracted from the birdsong. The texture features were extracted using: Local Binary Pattern (LBP), Local Phase Quantization (LPQ), Robust Local Binary Pattern (RLBP) Gray-Scale Level Co- currence Matrix (GLCM) and Gabor filters. The acoustic characteristics are in turn extracted through the descriptors: Rhythm Histogarm (RH), Rhythm Patterns (RP) and Statistical Spectrum Descriptor (SSD.) Aiming to perform more fare comparisons, the experiments performed were made over a similar database used in the work Automatic Bird Species Identification for Large Number of Species (Lopes et al., 2011a). In the classification step, SVM classifier was used and the final results were taken by using 10-fold cross validation. |