Optimización del Análisis de Imágenes de Cámaras Trampa para Fauna: Modelos de Agrupamiento y Recuperación Basados en IA
Main Article Content
Abstract
Este estudio propone el uso del modelo CLIP-ViT-B-32 para optimizar el análisis de bancos de imágenes masivos capturados por cámaras trampa, con el objetivo de filtrar falsos disparos provocados por el movimiento de la flora y otros factores ambientales. Se utiliza un enfoque multimodal que combina embeddings visuales y textuales para lograr una clasificación eficiente y precisa de imágenes, reduciendo significativamente el tiempo y trabajo de investigadores expertos a cargo de la clasificación de la fauna fotografiada.
Downloads
Article Details
Section
References
F. Rovero, F. Zimmermann, D. Bersi, y P. Meek, «“Which camera trap type and how many do I need?” A review of camera features and study designs for a range of wildlife research applications», 2013.
A. C. Burton et al., «REVIEW: Wildlife camera trapping: a review and recommendations for linking surveys to ecological processes», J. Appl. Ecol., vol. 52, n.o 3, pp. 675-685, 2015, doi: 10.1111/1365-2664.12432.
R. Steenweg, M. Hebblewhite, J. Whittington, P. Lukacs, y K. McKelvey, «Sampling scales define occupancy and underlying occupancy–abundance relationships in animals», Ecology, vol. 99, n.o 1, pp. 172-183, 2018, doi: 10.1002/ecy.2054.
A. Swanson, M. Kosmala, C. Lintott, R. Simpson, A. Smith, y C. Packer, «Snapshot Serengeti, high-frequency annotated camera trap images of 40 mammalian species in an African savanna», Sci. Data, vol. 2, n.o 1, p. 150026, jun. 2015, doi: 10.1038/sdata.2015.26.
Camera Traps in Animal Ecology. Accedido: 10 de junio de 2024. [En línea]. Disponible en: https://link.springer.com/book/10.1007/978-4-431-99495-4
M. S. Norouzzadeh et al., «Automatically identifying, counting, and describing wild animals in camera-trap images with deep learning», 15 de noviembre de 2017, arXiv: arXiv:1703.05830. doi: 10.48550/arXiv.1703.05830.
S. Beery, G. van Horn, y P. Perona, «Recognition in Terra Incognita», 24 de julio de 2018, arXiv: arXiv:1807.04975. doi: 10.48550/arXiv.1807.04975.
S. Schneider, G. W. Taylor, S. S. Linquist, y S. C. Kremer, «Past, Present, and Future Approaches Using Computer Vision for Animal Re-Identification from Camera Trap Data», 19 de noviembre de 2018, arXiv: arXiv:1811.07749. doi: 10.48550/arXiv.1811.07749.
G. Chen, T. X. Han, Z. He, R. Kays, y T. Forrester, «Deep convolutional neural network based species recognition for wild animal monitoring», en 2014 IEEE International Conference on Image Processing (ICIP), oct. 2014, pp. 858-862. doi: 10.1109/ICIP.2014.7025172.
M. A. Tabak et al., «Machine learning to classify animal species in camera trap images: Applications in ecology», Methods Ecol. Evol., vol. 10, n.o 4, pp. 585-590, 2019, doi: 10.1111/2041-210X.13120.
M. Willi et al., «Identifying animal species in camera trap images using deep learning and citizen science», Methods Ecol. Evol., vol. 10, n.o 1, pp. 80-91, 2019, doi: 10.1111/2041-210X.13099.
A. Radford et al., «Learning Transferable Visual Models From Natural Language Supervision», 26 de febrero de 2021, arXiv: arXiv:2103.00020. Accedido: 10 de junio de 2024. [En línea]. Disponible en: http://arxiv.org/abs/2103.00020
A. Dosovitskiy et al., «An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale», 3 de junio de 2021, arXiv: arXiv:2010.11929. doi: 10.48550/arXiv.2010.11929.
X. Zhai, A. Kolesnikov, N. Houlsby, y L. Beyer, «Scaling Vision Transformers», 20 de junio de 2022, arXiv: arXiv:2106.04560. doi: 10.48550/arXiv.2106.04560.
M. Ester, H.-P. Kriegel, J. Sander, y X. Xu, «A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise».
L. McInnes, J. Healy, y J. Melville, «UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction».