Optimización del Análisis de Imágenes de Cámaras Trampa para Fauna: Modelos de Agrupamiento y Recuperación Basados en IA

Axel Alfredo Skrauba; Sergio Eduardo Moya

doi:10.36995/j.masingenio.2025.06.01.002

.PDF (Spanish) .HTML (Spanish)

Recibido: 2025-03-14

Aceptado: 2026-07-04

Published: 2025-12-19

Updated: 2025-12-19

DOI: https://doi.org/10.36995/j.masingenio.2025.06.01.002

Keywords:

Aprendizaje Profundo, Biodiversidad, Cámaras Trampa, Clustering, Conservación de Fauna, Filtrado de Imágenes, Modelo CLIP-ViT-B-32

Axel Alfredo Skrauba

Universidad Nacional de Misiones, Facultad de Ingeniería. Misiones, Argentina

https://orcid.org/0009-0008-6398-0137 (unauthenticated)

Sergio Eduardo Moya

Universidad Nacional de Misiones, Facultad de Ingeniería. Misiones, Argentina

https://orcid.org/0000-0002-7633-3309 (unauthenticated)

Abstract

Este estudio propone el uso del modelo CLIP-ViT-B-32 para optimizar el análisis de bancos de imágenes masivos capturados por cámaras trampa, con el objetivo de filtrar falsos disparos provocados por el movimiento de la flora y otros factores ambientales. Se utiliza un enfoque multimodal que combina embeddings visuales y textuales para lograr una clasificación eficiente y precisa de imágenes, reduciendo significativamente el tiempo y trabajo de investigadores expertos a cargo de la clasificación de la fauna fotografiada.

Downloads

Download data is not yet available.

Issue

Vol. 6 No. 1 (2025): Revista de Ciencia, Tecnología e Innovación

Section

Artículos Científicos

Recibido: 2025-03-14

Aceptado: 2026-07-04

References

F. Rovero, F. Zimmermann, D. Bersi, y P. Meek, «“Which camera trap type and how many do I need?” A review of camera features and study designs for a range of wildlife research applications», 2013.

A. C. Burton et al., «REVIEW: Wildlife camera trapping: a review and recommendations for linking surveys to ecological processes», J. Appl. Ecol., vol. 52, n.o 3, pp. 675-685, 2015, doi: 10.1111/1365-2664.12432.

R. Steenweg, M. Hebblewhite, J. Whittington, P. Lukacs, y K. McKelvey, «Sampling scales define occupancy and underlying occupancy–abundance relationships in animals», Ecology, vol. 99, n.o 1, pp. 172-183, 2018, doi: 10.1002/ecy.2054.

A. Swanson, M. Kosmala, C. Lintott, R. Simpson, A. Smith, y C. Packer, «Snapshot Serengeti, high-frequency annotated camera trap images of 40 mammalian species in an African savanna», Sci. Data, vol. 2, n.o 1, p. 150026, jun. 2015, doi: 10.1038/sdata.2015.26.

Camera Traps in Animal Ecology. Accedido: 10 de junio de 2024. [En línea]. Disponible en: https://link.springer.com/book/10.1007/978-4-431-99495-4

M. S. Norouzzadeh et al., «Automatically identifying, counting, and describing wild animals in camera-trap images with deep learning», 15 de noviembre de 2017, arXiv: arXiv:1703.05830. doi: 10.48550/arXiv.1703.05830.

S. Beery, G. van Horn, y P. Perona, «Recognition in Terra Incognita», 24 de julio de 2018, arXiv: arXiv:1807.04975. doi: 10.48550/arXiv.1807.04975.

S. Schneider, G. W. Taylor, S. S. Linquist, y S. C. Kremer, «Past, Present, and Future Approaches Using Computer Vision for Animal Re-Identification from Camera Trap Data», 19 de noviembre de 2018, arXiv: arXiv:1811.07749. doi: 10.48550/arXiv.1811.07749.

G. Chen, T. X. Han, Z. He, R. Kays, y T. Forrester, «Deep convolutional neural network based species recognition for wild animal monitoring», en 2014 IEEE International Conference on Image Processing (ICIP), oct. 2014, pp. 858-862. doi: 10.1109/ICIP.2014.7025172.

M. A. Tabak et al., «Machine learning to classify animal species in camera trap images: Applications in ecology», Methods Ecol. Evol., vol. 10, n.o 4, pp. 585-590, 2019, doi: 10.1111/2041-210X.13120.

M. Willi et al., «Identifying animal species in camera trap images using deep learning and citizen science», Methods Ecol. Evol., vol. 10, n.o 1, pp. 80-91, 2019, doi: 10.1111/2041-210X.13099.

A. Radford et al., «Learning Transferable Visual Models From Natural Language Supervision», 26 de febrero de 2021, arXiv: arXiv:2103.00020. Accedido: 10 de junio de 2024. [En línea]. Disponible en: http://arxiv.org/abs/2103.00020

A. Dosovitskiy et al., «An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale», 3 de junio de 2021, arXiv: arXiv:2010.11929. doi: 10.48550/arXiv.2010.11929.

X. Zhai, A. Kolesnikov, N. Houlsby, y L. Beyer, «Scaling Vision Transformers», 20 de junio de 2022, arXiv: arXiv:2106.04560. doi: 10.48550/arXiv.2106.04560.

M. Ester, H.-P. Kriegel, J. Sander, y X. Xu, «A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise».

L. McInnes, J. Healy, y J. Melville, «UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction».

Article Sidebar

Main Article Content

Abstract

Downloads

Article Details

Issue

Section

References