Santana Domínguez, Claudio Blas Arnaldo2025-06-052025-06-052024-12https://repositorio.usm.cl/handle/123456789/75202Si bien recién en 2022 las inteligencias artificiales (IA) basadas en redes neuronales convolucionales (CNN) experimentaron un crecimiento acelerado en su uso en varias áreas, llegando a convertirse en una herramienta del día a día, la visión por computador (CV) es un área de la IA que lleva más de 70 años en desarrollo. Su avance actual se observa, por ejemplo, en las cámaras de seguridad, muchas de las cuales hoy son capaces de identificar personas y objetos dentro de su campo visual. El uso de monitoreo e identificación ha cobrado interés incluso en el ámbito deportivo. Por ejemplo, la UEFA es capaz de realizar modelados 3D de los jugadores y del balón en fotogramas clave para detectar de forma más precisa fueras de juego, faltas o goles. Asimismo, existen diversas herramientas especializadas en el análisis de acciones deportivas, como la cámara Veo, utilizada por el club de rugby chileno All Brads. Si bien la IA incorporada en Veo identifica eventos clave del partido (como try, scrum, conversión, lineout y el inicio/final de cada mitad), no detecta otros momentos de interés para los entrenadores. Esta memoria busca cubrir algunos de estos aspectos que Veo no logra identificar, como los choques entre jugadores durante el partido, mediante la detección de caídas, tackles y colisiones. Para ello, se utilizan diversos frameworks con herramientas de identificación y seguimiento basadas en modelos ya entrenados. Estas herramientas permiten detectar posibles colisiones entre rugbistas en los fotogramas de las grabaciones, y confirmar si corresponden a alguno de los tres eventos de interés a través de una arquitectura de IA desarrollada en PyTorch. Finalmente, se mide la gravedad de estas acciones mediante clips cortos generados a partir de los fotogramas identificados por la arquitectura, incluyendo además la indicación de las partes del cuerpo impactadas.While it was not until 2022 that artificial intelligence (AI) based on convolutional neural networks (CNN) experienced accelerated growth in its use across various fields, even becoming an everyday tool, computer vision (CV) is an area of AI that has been developed for over 70 years. Today, its advancements are evident in security cameras, many of which can now identify people and objects within their field of vision. The use of monitoring and identification has even become relevant in sports. For example, UEFA can now create 3D models of players and the ball in key frames to better detect offside calls, fouls, or goals. Similarly, there are other specialized tools for analyzing actions in sports, such as the Veo camera, used by a Chilean rugby club: All Brads. While the AI implemented by Veo can identify key moments in a match (Try, Scrum, Conversion, Lineout, and the start/end of the two halves), it fails to identify other moments of interest to coaches. This thesis aims to address some of the parameters Veo does not cover, such as collisions between players during a match, by identifying falls, tackles, and collisions. This is achieved using various frameworks with identification and tracking tools containing pre-trained models. These identifications are used to detect potential collisions between rugby players in the video frames, confirm whether they correspond to one of the three target identifications using an AI architecture designed in PyTorch, and measure their severity through short clips generated from the frames identified by the architecture, along with indicating the parts of the body impacted.81 páginasesAnálisis de acciones en el deporteRedes neuronales convolucionalesVisión por computadorDetección de eventosMonitoreo de rugbistas mediante visión por computador para identificación de choques3560900287924