Thesis Implementación eficiente en GPU de método de Lattice Boltzmann, aplicando herramientas de cooperative groups
Loading...
Date
2022
Authors
Journal Title
Journal ISSN
Volume Title
Program
Ingeniería Civil Informática
Departament
Campus
Campus Santiago San Joaquín
Abstract
El trabajo trabajo realizado presenta un algoritmo para la implementación de el método de Lattice Boltzmann con enfoque push en un solo Kernel de CUDA haciendo uso de las herramientas de grupos cooperativos presentados por NVIDIA. Este algoritmo soluciona la problemática de sincronización de los threads entre los pasos de streamming y collision de manera eficiente sin generar condiciones de carrera ni bloqueos.
La solución propuesta muestra un rendimiento comparable a soluciones ya desarrolladas anteriormente, mejorando incluso el tiempo de ejecución promedio del programa en nuevas arquitecturas de GPUs NVIDIA.
The following work presents an algorithm for the implementation of the Lattice Boltzmann method with a push approach in a single CUDA Kernel using the Cooperative Groups library developed by NVIDIA. This algorithm efficiently solves the thread synchronization problem between the streaming and collision steps without generating race conditions or deadlock. The proposed solution shows a performance comparable to previously developed solutions, even improving the average execution time of the program on new NVIDIA GPU architectures.
The following work presents an algorithm for the implementation of the Lattice Boltzmann method with a push approach in a single CUDA Kernel using the Cooperative Groups library developed by NVIDIA. This algorithm efficiently solves the thread synchronization problem between the streaming and collision steps without generating race conditions or deadlock. The proposed solution shows a performance comparable to previously developed solutions, even improving the average execution time of the program on new NVIDIA GPU architectures.
Description
Keywords
Dinámica de redes, Dinámica de fluídos, Modelos matemáticos, Algoritmos computacionales
