Aplicación de modelos generativos en salud para la generación de mamografías y registros clínicos sintéticos
Abstract
Para la investigación y desarrollo de sistemas de aprendizaje de máquinas es necesario tener una
base de datos en común que permita entrenar y comparar distintos modelos. Sin embargo, en el área
de salud existen barreras legales que al buscar proteger la integridad y privacidad de los pacientes
prohíbe la publicación de dicha información, obstruyendo las labores de investigación.
Como solución al problema anteriormente planteado se propone el uso de modelos generativos que
a partir de un dataset inicial generen información sintética que mantenga las características estadísticas
originales, así aumentando el volumen de datos útiles disponibles para investigación.
En este informe se presenta el estudio de las Generative Adversarial Networks (GANs) como
alternativa para generación de mamografías sintéticas, así como el desarrollo y aplicación de un software basado en la biblioteca Synthetic Data Vault (SDV) para generaci´on de tablas sintéticas a partir
archivos ’.csv’ o ’.xlsx’.