Browsing by Author "SALINAS DEZEREGA, FRANCISCO JAVIER"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Thesis EVALUACIÓN DE ALGORITMOS DE AGRUPAMIENTO UTILIZANDO APACHE SPARK(2017) SALINAS DEZEREGA, FRANCISCO JAVIER; SALINAS DEZEREGA, FRANCISCO JAVIER; Universidad Tecnica Federico Santa Maria UTFSM INFORMATICA; MENDOZA, MARCELOCon el continuo crecimiento de la cantidad de datos con los que se debe trabajar enla actualidad, surge la necesidad de utilizar ciertas herramientas que pueden manejar estosnuevos volúmenes de datos. Una herramienta popular para trabajar con Big Data enla actualidad es el framework de código abierto Apache Spark, siendo específicamentede interés para este trabajo de investigación su librería para el aprendizaje automático.Resulta interesante estudiar si ésta herramienta puede obtener resultados eficientes alser utilizada en un computador con cuatro núcleos, y además, si las soluciones provistasse ven afectadas por las implementaciones en paralelo de sus algoritmos.En este documento se estudian las diferencias que se pueden observar en los tiemposde ejecución y la calidad de las soluciones entregadas, al ejecutar determinados algoritmosde agrupamiento sobre datasets con distintas características, utilizando ApacheSpark y Python, con sus librerías para el aprendizaje automático MLlib y scikit-learn,respectivamente.
