EXTENSIÓN DEL FRAMEWORK DE BASES DE DATOS APACHE TINKERPOP PARA LA EJECUCIÓN DE CONSULTAS SPARQL SOBRE EL MODELO DE PROPERTY GRAPHS
Abstract
Esta memoria aborda el problema de la incompatibilidad entre el lenguaje deconsultas de bases de datos de grafos SPARQL y el framework de bases de datos de grafosTinkerpop, que organiza sus datos basándose en el modelo property graph. Este modelo difierede RDF, que se basa en edge-labelled graph y se consulta con SPARQL. Se busca poderconsultar un grafo Tinkerpop, utilizando una consulta SPARQL. Para esto se diseña un mapeode property graph a RDF y un traducción desde la consulta a traversals Gremlin. Además,se simplificó la sintaxis de las consultas utilizando SPARQL*, una extensión de SPARQL, y lacomplejidad de ejecución tipificando las variables a piori. Se logró implementar un softwareque funciona con operaciones de selección, filtrado, opcional y unión, además del calce depatrones básicos. El mapeo, la traducción, las simplificaciones y diseño del software puedenser usados en el futuro como base para una capa de compatibilidad más amplia. This thesis is about the incompatibility problem between the graph databasequery language SPARQL and the graph database framework Tinkerpop, that organizes its datafollowing the property graph model. This model diferes from RDF, that follows the edgelabelledgraph and it is queried using SPARQL. To do this, a mapping from property graph toRDF and a translation from the query to Gremlin traversals are made. Also, the query syntaxis simplified using SPARQL*, a SPARQL extension, and the execution complexity is reducestipyfing the variables a priori. It was possible to implement a software that works with operations like selection, filtering, optional and union, besaids the basic pattern matching. Themapping, translations, simplifications and software design can be used in the future as baseto a more wide compatibility layer.