Sansana Parra, José Miguel2025-06-122025-06-122023https://repositorio.usm.cl/handle/123456789/75296La geografía chilena hace que este sea un país muy diverso en variados aspectos, haciéndose presente en la cultura de diversas comunas y conurbaciones. Es por ello que se desea indagar si esta diversidad afecta los atributos que más determinan el precio de venta de un inmueble dependiendo del lugar geográfico de la propiedad. Considerando lo anterior, en este estudio se comparan tres modelos de aprendizaje automático: Regresión lineal, árboles de decisión y GAM mediante técnicas de inferencia y métricas de desempeño. La metodología se centra en la recopilación de datos mediante web scraping en Goplaceit.com, análisis exploratorio, pre-procesamiento de datos, ajuste de modelos y análisis de inferencia y métricas en base a estos. Los resultados dictan que el árbol de decisión es el más consistente respecto a la inferencia realizada, puesto que muestra los mismos cinco atributos (m2 útiles, m2 totales, latitud, longitud y cantidad de baños) como los más influyentes independiente de la conurbación, sumado a un desempeño superior a los otros modelos en cuanto a predicción. A su vez, todos los modelos tienden a bajar su desempeño al reducir la cantidad de datos. GAM baja el desempeño más drásticamente que otros modelos y no provee determinantes concisos. Por último, regresión lineal logra un intermedio de desempeño junto a consistencia, ya que dentro de los seis atributos más importantes entre conurbaciones, permanece un patrón consistente.Chilean geography makes this a very diverse country in various aspects, becoming present in the culture of various communes and conurbations. That is why it is desired to investigate whether this diversity affects the attributes that most determine the sale price of a property depending on the geographical location of it. Considering the above, in this study three machine learning models are compared: Linear Regression, Decision Trees and GAM using inference techniques and performance metrics. The methodology focuses on data collection through web scraping on Goplaceit.com, exploratory analysis, data pre-processing, model fitting and inference analysis and metrics based on these. The results dictate that the decision tree is the most consistent with respect to the inference made, since it shows the same five attributes (usefulm2 , totalm2 , latitude, longitude and number of bathrooms) as the most influential independent of the conurbation, added to a better performance respect to the other models compared. In turn, all models tend to lower their performance by reducing the amount of data. GAM lowers performance more drastically than other models and does not provide concise determinants. Finally, linear regression achieves an intermediate performance along with consistency, since within the six most important attributes between conurbations, a consistent pattern remains. Corresponde a la traducción al idioma inglés del Resumen anterior. Sujeto a la misma regla de extensión del Resumen.91 páginasesAprendizaje automáticoWeb scrapingInterpretabilidadConurbaciones chilenasPrecio de viviendasDeterminantes del comportamiento de precios de propiedades en conurbaciones de las Regiones de Valparaíso, Metropolitana y Bío-bío: inferencia por medio de aprendizaje automático3560902039610