Thesis Neural Abstractive Summarization Of Online News Discussion Threads
dc.contributor.advisor | MARCELO, MENDOZA | |
dc.contributor.author | TAMPE PALMA, IGNACIO EDUARDO | |
dc.contributor.department | Universidad Técnica Federico Santa María. Departamento de Informática | |
dc.contributor.other | MILIOS, EVANGELOS | |
dc.coverage.spatial | Campus San Joaquín, Santiago | |
dc.date.accessioned | 2024-09-25T15:31:17Z | |
dc.date.available | 2024-09-25T15:31:17Z | |
dc.date.issued | 2020-11 | |
dc.description.abstract | Resumir automaticamente normalmente ha dependido de resúmenes realizados por expertos para poder entrenar modelos. Las redes sociales agregan nuevos desafíos a las tecnicas de resumen ya que requieren revisar enfoques multi-documento y multi-autor. En este trabajo revisamos esta tarea introduciendo un metodo que genera resúmenes abstractivos de discusiones en artículos de noticias en línea. El metodo extiende a una arquitectura basada en BERT, incluyendo una capa de atención a la que se le entregan los “Me gusta” de los comentarios durante entrenamiento. Para entrenar el modelo, se definio una tarea que consiste en la reconstrucción de comentarios de alto impacto, basados en su popularidad. De esta forma, el modelo logra aprender a resumir discusiones basado en los comentarios mas relevantes. Nuestro novedoso enfoque provee un resumen que representa los aspectos mas importantes de la noticia que la gente comento, incorporporando el contexto social como base de información para hacerlo. Nuestro modelo fue validado con ROUGE Recall entre el resumen generado y cada uno de los comentarios del hilo, ponderados segun popularidad. Basada en esta evaluación, nuestro modelo con su capa de atención, sobrepasa significativamente a modelos base extractivos y abstractivos sin atención. | es_cl |
dc.description.abstract | Summarization has usually relied on gold standard summaries to train extractive or abstractive models. Social media brings a hurdle to summarization techniques since it requires addressing a multi-document multi-author approach. We address this challenging task introducing a novel method that generates abstractive summaries of online news discussions. Our method extends a BERT-based architecture, including an attention encoding that fed comments’ likes during the training stage. To train our model, we define a task which consists of reconstructing high impact comments, based on popularity (likes). Accordingly, our model learns to summarize online discussions based on their most relevant comments. Our novel approach provides a summary that represents the most relevant aspects of a news item that users comment on, incorporating the social context as a source of information to summarize texts in online social networks. Our model is evaluated using ROUGE recall between the generated summary and each comment on the thread, weighted by its popularity. Based on such evaluation, our model, including the social attention encoding, significantly outperforms both an extractive summarization baseline and a baseline abstractive model without an attention encoding. | en |
dc.description.degree | INGENIERO CIVIL INFORMÁTICO | |
dc.description.program | DEPARTAMENTO DE INFORMÁTICA. INGENIERÍA CIVIL INFORMÁTICA | |
dc.identifier.barcode | 3560902038975 | |
dc.identifier.uri | https://repositorio.usm.cl/handle/123456789/7354 | |
dc.identifier.uri | https://doi.org/10.71700/dspace-memorias/1189 | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.subject | INTELIGENCIA ARTIFICIAL | |
dc.subject | PROCESAMIENTO DE DATOS | |
dc.subject | MEDIOS DE COMUNICACION DE MASAS | |
dc.title | Neural Abstractive Summarization Of Online News Discussion Threads | en |
dc.type | Tesis de Pregrado | |
dspace.entity.type | Tesis |
Files
Original bundle
1 - 1 of 1