Neural Abstractive Summarization Of Online News Discussion Threads

TAMPE PALMA, IGNACIO EDUARDO

Thesis
Neural Abstractive Summarization Of Online News Discussion Threads

dc.contributor.advisor	MARCELO, MENDOZA
dc.contributor.author	TAMPE PALMA, IGNACIO EDUARDO
dc.contributor.department	Universidad Técnica Federico Santa María. Departamento de Informática
dc.contributor.other	MILIOS, EVANGELOS
dc.coverage.spatial	Campus San Joaquín, Santiago
dc.date.accessioned	2024-09-25T15:31:17Z
dc.date.available	2024-09-25T15:31:17Z
dc.date.issued	2020-11
dc.description.abstract	Resumir automaticamente normalmente ha dependido de resúmenes realizados por expertos para poder entrenar modelos. Las redes sociales agregan nuevos desafíos a las tecnicas de resumen ya que requieren revisar enfoques multi-documento y multi-autor. En este trabajo revisamos esta tarea introduciendo un metodo que genera resúmenes abstractivos de discusiones en artículos de noticias en línea. El metodo extiende a una arquitectura basada en BERT, incluyendo una capa de atención a la que se le entregan los “Me gusta” de los comentarios durante entrenamiento. Para entrenar el modelo, se definio una tarea que consiste en la reconstrucción de comentarios de alto impacto, basados en su popularidad. De esta forma, el modelo logra aprender a resumir discusiones basado en los comentarios mas relevantes. Nuestro novedoso enfoque provee un resumen que representa los aspectos mas importantes de la noticia que la gente comento, incorporporando el contexto social como base de información para hacerlo. Nuestro modelo fue validado con ROUGE Recall entre el resumen generado y cada uno de los comentarios del hilo, ponderados segun popularidad. Basada en esta evaluación, nuestro modelo con su capa de atención, sobrepasa significativamente a modelos base extractivos y abstractivos sin atención.	es_cl
dc.description.abstract	Summarization has usually relied on gold standard summaries to train extractive or abstractive models. Social media brings a hurdle to summarization techniques since it requires addressing a multi-document multi-author approach. We address this challenging task introducing a novel method that generates abstractive summaries of online news discussions. Our method extends a BERT-based architecture, including an attention encoding that fed comments’ likes during the training stage. To train our model, we define a task which consists of reconstructing high impact comments, based on popularity (likes). Accordingly, our model learns to summarize online discussions based on their most relevant comments. Our novel approach provides a summary that represents the most relevant aspects of a news item that users comment on, incorporating the social context as a source of information to summarize texts in online social networks. Our model is evaluated using ROUGE recall between the generated summary and each comment on the thread, weighted by its popularity. Based on such evaluation, our model, including the social attention encoding, significantly outperforms both an extractive summarization baseline and a baseline abstractive model without an attention encoding.	en
dc.description.degree	INGENIERO CIVIL INFORMÁTICO
dc.description.program	DEPARTAMENTO DE INFORMÁTICA. INGENIERÍA CIVIL INFORMÁTICA
dc.identifier.barcode	3560902038975
dc.identifier.uri	https://repositorio.usm.cl/handle/123456789/7354
dc.identifier.uri	https://doi.org/10.71700/dspace-memorias/1189
dc.rights	info:eu-repo/semantics/openAccess
dc.subject	INTELIGENCIA ARTIFICIAL
dc.subject	PROCESAMIENTO DE DATOS
dc.subject	MEDIOS DE COMUNICACION DE MASAS
dc.title	Neural Abstractive Summarization Of Online News Discussion Threads	en
dc.type	Tesis de Pregrado
dspace.entity.type	Tesis

Files

Original bundle

Now showing 1 - 1 of 1

Name:: 3560902038975UTFSM.pdf
Size:: 577.61 KB
Format:: Adobe Portable Document Format

Download

Collections

Tesis de Pregrado Acceso Abierto

Thesis
Neural Abstractive Summarization Of Online News Discussion Threads

Files

Original bundle

Collections

UNIVERSIDAD

CAMPUS Y SEDES

EXTENSIÓN Y CULTURA

SERVICIOS

Thesis Neural Abstractive Summarization Of Online News Discussion Threads

Files

Original bundle

Collections

UNIVERSIDAD

CAMPUS Y SEDES

EXTENSIÓN Y CULTURA

SERVICIOS

Thesis
Neural Abstractive Summarization Of Online News Discussion Threads