View Item 
  •   DSpace Home
  • Sistema de Bibliotecas USM
  • Tesis USM
  • TESIS de Pregrado de acceso ABIERTO
  • View Item
  •   DSpace Home
  • Sistema de Bibliotecas USM
  • Tesis USM
  • TESIS de Pregrado de acceso ABIERTO
  • View Item
    • español
    • English
  • English 
    • español
    • English
  • Login
JavaScript is disabled for your browser. Some features of this site may not work without it.

NEURAL ABSTRACTIVE SUMMARIZATION OF ONLINE NEWS DISCUSSION THREADS

Thumbnail
View/Open
3560902038975UTFSM.pdf (577.6Kb)
Date
2020-11
Author
TAMPE PALMA, IGNACIO EDUARDO
Metadata
Show full item record
Abstract
Resumir automáticamente normalmente ha dependido de resúmenes realizados por expertos para poder entrenar modelos. Las redes sociales agregan nuevos desafíos a las técnicas de resumen ya que requieren revisar enfoques multi-documento y multi-autor. En este trabajo revisamos esta tarea introduciendo un método que genera resúmenes abstractivos de discusiones en artículos de noticias en línea. El método extiende a una arquitectura basada en BERT, incluyendo una capa de atención a la que se le entregan los “Me gusta” de los comentarios durante entrenamiento. Para entrenar el modelo, se definió una tarea que consiste en la reconstrucción de comentarios de alto impacto, basados en su popularidad. De esta forma, el modelo logra aprender a resumir discusiones basado en los comentarios mas relevantes. Nuestro novedoso enfoque provee un resumen que representa los aspectos mas importantes de la noticia que la gente comento, incorporporando el contexto social como base de información para hacerlo. Nuestro modelo fue validado con ROUGE Recall entre el resumen generado y cada uno de los comentarios del hilo, ponderados según popularidad. Basada en esta evaluación, nuestro modelo con su capa de atención, sobrepasa significativamente a modelos base extractivos y abstractivos sin atención.
 
Summarization has usually relied on gold standard summaries to train extractive or abstractive models. Social media brings a hurdle to summarization techniques since it requires addressing a multi-document multi-author approach. We address this challenging task introducing a novel method that generates abstractive summaries of online news discussions. Our method extends a BERT-based architecture, including an attention encoding that fed comments’ likes during the training stage. To train our model, we define a task which consists of reconstructing high impact comments, based on popularity (likes). Accordingly, our model learns to summarize online discussions based on their most relevant comments. Our novel approach provides a summary that represents the most relevant aspects of a news item that users comment on, incorporating the social context as a source of information to summarize texts in online social networks. Our model is evaluated using ROUGE recall between the generated summary and each comment on the thread, weighted by its popularity. Based on such evaluation, our model, including the social attention encoding, significantly outperforms both an extractive summarization baseline and a baseline abstractive model without an attention encoding.
 
URI
https://hdl.handle.net/11673/49998
Collections
  • TESIS de Pregrado de acceso ABIERTO

© Universidad Técnica Federico Santa María
Avenida España 1680, Edificio U, Valparaíso· 56-32-2654147, Informaciones escribir a email repositorio@usm.cl Repositorio Digital administrado por el Área de Archivo Digital, Dirección de Información y Documentación Bibliográfica Institucional

DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback
Theme by 
@mire NV


USM
 

 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsAdvisorProgramOther AdvisorThis CollectionBy Issue DateAuthorsTitlesSubjectsAdvisorProgramOther Advisor

My Account

Login

© Universidad Técnica Federico Santa María
Avenida España 1680, Edificio U, Valparaíso· 56-32-2654147, Informaciones escribir a email repositorio@usm.cl Repositorio Digital administrado por el Área de Archivo Digital, Dirección de Información y Documentación Bibliográfica Institucional

DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback
Theme by 
@mire NV


USM