Thesis SISTEMA DE RECONOCIMIENTO SEMI-AUTOMATIZADO DE TEXTO EN TARJETAS DE PRESENTACION
Loading...
Date
2016
Journal Title
Journal ISSN
Volume Title
Program
Campus
Universidad Técnica Federico Santa María UTFSM. Casa Central Valparaíso
Abstract
The thesis work described in the present document focuses on the design and implementation
of a semi-automatic system that recognizes text from a presentation card
image. The project is capable of obtaining the data of interest from the card, being
the information of interest: the name, email, phone number and address. After it, is
able to categorize the data in their corresponding box and present the information
neatly to the user. This kind of programs is known as OCR type applications, acronym
that comes from Optical Character Recognition. The OCR technology detects characters
from images, which then allows the user to work over the text or characters
found. The OCR technology gives birth to diverse and useful applications, because
of its great potential. Companies like Google and Adobe Acrobat are developing and
vastly using this technology. Particularly, this application finds and sorts out keywords
present in the presentation card. These keywords are the ones of interest for Meetcard
entrepreneurship, born in Federico Santa Maria Technical University (UTFSM), entrepreneurship
for whom the project is being developed. Meetcard is a smart presentation
card, which uses NFC technology and QR codes to transfer the contact information
(name, phone, address, among other information) directly to the smartphone which
contains the Meetcard application. The problem appears when a person who has the
application wants to obtain the contact information from a traditional presentation
card. The project solves this issue by taking a photo of the card and automatically extracting
the relevant information and classifying it very quickly and easily. The project
shown here is the first prototype of the new feature that Meetcard will implement in
their service on the near future.
El proyecto de titulacion que se describe en el presente documento, contempla el diseño e implementacion de un sistema semiautomatico de reconocimiento de texto desde una imagen de una tarjeta de presentaci´on. El proyecto es capaz de obtener los datos de interes desde la tarjeta, siendo estos: el nombre, email, telefono y direccion, luego categoriza los datos en sus respectivas casillas y los presenta ordenadamente al usuario. Este tipo de programas son conocidos como aplicaciones de tipo OCR, sigla que proviene de las palabras en ingles Optical Character Recognition (Reconocimiento optico de Caracteres). La tecnologıa OCR reconoce caracteres desde im´agenes, lo que permite luego trabajar sobre el texto encontrado. La tecnologıa OCR da pie para crear diversas y utiles aplicaciones, debido al gran potencial que posee. Empresas tales como Google y Adobe estan desarrollando y utilizando bastamente esta tecnologıa en sus productos. Esta aplicacion en particular encuentra y encasilla palabras claves dentro de las tarjetas de presentacion, las que son de utilidad para el emprendimiento Meetcard [1, 2], nacido en la Universidad Tecnica Federico Santa Marıa, emprendimiento para el cual se esta realizando este proyecto. Meetcard es una tarjeta inteligente de presentacion, la cual utiliza tecnologıa NFC y codigos QR para el traspaso de informacion del contacto (nombre, tel´efono, direccion, entre otras) de manera directa al celular de la persona que posee la aplicacion. Esta tarjeta inteligente traspasa toda la informacion de contacto al movil. El problema surge cuando una persona que posee Meetcard quiere obtener la informacion de una tarjeta tradicional de papel. El proyecto resuelve esta problematica mediante la toma de una foto de la tarjeta de presentacion y extrayendo autoMaticamente la informacion de relevancia de manera muy rapida y sencilla. El proyecto que aca se muestra tiene como objetivo ser el primer prototipo de la nueva caracterıstica que implementara en el futuro proximo Meetcard en su aplicacion.
El proyecto de titulacion que se describe en el presente documento, contempla el diseño e implementacion de un sistema semiautomatico de reconocimiento de texto desde una imagen de una tarjeta de presentaci´on. El proyecto es capaz de obtener los datos de interes desde la tarjeta, siendo estos: el nombre, email, telefono y direccion, luego categoriza los datos en sus respectivas casillas y los presenta ordenadamente al usuario. Este tipo de programas son conocidos como aplicaciones de tipo OCR, sigla que proviene de las palabras en ingles Optical Character Recognition (Reconocimiento optico de Caracteres). La tecnologıa OCR reconoce caracteres desde im´agenes, lo que permite luego trabajar sobre el texto encontrado. La tecnologıa OCR da pie para crear diversas y utiles aplicaciones, debido al gran potencial que posee. Empresas tales como Google y Adobe estan desarrollando y utilizando bastamente esta tecnologıa en sus productos. Esta aplicacion en particular encuentra y encasilla palabras claves dentro de las tarjetas de presentacion, las que son de utilidad para el emprendimiento Meetcard [1, 2], nacido en la Universidad Tecnica Federico Santa Marıa, emprendimiento para el cual se esta realizando este proyecto. Meetcard es una tarjeta inteligente de presentacion, la cual utiliza tecnologıa NFC y codigos QR para el traspaso de informacion del contacto (nombre, tel´efono, direccion, entre otras) de manera directa al celular de la persona que posee la aplicacion. Esta tarjeta inteligente traspasa toda la informacion de contacto al movil. El problema surge cuando una persona que posee Meetcard quiere obtener la informacion de una tarjeta tradicional de papel. El proyecto resuelve esta problematica mediante la toma de una foto de la tarjeta de presentacion y extrayendo autoMaticamente la informacion de relevancia de manera muy rapida y sencilla. El proyecto que aca se muestra tiene como objetivo ser el primer prototipo de la nueva caracterıstica que implementara en el futuro proximo Meetcard en su aplicacion.
Description
Catalogado desde la versión PDF de la tesis.
Keywords
SEMI AUTOMATIZACION, TARJETAS DE PRESENTACION, OCR