DSpace About DSpace Software
 

DSpace Biblioteca Universidad de Talca (v1.5.2) >
Facultad de Ingeniería >
Memorias de pregrado Ingeniería Civil en Computación >

Please use this identifier to cite or link to this item: http://dspace.utalca.cl/handle/1950/8657

Title: Recuperación eficiente de datos para el refinamiento de traducciones automáticas, utilizando la web como base de conocimiento
Authors: Yáñez Alarcón, Danilo Alfonso
Paredes Moraleda, Rodrigo (Prof. Guía)
Keywords: Indexación
Traductores Programas para Computadores
Issue Date: 2011
Publisher: Universidad de Talca (Chile). Escuela de Ingeniería Civil en Computación.
Abstract: La refinación de las traducciones automáticas pretende corregir ciertas ambigüedades que ocurren con los algoritmos que actualmente se usan en los motores de traducción, de modo de obtener textos cuya comprensión por parte del usuario final sea mejor. Nuestra propuesta se basa en tomar como fuente de conocimiento la Web, entorno donde en cada momento se esta publicando nueva información (revistas, libros, tesis, papers, investigaciones, noticias etc.), en diferentes lugares del mundo. En este estudio se considera que la unidad mínima de traducción es una frase. La maquina comunicacional considerada para llevar acabo el proceso de refinamiento considera tres etapas a saber: (1) La captura de información textual de la Web (que deja como resultado una base de datos que crece constantemente); (2) El indexamiento de la información recopilada; y posteriormente ,(3) algoritmos de búsqueda por similaridad que permiten encontrar la frase mas adecuada al contenido(contexto) del texto traducido. Esta memoria se enfoca principalmente en el indexamiento de frases y la resolución eficiente de diversos tipos de consultas para recuperaci´on de frases utilizando diferentes estructuras de datos y algoritmos que servir´an de apoyo al momento de tomar la decisi´on de las frases m´as apropiadas a fin de mejorar la calidad de la traducci´on. Esta memoria esta inmersa en un proyecto m´as complejo en que se estudian y proponen t´ecnicas que permite refinar las traducciones autom´aticas, previamente realizadas por motores de traducci´on al idioma espa˜nol, por ejemplo: Google Translate,Yahoo! Babel Fish, Systran entre otros. Dicha memoria se enfoca principalmente en la recuperaci´on eficiente de informacion textual como medio de apoyo (reflejada en un m´odulo de la aplicación) al proceso de refinamiento de traducciones automáticas, indexando y estructurando la informaci´on que ha sido obtenida de la Web. Palabras Clave: Recuperacion de Informacion, Indexaci´on, Indices invertidos, Lenguajes de consulta./ABSTRACT: Automatic translation refining aims to correct some ambiguities that occur when using algorithms that are currently operating on translation engines, so as to obtain texts than are more understandable by the end user. Our proposal is based on taking the Web as a knowledge source where every time new information (magazines,books, theses, papers, research, news, and so on) is being published in different parts of the world. In this study we consider that the minimum unit of translation is a phrase. The whole machinery required to carry out the refining process considers three stages, namely, (1) to capture textual information from the Web (this stage produces a phrase database that is constantly growing); (2) to index the information collected; and (3) similarity search algorithms that find the most appropriate phrase according to the content (context) of the translated text. In this study we consider that the minimum unit of translation is a phrase. While the whole project studies and proposes techniques that allow to refine automatic translations previously translated by a engine translations (for instance, Google Translate,Yahoo! Babel Fish, Systran) into Spanish; this work focuses primarily on the efficient retrieval of textual information as a mean of supporting the process of refining machine translations, indexing and structuring the information that has been obtained from the Web.
Description: 82 p.
URI: http://dspace.utalca.cl/handle/1950/8657
Appears in Collections:Memorias de pregrado Ingeniería Civil en Computación

Files in This Item:

File Description SizeFormat
yanez_alarcon.pdfTabla de Contenidos44.84 kBAdobe PDFView/Open
yanez_alarcon.pdfResumen21.99 kBAdobe PDFView/Open
yanez_alarcon.htmlLink a Texto Completo2.78 kBHTMLView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2009  The DSpace Foundation - Feedback