|
DSpace Biblioteca Universidad de Talca (v1.5.2) >
Facultad de Ingeniería >
Memorias de pregrado Ingeniería Civil en Computación >
Please use this identifier to cite or link to this item:
http://dspace.utalca.cl/handle/1950/8657
|
Title: | Recuperación eficiente de datos para el refinamiento de traducciones automáticas, utilizando la web como base de conocimiento |
Authors: | Yáñez Alarcón, Danilo Alfonso Paredes Moraleda, Rodrigo (Prof. Guía) |
Keywords: | Indexación Traductores Programas para Computadores |
Issue Date: | 2011 |
Publisher: | Universidad de Talca (Chile). Escuela de Ingeniería Civil en Computación. |
Abstract: | La refinación de las traducciones automáticas pretende corregir ciertas ambigüedades
que ocurren con los algoritmos que actualmente se usan en los motores de traducción, de modo de obtener textos cuya comprensión por parte del usuario final sea
mejor. Nuestra propuesta se basa en tomar como fuente de conocimiento la Web, entorno donde en cada momento se esta publicando nueva información (revistas, libros,
tesis, papers, investigaciones, noticias etc.), en diferentes lugares del mundo.
En este estudio se considera que la unidad mínima de traducción es una frase. La
maquina comunicacional considerada para llevar acabo el proceso de refinamiento
considera tres etapas a saber: (1) La captura de información textual de la Web (que
deja como resultado una base de datos que crece constantemente); (2) El indexamiento
de la información recopilada; y posteriormente ,(3) algoritmos de búsqueda por similaridad que permiten encontrar la frase mas adecuada al contenido(contexto) del
texto traducido. Esta memoria se enfoca principalmente en el indexamiento de frases
y la resolución eficiente de diversos tipos de consultas para recuperaci´on de frases
utilizando diferentes estructuras de datos y algoritmos que servir´an de apoyo al momento
de tomar la decisi´on de las frases m´as apropiadas a fin de mejorar la calidad
de la traducci´on. Esta memoria esta inmersa en un proyecto m´as complejo en que
se estudian y proponen t´ecnicas que permite refinar las traducciones autom´aticas,
previamente realizadas por motores de traducci´on al idioma espa˜nol, por ejemplo:
Google Translate,Yahoo! Babel Fish, Systran entre otros. Dicha memoria se enfoca
principalmente en la recuperaci´on eficiente de informacion textual como medio de
apoyo (reflejada en un m´odulo de la aplicación) al proceso de refinamiento de traducciones automáticas, indexando y estructurando la informaci´on que ha sido obtenida de la Web.
Palabras Clave: Recuperacion de Informacion, Indexaci´on, Indices invertidos,
Lenguajes de consulta./ABSTRACT:
Automatic translation refining aims to correct some ambiguities that occur when
using algorithms that are currently operating on translation engines, so as to obtain
texts than are more understandable by the end user. Our proposal is based on taking
the Web as a knowledge source where every time new information (magazines,books, theses, papers, research, news, and so on) is being published in different parts of the world. In this study we consider that the minimum unit of translation is a phrase. The whole machinery required to carry out the refining process considers three stages, namely, (1) to capture textual information from the Web (this stage produces a phrase database that is constantly growing); (2) to index the information collected; and (3) similarity search algorithms that find the most appropriate phrase according to the content (context) of the translated text. In this study we consider that the minimum unit of translation is a phrase. While the whole project studies and proposes techniques that allow to refine automatic translations previously translated by a engine translations (for instance, Google Translate,Yahoo! Babel Fish, Systran)
into Spanish; this work focuses primarily on the efficient retrieval of textual information as a mean of supporting the process of refining machine translations, indexing and structuring the information that has been obtained from the Web. |
Description: | 82 p. |
URI: | http://dspace.utalca.cl/handle/1950/8657 |
Appears in Collections: | Memorias de pregrado Ingeniería Civil en Computación
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|