Glorias y miserias de la traducción automática
Ponencia presentada en las
Jornadas "Lengua e Informática" organizadas por la
Asociación de Técnicos de Informática – SIMO –
4 de noviembre de 1999
Problemas inherentes a la traducción
En opinión de muchas voces autorizadas, el hecho mismo de la traducción, y me refiero todavía a la traducción humana, es una empresa condenada al fracaso. Títulos tan expresivos de libros recientes como "El delito de traducir" (1), del profesor Santoyo, de la Universidad de León o "La imposibilidad de la traducción" (2), del profesor Dámaso López, de la Universidad de Castilla - La Mancha, ponen en evidencia la duda razonable sobre las posibilidades de éxito a que puede aspirar quien se pone a traducir. No hay virtualmente ningún libro entre la abundante literatura especializada en la teoría de la traducción que se ha generado y se está generando en las últimas décadas, que no ponga de manifiesto esa duda, cuando no una decidida negación de la posibilidad de traducir. Según Samuel Johnson, "la única traducción posible es la científica". Por no hablar del conocido adagio italiano "Traduttore, tradittore". En cuanto a las opiniones que suscita
la traducción automática, se han producido en los últimos
cuarenta años varios flujos y reflujos, pasando por pasiones e indiferencias,
apasionados entusiasmos y airados rechazos. Ahora, los ardores parecen
haberse moderado en uno y otro sentido, y ya nadie parece esperar tanto
ni despreciar tan enérgicamente las posibilidades de la tecnología
que nos ocupa. Ya todo el mundo parece tener claro que ni es la panacea
que auguraba Warren Weaver en 1947 ni la entelequia desprovista de futuro
que dictamino la comisión ALPAC en 1966.
Las dificultades
"Para hacer una traducción son dos cosas al menos necesarias: la primera, entendimiento de la verdad que se interpreta. La segunda, perfecto conocimiento de los dos idiomas. Un traductor no puede traducir con verdad si no tiene conocimiento de lo que traduce." En verdad, los requisitos que exigía el cultísimo obispo son bien razonables, y de su no cumplimiento nace tanta aberración como leemos en las traducciones que sufrimos. Pero hemos de reconocer que no son ni mucho menos fáciles de cumplir. ¿Quién tiene un conocimiento perfecto de dos idiomas? ¿Cuántos tan solo de uno, del suyo materno? ¿Cuántas personas distinguen los matices y sutilezas de lo que denominamos sinónimos sin que realmente lo sean? Y, en cuanto a lo que Alonso llamaba "la verdad que se interpreta", es decir, la materia, tema o disciplina de que trata el texto a traducir, aún en los técnicos y científicos, cuya traducción se suele tener por más sencilla, con excesiva frecuencia es notorio el desconocimiento de que hacen gala los traductores de turno. Se podría añadir el descuido, y la poca atención al sentido y al significado del texto, y el escaso sentido común, y la pobreza de sensibilidad lingüística, y la prisa, y, ¿por qué no decirlo?, la desidia tal vez ocasionada por unos emolumentos demasiado bajos. Todos los problemas que puedan encontrarse los humanos con la traducción, se ven incrementados con la traducción automática. Veamos un ejemplo facilito. Hace ya bastantes años, leyendo una traducción de "Fiesta", de Hemingway, tropecé con una frase que me produjo cierta perplejidad. Era algo así como (cito de memoria) "... el sol brillaba sobre las paredes concretas de la plaza". ¿A cuento de qué venía lo de "concretas"? Me resultaba difícil entonces, y me lo resulta todavía, concebir las paredes de una plaza de toros (ese era el contexto) como un ente abstracto. Fueron necesarios un poquito de reflexión y unos conocimientos, siquiera elementales, de inglés para colegir que el traductor se había dejado engañar por lo que se conoce como un "falso amigo", en este caso provocado por una homografía. Lo que con toda seguridad había en la mente de Hemingway al escribir "concrete walls" eran unas "paredes de hormigón" o, lo que es lo mismo, de concreto, término que si bien en España se usa poco con ese significado, es muy usado en América (DRAE, acepción 2). Es este un caso típico de homografía que al traducir del inglés resulta doblemente problemático. La palabra funciona en unos casos como sustantivo (hormigón) y en otros como adjetivo (concreto, -a, -os, -as). Ni la morfología ni la sintaxis nos ayudan en inglés, al carecer el sustantivo de género y el adjetivo de género y número que nos aporten pistas aclaratorias. En español, además, la preposición "de"nos ayuda un poco más, aportando el matiz "hechas de". A mi entender, el traductor (cuyo nombre no merece ser recordado) podía haber resuelto la dicotomía con un poquito de sentido común, de pensar un poco lo que leía y lo que escribía. Pero seguramente tenía prisa. Otra cosa que podía haberle ayudado habría sido pasar la traducción por el tamiz crítico de una lectura ajena, lo que algunas agencias de traducción llaman "la sombra", alguien no sujeto a los condicionantes lingüísticos que a menudo sufren (sufrimos) los traductores (literalidad, calcos sintácticos, los mencionados "falsos amigos", etc.), y que al leer el texto traducido sin estar influenciado por el texto original, detecta fácilmente la falta de naturalidad, las expresiones oscuras o ambiguas o los términos de difícil comprensión. En la traducción automática "la sombra" es una absoluta necesidad, lo que se conoce como postedición, que pone un poco de cordura en los frecuentes dislates léxicos y sintácticos con que nos regala los sentidos el traductor automático. Pero no cabe duda de que, en términos
de traducción automática, la solución del problema
debe pasar por un proceso distinto al del "sentido común", que si
entre los humanos es el menos común de los sentidos, en las máquinas
está aún en el dominio de lo borroso, demasiado borroso.
¿Cuál hubiera podido ser el planteamiento para resolver la
dicotomía planteada por las tan mentadas paredes? Se me ocurre,
en principio, que en las tablas léxicas del programa traductor podría
existir un campo en la definición de los sustantivos que indicase
precisamente si se trata de un objeto concreto o de una idea abstracta.
En este caso, el término wall estaría marcado
como concreto, lo que mediante una programación adecuada excluiría
el uso de concrete como adjetivo. Pero justo es reconocer
que ello requeriría una programación extremadamente cuidadosa.
La traducción literaria
Estas dificultades de traducción
intercultural, la riqueza connotativa y evocadora de determinadas expresiones
y palabras, junto con la no menos importante dificultad de la conservación
del estilo original, que es parte esencial del mensaje literario (3), hacen
que la posibilidad de utilizar la traducción automática para
obras literarias esté fuera de toda consideración.
La traducción técnica
Los problemas de la traducción técnica son fundamentalmente de orden léxico y concrptual. La continua y cada vez más rápida aparición de neologismos exige del traductor una permanente puesta al día sobre los nuevos términos, tanto en su aspecto conceptual como en su posible versión en la lengua meta. Es bien conocido el hecho de que en la terminología técnica hay una fuerte tendencia a la conservación de la versión original, que, con excesiva frecuencia, acaba siendo adoptada en forma de préstamo o de calco. Muchas veces esa adopción es totalmente innecesaria, por existir en la lengua meta una palabra o expresión totalmente equivalente. Este es un fenómeno que se da sobre todo en las jergas profesionales, algo así como la pretensión de un lenguaje críptico y sacerdotal tan solo asequible a los iniciados. Pero los problemas léxicos son
los de más fácil solución en traducción automática.
Es ‘solamente’ una cuestión de recopilar un buen corpus de
la materia o materias que se pretende traducir, cosa que al fin y al cabo,
también debe hacer el traductor humano. Pero los textos técnicos
no suelen contener la riqueza lingüística de los literarios,
por lo que sí son los candidatos naturales a la traducción
automática.
El proyecto SATMET. Un ejemplo práctico
Durante los años 1993 y 1994 participé en Estocolmo en un proyecto denominado SATMET, Semi Automatic Translation METhod. En éste proyecto, que utilizaba como base el sistema LOGOS, se combinaba el desarrollo de un sistema de traducción semiautomática con la obtención de resultados prácticos, tanto en su aspecto de producción como en su rentabilidad económica. En este sistema, el proceso de traducción se dividía en tres etapas típicas: Preedición, Traducción por ordenador y Postedición. El proyecto incluía, además,
una cuarta etapa, ya fuera del proceso productivo, mediante la cuál
se pretendía llevar a cabo un refinamiento progresivo del sistema.
Mediante el análisis de los errores observados en las traducciones
obtenidas, se procedía a la modificación de las tablas internas
del traductor, tratando así de evitar aquello tan humano de ‘tropezar
dos veces en la misma piedra’ y tendiendo a obtener unos resultados
cada vez mejores.
PreediciónEl tratamiento previo de los textos, escritos en SGML, incluye las adaptaciones de formato físico (marcar el texto que no se desea traducir, fuentes especiales, etc.), así como la edición de la corrección gramatical, errores tipográficos, estilos farragosos, etc. Obedece a un principio de la Traducción Automática que se ha venido en denominar como Garbage in, garbage out, es decir, Si metemos basura, basura sacaremos. En cuanto al estilo, a finales de los 80 y principios de los 90 algunas grandes empresas generadoras de enormes volúmenes de documentación, candidata a la Traducción Automática, hicieron un siniestro intento de imponer a sus escritores técnicos un estilo empobrecido en cuanto al léxico y la sintaxis, con vistas a que la documentación generada cumpliese unos estándares de simpleza más fáciles de reconocer por una máquina. Para ello se llegaron a editar manuales de lo que yo llamaría mal estilo, imponiendo restricciones sintáctica e incluyendo glosarios del léxico a utilizar, unas 1.000 o 1.500 palabras. El intento no tuvo éxito. Una sorda rebelión de los autores de originales dio al traste con tan sombrío planteamiento. Tal vez estaban vacunados por la lectura del 1984 de Orwell, y su denuncia de aquella sociedad en la que se pretendía empobrecer el lenguaje, por que la idea que no se puede expresar no existe. Aunque no cabe duda de que de haber prosperado tal intento, hubiera sido de gran ayuda para el diseño de los sistemas de traducción por ordenador, especialmente en lo relativo a sus tablas tanto léxicas como de reglas sintácticas y semánticas.Las tablas léxicas, las reglas sintácticas y la información semántica son el corazón de un sistema de traducción automática. De lo cuidado de su diseño depende el éxito o el fracaso del proceso. Hay algunos problemas específicos de la traducción por ordenador que merece la pena ver aquí, siquiera someramente. Estos se pueden dividir en tres grandes grupos: léxicos, sintácticos y semánticos o contextuales. Un problema de particular envergadura,
como hemos entrevisto, es el de las polisemias y las homografías.
En los sistemas que se usan en la actualidad para fines prácticos,
el problema se resuelve a medias al estar los textos a traducir bastante
ceñidos a unos temas muy concretos y estar, por lo tanto, el contexto
muy acotado. Es lo que se denomina sublengua o submundo.
La siguiente lista de ocurrencias de un conocido programa de traducción
automática, LOGOS (por otra parte uno de los sistemas más
aceptados), nos puede dar una idea de los despropósitos que se pueden
obtener al no tener en cuenta el contexto de lo traducido:
Problemas sintácticos Podemos ver que en algunos casos, no solo cambia el significado, sino incluso la parte de la oración. Términos tan frecuentes en el contexto técnico, y no solo en él, como date, pueden ser tomados, y de hecho lo fueron en un documento corregido por mí, en el verbo salir con el significado de tener una cita. Es fácil imaginar el regocijo. Pero, ¿cómo puede llegar a ocurrir tamaño despropósito? ¿Acaso el programa no sabe distinguir entre un sustantivo y un verbo? Pues precisamente ahí esta el meollo del problema. En su estrategia de análisis de la oración original, el programa trata de ir extrayendo progresivamente el sujeto, el verbo y los sucesivos complementos. En una frase del tipo: The system dates included in the register .... El sistema hace el siguiente análisis sintáctico: Complemento directo: (those) included in the register Con lo que nos podría dar la siguiente traducción: El sistema sale (o ‘tiene una cita’) con las incluidas en el registro. En efecto, una vez localizado el sujeto, el analizador sintáctico busca con avidez un verbo; y se encuentra con dates, que le sirve de maravilla como tal. Hasta tiene su ‘s’ de tercera persona y todo. Así que hace de agencia matrimonial y le proporciona una cita al sujeto en cuestión. Algo parecido ocurre con type, seconds, time, por mencionar tan solo algunos de los ejemplos de la lista anterior, obtenidos de casos reales de traducción automática corregidos por mí. El punto de partida de esa cruzada en busca del verbo anhelado comienza una vez que el programa determina que ya ha encontrado el sujeto. Pero el origen del problema está precisamente en las muchas dificultades que eso encierra. El mismo problema se produce con los complementos directo e indirecto, es decir, es un problema general de los grupos nominales, especialmente con algunos de ellos, por ejemplo: (TM = Traducción de máquina, TH = Traducción humana o corregida)
ej. the BTE device => el BTE de dispositivo => el dispositivo BTE), ej. Is device IT, OT or BT selected? TM ¿Está IT el dispositivo, OT o BT seleccionado? TH ¿Está seleccionado el dispositivo IT, OT o BT? ej. 1 This command connects devices CR1 – CR5 in consecutive order TM Este comando conecta -CR1 de dispositivos; CR7 en la orden consecutiva TH Este comando conecta los dispositivos CR1 - CR7 en orden consecutivo ej. 2 This command deblocks devices IT and OT TM Este comando desagrupa IT de dispositivos y OT TH Este comando desagrupa los dispositivos IT y OT
Dígitos de verificación de número de extensión privados Dígitos de verificación de número de extensión privada. (El sentido común nos dicta que lo privado es la extensión, no los dígitos. Pero, ¿quién se lo dicta al ordenador?).
- El propietario del viejo coche negro - El viejo propietario negro del coche - El propietario negro del coche viejo ¿Qué es viejo, el coche o su propietario? Todas ellas podrían ser interpretaciones posibles Una vez vistos estos grupos nominales aislados, veamos el efecto que produce la imprecisión de la frase nominal en un caso un poco más complejo:
TM - ¿La supervision de fallo de señalización alarma la necesidad que tiene de ser restaurada? TH ¿Necesita ser restaurada la alarma de supervisión de fallo de señalización? Postedición
Y si se quieren algunos ejemplos más, basta con acceder a alguno de los sitios web que ofrecen un servicio de traducción en línea, por ejemplo Altavista (http://www.altavista.com/). La traducción automática hoy. Estado de la cuestión
Al terminar la 2ª Guerra Mundial,
animados por el entusiasmo de Warren Weaver, uno de los padres de la disciplina,
varios grupos empezaron a investigar sobre la traducción automática.
No tardaron en darse cuenta de que la cosa no era, ni mucho menos, tan
simple como se había `previsto.
El informe ALPAC
En la época de la publicación del informe ALPAC (guerra fría, carrera espacial) el principal interés de traducción por parte del gobierno norteamericano estaba centrado en la traducción del ruso al inglés. Es anecdótico. pero significativo, el ejemplo (4) del resultado obtenido con una traducción realizada en este par lingüístico, primero del inglés al ruso, después del ruso al inglés (una especie de prueba del nueve de la traducción automática): Original inglés (equivalente español): El espíritu es fuerte, pero la carne es débil Resultado obtenido después de traducir al ruso y volver a traducir al inglés: El vodka es bueno, pero el filete está podrido A la vista de un resultado así,
tal vez no debieran extrañarnos las conclusiones del comité
ALPAC.
El informe JEIDA
La piedra de toque para determinar si, en su estado actual, la traducción automática puede considerarse una técnica útil es preguntarse qué se pretende de ella y qué se está obteniendo. Las necesidades de traducción del mundo actual son ingentes (4, 5). Las agencias y organismos dedicados a la traducción se encuentran sobrepasados y no dan abasto. Muchos de los documentos que se necesita traducir solo requieren lo que se denomina un "resumen informativo", tan solo lo imprescindible para que un ejecutivo pueda tener una información inmediata sobre determinado asunto. En muchos de estos casos, la calidad del estilo no resulta un problema importante, aunque sí la precisión y la claridad. Los contextos suelen estar bien delimitados. En todos estos casos, la traducción semiautomática puede ser una solución aceptable en su estado actual, entendiéndola como un proceso mecánico con intervención humana previa y posterior, y en algunos casos de forma interactiva para resolver ambigüedades durante el proceso de la traducción. En los últimos años ha adquirido gran auge una tecnología denominada traducción asistida, en la que el traductor se sirve de un programa que le ayuda a resolver problemas de traducción ya resueltos anteriormente, lo que además aporta consistencia a la terminología y al estilo. Estos sistemas, denominados también memorias de traducción, se sirven de traducciones hechas anteriormente (por ejemplo, para un proyecto o cliente determinado), indicando al traductor cuando existe una coincidencia total o parcial en términos de porcentaje y sugiriendo la traducción que hay en su memoria con indicación de aquellas palabras o términos que varían. Tras las correcciones necesarias, el traductor acepta la sugerencia y continúa con la siguiente unidad de traducción (párrafo). De entre estos sistemas, Trados es tal vez el más utilizado, incluso por traductores autónomos, que ven así incrementada su productividad. Además es cada vez más frecuente que las agencias que encargan los trabajos proporcionen las memorias de traducción ya existentes para ese proyecto, en aras de la mencionada consistencia. Sigue siendo cierta una de las conclusiones del Informe JEIDA, cuando se van a cumplir doce años de su publicación: "Los fenómenos lingüísticos
que en la actualidad se pueden abordar mediante la traducción automática
son limitados, pero la traducción automática sigue haciendo
continuos progresos. En los Estados Unidos, en Europa y en el Japón
están apareciendo y se están usando sistemas con utilidad
práctica."
Referencias bibliográficas
Santoyo, J. C. - Universidad de León, Secretariado de Publicaciones – 1996 López García, Dámaso – Universidad de Castilla – La Mancha, Servicio de Publicaciones – 1991 Rodríguez Jiménez, Manuel – Original facilitado por el autor Marcos Marín, F et al. – TELOS nº 16 – PP.90 – 99 Bel, Nuria –Boletín de FUNDESCO nº 163 pp. 17-18 Flanagan, Mary A. - Keystones of Communication – Proceedings of the 34th Annual Conference of the American Translators Association – p. 307 – 318 – Learned Information, Inc – Medford, N. J. Division of Behavioral Sciences – National Academy of Sciences National Research Council (1966) Japanese Electronics Industry Development Association (1988)
|
Última actualización:
30 |
|
info@ati.es
|