cognición, traducción, computación, utopía · web viewsi traducimos el término abstracto de 1...

Traducción, computación, utopía.Dra. Anna Aguilar-AmatDepartamento de Traducción e InterpretaciónUniversidad Autónoma de Barcelona

Abstract

The paper aims to reconsider some questions related with Machine Translation and Artificial Intelligence, their roles on other sciences development and their problems. It is willed to show an historical perspective to understand Machine Translation reality and future research. Part 3 wants to scope a general view on the analysis of knowledge and meaning, and to place natural language processing on its social and policy effect. It is also displayed a sample of a knowledge base developed in the Translation Faculty at Autonomous University of Barcelona. Furthermore there is a reflection on technical uthopie some notes on the real use of MT, and a vision of linguistics and translation from the computational angle.

For any complex problem, there is a solution that is simple, neat, and wrong.H.L. Mencken

Índice

1. Introducción: en torno a los términos2. Unidad de significado y unidad de traducción3. Historia de un concepto y de su Traducción Automática

3.1. La denominación3.2. El sublenguaje3.3. El contexto social3.4. El proyecto BACUS (Base de Conocimiento UniverSitario)

3.4.1. Hipótesis conceptual de BACUS4. Historia de una utopía

4.1. La vieja utopía: Substitución de la Traducción Humana 4.2. La nueva utopía: Automatización de la Traducción Humana

5. Cuándo es útil la Traducción Automática5.1. Condiciones de un texto para poder ser traducido automáticamente5.2. El concepto de ‘automático’

6. Puzzle de disciplinas6.1. La ciencia del lenguaje6.2. Teoría de la Traducción y Traducción Automática

1

1. Introducción: en torno a los términos

Tratándose del procesamiento del lenguaje natural, tal vez se puede comenzar por unas notas sobre los conceptos evocados por las denominaciones de Inteligencia Artificial y de Traducción Automática. Según Francesc Esteva (IIIA-UAB, Institut d’Investigació en Intel·ligència Artificial de la Universitat Autónoma de Barcelona), el término “Inteligencia Artificial” se acuñó en 1956, por convenio, en una reunión de miembros de la comunidad científica que trabajaban en los primeros estadios del desarrollo del software y que provenían del campo de la lógica. Aunque tiempo después se demostró la imposibilidad de la existencia de un ‘razonador universal’, se sigue trabajando en la posibilidad de que el ordenador resuelva problemas concretos, emita diagnósticos y tome decisiones. Así, se considera ‘inteligente’ el hecho de que el sistema aprenda y de que pueda encontrar una solución nueva para un problema planteado y ya resuelto otras veces de una determinada manera. En sus primeros estadios, tanto la IA como la Traducción Automática desarrollaron programas que tomaban sus decisiones según modelos deterministas basados en el denominado pattern matching o comparación de patrones. En ulteriores estadios, la aplicación de reglas de preferencia sobre los patrones así como las decisiones basadas en criterios estocásticos, conferían mayor capacidad ‘creativa’ a los sistemas. Para lograr cierto avance, los expertos en IA han dividido la investigación en ‘subproblemas’: la identificación de rostros, la detección de señales procedentes del universo, el archivo de historias clínicas, las agendas electrónicas, los sistemas de dictado automático, etc. Este ‘despiece’ afecta también al universo del lenguaje, pero de una manera un tanto más difusa.

Pero antes de entrar más de lleno en este asunto, quisiera señalar la incidencia del término ‘inteligencia’ desde un punto de vista humanístico1. La etimología popular podría creer que intelligere significa leer entre líneas, pero, en lo documentado, procede de legere, elegir, escoger entre varias opciones. Se aplica, en el caso de la Inteligencia Artificial a un aparato lógico del que se pretende obtener el resultado a partir de un proceso deductivo fijado metódicamente de antemano sobre un conjunto seleccionado de datos. Tanto el concepto de ‘inteligencia’ como el de ‘memoria’, asociados a este campo, están basados en la metáfora del ordenador como cerebro. Resulta discutible si esta metáfora ayuda al desarrollo de la Inteligencia Artificial o, por el contrario, constituye una limitación en sí misma, debido, sobre todo, al desconocimiento que poseemos los humanos del comportamiento de nuestros mecanismos cerebrales. También resulta discutible si esta metáfora contribuye al avance del conocimiento sobre la mente y el cerebro.

Entender el cerebro como un procesador de información ayuda a describir separadamente las estructuras de los procesos, siempre que esa separación sea factible y significativa en el acto de ‘elegir’. Sucede, sin embargo, que el proceso deductivo que protagoniza el concepto de Inteligencia Artificial no es el más importante, ni mucho menos el único, de los que caracterizan la inteligencia humana. El cerebro posee la facultad de tener ‘ocurrencias’, de llegar a conclusiones creativas, gracias, precisamente, a la capacidad de abandonar la modalidad deductiva de procesamiento y dejar que la mente ‘vague’ por todas las asociaciones posibles, muchas de ellas aparentemente estúpidas. Por eso, cuando el concepto de ‘inteligencia’retorna de su decurso instrumental, cuando después de 1 Este decurso sobre el concepto de inteligencia tiene razón de ser si tenemos en cuenta que la inteligencia es uno de los valores más preciados en la cultura occidental y un objeto de estudio que es proceso de frecuentes propuestas de cambio conceptual desde diferentes perspectivas. (Ver Claxton, 1997 o Goleman, 1995).

2

aplicarlo a los ordenadores volvemos a concebir la habilidad humana, redefinimos a las personas como procesadores de información, y a la naturaleza, en nuestro caso al lenguaje, como ‘información que tiene que ser procesada’. Como sostiene Postman (1992), el mensaje metafórico fundamental del ordenador es que nosotros somos ‘máquinas’ pensantes, y que la inteligencia es algo rápido, explícito, definido, basada en datos objetivos y bajo estricto control: “El ordenador hace posible el sueño de Descartes consistente en la matematización del mundo. Facilita la conversión de los hechos en estadísticas y de los problemas en ecuaciones” (Ibíd., pp. 118-119).

Desde la visión humanista, este concepto tecnológico de la inteligencia parece pernicioso cuando se hace general y dominante. En cuanto a la Traducción cabe decir que, situados en contextos especializados, el valor de la capacidad de cálculo, la velocidad y el volumen de la información está fuera de toda duda, pero los problemas más serios que afectan al campo de la Traducción no son del orden de los que pueden ser resueltos con ayuda del ‘cálculo’. Por este motivo el usuario de un sistema de Traducción Automática debe poseer la ‘inteligencia’ o la intuición de lo que puede exigir y obtener, y de lo que va a ser silenciado o equivocado. El resultado de un programa de Traducción Automática depende en gran medida del carácter repetitivo de los patrones ofrecidos y de la especificidad y especialización2 del texto y del vocabulario. La meteorología, por ser un dominio donde la innovación conceptual es mínima, fue uno de los primeros campos en que la TA fue aplicada con éxito. Aunque pueda hallarse soluciones ‘ad hoc’ para cada problema, el proceso traductológico es un problema complejo, y la TA debería ser considerada un sistema experto. Un sistema experto es un multiagente que trabaja como un detective: utiliza grandes cantidades de información almacenada para, mediante la aplicación de reglas lógicas, resolver un problema complejo.

El punto de partida de la investigación en TA (como el de las redes neuronales) se caracterizó por la aplicación de la estrategia bottom up, es decir por el proceso de construir el significado a partir de sus unidades mínimas. Parece, sin embargo, que los sistemas expertos más efectivos parten de la aproximación top down, en la cual los programas empiezan la casa por el tejado, es decir, por los resultados de un proceso cognitivo. Por otro lado cabe anotar que el lenguaje natural es, en sí mismo, un sistema experto, un extraordinario proceso de computación. Esto significa que estamos construyendo un sistema experto para regir otro, basado en la asignación de símbolos y signos. Por eso algunas tendencias desarrollaron la posibilidad de procesar en primer lugar los significados, el universo conceptual (Schank , Nirenburg, entre otros).

Cuando en los años cincuenta se acuñaron los términos ‘Inteligencia Artificial’ y ‘Traducción Automática’ se creía que en unos veinte años las máquinas harían la mayor parte de las tareas cotidianas. El resultado de esa utopía fallida fue la desconfianza de los que invirtieron en esta área tecnológica. Hoy en día no existen aplicaciones estrella, pero sí una invasión silenciosa y una ampliación del concepto de ‘automático’, tal y como pretendemos mostrar en este artículo.

2. Unidad de significado y unidad de traducción.

2 La especialización de un texto es su vinculación con un área temática determinada. Depende en parte de la clasificación de los campos del saber. La especificidad de un texto se mide por la intensidad de términos específicos cuya denominación es descriptiva del referente desde el punto de vista de la especialidad.

3

A menudo se ha pensado que los sucesivos esfuerzos fallidos por computar el lenguaje se debían a un desconocimiento del mismo, a una mala interpretación de los mecanismos que conducían a la producción de significado. Por este motivo una de las mayores contribuciones de la Traducción Automática se ha producido en el campo de la lingüística (ver apartado 6). En 1966 (solo dos décadas después de la segunda Guerra Mundial ) el comité ALPAC (Automatic Language Processing Advisory Committee) ya había determinado que la Fully Automatic High Quality Translation of Unrestricted Text (FAHQTUT) no era un objetivo posible debido a una infranqueable barrera: la semántica. Así y todo la investigación en Traducción Automática no sólo continuó sino que se expandió. En 1976 la Comunidad Económica Europea adquirió el programa SYSTRAN (La Jolla, California) que se enfrentaba a la traducción inglés-ruso e inglés-francés y realizó un plan de investigación y desarrollo para un conjunto de lenguas europeas. Representantes de 30 universidades formaron el grupo de coordinación. Una década y media después (en 1990) el proyecto EUROTRA cerraba sus puertas sin haber conseguido el producto deseado, casi al mismo tiempo que lo hacían los japoneses con su proyecto ATLAS en el que participaron entes privados y públicos. Sin embargo, la investigación tampoco cesó. Algunas potencias como Estados Unidos han mantenido sus niveles de inversión en el campo, mientras que otras han modificado la orientación de los mismos para reconducirlos hacia la iniciativa privada.

La búsqueda de la Traducción Automática se parece al esfuerzo que ha hecho el ser humano para hacer efectivo el sueño de volar que mantuvo durante más de diez siglos, tal vez desde siempre. Cuando finalmente lo consiguió, ni los procedimientos ni los materiales ni las aplicaciones se parecían mucho a los que diseñó Leonardo da Vinci a finales del siglo XV. En un principio se pensó que para poder volar el hombre necesitaba imitar al pájaro, o al menos, entender la esencia física de su vuelo. Ése esfuerzo (Borelli, 1680) asienta las dos ramas de la aeronáutica: la aerostación, donde la forma de sustentación es obtenida según el principio de Arquímedes mediante ingenios menos pesados que el aire, y la aviación, en la cual la fuerza es obtenida con la ayuda de motores por aparatos más pesados que el aire y según las leyes de la aerodinámica. Naturalmente, los hombres no vuelan como los pájaros. Tal vez debamos renunciar a la idea de que las máquinas piensen o traduzcan como los humanos para observar qué es lo que realmente pueden hacer. Y tal vez podamos entender mejor en qué consiste la comunicación y cómo funciona cuándo se trata de comunicación verbal. En palabras de Jackendoff (1983), desde el punto de vista de la lingüística, la pregunta es: “¿Cuál es la naturaleza del significado en el lenguaje, qué hace que podamos hablar de aquello que percibimos y hacemos?” Desde el punto de vista de la sicología cognitiva la pregunta es: “¿Qué revela la estructura gramatical del lenguaje natural respecto de la naturaleza de la percepción y la cognición?”

Tal vez una de las primeras trabas en el camino hacia la respuesta a estas preguntas haya sido la distinción de disciplinas y la ubicación del significado en el nivel denominado ‘semántico’ al que, en el proceso de computación, se asignaba un espacio ulterior, posterior al procesamiento de los niveles morfológico y sintáctico, en una estrategia marcadamente vertical y ascendente, bottom-up, como indicábamos al principio. En realidad, la semántica, como ciencia del significado, está relacionada con cualquiera de los acontecimientos sígnicos que configuran el lenguaje. De este modo, un fonema3 , mediante sus períodos de transición de formantes hacia otro fonema, sobre todo en el habla continua o espontánea, produce efectos 3 La fonética queda normalmente relegada de los estudios sobre Traducción Automática, pero no de los contenidos que afectan una disciplina que le es básica, la lingüística computacional.

4

conativos o apelativos, fáticos, expresivos o meramente referenciales (cf. Jakobson, 1936). El estudio de los aspectos prosódicos (pausas, entonación, etc.) se ha mostrado muy importante en este sentido (oratoria política, discurso publicitario, etc.). Así, un periodo de silencio sólo es evaluable en relación con el discurso, pero, también, el discurso puede cambiar su intencionalidad en relación con la duración de las pausas. El significado está íntimamente ligado con fenómenos como el cambio lingüístico: la gramática histórica, el cambio lexicológico o lexicográfico. También en la distinción de rasgos morfológicos que conllevan variación homonímica: espacio-s, vs. espacio-0 -interestelar-. La determinación o indeterminación de los sintagmas nominales (un espacio vs. el espacio), así como otros aspectos sintácticos como la modificación del núcleo (el espacio de juego, un espacio contaminado). Los criterios semánticos, con tanta fuerza como los sintácticos, intervienen en el estudio de la naturaleza de los nombres propios (-El- Salvador), los nombres genéricos (el hombre), la función de ciertos pronombres (la mayoría de) o adverbios.

La lingüística, al pasar la prueba de su computación, ha dejado claro que el estudio del lenguaje es el estudio de un sistema semiótico donde los signos son tanto entidades como relaciones entre los diferentes signos, y donde las diferentes áreas interaccionan profundamente. De hecho éstas relaciones eran conocidas desde el principio: “el estudio lingüístico, constituido como una ciencia, probablemente evolucionará hasta abarcar signos muy complejos, grandes frases, como por ejemplo una obra literaria” (Barthes 1969). Estas afirmaciones llevaron al posterior desarrollo de la teoría del discurso y de la gramática de texto.

Pero este nivel semántico omnipresente en todos los paradigmas de un sistema lingüístico muta su naturaleza en el momento en que comparamos un sistema lingüístico con otro. Emmanuel, El Salvador, El Redentor, Cristo, El Mesías, son algunos de los nombres con los que Occidente llama a su Dios. En El Corán aparecen más de doscientos nombres para ese referente divino. En pastún (Afganistán) o en malamayán (India) existen muchos conceptos distintos que equivalen a nuestro concepto de ‘mujer’, según sea una mujer soltera, casada, repudiada, viuda, joven, anciana, etc., y por ello nos enfrentamos a un problema de ambigüedad y de selección de la equivalencia.

Este es el motivo de que no exista una definición precisa de lo que es una unidad de significado en Traducción. Lo que se ha dado en denominar unidad de traducción (sea su forma el término, la frase, el párrafo o el documento entero), es un compendio de las posibilidades comparativas de un texto con otro, y por lo tanto hay tantas unidades de traducción como posibilidades de comparar una lengua con otra.

En España los estudios de Traducción se han separado de los estudios lingüísticos y ambos configuran licenciaturas independientes de la Filología desde 1993. El estudio sobre la naturaleza del significado en el aspecto comunicativo del lenguaje (y, al fin, no hay otro) sólo puede partir, a mi modo de ver, de los estudios de Traducción, y por lo tanto también lo hará un nuevo concepto de la Traducción Automática.

3. Historia de un concepto y de su Traducción Automática.

5

3.1. La denominación

Supongamos por un momento que hemos retrocedido a los años 90 y que debemos traducir un texto especializado en informática en el cual aparece el concepto ‘ordenador de quinta generación’. Supongamos que la oración completa en la que aparece el concepto es la siguiente:

“A principios de los años 90 se anuncia ya la aparición de los ordenadores de quinta generación como una revolución tecnológica”

La automatización del proceso supone el análisis morfosintáctico de los componentes del sintagma4. Es preciso identificar cada una de las denominaciones implicadas como pertenecientes a una categoría gramatical, así como determinar sus propiedades, entre otras el género y el número, para poder controlar las relaciones de concordancia con el resto de la frase en que esté ubicado. Este proceso se realiza mediante la comparación de cada elemento con el contenido de un diccionario o lexicón, donde la información léxica ha sido almacenada previamente por un lexicógrafo. Existe la posibilidad de almacenar todas las formas posibles de un lema (ordenador, ordenadores) o la de efectuar un cálculo según unas reglas predeterminadas. Con respecto del número, por ejemplo, es posible establecer una heurística de las posibilidades que presenta la lengua castellana para el mismo:

tipo de lexema según la sufijación

Singular Pluralmasculino femenino masculino femenino

1funcionario o a s2ordenador 0 es3fábrica 0 s4comisión 0 -5comision - es6presidente e a s7director 0 a es s8zulú 0 s/es9crisis 0 0 10patrón 0 - - -

4 Partimos de un sistema basado en la transferencia como el desarrollado por el proyecto Eurotra.

6

11patron - a es s12aprendiz 0 a - s13aprendic - - es -

Los tipos 5, 11 y 13 responden a lexemas existentes sólo para las formas de plural.

Si bien algunos fenómenos como el anteriormente descrito permiten ser sistematizados con exhaustividad, otros presenten paradigmas bastante más complejos, aún tratándose de fenómenos de naturaleza aparentemente no muy diferente, como por ejemplo el caso del diminutivo. Naturalmente que es preciso restringir las expectativas de análisis a aquella casuística que tiene probabilidades altas de aparecer en un texto especializado (ver apartado 5).

El paso siguiente en el proceso de análisis de un término como ‘ordenador de quinta generación’ es el de concebir el sintagma como una unidad lexemática compleja, un multi-word unit. El traductor humano sabe que ‘ordenador de quinta generación’ es un término complejo porque se corresponde con un único concepto, porque aparece recurrentemente en el texto, y porque cumple determinadas restricciones sintácticas como la ausencia de determinante en el sintagma nominal modificador5. La recurrencia y la carencia de determinante pueden ser detectadas por el ordenador. La existencia del concepto, sin una base de conocimiento, no.

Reconocer la existencia de MWU en los primeros estadios del análisis permite obviar el análisis de las relaciones sintácticas entre el núcleo y sus modificadores y evitar los problemas de sobregeneración de resultados que podrían surgir en el caso de que se produjera algún tipo de ambigüedad estructural6, es decir, que el programa considerara la posibilidad de que el sintagma preposicional dependiera de más de un núcleo en la oración (en nuestro ejemplo ‘de quinta generación’ puede ser considerado modificador de ‘ordenadores’ o de ‘aparición’.) En el caso de que el MWU no fuera identificado como tal, el programa analizaría la secuencia según los constructores previstos para el análisis del léxico simple. Una de las estrategias propuestas, una vez que el término ha sido detectado como término complejo, es la de unir los constituyentes mediante guiones bajos, y otorgar la categoría del núcleo y todas sus propiedades al nuevo lexema, léase ordenador_de_quinta_generación. Las limitaciones de esta aproximación se hacen patentes cuando contemplamos la posibilidad de que exista la siguiente frase:

“A principios de los años 90 se anuncia ya la aparición de los ordenadores denominados de quinta generación como una revolución tecnológica”

Esto construye la certeza de que las unidades complejas deben mantener su estructura, puesto que su naturaleza composicional es muy cohesionada semánticamente y 5 Ver los criterios para identificar un término en Cabré, M.T. (1992)6 La ambigüedad es connatural al lenguaje humano. Otros tipos de ambigüedad son la referencial (‘sacó la mosca de la sopa y se la comió’ –la mosca o la sopa), la léxica (polisemia) y la funcional (‘pan para comer’ –para ser comido, ‘gafas para leer’ –*para ser leídas).

7

por lo tanto bastante rígida desde el punto de vista sintáctico, pero no absolutamente rígida. De hecho los términos complejos se comportan como colocaciones, coocurrencias recurrentes dentro de un sublenguaje (especializado) o un sistema lingüístico (un idioma.).

Se definen 25 tipos de estructura diferentes para las colocaciones terminológicas para un texto de telecomunicaciones, de las cuáles la que sigue es una muestra:

%% 23%% ordenador de quinta generacio1n%% N1_P1_A_N2

MWU= {/cat=np} [*{}, {mwu_lu=MWU/cat=n,e_lu=N1}, {imwu=yes/cat=pp}[{/e_lu=P1}, {/cat=np}[ *{}, {/cat=ap,head=A}, {/cat=n,e_lu=N2}, *{imwu=no/cat=?}]], *{} ].

%% 24%% pequen&3a y mediana empresa%% A1_CONJ_A2_N1

MWU= {/cat=np}[*{}, {imwu=yes/cat=ap,cs=yes}[ {imwu=yes/cat=ap,head=A1}, {imwu=yes/cat=ap,head=A2,conj=CONJ}, {mwu_lu=MWU/cat=n,e_lu=N1}, *{} ].

%% 25%% red nacional analo1gica con conmutacio1n%% N1_A1_A2_P1_N2

MWU= {/cat=np} [*{}, {mwu_lu=MWU/cat=n,e_lu=N1}, {imwu=yes/cat=ap,head=A1}, {imwu=yes/cat=ap,head=A2}, {imwu=yes/cat=pp}[{/e_lu=P1}, {/cat=np}[*{}, {/cat=n,e_lu=N2}, *{imwu=no/cat=?}]], *{} ].

3.2. El sublenguaje

8

La identificación de las colocaciones terminológicas previa al procesamiento del texto resulta ser una estrategia útil. Esta identificación puede hacerse de manera automática según diferentes técnicas, pero la asignación unívoca del patrón correspondiente es preferible que sea manual. Esto significa que el proceso sólo devendrá completamente automático para un sublenguaje cuya terminología haya sido identificada de antemano y clasificada según su estructura sintáctica. Como ya dijimos, para los sublenguajes donde la repetición es máxima y la innovación terminológica mínima (como la meteorología), ésta es una tarea posible. Para aquellos otros lenguajes más difíciles de acotar habría que buscar técnicas que trabajaran por aproximación, con la consiguiente pérdida de exactitud.

Por otro lado, para extraer la terminología de un texto es preciso, o bien categorizar todo el texto para poder identificar patrones de nombre + adjetivo, de nombre + preposición + nombre, etc., o bien utilizar criterios estadísticos.

La primera opción implicaba el trabajo de un lematizador, es decir, de una herramienta que pudiera determinar la categoría de un lexema sin necesidad de cotejo con un diccionario. El lematizador trabaja con ayuda de una lista de sufijaciones (nominales, adjetivales, verbales, etc.), y por medio de reglas que efectúan un cálculo a partir de la adyacencia con otras categorías, actuando las categorías cerradas como punteros. Es decir, gracias a la presencia de artículos o preposiciones (categorías cerradas y listadas) es posible desambiguar aquellos casos en los que la información de la sufijación es insuficiente. Por ejemplo: ‘canto’ puede tratarse de un nombre o de un verbo. Si se detecta la adyacencia de un artículo (el canto) el programa rechaza la posibilidad de que sea un verbo. El lematizador es una herramienta que puede reutilizar la información que ella misma obtiene gracias a su cálculo para determinar la categoría de otros casos ambiguos.

Respecto de la segunda opción, la de utilizar criterios estadísticos para detectar los patrones léxicos coocurrentes y recurrentes, se parte del cálculo matemático de la información mutua entre dos eventos:

(11,12) log p (11 1 2 ) p(11) x (p12)

Smadja (1992) utilizó esta fórmula para identificar colocaciones en un corpus. Los binomios podían estar separados por varias palabras sin que ello menguara la relevancia estadística de su coocurrencia. La relevancia de las asociaciones, cuando éstas no eran corroboradas por patrones sintácticos, se medía a partir de los factores distancia, intensión, extensión, (distance, strenght, spread) en virtud de la frecuencia de coaparición de una palabra (wi ) con una palabra dada (w).

ki = freqi – f >/ 0stdv

wi palabra en colocaciónki extensión (puntuación asignada)freqi frecuencia de coaparición en cualquier posición para la palabra wi

f frecuencia mediastdv desviación estándar

9

Este tipo de aproximación, que podía trabajar también sobre textos paralelos alineados (Brown, 1991) para extraer información bilingüe (Smadja, 1993), sentó la base para la aparición en el mercado de varios productos destinados a la explotación de los textos y la obtención de información léxica. De entre los pioneros podemos destacar OCP (Oxford Concordance Program) y Tact (Universitat de Toronto), pero existen muchas otras (ver Sánchez-Gijón, 2002). Estos productos permiten obtener listas de palabras ordenadas de diversas maneras, extraer contextos y efectuar comparaciones de textos en distintas lenguas. Actualmente estos programas (Word Smith Tools, Kwick, System Quirck) son de gran utilidad para el traductor humano.

3.3. El contexto social

Sin embargo, aunque éstas herramientas pudieran ponerse al servicio de un programa de Traducción Automática, existen razones sociolingüísticas que afectan al proceso de Traducción de tal manera que sólo podemos concebir un proceso de Traducción Automática que trabaje con la información anteriormente procesada por un traductor humano. En lo que concierne al término ‘ordenador de quinta generación’, en la actualidad ha sido substituido por el término simple ‘Pentium’. Éste es un proceso muy común en todos los lenguajes de especialidad, los únicos lenguajes que, en principio, pueden ser traducidos automáticamente. Por lo general los términos inician su decurso conceptual con una anatomía fuertemente descriptiva, para luego metamorfosear en formas más analógicas o reducidas. Esto es mucho más acusado en el caso de las lenguas que importan (traducen) tecnología, y más todavía cuando la lengua receptora es de origen latino. Las lenguas románicas tienen menos agilidad que, por ejemplo, las anglogermánicas, para crear términos por composición de modificadores en número superior a uno, y a menudo prefieren la analogía:

carretilla hidráulica de elevación de horquilla (traducción literal del alemán) -> toro

También sucede a menudo que los términos son substituidos por sus siglas o, simplemente, elididos en parte o substituidos.

pequeña y mediana empresa -> PYMEprocesador esclavo -> servidor

Existe, pues, un conflicto que se resuelve sólo con el tiempo entre la necesidad de traducir rápidamente para obtener la información que precisa la ciencia y el mercado y la consolidación de los términos, la cual viene determinada solamente por el uso de los mismos.

Este último tipo de cuestiones supone, tal como sugiere el tipo de inversión pública en el sector educativo, un campo de estudio tal vez mucho más apasionante que el de la Traducción Automática. Dónde, cuándo, qué, cómo y a qué se traduce es, al fin y al cabo, mucho más importante que el instrumento o la velocidad, si lo que estamos traduciendo no es una declaración de amor o de guerra.

Para estos otros casos, y cuando desconocemos por completo la lengua a la que nos enfrentamos, es suficiente con el hecho de que la Traducción Automática nos ofrezca un mensaje ‘correcto’ desde el punto de vista binomial (sí cuando es sí, no cuando es no), algo

10

que se puede lograr con un buen diccionario y algunas reglas. En lo que se refiere al lenguaje natural, el control de la producción y la síntesis de significado puede efectuarse mediante la utilización de ontologías como la que se desarrolla en el Computing Research Laboratory de la Universidad de Nuevo Méjico, a cargo de Sergei Nirenburg (http://crl.nmsu.edu/). Una ontología es una representación del mundo donde los conceptos y sus denominaciones se definen en razón de sus características como procesos, entes, o propiedades. La ontología es una jerarquía taxonómica que permite desambiguar la polisemia por medio de la selección de los significados próximos en el árbol. Podemos ver un ejemplo en las frases siguientes:

a) La multiplicación de grupos de immigrantes preocupa a las autoridades.b) La multiplicación de grupos posee la propiedad conmutativa.

El conocimiento del mundo permite, en el caso de un lector humano, distinguir entre los diferentes significados de ‘multiplicación’ y de ‘grupo’. Un programa de TA basado en una ontología como la del CRL reconocerá la polisemia de estas unidades para luego decidir una lectura en función de la coincidencia y proximidad que poseen algunas de las características en a) geografía humana, y en b) matemáticas.

Pero el magnífico trabajo ontológico subvencionado por la NASA que puede traducir titulares de periódico de lenguas como el persa, el coreano o el ruso, no es lo bastante sutil como para acercarse a los lenguajes especializados. Un concepto como ‘ojo anterior lateral’ que pertenece a la anatomía de la araña no puede ser procesado por la ontología de Nirenburg. En estos casos la traducción palabra a palabra es la única solución, aunque el resultado puede que no sea muy convincente. Una expresión como ‘agua física metálica’ sería el resultado de traducir del griego, palabra por palabra, el concepto de ‘agua mineral natural’, por poner un ejemplo.

Lo cierto es que la Traducción Automática que será tendrá que pasar necesariamente por una combinación de estrategias: lógicas, estadísticas, probabilísticas, pero en cualquier caso no podrá eludir la Ingeniería del Conocimiento.

3.4. El proyecto BACUS (Base de Conocimiento UniverSitario)

BACUS (BAse de Conocimiento UniverSitario, 1996-2001) es una base de datos que resulta del trabajo de investigación terminológica multilingüe que realizan los alumnos de cuarto curso de la Facultad de Traducción e Interpretación de la Universidad Autónoma de Barcelona. Se trata de un trabajo descriptivo que parte de textos originales en diferentes lenguas sobre un mismo tema, con el requisito de homogeneidad de los textos en cuanto a nivel de lengua y actualidad. Se exige a los alumnos la colaboración de un experto en la especialidad que van a tratar. Aunque los datos no se someten, de momento, a un criterio de normalización, las referencias contextuales, lexicográficas y terminográficas colaboran a documentar al máximo cada caso. Se calcula un incremento aproximado de BACUS en unos 1500 nuevos términos por año académico.

Las áreas de trabajo son, básicamente, técnicas y científicas, pero no se excluye la posibilidad de que otro tipo de áreas temáticas puedan ser representadas. Los alumnos escogen el área temática libremente, acogiéndose, si lo desean, a las propuestas de los profesores de nuestra universidad que se prestan como asesores. Cada término está orientado temáticamente

11

a través de tres ejes: el área temática, el título del trabajo (el cual indica el nivel máximo de especifidad) y el código de la UNESCO que más se ciña a ese nivel de especifidad.

La definición de esta base de conocimiento se ha realizado en el entorno MultiTerm para Windows, y pretende ser una plataforma para representar la información léxica de modo jerarquizado y relacionado. En su día se escogió este programa por haber sido acordado como estándar por la Coordinadora Interuniversitaria para la Normalización Lingüística e Informática (CINLI) de los países de habla catalana.

Para establecer una base de conocimiento multilingüe hemos partido de cuatro criterios: relatividad conceptual, atomización del conocimiento, exclusión de la gramática y navegación conceptual.

Cuando se comparan distintas lenguas se están comparando sistemas conceptuales diferentes, lo cual presenta una dificultad en la búsqueda de equivalencias léxicas. Debemos aceptar, pues, la relatividad de nuestro propio sistema y sustituir el ideal de biunivocidad y exactitud por un sistema plural, para que, a ser posible, ningún sistema conceptual ejerza de director de orquesta. Cada tema tiene como lengua de referencia aquella en la que cuenta con mayor refinamiento conceptual.

La información debe representarse en la forma más atomizada posible. Esto puede provocar que la información contenida en la definición y/o el contexto sea repetida en un campo particularizado (por ejemplo color, forma, etc.). Pero, precisamente, la finalidad de la atomización del conocimiento es evitar caer en la trampa lingüística de la paráfrasis definitoria. Esto puede ser importante cuando queremos representar y comparar terminologías de culturas distantes. Además, aunque la estructura de campos semánticos (unos 50) no es un conjunto completo ni perfecto, una información atomizada puede facilitar el tratamiento y la utilización de la información si se pretende integrar la base de datos en un sistema de procesamiento más amplio, como pueda ser un sistema de TA.

Las cuestiones gramaticales no atañen a la base de datos, la cual se centra en la estructura conceptual. Esto significa, por ejemplo, que los nombres predicativos y los verbos son considerados sinónimos conceptuales. Así, ejecución y ejecutar son dos índices para el mismo concepto. Se adjunta información sobre la categoría gramatical de cada denominación; así se indica género femenino en los sustantivos de lenguas flexivas como silla o mesa, pero se dejará abierto en los demás casos para que pueda flexionar según la gramática de la lengua en cuestión.

La flexibilidad en la representación de la información de la que BACUS hace gala también afecta al nivel monolingüe. Por ejemplo: podemos recoger un concepto constituido por la expresión ejecutar un programa, pero este término complejo también puede ser representado si creamos una entrada para programa y la relacionamos con otra entrada correspondiente al concepto ejecutar a través de un determinado campo que indique el tipo de relación verbo-objeto existente (el campo 'argument of'). Esta última representación es preferible, porque todos los conceptos que tengan a programa como hiperónimo pueden quedar asimismo relacionados con ejecutar a través de las relaciones cruzadas.

El léxico no se compone sólo de denominaciones que vinculan la realidad con los conceptos, sino también de relaciones interléxicas que configuran una red de familias. Estas familias también se relacionan unas con otras a través de relaciones lógicas, ontológicas, analógicas, infralógicas o argumentales. Una base de datos terminológica que reflejase solamente una información glosariada, documentada y ponderada, no sería una base de conocimiento. Son precisamente las remisiones las que permiten al usuario navegar a través de un sistema conceptual.

12

Una muestra de la base de datos BACUS:

3.4.1. Hipótesis conceptual de BACUS(Aguilar-Amat, 1996)

13

┌── │ lógicas - verticales:│ superconcepto/subconcepto│ . genérico/específico│ (pala/spade-shovel)│ . hiperónimo/hipónimo│ (mineral/antracita)

│ │ - horizontales:│ . coordinación (pragmáticas)│ (mesa/silla)│ . cohiponimia│ (antracita/pirita)│ │ analógicas - transferéncia:│ . metáfora│ . metonimia│ │ ontológicas - parte/todo:

Relaciones │ . parte/parte (radio/llanta)conceptuales │ . todo/parte (rueda/radio)

│ - causa/efecto (VIH/sida)│ │ infralógicas │ . localizaciones (cebra/África)│ . cronológicas (Edad Media/Edad Moderna)│ . sustancia (chupete/caucho,silicona)│ . genéticas (Microsoft/MS-DOS)│ . transmisión (televisión/telespectadores)│ . instrumentales (agua oxigenada/desinfección)│ . pragmáticas (divorcio/juicio, pensión, tutela)

│└── argumentales (biomasa/extracción)

14

4. Historia de una utopía

El 14 de enero de 2001 en el periódico El Nacional de Venezuela, Jorge Olavarría publicaba un artículo sobre el origen de los topónimos que los descubridores españoles introdujeron en América. Además de reproducir los nombres de ciudades y villas de su país de origen, los españoles que conquistaban las nuevas tierras poco después de guerrear en la reconquista de Granada estaban fuertemente influidos por la ficción de romances “caballerescos” y novelas del mismo tipo, desde los carolingios como La chanson de Roland, los bretones como Don Tristán y Lanzarote, el Amadís de Gaula o el Palmerín de Oliva. No es hasta 1605, cuando la epopeya de la conquista había llegado a su madurez, que se publicó la primera parte de El ingenioso hidalgo Don Quijote de la Mancha, donde el personaje se muestra como un trastornado por los temas de las aventuras de caballerías. Con el Quijote se constata históricamente lo que podríamos llamar “alucinación conquistadora”, la cual se nutría tanto de las espectaculares realidades naturales y humanas descubiertas en las nuevas tierras como de un mundo de ficción ‘vivido’. Así, el nombre de California -por la reina Calafia- procede del Amadís de Gaula, donde Garci Rodríguez de Montalvo describe un hipotético Paraíso Terrenal llamado California poblado de mujeres negras entre las cuales no existía varón alguno. El mismo Cristobal Colón confesaba andar a la caza de una isla llamada Matanino o Madanina -quizá la Martinica de hoy- que estaría poblada sólo por mujeres, las cuales usaban arcos, flechas y corazas de cobre. El río por el que navegó Orellana fue llamado “de las Amazonas” porque en la descripción que de este viaje hizo el padre Carvajal, se hace mención constante de una nación rica en oro y plata, con ciudades de bravas guerreras de enormes pechos y certera puntería, que todos habían visto pero que nadie volvió a ver. De este modo podemos intuir, lejos de los intereses económicos, políticos y proselitistas de las clases dominantes, una utopía cotidiana que respondía a la necesidad de relaciones con el otro sexo de un grupo de hombres, éstos sí solos, y que había desarrollado una imaginación utópica con ayuda de las novelas y los romances de su época. Esta epopeya es sólo una excusa para postular una visión histórica de otra epopeya, la de la Traducción Automática. Sin duda ambas hazañas se produjeron en momentos de circunstancias compartidas: progreso tecnológico, guerras expansionistas, literatura de ficción, sentimiento utópico, azar y necesidad.

La aventura marítima de los navegantes del siglo XV se debe al progreso técnico, así como la aventura computacional se debe a la revolución digital. La segunda guerra mundial y la guerra fría, la guerra de la Reconquista y la del control del Mediterráneo para los antiguos. La literatura de caballerías tiene algo en común con la de ficción científica7 (Asimov, Arthur C. Clarcke, Ray Bradbury). Pero ¿cuáles fueron o son todavía los sentimientos utópicos de nuestra era tecnológica? ¿Cuál nuestra necesidad?

4.1. La vieja utopía: sustitución de la Traducción Humana7 Decimos ‘ficción científica’ por considerarlo el calco correcto de science fiction, y para llamar atención sobre la desvirtuación que ofrece el término ya extendido de ‘ciencia ficción’.

15

La Traducción Automática, como muchos de los avances técnicos de nuestra era, tuvo una motivación bélica. La Segunda Guerra Mundial enfrentó a grandes potencias que, catapultadas por el desarrollo industrial, lucharon por la supremacía de los mercados y por imponer su modelo en el mundo. El desarrollo industrial había gestado el desarrollo tecnológico. En la escabrosa urgencia de enfrentarse a un enemigo y de conocer sus planes lo antes posible, la TA se convirtió en una esperanza y una necesidad. Los traductores humanos eran pocos, lentos y, posiblemente, ambiguos respecto de la causa de cualquiera de los bandos. Esta fue la situación que motivó la inversión en sistemas de análisis del lenguaje y en aparatos lógicos. A pesar de este origen bélico, debemos a esta situación grandes avances en el desarrollo de la Lingüística, y en consecuencia en la enseñanza de idiomas, así como en las llamadas “industrias de la lengua” que engloban, de la mano del avance en las ciencias de la computación, aspectos relacionados con el procesamiento del habla, la corrección ortográfica y estilística de documentos procesados, las interficies para la consulta de bases de datos y la ingeniería del conocimiento, entre otros.

La intención inicial de la inversión en Traducción Automática fue inicialmente la de sustituir al traductor humano, ya fuera por su posible compromiso político (Guerra Fría) como por su coste (CEE). En el primer caso el ideal utópico consistía en expandir y proteger el ideal democrático y el sistema capitalista. En el segundo de superar el escollo de la diversidad lingüística para poder participar en la competición capitalista ya instaurada.

La primera escuela de Traducción europea se funda en Ginebra en 1941. Por las mismas fechas aparece la primera estadounidense en Monterrey, California. Casi al mismo tiempo se da comienzo a la utopía computacional. En 1965, un año antes del informe ALPAC, aparece Taum-Meteo, sistema canadiense para partes meteorológicos. Al mismo tiempo que la ‘necesidad’ impulsa la inversión, el público y el personal implicado convierte la ambición en un objetivo idealista. En 1987, cuando yo entré en contacto con la Traducción Automática y el Procesamiento del Lenguaje Natural, escuchaba de mis maestros la verbalización de esperanzas relacionadas con el ‘descubrimiento’ de la aplicación de la computación al análisis del lenguaje: los ciegos podrían acceder a la lengua escrita porque habría máquinas que sintetizarían el texto y producirían sonidos; estas personas dictarían al ordenador aquello que desearan fuera reproducido. Los países pobres del tercer mundo serían capaces de realizar la revolución tecnológica sin necesidad de pasar por la revolución industrial, y lograrían así equipararse en poco tiempo a los países desarrollados, etc.

De estas ideas ilusionadas algunas, como la compensación de minusvalías, es, afortunadamente, una realidad. Otros avances como el desarrollo de las autopistas de la información no fue imaginado por muchos. Pero algunas de aquellas esperanzas, por desgracia, han desvelado su ingenuidad con el paso del tiempo. Para que la revolución tecnológica llegara al tercer mundo hacía falta red eléctrica, dinero para instalarla (lejos aún hoy de los circuitos inalámbricos), pero además definir fenómenos lingüísticos muy variados, cuestiones cognitivas muy complejas y ciertas actitudes políticas. Esto aún admitiendo que la revolución tecnológica fuera una pieza clave de progreso para culturas de las que desconocemos mucho. Cuáles de los sueños de nuestra década se cumplirán y cuáles no es una pregunta sin respuesta, pero hoy probablemente ningún científico al que se haya preguntado dirá ‘bienestar’, ‘un mundo más humano’ o ‘la paz’.

16

4.2 La nueva utopía: Automatización de la Traducción Humana

Desde le generalización del uso del correo electrónico los sistemas de Traducción Automática han visto dispararse su uso. La mayor parte de los usuarios son personas sin cometidos ‘lingüísticos’ que recurren a la TA para obtener traducciones urgentes, ojear los contenidos de los documentos u obtener versiones preliminares. Pero para poder usar la traducción como un texto es preciso que exista un corrector humano, y a ser posible, veterano. La veteranía en Traducción es un valor muy importante. Tal vez la distinción posible y necesaria es entre el uso de un programa para ‘leer’ un texto, y el mal uso del mismo para producir un texto que va a ser leído.

A la luz (o la sombra) de la historia, algunos estudiosos vinculan el avance tecnológico con la guerra. Lynn White (1973) asegura que el sistema feudal se originó gracias a una tecnología novedosa: la aparición del estribo, el uso de la silla de montar, la aplicación de herraduras en las pezuñas de los caballos. Todo esto dio lugar a un nuevo cuerpo guerrero en el campo de batalla, el de los caballeros, y a través de él se congriaron las dependencias, las jerarquías y las luchas feudales. Este determinismo tecnológico es discutible, pero pone de manifiesto las intensas relaciones entre sociedad, tecnología, economía y naturaleza.

En este contexto, la TA, como utopía, surge del choque entre lo que es y lo que la sociedad cree que debería ser. Riera (2001:158) sostiene que el modelo utópico tiene un lado positivo por su fecundidad al abrir nuevas vías y por el poder que posee de resolver el problema que surge del desencanto de la sociedad en que se ha gestado. El lado negativo de la utopía es, paradójicamente, su esterilidad, porque, si bien abre nuevos horizontes, confunde la posibilidad con la imposibilidad. La mezcla de verdad y falsedad, de posibilidad y de imposibilidad conducen otra vez al desencanto, y éste al nacimiento de una nueva utopía.

En 1980, tal y como explica Joseba Abaitua de la Universidad de Deusto en su artículo TA: Presente y Futuro (http://www.foreignword.com/es/Technology/), Martin Kay redactó un informe interno para la empresa RankXerox, "The Proper Place of Men and Machines in Language Translation", inédito para el gran público hasta su publicación en 1997 en la revista Machine Translation. En este informe, que tardó tanto en ver la luz, Martín Kay afirmaba:

"El ordenador es un instrumento que puede servir para magnificar la productividad humana. Usado adecuadamente, no tiene por qué deshumanizar, con la impronta de su sello orwelliano, los productos de la creatividad y del trabajo del hombre sino que, apropiándose de lo que es mecánico y rutinario, puede liberarle para que se dedique íntegramente a las labores que son esencialmente humanas. La traducción, aun siendo un arte delicado y preciso, conlleva muchas tareas que son mecánicas y rutinarias. Si estas tareas fueran encomendadas a una máquina, la productividad del traductor no sólo se vería magnificada, sino que su trabajo se haría más gratificante, más apasionante, más humano."

Abaitua afirma que el artículo se publicó tan tarde debido a la primera incredulidad y a la confirmación posterior de las expectativas de Kay. Muchos traductores humanos fueron detractores de la TA hasta que no tuvieron la posibilidad de acceder a ella, usarla, y confiar que nunca serían sustituidos. Actualmente el volumen de textos a traducir es tan

17

http://www.foreignword.com/es/Technology/

grande que hay espacio para todo tipo de traducción. Sin embargo es conveniente diferenciar los procedimientos y los objetivos.

En el mundo de la globalización, aún de manera imperfecta, uno de los programas modernos, convenientemente distribuido, puede producir unos 20 millones de páginas por hora, mientras que un traductor manual puede llegar a rendir, en los casos más favorables, a un ritmo de 20 páginas por día. (Naturalmente cabe tener en cuenta que la calidad de los textos difiere respecto de la cantidad). Es aceptado generalmente el hecho de que la Unión Europea es una de las potencias que más gastos de traducción sufraga, aunque tal vez haya que poner en entredicho las afirmaciones de Abaitua en cuanto que supone “alrededor de un 50 % del presupuesto administrativo”. Las estimaciones de los traductores de la Comisión son de un euro por año por contribuyente. Lo que sí parece cierto es que la incorporación de nuevos países hace aumentar el volumen de traducción. Cuando Suecia y Finlandia se incorporaron a la UE en 1995 hubo que traducir alrededor de 60.000 páginas de regulaciones comunitarias. Al parecer en los últimos 30 años, con más de 9.000 publicaciones periódicas diarias y casi 1.000 libros en el mundo, se ha producido más información que en los 5.000 años anteriores. El 90 por ciento de esa información es de tipo técnico. Según Abaitua, si se tiene en cuenta que sólo un 3% del volumen total de páginas traducidas corresponde a obras literarias, existen motivos más que suficientes para ensayar la mecanización a gran escala de la producción plurilingüe del grueso de publicaciones diplomáticas, administrativas, comerciales y técnicas, cuyas traducciones son, por su propia naturaleza, mecánicas y rutinarias. (Cabe decir que la rutina y la mecánica no las hace más fáciles).

Ahora bien, si intentamos una visión que sea exhaustivamente ‘globalizadora’ vemos como las cifras anteriormente barajadas muestran solamente un porcentaje recortado de la producción ‘textual’ mundial. Muchas lenguas siguen produciendo sus textos en la tradición oral, otras muchas no implican a la tecnología en la producción de sus textos, no participan en la red ni usan con fluidez el correo electrónico. Muchas culturas basan su dinámica en conceptos culturales, religiosos o literarios. ‘Eliminar’ esos miles de millones de personas del mundo para que las cifras esgrimidas sean representativas de la humanidad es una especie de ‘genocidio’ tecnológico. Traducir automáticamente un texto jurídico ¿Significa aceptar que existe un modelo jurídico único? Porque no sería cierto. Al mismo tiempo que se invierte en evitar o acelerar ciertas tareas sería preciso invertir en aumentar nuestro conocimiento sobre otros tipos de organización, aunque esto supusiera poner los propios en entredicho.

Después del 11 de septiembre y de la cotidianeidad de fenómenos como la inmigración, la nueva utopía no puede ser sino multiculturalista. Uno de los fundadores de la sociología moderna, Georg Simmel (1911:175) esbozaba esta definición de ‘cultura’: “Cultura es el proceso de perfeccionamiento de individuos que se obtiene gracias al espíritu objetivado por el trabajo histórico de la especie humana”.

Cuando algún suceso pone en relieve que existen otras lenguas, otras culturas, otras maneras de entender el mundo, los medios ponen en cuestión la bondad de las traducciones convencionales. Expertos arabistas como Joan Vernet afirman que el término árabe Yihad se ha traducido erróneamente por guerra santa y sugieren que debería traducirse por ‘esfuerzo’ (esfuerzo menor, puesto que el mayor, la gran Yihad, es el espiritual). Si esto es cierto es también una muestra de la subjetividad y el desconocimiento que tenemos de la alteridad. ¿Vamos a transmitir esa ignorancia a nuestros ordenadores al mismo tiempo que el reconocimiento de la autoridad de sus procesos deductivos? No sería, éste, un acto

18

inocente. Es posible que no sea la tecnología lo que genere la guerra, pero el desconocimiento y la interpretación subjetiva sí lo hacen.

Al mismo tiempo que invertimos en TA deberíamos invertir en la respuesta a esta pregunta que formulaba T.S. Eliot en 1962:18:

The most important question that we can ask, is wether there is a permanent standard, by which we can compare one civilisation with another, and by which we can make some guess at the improvement or decline of our own.

El perfil del nuevo traductor es el de un experto corrector de textos traducidos automáticamente de o al inglés, francés, español, italiano y alemán, y además el de un profesional de la comunicación intercultural con lenguas de trabajo como el árabe, el quechua o el chino. O tal vez tendremos dos tipos diferenciados de traductor: el lingüístico, tecnificado, y el cultural, al servicio del cual estará el primero.

5. Cuándo es útil la Traducción Automática

Cuando la inversión lo fomenta, la TA es un instrumento útil para conseguir un plurilingüismo igualitario y sostenible y para reforzar los procesos de estandarización en lenguas recesivas o minorizadas. La TA es rentable cuando traducimos sistemas lingüísticos cercanos desde el punto de vista cultural y gramatical, o si se da alguno de ambos casos. Ahora bien, cabe tener en cuenta que ‘rentable’ no es lo mismo que ‘útil’. Los sistemas lingüísticos en adyacencia como el castellano y el catalán comparten muchas características que hacen relativamente sencilla la TA. Sin embargo no parece tener mucho sentido utilizar solamente el terreno común a ambas lenguas. Después de haber sido prohibido durante muchos años, el catalán ha perdido gran parte de la cohesión conceptual, estilística y expresiva original. Si no se hace un esfuerzo léxico importante, la TA puede funcionar como un cómplice más de la tendencia a hablar castellano en catalán o catalán en castellano. La lengua no es sólo el instrumento de una fuerza política o de una clase social, sino una fuente de riqueza conceptual y expresiva para el individuo, por lo que el proceso de conservación y estandarización de lenguas minoritarias o minorizadas no debería privarlas de sus rasgos más diferenciadores.

Por otro lado, como se ha dicho en apartados anteriores, la TA es útil cuando lo que se pretende es hacer una aproximación rápida a los contenidos, y también cuando se procede a corregir de manera profesional el resultado. La TA puede ser una potente herramienta si el que la usa conoce las limitaciones del programa y las peculiaridades de las lenguas en contraste. Con el paso del tiempo las estrategias, la capacidad de los ordenadores y los diccionarios mejoran sustancialmente, y proliferan los recursos que pueden consultarse en línea.

Pero, a mi modo de ver, la TA y lo que se denomina Traducción Asistida por ordenador (TAO), tienen demasiados puntos en común para seguir diferenciándose. Desde el punto de vista del traductor profesional, ambas perspectivas suponen un punto de partida ineludible. Los programas de TAO se basan en las denominadas memorias de traducción para proponer al traductor la reutilización de material ya elaborado y contrastado. Las bases de datos, la información extraída de la red o de corpus clasificados proporcionan al traductor la posibilidad de aumentar su rendimiento y de hacerlo con mayor rigor.

19

El hecho de poder compartir recursos terminológicos favorece a las diferentes sectores porque supone una homogeneización conceptual y una mayor definición, y también favorece al sistema lingüístico en general, puesto que evita la aparición de variantes que distorsionan la distribución de significado de los términos.

Tanto la TA como la TAO precisan de la intervención humana para efectuar una validación de los resultados. En este sentido cabe plantearse la automatización de la traducción como un proceso simbiótico de la ‘inteligencia’ del ordenador, deductiva, algorítmica, y de la capacidad creativa del traductor humano para encontrar soluciones a problemas complejos que exigen un conocimiento maduro del mundo para los cuáles la mera deducción a partir de datos cuantificables es insuficiente.

5.1. Condiciones de un texto para poder ser traducido automáticamente.

Algunos programas de TA como ATS (www.automatictrans.es) ofrecen una lista de recomendaciones para aquellas personas que desean traducir automáticamente un texto. Estas recomendaciones, similares a los principios aplicados a la comprensión de la lectura, sirven para obtener la máxima calidad en la Traducción Automática:

1.- Realizar revisión y corrección previas. Antes de enviar el documento a traducir, es aconsejable pasar el corrector propio del editor de textos que se esté utilizando. Éste corregirá palabras mal escritas, o quizás proponga alguna corrección en la concordancia de la oración.

2.- Evitar frases demasiado largas y eliminar ambigüedades del tipo: Ayer estuve en casa del primo de mi vecino, que había vuelto de un viaje que había realizado para reencontrarse con los familiares que emigraron al nuevo continente a finales del siglo pasado. Resultaría más comprensible así: "Ayer estuve en casa del primo de mi vecino. Éste había vuelto del nuevo continente. Había realizado el viaje para reencontrarse con los familiares que emigraron allí a finales del siglo pasado".

3.- Construir frases completas. Por ejemplo: Inserte disquete y aprete aceptar. Sería más correcto decir: "Ud. debe insertar el disquete y después debe pulsar el botón Aceptar".

4.- Tratar de evitar ciertos tipos de frases, como las pasivas. Por ejemplo, la frase: El niño fue atropellado por un camión, podría ser: "El camión atropelló a un niño".

5.- Utilizar correctamente la puntuación: puntos, comas, puntos y coma, etc. La puntuación es determinante para dar el correcto sentido a las frases.

6.- Evitar muchas preposiciones en la misma frase. Por ejemplo, en la frase: El niño vio el coche en la cuneta de la calle enfrente de la academia de inglés, ¿qué o quién estaba enfrente de la academia, el coche o el niño?

7.- Intentar evitar coloquialismos y expresiones idiomáticas. Por ejemplo, la frase: Juan no tenía pasta y se la birló a su hermano, debería ser: "Juan no tenía dinero y se lo robó a su hermano".

20

8.- No inventar abreviaturas. Por ejemplo, la abreviatura de departamento es "dept." y no dpto., la abreviatura de teléfono es "tel." y no tlf., etc.

9.- Evitar palabras espaciadas o en mayúscula. Puede utilizar distintos métodos para enfatizar una palabra o frase: escríbala en negrita, itálica o cursiva, subráyela, o combine estas opciones. Pero existen dos formas no recomendables para el traductor: p a l a b r a s con espacios entre letras, que no entiende, o PALABRAS en mayúsculas, que pueden confundirse con acrónimos y por lo tanto no traducirse.

10.- Marcar palabras especiales. Por ejemplo, en un manual informático, se recomienda la frase: "Escoja la opción "Herramientas" y haga clic en "Aceptar"." en lugar de Escoja la opción Herramientas y haga clic en Aceptar.

Tal vez estas recomendaciones no sean útiles para escribir una novela, pero probablemente favorecen la coherencia y la cohesión de un texto especializado. Evitar la verbosidad, fomentar la concreción, utilizar denominaciones idénticas para el mismo concepto, así como el uso de las convenciones estandarizadas como símbolos o abreviaturas son aspectos que benefician a los textos técnicos y a la comunicación entre el personal experto. Todavía queda bastante que estudiar, sin embargo, respecto de la estructura y el contenido de estos textos. A menudo se produce lo que se ha denominado ‘contaminación conceptual’, de manera que, en jergas altamente especializadas, a veces se produce una usurpación del significado de un término por parte de otro (cf. Antia, 1999), lo cual supone un grave problema no sólo de traducción, sino de identidad del conocimiento.

5.2. El concepto de ‘automático’.

La definición que da el diccionario de ‘automático’ reza: “Que funciona o actúa mecánicamente, sin la intervención del hombre. Dicho de una operación o proceso que, al recibir un estímulo para empezar, se desarrolla por él mismo hasta el final” (Gran Enciclopedia Catalana). Este concepto procede de la revolución industrial, y da lugar a otro, el de ‘automación’, que aparece por primera vez en 1947 en la industria del automóvil. La automación es la aplicación de automatismos para conseguir que partes importantes, y a ser posible la totalidad, de un proceso de producción aumente la rentabilidad haciendo que se mantenga un nivel uniforme de calidad. La nueva palabra fue creada por la necesidad de distinguir entre una operación automática y una sucesión automática de operaciones.

Después de las reflexiones esbozadas en los apartados anteriores, quisiera proponer un nuevo concepto para la TA, o por lo menos un nuevo término, basado en el concepto de ‘automación’. Cuando tenemos un problema que no podemos resolver de un solo paso hay que encontrar la manera de dividirlo en subproblemas y buscar la solución de cada uno por separado. En palabras de Marvin Minsky (Brockman, 1995:153) “la clave para construir una máquina inteligente es inventar la manera de administrar una variedad de recursos, y a partir de ahí se llega a lo que llamamos teoría de la sociedad de la mente”.

Si la mente es una sociedad, la sociedad es una mente. Este es el postulado que pretendemos exponer en este artículo. La automación de la traducción consiste en conseguir relacionar diferentes estrategias y métodos para que el resultado del trabajo del traductor sea más riguroso, más fiable, más rápido, más fácil y más creativo. Me refiero al hecho de optimizar la estación de trabajo (translator workstation ) para que el análisis, la

21

transferencia y la generación de un contenido vaya acompañado de una solución que procede de una red conceptual (como la de BACUS), de un cotejo con la producción textual del momento (Internet) a través de estrategias de la Lingüística de Corpus y la extracción de información.

Las empresas de traducción que proliferan en España están extendiendo un entramado de memorias de traducción que producirán un corpus global de documentación técnica. A pesar de que la legislación no es lo bastante clara al respecto, es previsible que este corpus supere las barreras legales y devenga una plataforma homogeneizada para la comunicación técnica. La Traducción Automática o la automoción de la traducción es un proceso que se augura más parecido a una red de carreteras, con acuerdos entre municipios, que como un potente helicóptero que salve todos los accidentes geográficos. El objetivo debería ser el de coordinar todos los recursos existentes para convertir la Traducción en un protagonista de toda actividad relacionada con la transacción de información, más que en la búsqueda de una solución que la haga inexistente.”Quizá no podamos entender nada a menos que lo entendamos de diversas maneras diferentes; la búsqueda de la única verdad –la mejor y más pura manera de representar el conocimiento- es un pertinaz error. Si queremos obtener aprendizaje mediante redes neuronales, no podemos emplear sólo una clase de red; probablemente tendremos que diseñar unas para recordar historias, otras para representar estructuras geométricas, otras para las interacciones causales, otras para los razonamientos en cadena, otras para las relaciones semánticas de las expresiones lingüísticas, otras para las representaciones bidimensionales de la visión, y así sucesivamente. El secreto de la inteligencia es que no hay ningún secreto, ningún truco mágico especial” (Minsky, Ibid. 154).

6. Puzzle de disciplinas.

6.1. La ciencia del lenguaje.

En 1993 la Lingüística se independiza de los estudios de Filología en España. Es el resultado del proceso de desarrollo de esta disciplina desde los años cincuenta debido a las razones históricas ya esbozadas. La razón académica que atorga más peso a esta escisión es la de que, debido a la aplicación del método inductivo y deductivo y al uso de lenguajes formalizados, la lingüística deja de ser una ciencia humana o histórica. Las humanidades se basan en el método de regresión no inductiva: regresión porque hay un remontarse del condicionado a la condición, y no inductiva porque el condicionado no es un caso singular de una condición universal. Por el contrario, Chomsky, sus coetaneos y seguidores, defendían que el lenguaje era un universo infinito postulable a partir de leyes finitas. Intentaron una ‘matemática’ del lenguaje que seguía a otros esfuerzos más ‘físicos’ o clasificatorios como el de los estructuralistas.

En el momento en que la lingüística cobra autonomía y se acerca a la denominación de ‘ciencia’, se escinde en dos grandes ramas: la lingüística teórica y la lingüística aplicada. La lingüística teórica se encarga de la descripción de las lenguas y de la búsqueda de formalismos de representación, mientras que la lingüística aplicada, con un mayor lato sensu, se convierte en un terreno interdisciplinario que incluye la enseñanza de lenguas (patologías en el aprendizaje de la lengua materna, aprendizaje de segundas lenguas) e incluso del aprendizaje de lenguajes no verbales (iconografía y semiótica). La sociolingüística (normativa, dialectología), la lexicografía, la terminología y todas aquellas

22

actividades en que se realiza investigación con finalidades aplicadas y en las que interfiere el uso o desarrollo de herramientas tanto metodológicas como computacionales para el análisis o la evaluación.8 La evaluación de sistemas es un área que ha recibido mucha atención y una muestra del espacio compartido por la TA y la Lingüística teórica. Algunos autores (Flickinger, 1987) propusieron listas de fenómenos que permitían comprobar la eficacia o la ineficacia de un sistema de análisis. Pero, así como decíamos que el concepto de unidad de traducción dependía de cada par de lenguas, la lista de fenómenos que debe resolver un sistema de análisis para resultar fiable depende también de las características de cada idioma. No todas las lenguas presentan duplicación de clítico o clitic doubling, sujetos vacíos (pro-drop, oraciones impersonales, sujetos expletivos).

La lingüística computacional es por una lado una esposa de la lingüística teórica y por otro una concubina de la lingüística aplicada. El hijo primogénito de la lingüística computacional es el PLN. Los frutos de la investigación en PLN alimentan la lingüística descriptiva y sus problemas son retos para la lingüística teórica en el plano de la representación. Por otro lado, pasar la prueba de la computación es una baza en la validación de una teoría gramatical, aunque obviamente esa validación tiene una dependencia determinante respecto del avance tecnológico.

IA, la TA y el PLN tienen puntos de contacto con la Ciencia Cognitiva. La mente, su modelización, su proyección, son áreas en las que se realiza inversión. A veces ocurre que la inversión imanta al resto de las disciplinas y se destaca aquello que cada una puede aportar a la investigación.

The cognitive sciences are understood to embrace anthropology, philosophy and linguistics as web as cognitive psychology, neuroscience and artificial intelligence (Pinker 1994).

¿Qué puede aportar la Traducción a la IA y la Ciencia Cognitiva? Los estudios de traducción pueden jugar un papel importante mediante su visión de la comunicación intercultural en un nivel sociológico. La TA tiene en común con la IA que se esfuerza en dotar a una máquina (o un robot) de la información precisa para que efectúe tomas de decisiones. La IA intenta emular el comportamiento de las neuronas (sinapsis y conexiones) en el cerebro humano, y conseguir que el procesador saque conclusiones de los datos que se le proporcionan. La TA pretende que el procesador analice frases o textos a partir de los datos sobre el comportamiento de su sintaxis y la identidad de sus unidades léxicas. La TA y la IA comparten el problema del almacenamiento optimizado de información, que en un caso es léxica o gramatical, y en el otro puede ser auditiva o visual, y ambos se enfrentan a una cuestión importante: proporcionar a la máquina conocimiento del mundo que le permita decidir en caso de ambigüedad. Por eso ambas están interesadas en la ingeniería del conocimiento y en las taxonomías, tal y como vimos en apartados anteriores.

Can the study of translation really contribute to our understanding of the mind? The prospect is less far-fetched if we see cognitive science as two complementary and interacting projects: on the one hand, to learn more about the human mind and behaviour; and on the other, to learn to simulate some of its functions where feasible

8 En España y hasta 1997 los estudios universitarios de Traducción formaron parte del área de conocimiento de la Lingüística Aplicada. A partir de esa fecha la Traducción constituye un área de conocimiento en sí misma.

23

and desirable (for example, to do tedious or difficult jobs like screening cervical smears or exploring the surface of Mars. As a complex cognitive activity involving language, translation should have something to contribute to the former project, even while progress in the latter is slow (and, some would claim, as far as translation is concerned, not necessarily feasible or desirable). Setton (2001:114).

Si factible, ¿es la TA deseable? Como buena utopía la TA es la zanahoria que hace avanzar al caballo (Riera, 2001:157). Enfrentándonos a los retos que plantea avanzamos en la asunción de una idea más completa de lo que es clave para la comunicación, y cuando eso que es clave queda fuera de nuestro alcance o del alcance de los programas. La TA ha contribuido a plantear cuestiones básicas respecto de los comportamientos sintácticos y semánticos, y últimamente se enfrenta a la implementación de la dimensión pragmática.En palabras de Lakoff (1993:367), la pragmática es, o debería ser, aquella área de estudio que nos dijera qué es lo que deseamos saber realmente, al menos en lo que se refiere al lenguaje. La TA es aquella área de estudio que nos hace distinguir entre lo que se puede procesar y lo que no se puede procesar del lenguaje y de la cultura.

6.2. Teoría de la Traducción y Traducción Automática

Cuando traducimos un texto encontramos una enorme casuística de problemas relacionados con la dificultad de traducir los referentes conceptuales y culturales sin que se pierda el sentido inicial y la función que tienen en el contexto del texto original. Encontrar una equivalencia es una cuestión de adecuación y de toma de decisiones del traductor, y esto es lo que hace que unos traductores sean mejores que otros. Esta labor es, en muchas ocasiones, difícil y sutil, por lo que a menudo se asemeja más al talento artístico que al tipo de cálculo que puede efectuar un científico. ¿Cuándo pueden las herramientas lógicas ayudar en este proceso? La respuesta a esta pregunta debe partir de una clasificación de los problemas posibles en el proceso de traducción, y cuáles de ellos pueden ser solucionados a partir del almacenamiento de información en las entradas léxicas. Proponemos una clasificación incompleta de los distintos niveles de dificultad.

1. El primer nivel de dificultad es el morfosintáctico. Algunas cuestiones han sido resueltas con bastante éxito por el Procesamiento del Lenguaje Natural, por ejemplo el género; pero otras presentan bastantes dificultades (por ejemplo el diminutivo).

2. El segundo tipo de dificultades se refiere al nivel léxico-semántico. Los problemas más sutiles se refieren a las colocaciones atributivas. Las colocaciones idiomáticas y las terminológicas poseen una rigidez sintáctica que facilita su procesamiento.

3. Un tercer tipo de problemas pertenece al ámbito de la pragmática en un sentido amplio. Se trata de cuestiones que hemos denominado ‘problemas de localización’. Éstos pueden dividirse en problemas de localización de primer grado, problemas de localización de segundo grado, y, respectivamente, de tercer, cuarto y quinto grado.

a) Problemas de localización de primer grado. Son bien conocidos; se trata de cuestiones del tipo de la conversión de unidades de medida: millas en kilómetros, galones en litros,

24

etc. Este tipo de información puede almacenarse fácilmente en tablas de conversión que pueden ser usadas tanto por un traductor humano como por un programa de TA. Este tipo de localización afecta sobre todo al lenguaje especializado, pero no únicamente. De hecho vamos a prescindir de la diferencia entre lengua común y lenguaje especializado, y vamos a considerar a la lengua común un subconjunto del lenguaje total, y por lo tanto perteneciente a un área temática (si se quiere, el área temática de la “no especialización”). No sólo unidades de medida, sino muchos términos compuestos consolidados pueden incluirse en este primer nivel de localización y, a pesar de no responder a una traducción literal (estándar) de cada uno de sus componentes, se puede obtener su equivalente a partir de glosarios o diccionarios comunes:

hormigón armado => prestessed concretegoma espuma => foam rubberestrella de mar => starfishratoncito Pérez => tooth fairy

Naturalmente es preciso identificar la colocación terminológica como una unidad conceptual, tal y como veíamos en el apartado 3, y también debemos contar con la presencia del concepto en los sistemas lingüísticos que estamos comparando.

b) Un segundo grado de problemas de localización se encuentra en la conversión de conceptos que tienen un mayor grado de dependencia de dominio o de contexto. Si traducimos el término abstracto de 1 gallon al español , la solución es 3’785 litros (4’546 en el contexto de la Gran Bretaña), pero si de lo que estamos hablando es de un recipiente para agua potable (a gallon container) deberemos traducirlo por “garrafa de 5 litros”, puesto que ésa es la medida que se ha estandarizado para su comercialización en España. Este tipo de adecuación es muy difícil que pueda ser efectuado por un programa, a no ser que éste haya sido adaptado a un tema muy concreto, lo cual supondría a la vez una fuerte limitación para la comercialización del mismo. (Algo parecido pero más difuso ocurre con la traducción general de los referentes culturales marcados como ‘pancakes’ => ¿crêpes?, ¿tortas?, o ‘scones’ =>¿madalenas?, ¿pastas?)

c) Un tercer grado de dificultad en la localización procede de lo que se ha denominado ‘creencias’ o ‘inferencias’ que afectan la lengua de partida así como la lengua de llegada (Farwell & Helmreich, 1995). El traductor debe hacer emerger a la conciencia las asunciones y convenciones que se hallan en el texto original para construir un texto meta que posea el grado máximo de adecuación. Esto significa columpiarse entre los dos universos de creencias, el de la cultura origen y la cultura meta, y considerar cuáles son las consecuencias de las decisiones que afectan el contenido. En su artículo Farwell & Heilmreich plantean un ejemplo interesante sobre la traducción de una referencia a un autor de teatro francés, Feydou, cuyo nombre fue sustituido por la denominación común de ‘obra de enredo’ (bedfarce), porque el público americano incluía este referente en su conjunto de creencias, pero no el nombre del dramaturgo francés. A pesar de la posibilidad de hacer que la máquina consulte una base de datos como Internet, parece difícil almacenar en el ordenador la ausencia de conocimiento, y entrenarla para que decida que la substitución es la acción pertinente.

25

d) Todavía podemos contemplar un cuarto grado de dificultad, éste se produce cuando no hay referentes explícitos porque el autor y el lector del texto original poseen un conocimiento compartido al cual se hace referenciaimplícita, en una relación de complicidad. Si contemplamos el texto siguiente:

- Otra cerveza, por favor- No puedo servirle, señor, esto es Nuevo Méjico

Esto significa que el cliente ha bebido ya tres cervezas. El traductor deberá inferir información que no es explícita en el texto. Sólo podrá hacerlo si ha sido bebedor de cerveza en Nuevo Méjico, o si conoce las tasas de alcoholismo permitidas en los estados de EEUU y sus leyes. ¿Podría una máquina hacer eso? Tal vez lo que pueda hacer es llevarnos a otro lugar del texto donde se haga referencia a la cerveza y a Nuevo Méjico. Además de todo esto el traductor deberá decidir si va a explicar la información que falta en una nota a pie de página, si va a cambiar la frase en algo así como ‘la ley no le permite a usted beber más’ o si va a dejar las cosas como están.

e) En último lugar podemos considerar un quinto nivel, éste aparentemente imposible de ser objeto de computación. Se produce en el nivel del discurso. Considérese, por ejemplo, la importancia que puede tener en la construcción de un personaje femenino que hable de su estreñimiento y su menstruación en la segunda página de un libro (Angela Carter en Wise Children. Cf. Santamaria L., 2000). ¿Considerara el traductor que es una señal del autor para indicar que el personaje es de clase baja? ¿O que muestra una actitud desvergonzada, o irónica? ¿Significa realmente algo? Si la respuesta a la última pregunta es afirmativa por parte del traductor, éste deberá intentar reproducir para el lector de la traducción el efecto que el original produce en el lector original.

Referencias

ANTIA, B.E. (2000): Language Planning and Terminology: an alternative framework of discourse and practice. Amsterdam/Philadelphia. John Benjamins.

AGUILAR-AMAT, A. (1996): Logical Organization of Information at BACO: A Knowledge Multilingual Database for Translation Purposes. Proceedings of the TKE'96 4th International Congress on Terminology and Knowledge Engineering, p. 238-244.

ALPAC (1966): Language and Machines; Computers in Translation and Linguistics, Washington, DC: Publication 1416, National Academy of Sciences.

BALARI, S. (2001): Natural Language Processing as a Computational Problem

BARTHES, R. (1969): Critique et vérité, Éditions du Seuil, París.

BROWN P., DELLA PIETRA S. et al. (1991): Aligning Sentence in Parallel Corpora. In Proceedings of the 29th Annual Meeting of the Association of Computational Linguistics, Berkeley.

26

BROCKMAN, J. ed. (1995): The third culture. Beyond the Scientific Revolution. Versión castellana de Ambrosio García, La tercera cultura. Más allá de la revolución científica. Ed. Tusquets, Barcelona, 1996.

CABRÉ, M.T. (1992): La terminologia. La teoria, els mètodes, les aplicacions, ed. Empúries, Barcelona.

CLAXTON, G. (1997): Hare Brain, Tortoise Mind. Fourth State. Versión castellana de J.J. Estrella, Eds. Urano, 1999, Cerebro de liebre, mente de tortuga.

ELIOT, T.S (1948): Notes towards the Definition of Culture, Faber ed., London.

FARWELL, D. & HEILMREICH, S. (1995): This is not a Bedroom Farce: Pragmatics and Translation, Fourth Colloquium on Cognitive Science.

FLICKINGER, D., NERBONNE, J., et al. (1987): Toward Evaluation of NLP Systems, Hewlett-Packard Laboratories, Palo Alto, CA.

JACKENDOFF, R. (1983): Semantics and Cognition, The MIT Press, Cambridge, Massachusetts.

JACKOBSON, R. (1936): "Contribución a la teoría general de los casos", en Ensayos de Lingüística General, Seix Barral, Barcelona.

LAKOFF, R.T (1993): Lewis Carroll: subversive pragmaticist? Pragmatics 3: 367-85

NIRENBURG, S. (1989): "Knowledge-based machine translation", en Machine Translation, n.4, Kluwer Academic Publishers, 1989, pp. 5-24

NIRENBURG, S. (ed.). (1995): Proceedings of the Conference on Theoretical and Methodological Issues in Machine Translation. Colgate University, Hamilton, NY.

PINKER, S. (1994): The language instinct, London: Penguin Books.

POSTMAN, N. (1992): Technology (Knopf, Nueva York).

RIERA, S. (2001): Ciència, Romanticisme i Utopia, Barcelona, Edicions 62.

SANTAMARIA, L. (2001): Subtitulació i referents culturals. La traducció com a mitjà d'adquisició de representacions socials. Tesis doctoral. Universitat Autònoma de Barcelona.

SETTON, R. (2001): Translation Studies and Cognitive Science: Do we need each other?, Olohan, M. (ed), CTIS Occasional Papers, Manchester, St. Jerome, vol.1

27

SIMMEL, G (1911): Weibliche Kultur, recogido en Cultura femenina y otros ensayos, Alba Editorial, Barcelona, 1999. Traducción de Genoveva Dieterich.

SMADJA, F.A: (1992): "How to compile a bilingual collocational lexicon automatically", en Proceedings of the AAAI workshop on statistically based NLP techniques, Columbia University.

SMADJA, F.A. (1993): "Retrieving Collocations from Text: Xtract", Computational Linguistics, vol. 19. 143-178.

SCHANK, R. C. & Abelson, R.P. (1987): Guiones, planes, metas y entendimiento. Un estudio de las estructuras del conocimiento humano.Barcelona, Piados.

VERSCHUEREN, J. (1999): Understanding pragmatics, Understanding Language Series, Arnold, NY.

WHITE, L. (1973): Tecnología medieval y cambio social, Buenos Aires, Ed. Paidós.

28

cognición, traducción, computación, utopía · web viewsi traducimos el término abstracto de 1...

Documents