los diccionarios electrÓnicos fraseolÓgicos, · 2012-10-23 · usuarios de un diccionario son la...

20
LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIÓN PEDRO MOGORRÓN HUERTA Universidad de Alicante [email protected] Resumen This paper shows the poor treatment of phraseological units provided by traditional monolingual and bilingual dictionaries. It then goes on to focus on the recent launching of electronic dictionaries, their applications and the automated treatment of language, lexicon and its possible classifications. Taking verbal locutions as a starting point, the author suggest a new way to compile an electronic dictionary, attempting to make up for the usual lack of information about phraseological units in tradi- tional dictionaries. The paper concludes showing all the possible applications of these new dictionaries in lexicology and in contrastive semantics, as well as in translation. 1. INTRODUCCIÓN La finalidad de los diccionarios generales en soporte papel ha sido y es aún hoy en día, en el caso de los diccionarios monolingues, la de servir de apoyo a los usuarios de una lengua para mejorar sus competencias lingüísticas y la de ayudar a los estudiantes y a los traductores realizando un análisis contrastivo (siempre parcial) en el caso de los diccionarios bilingües. Tradicionalmente, los diccionarios generales se han organizado alfabéticamente en torno a las entradas del léxico que recogían, reagrupando todas aquellas unidades que presentan la misma forma bajo una misma entrada. Éste ha sido un grave error de conceptualización, pues no pueden realmente existir unidades léxicas con varios significados ya que entonces en el fondo se están describiendo tantas unidades léxicas como significados o subentradas existan con una determinada palabra en ese diccionario. En efecto, para todas y cada una de las unidades léxicas existe un triplete constituido por una forma (x), un significado (x') y una combinatoria propia 2=x". Si consideramos por ejemplo los ejemplos siguientes: — (1) Max pone el libre en el estante = (deja, guarda). — (2) María le pone el vestido rojo a su hijo = (viste). — (3) El sol pone moreno = (tuesta la piel) — (4) Juan se pone enfermo = (enfermar) — (5) Max pone hoy todo su dinero en la cuenta del banco = (depositar). — (6) Max pone un telegrama a Mar = (enviar). — (7) Mar pone una tienda = (montar) ESTUDIOS DE LINGÜISTICA: EL VERBO, 2004, págs. 381-400.

Upload: others

Post on 26-Mar-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN

PEDRO MOGORROacuteN HUERTA

Universidad de Alicante Pedromogorronuaes

Resumen This paper shows the poor treatment of phraseological units provided by traditional monolingual

and bilingual dictionaries It then goes on to focus on the recent launching of electronic dictionaries their applications and the automated treatment of language lexicon and its possible classifications

Taking verbal locutions as a starting point the author suggest a new way to compile an electronic dictionary attempting to make up for the usual lack of information about phraseological units in tradishytional dictionaries The paper concludes showing all the possible applications of these new dictionaries in lexicology and in contrastive semantics as well as in translation

1 INTRODUCCIOacuteN

La finalidad de los diccionarios generales en soporte papel ha sido y es auacuten hoy en diacutea en el caso de los diccionarios monolingues la de servir de apoyo a los usuarios de una lengua para mejorar sus competencias linguumliacutesticas y la de ayudar a los estudiantes y a los traductores realizando un anaacutelisis contrastivo (siempre parcial) en el caso de los diccionarios bilinguumles

Tradicionalmente los diccionarios generales se han organizado alfabeacuteticamente en torno a las entradas del leacutexico que recogiacutean reagrupando todas aquellas unidades que presentan la misma forma bajo una misma entrada Eacuteste ha sido un grave error de conceptualizacioacuten pues no pueden realmente existir unidades leacutexicas con varios significados ya que entonces en el fondo se estaacuten describiendo tantas unidades leacutexicas como significados o subentradas existan con una determinada palabra en ese diccionario

En efecto para todas y cada una de las unidades leacutexicas existe un triplete constituido por una forma (x) un significado (x) y una combinatoria propia 2=x

Si consideramos por ejemplo los ejemplos siguientes mdash (1) Max pone el libre en el estante = (deja guarda) mdash (2) Mariacutea le pone el vestido rojo a su hijo = (viste) mdash (3) El sol pone moreno = (tuesta la piel) mdash (4) Juan se pone enfermo = (enfermar) mdash (5) Max pone hoy todo su dinero en la cuenta del banco = (depositar) mdash (6) Max pone un telegrama a Mar = (enviar) mdash (7) Mar pone una tienda = (montar)

ESTUDIOS DE LINGUumlISTICA EL VERBO 2004 paacutegs 381-400

382 P E D R O M O G O R I Igrave Oacute N H U E R T A

Cada una de estas unidades leacutexicas representadas aunque comparta una forma comuacuten con los demaacutes ejemplos (el verbo poner o cualquiera de sus formas lematizada) se caracshyteriza de eacutestas por tener una combinatoria y un significado propio totalmente independiente de los demaacutes

Existen asimismo otras unidades leacutexicas que presentan tambieacuten esa misma forma y que tradicionalmente han sido reunidas bajo la misma entrada en los diccionarios claacutesicos generales pero que sin embargo no se pueden acoger al triplete 2 = x+y ya que tienen un significado que no es composicional En efecto en determinadas unidades leacutexicas la suma de los significados de los componentes (a b c) no da como seriacutea de suponer (a + b + c) sino que da un significado (a + b + c = d) que no se parece en nada a la suma del significado de cada uno de los componentes tomado individualmente Ej

mdash (8) Poner(le) alguien el cascabel al gato mdash (9) Poner el grito en el cielo mdash (10) Poner a alguien como un trapo mdash (11) Poner las cartas boca arriba mdash (12) Poner verde a alguien

Esta muestra de agrupacioacuten de significados bajo una misma forma nos introduce de lleno en uno de los grandes problemas de elaboracioacuten de los diccionarios

Los problemas fundamentales con los que debe enfrentarse tanto los redactores como los usuarios de un diccionario son la polisemia y la fijacioacuten leacutexica laquoescribirraquo o laquoleerraquo un dicshycionario consiste en gran medida en saber delimitar unidades leacutexicas acerca de las cuales se da o se recibe una informacioacuten maacutes o menos formalizada seguacuten la microestructura de cada diccionario (Blanco 1999 1)

Si ahora a la entrada en la que figuran los ejemplos (1 2 3 4 5 6 7) le antildeadimos los ejemplos (8 9 10 11 12 etc) que presentan fijacioacuten leacutexica entonces nos podremos enconshytrar con una entrada de dimensiones realmente difiacuteciles de manejar pues algunas entradas tienen una enorme cantidad de Unidades leacutexicas por ej agua boca casa cuenta etc

Las unidades con fijacioacuten leacutexica (8 9 10 11 12) que presentan un significado comshyponen parte de lo que hoy en diacutea se ha venido a llamar fraseologiacutea Nos proponemos a continuacioacuten mostrar en este artiacuteculo el tratamiento tan deficiente que han recibido en los diccionarios claacutesicos generales a pesar de la importancia que tienen en el uso y comprenshysioacuten de la lengua y exponer el tratamiento que se les deberiacutea otorgar Para ello hablaremos de la reciente aparicioacuten en el marco de la linguumliacutestica informatizada de los diccionarios electroacutenicos y de los logros que se pueden y esperan conseguir gracias a ellos Tambieacuten trataremos de sus principales objetivos asiacute como de sus posibles aplicaciones al mundo de la fraseologiacutea y de la traduccioacuten

2 LAS UNIDADES FRASEOLOacuteGICAS

Una lengua es un sistema de comunicacioacuten linguumliacutestico propio de una nacioacuten o de una comunidad linguumliacutestica que se caracteriza ademaacutes por ser vehiacuteculo de una cultura propia Para

1 Tenemos censados por ahora 262 ejemplos de locuciones verbales con poner(le)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS lLRSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 8 3

hablarla y comprenderla es preciso conocer sus reglas gramaticales asiacute como gran parte del leacutexico que la compone Ademaacutes Mogorroacuten (200215)

El conocimiento de una lengua se mide generalmente por el dominio y la soltura con los que un hablante utiliza las unidades fraseoloacutegicas propias y caracteriacutesticas de esa lengua En los usuarios nativos estas expresiones representan un saber linguumliacutestico cultural y social comuacuten depositado por la viacutea de la experiencia En los usuarios no nativos que aprenden un segundo idioma las unidades fraseoloacutegicas suponen en general un reto pues representan la mayor dificultad con la que se van a encontrar debido a la gran cantidad de informacioacuten linguumliacutestica social y cultural que han de aprender a utilizar y a diferenciar de las caracteshyriacutesticas propias de su idioma materno

Estas unidades fraseoloacutegicas que podremos en lo sucesivo abreviar bajo la forma UFS se utilizan con un objetivo discursivo muy claro Representan el deseo del locutor de utilizar en el acto de comunicacioacuten una determinada foacutermula refrendada por la mayor parte de la comunidad linguumliacutestica sumaacutendole de esa forma un matiz cultural social generacional etc en vez de utilizar un teacutermino neutro o una periacutefrasis verbal

Aunque ya a principios del siglo XX algunos autores2 habiacutean iniciado una tiacutemida aproxishymacioacuten al fenoacutemeno de la fijacioacuten en la lengua y en el discurso en la segunda mitad del siglo la linguumliacutestica ha descubierto en las fijaciones y en las unidades fraseoloacutegicas3 un mashyterial no solamente de estudio sino tambieacuten de enorme intereacutes y trascendental importancia en la lengua y en el desarrollo adquisicioacuten y utilizacioacuten de la competencia comunicativa de los hablantes4

21 Tratamiento de las unidades fraseoloacutegicas en los diccionarios generales

Si bien es verdad que en un diccionario de corte general (ya sea monolingue o bilinguumle) se deberiacutea poder encontrar cualquier vocablo cualquier unidad leacutexica simple o compleja de significado composicional o fijado que se buscara en eacutel tambieacuten de sobra es sabido que numerosas razones teoacutericas y teacutecnicas motivos de adecuacioacuten de espacio fiacutesico amplitud de la tarea a realizar5 han limitado esa posibilidad

2 C Bally (1905) Osear Jespersenn (1926) 3 Queremos aclarar que no es nuestra intencioacuten aquiacute presentar un estado de la cuestioacuten acerca de los estudios fraseoloacutegicos y o de stis posibles clasificaciones Ver para ello Blanco (1999) Corpas (1996b 2003) Martins (1996) Mogorroacuten (2002) Ruiz Gurillo (1997) 4 Basta para ello ver la enorme cantidad de grupos de investigacioacuten que han trabajado siguen trabajando o estaacuten iniciando sus investigaciones entorno a los fenoacutemenos de fijacioacuten linguumliacutestica en numerosas lenguas con lo que eso supone en cuanto a proyectos produccioacuten bibliograacutefica congresos en los que se habla de ello o en los que uacutenishycamente se tratan estos fenoacutemenos Para tener tina pequentildea idea acerca de la importancia de estos fenoacutemenos basta consultar laquodiez antildeos de investigacioacuten en fraseologiacutearaquo de G Corpas (2003) Ademaacutes de los grupos mencionados en este libro se podriacutean antildeadir muchiacutesimos maacutes aunque solamente vamos a resentildear por considerarlos relevantes y con el riesgo de dejar algunos sin sentildealar al Laboratoire de Linguistique informatique (LLI) dirigido por G Gross en Paris 13 al Laboratoire dAutomatique Documentaire et Linguistique (LADL) creado por el recientemente fallecido M Gross al prolifico grupo de investigacioacuten de la Universidad de Tuacutenez dirigido por el profesor Salah Mejri y que estaacute desarrollando el atlas linguumliacutestico de Tuacutenez al grupo de Lexicologiacutea del departamento de Filologiacutea romaacutenica de la AUB dirigido por Xavier Blanco

5 No conviene olvidar que este tipo de obras es marcadamente editorialista y que por lo tanto se debe a un factor de rentabilidad no linguumliacutestica sino econoacutemica con todo lo que esta observacioacuten presupone

384 PEDRO MOGORROacuteN HUERTA

Por lo tanto queremos dejar patente que aunque el conjunto de unidades fraseoloacutegicas o fijaciones seleccionados y presentes tanto en los diccionarios monolingues como bilinshyguumles constituye una parte importante del sistema leacutexico sin embargo esa presencia se ha plasmado generalmente en la incorporacioacuten de laquocierto nuacutemero de unidadesraquo a menudo muy reducido siguiendo un proceso de seleccioacuten y descripcioacuten uacutenicamente alfabeacutetico fiuto de la propia intuicioacuten y competencia linguumliacutestica del o de los lexicoacutegrafos encargados de la elaboshyracioacuten de la obra y ademaacutes sin ninguacuten criterio de clasificacioacuten exhaustivo Esas limitaciones han acotado el uso de la lengua analizada y utilizada en los diccionarios reduciendo eacutesta a una lengua llamada estaacutendar que recoge las unidades leacutexicas y fraseoloacutegicas maacutes frecuentes y compartidas por la mayor parte de los usuarios Este proceso y criterios de seleccioacuten han dejado de lado numerosas otras expresiones que poseen dentro del macromodelo diasis-temaacutetico6 una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc Ej

Modelo de mareaje diasistemaacutetico

diastraacutetico

diatoacutepico

diacrogravenico

diaintegrativo

dianonnativo

diaconnotativo

diamediaacutetico

diafaacutesico

diatextual

diateacutecnico

diafrecuencia

estaacutendar culto familiar popular coloquial vulgar argoacutetico

americanismos dialectologiacutea regionalismo

arcaico neologismo

latiacuten argot

correcto incorrecto

infantil peyorativo apreciativo

oral escrito

formal informal

periodiacutestico administrativo literario

lenguaje de especialidad

raro frecuente

Cuadro 1

Existe pues frecuentemente un desfase considerable entre el continuo e imparable proshyceso de remodelacioacuten de los actos de comunicacioacuten constantemente obligados a readaptarse y el material que los lexicoacutegrafos insertan en los diccionarios En efecto por un lado estaacuten las UFS de la lengua claacutesica a menudo ya en desuso por pertenecer a un uso no ya de otras generaciones sino tambieacuten a una concepcioacuten diacrogravenica y que por lo tanto ya no son representativas de los usos y estados linguumliacutesticos que se van sucediendo Por otro lado se halla el uso presente marcadamente innovador de la lengua que se debe ir transformando y adaptando a los constantes cambios que se producen en la lengua por los usos generacioshynales y las diferentes necesidades y realidades sociales que se plasma en nuevos vocablos y expresiones Este desfase que es una de las deficiencias que nos proponemos paliar con los diccionarios electroacutenicos es muy patente en los diccionarios claacutesicos

6 Una de las descripciones del modelo diasistemaacutetico mas completa ha sido realizada por FJ Haussman ver para ello Blanco (2001 5253)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 385

En efecto numerosas UFS que aparecen en los diccionarios son las huellas de eacutepocas pashysadas ya no son representativas del estado vigente de la lengua activa pues pertenecen a un uso generacional caduco a menudo diacrogravenico a una concepcioacuten social y laboral diferente7 Esa falta de adecuacioacuten conceptual o composicional supone que el hablante utiliza unidades fraseoloacutegicas que le suponen los siguientes problemas de comprensioacuten e interpretacioacuten

mdash Se usan expresiones con palabras que solamente se utilizan ya en la lengua en esas expresiones Ej bull Salir de naja bull Prendre la poudre descampette

mdash Se usan expresiones que pertenecen a otras realidades vocabulario del campo refrashynes meteoroloacutegicos mundo laboral ya caduco como es el caso con todo lo referido al campo del caballo y que ya no son sentidas como propias por los usuarios de la lengua al no saber a que se refieren exactamente al no conocer el posible hecho histoacuterico en el que se basan Ej bull Cumplir con la parroquia8 (DUE)= Comulgar por Pascua bull Costar un Potosiacute (DUE) = Costar algo mucho dinero referencia a la colonizashy

cioacuten espantildeola de Hispanoameacuterica bull Colgarle a alguien el un Sambenito San-Benito (DUE) = Acusar injustamente

a alguien bull De casta le viene al galgo el ser rabilargo (DUE) = La cualidad de una persona

le viene de familia bull Poner a alguien a los pies de los caballos (DUE) = desairar humillar maltrashy

tar bull Pasar maacutes hambre que un maestro de escuela9

Este fenoacutemeno se puede apreciar auacuten con mayor claridad en los grupos de expresiones parasinoacutenimas (Ver Cuadro 2 y 3) En el primer cuadro

7 Seguacuten Rey-Debove (1971 98) laquoEn Synchronie pure cest agrave dire dans linstant des contemporains de tous les acircges compris entre 15 et 75 ans ont des eacutechanges reacuteels Mais une personne de 75 ans garde les habitudes de langage de sa jeunesse correspondant agrave un autre systegraveme lexical et qui persiste gracircce agrave la meacutemoire et aux eacutechanges avec les personnes du mecircme acircge Une grande partie du vocabulaire actif de ses 15 ans (communication avec les personnes acircgeacutees) lui ne fonctionne plus dans aucun eacutechange faute dinterlocuteurs Cest de cette maniegravere que la langue perd dun cocircteacute ce quelle acquiert de lautreraquo 8 Las siglas de las obras referenciadas corresponden a 1 Diccionario de la Real Academia Espantildeola de la lengua para RAE al diccionario de uso del espantildeol para DUE Gran diccionario Larousse Espantildeol-Franceacutes Franceacutes-espashyntildeol para LBI Dictionnaire des Expressions et Locutions de Alain Rey para AR Thesaurus Larousse para TL PR para Petit Robert Tambieacuten hay que sentildealar que las locuciones verbales que figuran por debajo de la liacutenea horizontal y que no tienen referencia no han sido encontradas en diccionarios pero sin embargo son bastante frecuentes en la lengua activa espantildeola o francesa 9 No viene referenciada esta locucioacuten muy conocida y muy usada en los diccionarios que hemos consultado (DUE DRAE En Larousse)

386 PEDRO MOGORROacuteN HUERTA

Estar en Babia (DUE) Estar en las Batuecas (DUE) Estar en Beleacuten (DUE) Estar en la higuera (DUE) Estar en el limbo (DUE) Estar en la luna (DUE) Estar en las nubes (DUE) Mirar a las musarantildeas (DUE) Mirar las telarantildeas (LBI)

Estar en la parra

Bayer aux corneilles(AR) Etre dans les limbes (AR) Ecirctre dans la lune (AR) Ecirctre dans les nuages (AR) Navoir pas les pieds sur terre (TL)

Cuadro nn 2

se pueden observar varias expresiones que significan praacutecticamente lo mismo si nos ateshynemos a las definiciones que de ellas dan los diccionarios (DUE DRAE) estar distraiacutedo no enterarse de algo Sin embargo estas locuciones no son utilizadas indistintamente por las distintas generaciones de usuarios que componen la populacioacuten total activa que utiliza una determinada lengua Asiacute sorprendentemente seguacuten una encuesta que hemos realizado entre nuestros alumnos en la U de Alicante las expresiones estar en Babia en las Batueshycas incluso estar en Beleacuten asiacute como Mirar a las musarantildeas o a las telerantildeas ya no son comprendidas por la mayoriacutea de los joacutevenes estudiantes de 20 antildeos

Por otro lado existe justamente el fenoacutemeno inverso Es decir que la lengua activa de una determinada fase linguumliacutestica crea otra unidades que no aparecen en los diccionarios que suelen tardar bastante tiempo en incorporar las nuevas creaciones o adaptaciones de la lengua Eacutestos las excluyen debido a su inestabilidad o a su caducidad en la lengua pues numerosas UFS aparecen son utilizadas cierto tiempo Ej

mdash estar de ir de guateque y posteriormente son reemplazadas por otras maacutes modernas

mdash estar de ir de guerra hacer la ruta (del bacalao) mdash estar hasta el punto com10 Tambieacuten es verdad que en otras ocasiones los diccionarios que como hemos sentildealado

anteriormente suelen reflejar una lengua estaacutendar no incorporan expresiones que se manshytienen en la lengua colectiva durante mucho tiempo debido a diferentes niveles de uso Pondremos como ejemplo la expresiones

mdash ser maacutes agarrado que un tango y ser maacutes agarrado que un catalaacuten de uso corriente que no aparecen mientras que

mdash ser maacutes agarrado que un chotis siacute que aparece en el DRAE Otro ejemplo representativo podriacutea ser la serie de expresiones parasinoacutenimas de estar harto de algo o alguien (Ver cuadro 3) que tienen escasa repercusioacuten en los diccionarios claacutesicos que no incluyen las expresiones siguientes que figuran por deacutebashy

lo Esta expresioacuten seria un ejemplo de muy reciente aparicioacuten en ia lengua activa Soacutelo con el paso del tiempo podremos saber su eacutexito real en la lengua

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 387

jo de la liacutenea horizontal (estar hasta los huevos hasta el cono etc) que sin embargo tienen gran representatividad en la lengua activa de los joacutevenes y de los no tan joacutevenes

Estar hasta el coco de (DUE) Estar hasta los cojones de ( DUE) Estar hasta la coronilla de (DUE) Estar hasta el culo de (DUE) Estar hasta el gollete de (RAE) Estar hasta el gorro de (DUE) Estar hasta el montildeo de (DUE) Estar hasta las narices de (DUE) Estar hasta la punta de los pelos (DUE) Estar hasta los pelos de (DUE) Estar hasta por encima de la cabeza de (DUE)

Estar hasta el cono de Estar hasta el punto com de Estar hasta los huevos de Estar hasta los mismiacutesismos de Estar hasta el nabo de Estar hasta los ovarios de Estar hasta el pini de Estar hasta el pilo de

En avoir assez(AR) En avoir marre (fam AR) En avoir par dessus la tecircte (fam AR) En avoir par dessus les eacutepaules (famAR) En avoir plein les bottes (famPR) En avoir plein le cul (fam AR) En avoir plein le dos (famAR) En avoir ras-lc-bol (famAR) En avoir son bol (famAR) En avoir (son) pied (Arg AR) bn avoir soupe (famTL)

En avoir ras le baba En avoir ras la casquette En avoir ras les couilles En avoir ras le jonc En avoir ras les pacircquerettes

Cuadro ndeg 3

Convendriacutea pues que los diccionarios tratasen debidamente estas UFS ya que al no estar debidamente recogidos por los diccionarios estos desfases entre el uso de la lengua activa estaacutendar claacutesica popular etc su escasa representatividad y clasificacioacuten en los diccionashyrios dificultan el conocimiento de numerosas foacutermulas a

mdash usuarios de un idioma mdash estudiantes que desean aprender ese idioma mdash traductores que no saben realmente cual de las combinaciones es el equivalente real

de traduccioacuten Ademaacutes de estos desfases de incorporacioacuten de las unidades fraseoloacutegicas tambieacuten cabriacutea

referirse al tratamiento que se les da con la escasa informacioacuten de caraacutecter gramatical y la mala gestioacuten o presentacioacuten de esta misma en efecto se suelen ordenar las UFS alfabeacutetishycamente sin aplicar una estructuracioacuten sistemaacutetica para no mezclar los distintos grupos de unidades fraseoloacutegicas Estas obras deberiacutean cuanto menos tratarlas y dar la misma cantidad de mformacioacuten que para el resto de las unidades simples no fijadas de la lengua para permishytirle a los usuarios disponer de toda la informacioacuten morfosintaacutectica necesaria para utilizarlas correctamente Asiacute por ejemplo la gran variedad estructural de UFS no viene tratada ya que los diccionarios las incorporan de forma desordenada Por otro lado existen varias deficienshycias en la presentacioacuten de estas formas Asiacute I Santamariacutea (2003 48) aprecia

388 PrDRO MoGORROacuteN HUBRTA

mdash indecisioacuten en la forma de la expresioacuten aportando una uacutenica de las variantes graacuteficas sin que esta sea siempre la maacutes usual (a boca de jarro en lugar de abocajarro)

mdash Indecisioacuten a la hora de lematizar la expresioacuten que una veces aparece con un verbo con el que se combina frecuentemente otras aparece sin forma verbal (de estampiacutea salir de estampiacutea

mdash Inclusioacuten de las expresiones con o sin preposiciones en ajamas ayunas Recientemente se estaacuten elaborando versiones comerciales de estos diccionarios en soshy

porte informaacutetico DUE DRAE Enciclopedia Larousse Petit Robert Enciclopedia Britaacuteshynica etc Sin embargo ese cambio de soporte no ha supuesto ninguacuten cambio apreciabie en la estructura o en el contenido de estas obras pues las uacutenicas diferencias que se han podido observar han sido la rapidez de las consultas a realizar la posibilidad de navegar por los artiacuteculos asiacute como la de seleccionar y buscar estructuras con pequentildeos localizadores ya que tanto la estructuracioacuten de la informacioacuten como la de los contenidos siguen siendo praacutecticashymente similares

3 APARICIOacuteN DE LOS DICCIONARIOS ELECTROacuteNICOS

Por otro lado y tambieacuten recientemente ha hecho su aparicioacuten en el mundo de la linguumliacutesshytica otro tipo de diccionarios cuya elaboracioacuten estaacute relacionada con posibles aplicaciones al tratamiento automaacutetico de textos en el campo de la linguumliacutestica aplicada Se trata de los diccionarios electroacutenicos Al contrario de lo que habiacutea ocurrido con la elaboracioacuten y el conshytenido parcial de los diccionarios generales claacutesicos ya desde sus inicios la concepcioacuten de este nuevo tipo de diccionarios se estaacute realizando asumiendo como objetivo a alcanzar el de la maacutexima exhaustividad posible En efecto un diccionario electroacutenico no es una sencilla lista alfabeacutetica muy completa de palabras simples o compuestas que se podraacute posteriormente aplicar al anaacutelisis automaacutetico de textos No Un diccionario electroacutenico es mucho maacutes que eso Se trata de una base de datos que contiene una enorme cantidad de datos recogidos por los lexicoacutegrafos que deberaacute ser gestionada por la informaacutetica en funcioacuten de las necesidades que se hallan programado y que se deseen alcanzar

Para poder entender las posibilidades de los diccionarios electroacutenicos hay que saber que se basan en torno a dos piedras angulares Por un lado tendremos una base linguumliacutestica y por otro lado la parte informaacutetica que se va a encargar de gestionar lo maacutes eficazmente posible toda la cantidad de informacioacuten linguumliacutestica recogida por los especialistas en lengua Eacutesta poshydraacute ser por lo tanto morfoloacutegica sintaacutectica foneacutetica semaacutentica etc Sin embargo la parte informaacutetica solamente podraacute analizar la informacioacuten que la base de datos linguumliacutestica haya recopilado y estructurado y realizar procesos selectivos de buacutesqueda sobre eacutesta Es decir que el mejor programa informaacutetico no podraacute hacer maravillas por mucho que se quiera a la hora de gestionar la informacioacuten para buscar resultados y posibles aplicaciones Son pues dos procesos que deben ir a la par El linguumlista debe saber lo que necesita el informaacutetico y el informaacutetico a su vez lo que desea conseguir el linguumlista Una vez esteacuten definidos entre los dos los objetivos a alcanzar se deben crear una serie de ficheros informaacuteticos que conshytendraacuten toda la informacioacuten en forma de entradas leacutexicas (simples o complejas) en forma de coacutedigos morfoloacutegicos identificablcs por los programas

LOS DICCIONARIOS ELECTROacuteNICOS KHASKOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 389

31 Diccionarios electroacutenicos desarrollados para sistemas de TAL (Tratamiento Autoshymaacutetico del Lenguaje)

Las aplicaciones contempladas por los diccionarios electroacutenicos son muy numerosas pero van a depender en gran parte de la informacioacuten y del tratamiento que se le haya dado a eacutesta En efecto la utilizacioacuten de la informacioacuten en tratamiento automaacutetico de textos exige que las palabras pertenecientes a los textos que se han introducido esteacuten etiquetadas de mashynera que el diccionario pueda catalogarlas A partir de teacutecnicas basadas en el procesamiento del lenguaje natural se han desarrollado sistemas para la lematizacioacuten es decir para el etishyquetado automaacutetico morfoloacutegico y sintaacutectico de los textos de un corpus que consisten en la lectura y en la divisioacuten del texto en unidades relevantes que seraacuten maacutes tarde utilizadas para trabajar el anaacutelisis de la palabra Las caracteriacutesticas que normalmente se indican durante este etiquetado hacen referencia a

mdash Aspectos de estructuras de texto marcas tipograacuteficas divisiones textuales paacuterrafos citas tiacutetulos

mdash las propiedades morfosintaacutecticas de la palabra y puede ir desde los datos necesarios a la conjugacioacuten de un verbo hasta todos los datos necesarios para poder realizar un anaacutelisis textual

mdash Caracterizacioacuten de las unidades leacutexicas leacutexico en general extranjerismos nombres propiacuteos siglas abreviaciones

mdash Funciones sintaacutecticas de cada constituyente y representacioacuten por medio de aacuterboles sintaacutecticos Etc

De esta forma dependiendo de la aplicacioacuten planteada se podraacute por ejemplo realizar una comprobacioacuten ortograacutefica un anaacutelisis sintaacutectico de una frase o de un texto la buacutesqueda de un corpus para poder contrastar y verificar los elementos analizados asiacute como la frecuencia de aparicioacuten de eacutestos mismos proporcionando datos acerca de la frecuencia de aparicioacuten de las palabras en teacuterminos cuantitativos y del tipo de textos en que aparece Finamente se podraacuten como veremos posteriormente aplicar toda la informacioacuten a procesos de aprendizaje y traduccioacuten automaacuteticos11

32 Diccionarios electroacutenicos concebidos para realizar una descripcioacuten gramatical completa del leacutexico y de la sintaxis

Se han elaborado numerosos prototipos de analizadores textuales pero sin embargo ninguno de ellos incorpora un tratamiento completo del leacutexico y de la gramaacutetica Desde prinshycipios del siglo XX los linguumlistas pareciacutean haber renunciado a constituir inventarios pues por ejemplo los estudios transformacionalistas se basaban en pequentildeos grupos de ejemplos estos uacuteltimos sin embargo seraacuten fundamentales para Maurice Gross (197520)

Leacutetude systeacutematique des proprieacuteteacutes syntaxiques simpose aujourdhui pour des raisons diverses Lexistence de theacuteories transformatiomielles fait quune eacutetude systeacutematique peut ecirctre deacutelimiteacutee avec beaucoup plus de preacutecisions quagrave linteacuterieur des cadres traditionnels Dautre part la situation preacutesente de la syntaxe transformationnelle est particuliegravere Apregraves

11 Los dos sistemas de TAL maacutes representativos son SYSTRAN y SADAW

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 2: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

382 P E D R O M O G O R I Igrave Oacute N H U E R T A

Cada una de estas unidades leacutexicas representadas aunque comparta una forma comuacuten con los demaacutes ejemplos (el verbo poner o cualquiera de sus formas lematizada) se caracshyteriza de eacutestas por tener una combinatoria y un significado propio totalmente independiente de los demaacutes

Existen asimismo otras unidades leacutexicas que presentan tambieacuten esa misma forma y que tradicionalmente han sido reunidas bajo la misma entrada en los diccionarios claacutesicos generales pero que sin embargo no se pueden acoger al triplete 2 = x+y ya que tienen un significado que no es composicional En efecto en determinadas unidades leacutexicas la suma de los significados de los componentes (a b c) no da como seriacutea de suponer (a + b + c) sino que da un significado (a + b + c = d) que no se parece en nada a la suma del significado de cada uno de los componentes tomado individualmente Ej

mdash (8) Poner(le) alguien el cascabel al gato mdash (9) Poner el grito en el cielo mdash (10) Poner a alguien como un trapo mdash (11) Poner las cartas boca arriba mdash (12) Poner verde a alguien

Esta muestra de agrupacioacuten de significados bajo una misma forma nos introduce de lleno en uno de los grandes problemas de elaboracioacuten de los diccionarios

Los problemas fundamentales con los que debe enfrentarse tanto los redactores como los usuarios de un diccionario son la polisemia y la fijacioacuten leacutexica laquoescribirraquo o laquoleerraquo un dicshycionario consiste en gran medida en saber delimitar unidades leacutexicas acerca de las cuales se da o se recibe una informacioacuten maacutes o menos formalizada seguacuten la microestructura de cada diccionario (Blanco 1999 1)

Si ahora a la entrada en la que figuran los ejemplos (1 2 3 4 5 6 7) le antildeadimos los ejemplos (8 9 10 11 12 etc) que presentan fijacioacuten leacutexica entonces nos podremos enconshytrar con una entrada de dimensiones realmente difiacuteciles de manejar pues algunas entradas tienen una enorme cantidad de Unidades leacutexicas por ej agua boca casa cuenta etc

Las unidades con fijacioacuten leacutexica (8 9 10 11 12) que presentan un significado comshyponen parte de lo que hoy en diacutea se ha venido a llamar fraseologiacutea Nos proponemos a continuacioacuten mostrar en este artiacuteculo el tratamiento tan deficiente que han recibido en los diccionarios claacutesicos generales a pesar de la importancia que tienen en el uso y comprenshysioacuten de la lengua y exponer el tratamiento que se les deberiacutea otorgar Para ello hablaremos de la reciente aparicioacuten en el marco de la linguumliacutestica informatizada de los diccionarios electroacutenicos y de los logros que se pueden y esperan conseguir gracias a ellos Tambieacuten trataremos de sus principales objetivos asiacute como de sus posibles aplicaciones al mundo de la fraseologiacutea y de la traduccioacuten

2 LAS UNIDADES FRASEOLOacuteGICAS

Una lengua es un sistema de comunicacioacuten linguumliacutestico propio de una nacioacuten o de una comunidad linguumliacutestica que se caracteriza ademaacutes por ser vehiacuteculo de una cultura propia Para

1 Tenemos censados por ahora 262 ejemplos de locuciones verbales con poner(le)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS lLRSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 8 3

hablarla y comprenderla es preciso conocer sus reglas gramaticales asiacute como gran parte del leacutexico que la compone Ademaacutes Mogorroacuten (200215)

El conocimiento de una lengua se mide generalmente por el dominio y la soltura con los que un hablante utiliza las unidades fraseoloacutegicas propias y caracteriacutesticas de esa lengua En los usuarios nativos estas expresiones representan un saber linguumliacutestico cultural y social comuacuten depositado por la viacutea de la experiencia En los usuarios no nativos que aprenden un segundo idioma las unidades fraseoloacutegicas suponen en general un reto pues representan la mayor dificultad con la que se van a encontrar debido a la gran cantidad de informacioacuten linguumliacutestica social y cultural que han de aprender a utilizar y a diferenciar de las caracteshyriacutesticas propias de su idioma materno

Estas unidades fraseoloacutegicas que podremos en lo sucesivo abreviar bajo la forma UFS se utilizan con un objetivo discursivo muy claro Representan el deseo del locutor de utilizar en el acto de comunicacioacuten una determinada foacutermula refrendada por la mayor parte de la comunidad linguumliacutestica sumaacutendole de esa forma un matiz cultural social generacional etc en vez de utilizar un teacutermino neutro o una periacutefrasis verbal

Aunque ya a principios del siglo XX algunos autores2 habiacutean iniciado una tiacutemida aproxishymacioacuten al fenoacutemeno de la fijacioacuten en la lengua y en el discurso en la segunda mitad del siglo la linguumliacutestica ha descubierto en las fijaciones y en las unidades fraseoloacutegicas3 un mashyterial no solamente de estudio sino tambieacuten de enorme intereacutes y trascendental importancia en la lengua y en el desarrollo adquisicioacuten y utilizacioacuten de la competencia comunicativa de los hablantes4

21 Tratamiento de las unidades fraseoloacutegicas en los diccionarios generales

Si bien es verdad que en un diccionario de corte general (ya sea monolingue o bilinguumle) se deberiacutea poder encontrar cualquier vocablo cualquier unidad leacutexica simple o compleja de significado composicional o fijado que se buscara en eacutel tambieacuten de sobra es sabido que numerosas razones teoacutericas y teacutecnicas motivos de adecuacioacuten de espacio fiacutesico amplitud de la tarea a realizar5 han limitado esa posibilidad

2 C Bally (1905) Osear Jespersenn (1926) 3 Queremos aclarar que no es nuestra intencioacuten aquiacute presentar un estado de la cuestioacuten acerca de los estudios fraseoloacutegicos y o de stis posibles clasificaciones Ver para ello Blanco (1999) Corpas (1996b 2003) Martins (1996) Mogorroacuten (2002) Ruiz Gurillo (1997) 4 Basta para ello ver la enorme cantidad de grupos de investigacioacuten que han trabajado siguen trabajando o estaacuten iniciando sus investigaciones entorno a los fenoacutemenos de fijacioacuten linguumliacutestica en numerosas lenguas con lo que eso supone en cuanto a proyectos produccioacuten bibliograacutefica congresos en los que se habla de ello o en los que uacutenishycamente se tratan estos fenoacutemenos Para tener tina pequentildea idea acerca de la importancia de estos fenoacutemenos basta consultar laquodiez antildeos de investigacioacuten en fraseologiacutearaquo de G Corpas (2003) Ademaacutes de los grupos mencionados en este libro se podriacutean antildeadir muchiacutesimos maacutes aunque solamente vamos a resentildear por considerarlos relevantes y con el riesgo de dejar algunos sin sentildealar al Laboratoire de Linguistique informatique (LLI) dirigido por G Gross en Paris 13 al Laboratoire dAutomatique Documentaire et Linguistique (LADL) creado por el recientemente fallecido M Gross al prolifico grupo de investigacioacuten de la Universidad de Tuacutenez dirigido por el profesor Salah Mejri y que estaacute desarrollando el atlas linguumliacutestico de Tuacutenez al grupo de Lexicologiacutea del departamento de Filologiacutea romaacutenica de la AUB dirigido por Xavier Blanco

5 No conviene olvidar que este tipo de obras es marcadamente editorialista y que por lo tanto se debe a un factor de rentabilidad no linguumliacutestica sino econoacutemica con todo lo que esta observacioacuten presupone

384 PEDRO MOGORROacuteN HUERTA

Por lo tanto queremos dejar patente que aunque el conjunto de unidades fraseoloacutegicas o fijaciones seleccionados y presentes tanto en los diccionarios monolingues como bilinshyguumles constituye una parte importante del sistema leacutexico sin embargo esa presencia se ha plasmado generalmente en la incorporacioacuten de laquocierto nuacutemero de unidadesraquo a menudo muy reducido siguiendo un proceso de seleccioacuten y descripcioacuten uacutenicamente alfabeacutetico fiuto de la propia intuicioacuten y competencia linguumliacutestica del o de los lexicoacutegrafos encargados de la elaboshyracioacuten de la obra y ademaacutes sin ninguacuten criterio de clasificacioacuten exhaustivo Esas limitaciones han acotado el uso de la lengua analizada y utilizada en los diccionarios reduciendo eacutesta a una lengua llamada estaacutendar que recoge las unidades leacutexicas y fraseoloacutegicas maacutes frecuentes y compartidas por la mayor parte de los usuarios Este proceso y criterios de seleccioacuten han dejado de lado numerosas otras expresiones que poseen dentro del macromodelo diasis-temaacutetico6 una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc Ej

Modelo de mareaje diasistemaacutetico

diastraacutetico

diatoacutepico

diacrogravenico

diaintegrativo

dianonnativo

diaconnotativo

diamediaacutetico

diafaacutesico

diatextual

diateacutecnico

diafrecuencia

estaacutendar culto familiar popular coloquial vulgar argoacutetico

americanismos dialectologiacutea regionalismo

arcaico neologismo

latiacuten argot

correcto incorrecto

infantil peyorativo apreciativo

oral escrito

formal informal

periodiacutestico administrativo literario

lenguaje de especialidad

raro frecuente

Cuadro 1

Existe pues frecuentemente un desfase considerable entre el continuo e imparable proshyceso de remodelacioacuten de los actos de comunicacioacuten constantemente obligados a readaptarse y el material que los lexicoacutegrafos insertan en los diccionarios En efecto por un lado estaacuten las UFS de la lengua claacutesica a menudo ya en desuso por pertenecer a un uso no ya de otras generaciones sino tambieacuten a una concepcioacuten diacrogravenica y que por lo tanto ya no son representativas de los usos y estados linguumliacutesticos que se van sucediendo Por otro lado se halla el uso presente marcadamente innovador de la lengua que se debe ir transformando y adaptando a los constantes cambios que se producen en la lengua por los usos generacioshynales y las diferentes necesidades y realidades sociales que se plasma en nuevos vocablos y expresiones Este desfase que es una de las deficiencias que nos proponemos paliar con los diccionarios electroacutenicos es muy patente en los diccionarios claacutesicos

6 Una de las descripciones del modelo diasistemaacutetico mas completa ha sido realizada por FJ Haussman ver para ello Blanco (2001 5253)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 385

En efecto numerosas UFS que aparecen en los diccionarios son las huellas de eacutepocas pashysadas ya no son representativas del estado vigente de la lengua activa pues pertenecen a un uso generacional caduco a menudo diacrogravenico a una concepcioacuten social y laboral diferente7 Esa falta de adecuacioacuten conceptual o composicional supone que el hablante utiliza unidades fraseoloacutegicas que le suponen los siguientes problemas de comprensioacuten e interpretacioacuten

mdash Se usan expresiones con palabras que solamente se utilizan ya en la lengua en esas expresiones Ej bull Salir de naja bull Prendre la poudre descampette

mdash Se usan expresiones que pertenecen a otras realidades vocabulario del campo refrashynes meteoroloacutegicos mundo laboral ya caduco como es el caso con todo lo referido al campo del caballo y que ya no son sentidas como propias por los usuarios de la lengua al no saber a que se refieren exactamente al no conocer el posible hecho histoacuterico en el que se basan Ej bull Cumplir con la parroquia8 (DUE)= Comulgar por Pascua bull Costar un Potosiacute (DUE) = Costar algo mucho dinero referencia a la colonizashy

cioacuten espantildeola de Hispanoameacuterica bull Colgarle a alguien el un Sambenito San-Benito (DUE) = Acusar injustamente

a alguien bull De casta le viene al galgo el ser rabilargo (DUE) = La cualidad de una persona

le viene de familia bull Poner a alguien a los pies de los caballos (DUE) = desairar humillar maltrashy

tar bull Pasar maacutes hambre que un maestro de escuela9

Este fenoacutemeno se puede apreciar auacuten con mayor claridad en los grupos de expresiones parasinoacutenimas (Ver Cuadro 2 y 3) En el primer cuadro

7 Seguacuten Rey-Debove (1971 98) laquoEn Synchronie pure cest agrave dire dans linstant des contemporains de tous les acircges compris entre 15 et 75 ans ont des eacutechanges reacuteels Mais une personne de 75 ans garde les habitudes de langage de sa jeunesse correspondant agrave un autre systegraveme lexical et qui persiste gracircce agrave la meacutemoire et aux eacutechanges avec les personnes du mecircme acircge Une grande partie du vocabulaire actif de ses 15 ans (communication avec les personnes acircgeacutees) lui ne fonctionne plus dans aucun eacutechange faute dinterlocuteurs Cest de cette maniegravere que la langue perd dun cocircteacute ce quelle acquiert de lautreraquo 8 Las siglas de las obras referenciadas corresponden a 1 Diccionario de la Real Academia Espantildeola de la lengua para RAE al diccionario de uso del espantildeol para DUE Gran diccionario Larousse Espantildeol-Franceacutes Franceacutes-espashyntildeol para LBI Dictionnaire des Expressions et Locutions de Alain Rey para AR Thesaurus Larousse para TL PR para Petit Robert Tambieacuten hay que sentildealar que las locuciones verbales que figuran por debajo de la liacutenea horizontal y que no tienen referencia no han sido encontradas en diccionarios pero sin embargo son bastante frecuentes en la lengua activa espantildeola o francesa 9 No viene referenciada esta locucioacuten muy conocida y muy usada en los diccionarios que hemos consultado (DUE DRAE En Larousse)

386 PEDRO MOGORROacuteN HUERTA

Estar en Babia (DUE) Estar en las Batuecas (DUE) Estar en Beleacuten (DUE) Estar en la higuera (DUE) Estar en el limbo (DUE) Estar en la luna (DUE) Estar en las nubes (DUE) Mirar a las musarantildeas (DUE) Mirar las telarantildeas (LBI)

Estar en la parra

Bayer aux corneilles(AR) Etre dans les limbes (AR) Ecirctre dans la lune (AR) Ecirctre dans les nuages (AR) Navoir pas les pieds sur terre (TL)

Cuadro nn 2

se pueden observar varias expresiones que significan praacutecticamente lo mismo si nos ateshynemos a las definiciones que de ellas dan los diccionarios (DUE DRAE) estar distraiacutedo no enterarse de algo Sin embargo estas locuciones no son utilizadas indistintamente por las distintas generaciones de usuarios que componen la populacioacuten total activa que utiliza una determinada lengua Asiacute sorprendentemente seguacuten una encuesta que hemos realizado entre nuestros alumnos en la U de Alicante las expresiones estar en Babia en las Batueshycas incluso estar en Beleacuten asiacute como Mirar a las musarantildeas o a las telerantildeas ya no son comprendidas por la mayoriacutea de los joacutevenes estudiantes de 20 antildeos

Por otro lado existe justamente el fenoacutemeno inverso Es decir que la lengua activa de una determinada fase linguumliacutestica crea otra unidades que no aparecen en los diccionarios que suelen tardar bastante tiempo en incorporar las nuevas creaciones o adaptaciones de la lengua Eacutestos las excluyen debido a su inestabilidad o a su caducidad en la lengua pues numerosas UFS aparecen son utilizadas cierto tiempo Ej

mdash estar de ir de guateque y posteriormente son reemplazadas por otras maacutes modernas

mdash estar de ir de guerra hacer la ruta (del bacalao) mdash estar hasta el punto com10 Tambieacuten es verdad que en otras ocasiones los diccionarios que como hemos sentildealado

anteriormente suelen reflejar una lengua estaacutendar no incorporan expresiones que se manshytienen en la lengua colectiva durante mucho tiempo debido a diferentes niveles de uso Pondremos como ejemplo la expresiones

mdash ser maacutes agarrado que un tango y ser maacutes agarrado que un catalaacuten de uso corriente que no aparecen mientras que

mdash ser maacutes agarrado que un chotis siacute que aparece en el DRAE Otro ejemplo representativo podriacutea ser la serie de expresiones parasinoacutenimas de estar harto de algo o alguien (Ver cuadro 3) que tienen escasa repercusioacuten en los diccionarios claacutesicos que no incluyen las expresiones siguientes que figuran por deacutebashy

lo Esta expresioacuten seria un ejemplo de muy reciente aparicioacuten en ia lengua activa Soacutelo con el paso del tiempo podremos saber su eacutexito real en la lengua

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 387

jo de la liacutenea horizontal (estar hasta los huevos hasta el cono etc) que sin embargo tienen gran representatividad en la lengua activa de los joacutevenes y de los no tan joacutevenes

Estar hasta el coco de (DUE) Estar hasta los cojones de ( DUE) Estar hasta la coronilla de (DUE) Estar hasta el culo de (DUE) Estar hasta el gollete de (RAE) Estar hasta el gorro de (DUE) Estar hasta el montildeo de (DUE) Estar hasta las narices de (DUE) Estar hasta la punta de los pelos (DUE) Estar hasta los pelos de (DUE) Estar hasta por encima de la cabeza de (DUE)

Estar hasta el cono de Estar hasta el punto com de Estar hasta los huevos de Estar hasta los mismiacutesismos de Estar hasta el nabo de Estar hasta los ovarios de Estar hasta el pini de Estar hasta el pilo de

En avoir assez(AR) En avoir marre (fam AR) En avoir par dessus la tecircte (fam AR) En avoir par dessus les eacutepaules (famAR) En avoir plein les bottes (famPR) En avoir plein le cul (fam AR) En avoir plein le dos (famAR) En avoir ras-lc-bol (famAR) En avoir son bol (famAR) En avoir (son) pied (Arg AR) bn avoir soupe (famTL)

En avoir ras le baba En avoir ras la casquette En avoir ras les couilles En avoir ras le jonc En avoir ras les pacircquerettes

Cuadro ndeg 3

Convendriacutea pues que los diccionarios tratasen debidamente estas UFS ya que al no estar debidamente recogidos por los diccionarios estos desfases entre el uso de la lengua activa estaacutendar claacutesica popular etc su escasa representatividad y clasificacioacuten en los diccionashyrios dificultan el conocimiento de numerosas foacutermulas a

mdash usuarios de un idioma mdash estudiantes que desean aprender ese idioma mdash traductores que no saben realmente cual de las combinaciones es el equivalente real

de traduccioacuten Ademaacutes de estos desfases de incorporacioacuten de las unidades fraseoloacutegicas tambieacuten cabriacutea

referirse al tratamiento que se les da con la escasa informacioacuten de caraacutecter gramatical y la mala gestioacuten o presentacioacuten de esta misma en efecto se suelen ordenar las UFS alfabeacutetishycamente sin aplicar una estructuracioacuten sistemaacutetica para no mezclar los distintos grupos de unidades fraseoloacutegicas Estas obras deberiacutean cuanto menos tratarlas y dar la misma cantidad de mformacioacuten que para el resto de las unidades simples no fijadas de la lengua para permishytirle a los usuarios disponer de toda la informacioacuten morfosintaacutectica necesaria para utilizarlas correctamente Asiacute por ejemplo la gran variedad estructural de UFS no viene tratada ya que los diccionarios las incorporan de forma desordenada Por otro lado existen varias deficienshycias en la presentacioacuten de estas formas Asiacute I Santamariacutea (2003 48) aprecia

388 PrDRO MoGORROacuteN HUBRTA

mdash indecisioacuten en la forma de la expresioacuten aportando una uacutenica de las variantes graacuteficas sin que esta sea siempre la maacutes usual (a boca de jarro en lugar de abocajarro)

mdash Indecisioacuten a la hora de lematizar la expresioacuten que una veces aparece con un verbo con el que se combina frecuentemente otras aparece sin forma verbal (de estampiacutea salir de estampiacutea

mdash Inclusioacuten de las expresiones con o sin preposiciones en ajamas ayunas Recientemente se estaacuten elaborando versiones comerciales de estos diccionarios en soshy

porte informaacutetico DUE DRAE Enciclopedia Larousse Petit Robert Enciclopedia Britaacuteshynica etc Sin embargo ese cambio de soporte no ha supuesto ninguacuten cambio apreciabie en la estructura o en el contenido de estas obras pues las uacutenicas diferencias que se han podido observar han sido la rapidez de las consultas a realizar la posibilidad de navegar por los artiacuteculos asiacute como la de seleccionar y buscar estructuras con pequentildeos localizadores ya que tanto la estructuracioacuten de la informacioacuten como la de los contenidos siguen siendo praacutecticashymente similares

3 APARICIOacuteN DE LOS DICCIONARIOS ELECTROacuteNICOS

Por otro lado y tambieacuten recientemente ha hecho su aparicioacuten en el mundo de la linguumliacutesshytica otro tipo de diccionarios cuya elaboracioacuten estaacute relacionada con posibles aplicaciones al tratamiento automaacutetico de textos en el campo de la linguumliacutestica aplicada Se trata de los diccionarios electroacutenicos Al contrario de lo que habiacutea ocurrido con la elaboracioacuten y el conshytenido parcial de los diccionarios generales claacutesicos ya desde sus inicios la concepcioacuten de este nuevo tipo de diccionarios se estaacute realizando asumiendo como objetivo a alcanzar el de la maacutexima exhaustividad posible En efecto un diccionario electroacutenico no es una sencilla lista alfabeacutetica muy completa de palabras simples o compuestas que se podraacute posteriormente aplicar al anaacutelisis automaacutetico de textos No Un diccionario electroacutenico es mucho maacutes que eso Se trata de una base de datos que contiene una enorme cantidad de datos recogidos por los lexicoacutegrafos que deberaacute ser gestionada por la informaacutetica en funcioacuten de las necesidades que se hallan programado y que se deseen alcanzar

Para poder entender las posibilidades de los diccionarios electroacutenicos hay que saber que se basan en torno a dos piedras angulares Por un lado tendremos una base linguumliacutestica y por otro lado la parte informaacutetica que se va a encargar de gestionar lo maacutes eficazmente posible toda la cantidad de informacioacuten linguumliacutestica recogida por los especialistas en lengua Eacutesta poshydraacute ser por lo tanto morfoloacutegica sintaacutectica foneacutetica semaacutentica etc Sin embargo la parte informaacutetica solamente podraacute analizar la informacioacuten que la base de datos linguumliacutestica haya recopilado y estructurado y realizar procesos selectivos de buacutesqueda sobre eacutesta Es decir que el mejor programa informaacutetico no podraacute hacer maravillas por mucho que se quiera a la hora de gestionar la informacioacuten para buscar resultados y posibles aplicaciones Son pues dos procesos que deben ir a la par El linguumlista debe saber lo que necesita el informaacutetico y el informaacutetico a su vez lo que desea conseguir el linguumlista Una vez esteacuten definidos entre los dos los objetivos a alcanzar se deben crear una serie de ficheros informaacuteticos que conshytendraacuten toda la informacioacuten en forma de entradas leacutexicas (simples o complejas) en forma de coacutedigos morfoloacutegicos identificablcs por los programas

LOS DICCIONARIOS ELECTROacuteNICOS KHASKOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 389

31 Diccionarios electroacutenicos desarrollados para sistemas de TAL (Tratamiento Autoshymaacutetico del Lenguaje)

Las aplicaciones contempladas por los diccionarios electroacutenicos son muy numerosas pero van a depender en gran parte de la informacioacuten y del tratamiento que se le haya dado a eacutesta En efecto la utilizacioacuten de la informacioacuten en tratamiento automaacutetico de textos exige que las palabras pertenecientes a los textos que se han introducido esteacuten etiquetadas de mashynera que el diccionario pueda catalogarlas A partir de teacutecnicas basadas en el procesamiento del lenguaje natural se han desarrollado sistemas para la lematizacioacuten es decir para el etishyquetado automaacutetico morfoloacutegico y sintaacutectico de los textos de un corpus que consisten en la lectura y en la divisioacuten del texto en unidades relevantes que seraacuten maacutes tarde utilizadas para trabajar el anaacutelisis de la palabra Las caracteriacutesticas que normalmente se indican durante este etiquetado hacen referencia a

mdash Aspectos de estructuras de texto marcas tipograacuteficas divisiones textuales paacuterrafos citas tiacutetulos

mdash las propiedades morfosintaacutecticas de la palabra y puede ir desde los datos necesarios a la conjugacioacuten de un verbo hasta todos los datos necesarios para poder realizar un anaacutelisis textual

mdash Caracterizacioacuten de las unidades leacutexicas leacutexico en general extranjerismos nombres propiacuteos siglas abreviaciones

mdash Funciones sintaacutecticas de cada constituyente y representacioacuten por medio de aacuterboles sintaacutecticos Etc

De esta forma dependiendo de la aplicacioacuten planteada se podraacute por ejemplo realizar una comprobacioacuten ortograacutefica un anaacutelisis sintaacutectico de una frase o de un texto la buacutesqueda de un corpus para poder contrastar y verificar los elementos analizados asiacute como la frecuencia de aparicioacuten de eacutestos mismos proporcionando datos acerca de la frecuencia de aparicioacuten de las palabras en teacuterminos cuantitativos y del tipo de textos en que aparece Finamente se podraacuten como veremos posteriormente aplicar toda la informacioacuten a procesos de aprendizaje y traduccioacuten automaacuteticos11

32 Diccionarios electroacutenicos concebidos para realizar una descripcioacuten gramatical completa del leacutexico y de la sintaxis

Se han elaborado numerosos prototipos de analizadores textuales pero sin embargo ninguno de ellos incorpora un tratamiento completo del leacutexico y de la gramaacutetica Desde prinshycipios del siglo XX los linguumlistas pareciacutean haber renunciado a constituir inventarios pues por ejemplo los estudios transformacionalistas se basaban en pequentildeos grupos de ejemplos estos uacuteltimos sin embargo seraacuten fundamentales para Maurice Gross (197520)

Leacutetude systeacutematique des proprieacuteteacutes syntaxiques simpose aujourdhui pour des raisons diverses Lexistence de theacuteories transformatiomielles fait quune eacutetude systeacutematique peut ecirctre deacutelimiteacutee avec beaucoup plus de preacutecisions quagrave linteacuterieur des cadres traditionnels Dautre part la situation preacutesente de la syntaxe transformationnelle est particuliegravere Apregraves

11 Los dos sistemas de TAL maacutes representativos son SYSTRAN y SADAW

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 3: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS lLRSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 8 3

hablarla y comprenderla es preciso conocer sus reglas gramaticales asiacute como gran parte del leacutexico que la compone Ademaacutes Mogorroacuten (200215)

El conocimiento de una lengua se mide generalmente por el dominio y la soltura con los que un hablante utiliza las unidades fraseoloacutegicas propias y caracteriacutesticas de esa lengua En los usuarios nativos estas expresiones representan un saber linguumliacutestico cultural y social comuacuten depositado por la viacutea de la experiencia En los usuarios no nativos que aprenden un segundo idioma las unidades fraseoloacutegicas suponen en general un reto pues representan la mayor dificultad con la que se van a encontrar debido a la gran cantidad de informacioacuten linguumliacutestica social y cultural que han de aprender a utilizar y a diferenciar de las caracteshyriacutesticas propias de su idioma materno

Estas unidades fraseoloacutegicas que podremos en lo sucesivo abreviar bajo la forma UFS se utilizan con un objetivo discursivo muy claro Representan el deseo del locutor de utilizar en el acto de comunicacioacuten una determinada foacutermula refrendada por la mayor parte de la comunidad linguumliacutestica sumaacutendole de esa forma un matiz cultural social generacional etc en vez de utilizar un teacutermino neutro o una periacutefrasis verbal

Aunque ya a principios del siglo XX algunos autores2 habiacutean iniciado una tiacutemida aproxishymacioacuten al fenoacutemeno de la fijacioacuten en la lengua y en el discurso en la segunda mitad del siglo la linguumliacutestica ha descubierto en las fijaciones y en las unidades fraseoloacutegicas3 un mashyterial no solamente de estudio sino tambieacuten de enorme intereacutes y trascendental importancia en la lengua y en el desarrollo adquisicioacuten y utilizacioacuten de la competencia comunicativa de los hablantes4

21 Tratamiento de las unidades fraseoloacutegicas en los diccionarios generales

Si bien es verdad que en un diccionario de corte general (ya sea monolingue o bilinguumle) se deberiacutea poder encontrar cualquier vocablo cualquier unidad leacutexica simple o compleja de significado composicional o fijado que se buscara en eacutel tambieacuten de sobra es sabido que numerosas razones teoacutericas y teacutecnicas motivos de adecuacioacuten de espacio fiacutesico amplitud de la tarea a realizar5 han limitado esa posibilidad

2 C Bally (1905) Osear Jespersenn (1926) 3 Queremos aclarar que no es nuestra intencioacuten aquiacute presentar un estado de la cuestioacuten acerca de los estudios fraseoloacutegicos y o de stis posibles clasificaciones Ver para ello Blanco (1999) Corpas (1996b 2003) Martins (1996) Mogorroacuten (2002) Ruiz Gurillo (1997) 4 Basta para ello ver la enorme cantidad de grupos de investigacioacuten que han trabajado siguen trabajando o estaacuten iniciando sus investigaciones entorno a los fenoacutemenos de fijacioacuten linguumliacutestica en numerosas lenguas con lo que eso supone en cuanto a proyectos produccioacuten bibliograacutefica congresos en los que se habla de ello o en los que uacutenishycamente se tratan estos fenoacutemenos Para tener tina pequentildea idea acerca de la importancia de estos fenoacutemenos basta consultar laquodiez antildeos de investigacioacuten en fraseologiacutearaquo de G Corpas (2003) Ademaacutes de los grupos mencionados en este libro se podriacutean antildeadir muchiacutesimos maacutes aunque solamente vamos a resentildear por considerarlos relevantes y con el riesgo de dejar algunos sin sentildealar al Laboratoire de Linguistique informatique (LLI) dirigido por G Gross en Paris 13 al Laboratoire dAutomatique Documentaire et Linguistique (LADL) creado por el recientemente fallecido M Gross al prolifico grupo de investigacioacuten de la Universidad de Tuacutenez dirigido por el profesor Salah Mejri y que estaacute desarrollando el atlas linguumliacutestico de Tuacutenez al grupo de Lexicologiacutea del departamento de Filologiacutea romaacutenica de la AUB dirigido por Xavier Blanco

5 No conviene olvidar que este tipo de obras es marcadamente editorialista y que por lo tanto se debe a un factor de rentabilidad no linguumliacutestica sino econoacutemica con todo lo que esta observacioacuten presupone

384 PEDRO MOGORROacuteN HUERTA

Por lo tanto queremos dejar patente que aunque el conjunto de unidades fraseoloacutegicas o fijaciones seleccionados y presentes tanto en los diccionarios monolingues como bilinshyguumles constituye una parte importante del sistema leacutexico sin embargo esa presencia se ha plasmado generalmente en la incorporacioacuten de laquocierto nuacutemero de unidadesraquo a menudo muy reducido siguiendo un proceso de seleccioacuten y descripcioacuten uacutenicamente alfabeacutetico fiuto de la propia intuicioacuten y competencia linguumliacutestica del o de los lexicoacutegrafos encargados de la elaboshyracioacuten de la obra y ademaacutes sin ninguacuten criterio de clasificacioacuten exhaustivo Esas limitaciones han acotado el uso de la lengua analizada y utilizada en los diccionarios reduciendo eacutesta a una lengua llamada estaacutendar que recoge las unidades leacutexicas y fraseoloacutegicas maacutes frecuentes y compartidas por la mayor parte de los usuarios Este proceso y criterios de seleccioacuten han dejado de lado numerosas otras expresiones que poseen dentro del macromodelo diasis-temaacutetico6 una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc Ej

Modelo de mareaje diasistemaacutetico

diastraacutetico

diatoacutepico

diacrogravenico

diaintegrativo

dianonnativo

diaconnotativo

diamediaacutetico

diafaacutesico

diatextual

diateacutecnico

diafrecuencia

estaacutendar culto familiar popular coloquial vulgar argoacutetico

americanismos dialectologiacutea regionalismo

arcaico neologismo

latiacuten argot

correcto incorrecto

infantil peyorativo apreciativo

oral escrito

formal informal

periodiacutestico administrativo literario

lenguaje de especialidad

raro frecuente

Cuadro 1

Existe pues frecuentemente un desfase considerable entre el continuo e imparable proshyceso de remodelacioacuten de los actos de comunicacioacuten constantemente obligados a readaptarse y el material que los lexicoacutegrafos insertan en los diccionarios En efecto por un lado estaacuten las UFS de la lengua claacutesica a menudo ya en desuso por pertenecer a un uso no ya de otras generaciones sino tambieacuten a una concepcioacuten diacrogravenica y que por lo tanto ya no son representativas de los usos y estados linguumliacutesticos que se van sucediendo Por otro lado se halla el uso presente marcadamente innovador de la lengua que se debe ir transformando y adaptando a los constantes cambios que se producen en la lengua por los usos generacioshynales y las diferentes necesidades y realidades sociales que se plasma en nuevos vocablos y expresiones Este desfase que es una de las deficiencias que nos proponemos paliar con los diccionarios electroacutenicos es muy patente en los diccionarios claacutesicos

6 Una de las descripciones del modelo diasistemaacutetico mas completa ha sido realizada por FJ Haussman ver para ello Blanco (2001 5253)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 385

En efecto numerosas UFS que aparecen en los diccionarios son las huellas de eacutepocas pashysadas ya no son representativas del estado vigente de la lengua activa pues pertenecen a un uso generacional caduco a menudo diacrogravenico a una concepcioacuten social y laboral diferente7 Esa falta de adecuacioacuten conceptual o composicional supone que el hablante utiliza unidades fraseoloacutegicas que le suponen los siguientes problemas de comprensioacuten e interpretacioacuten

mdash Se usan expresiones con palabras que solamente se utilizan ya en la lengua en esas expresiones Ej bull Salir de naja bull Prendre la poudre descampette

mdash Se usan expresiones que pertenecen a otras realidades vocabulario del campo refrashynes meteoroloacutegicos mundo laboral ya caduco como es el caso con todo lo referido al campo del caballo y que ya no son sentidas como propias por los usuarios de la lengua al no saber a que se refieren exactamente al no conocer el posible hecho histoacuterico en el que se basan Ej bull Cumplir con la parroquia8 (DUE)= Comulgar por Pascua bull Costar un Potosiacute (DUE) = Costar algo mucho dinero referencia a la colonizashy

cioacuten espantildeola de Hispanoameacuterica bull Colgarle a alguien el un Sambenito San-Benito (DUE) = Acusar injustamente

a alguien bull De casta le viene al galgo el ser rabilargo (DUE) = La cualidad de una persona

le viene de familia bull Poner a alguien a los pies de los caballos (DUE) = desairar humillar maltrashy

tar bull Pasar maacutes hambre que un maestro de escuela9

Este fenoacutemeno se puede apreciar auacuten con mayor claridad en los grupos de expresiones parasinoacutenimas (Ver Cuadro 2 y 3) En el primer cuadro

7 Seguacuten Rey-Debove (1971 98) laquoEn Synchronie pure cest agrave dire dans linstant des contemporains de tous les acircges compris entre 15 et 75 ans ont des eacutechanges reacuteels Mais une personne de 75 ans garde les habitudes de langage de sa jeunesse correspondant agrave un autre systegraveme lexical et qui persiste gracircce agrave la meacutemoire et aux eacutechanges avec les personnes du mecircme acircge Une grande partie du vocabulaire actif de ses 15 ans (communication avec les personnes acircgeacutees) lui ne fonctionne plus dans aucun eacutechange faute dinterlocuteurs Cest de cette maniegravere que la langue perd dun cocircteacute ce quelle acquiert de lautreraquo 8 Las siglas de las obras referenciadas corresponden a 1 Diccionario de la Real Academia Espantildeola de la lengua para RAE al diccionario de uso del espantildeol para DUE Gran diccionario Larousse Espantildeol-Franceacutes Franceacutes-espashyntildeol para LBI Dictionnaire des Expressions et Locutions de Alain Rey para AR Thesaurus Larousse para TL PR para Petit Robert Tambieacuten hay que sentildealar que las locuciones verbales que figuran por debajo de la liacutenea horizontal y que no tienen referencia no han sido encontradas en diccionarios pero sin embargo son bastante frecuentes en la lengua activa espantildeola o francesa 9 No viene referenciada esta locucioacuten muy conocida y muy usada en los diccionarios que hemos consultado (DUE DRAE En Larousse)

386 PEDRO MOGORROacuteN HUERTA

Estar en Babia (DUE) Estar en las Batuecas (DUE) Estar en Beleacuten (DUE) Estar en la higuera (DUE) Estar en el limbo (DUE) Estar en la luna (DUE) Estar en las nubes (DUE) Mirar a las musarantildeas (DUE) Mirar las telarantildeas (LBI)

Estar en la parra

Bayer aux corneilles(AR) Etre dans les limbes (AR) Ecirctre dans la lune (AR) Ecirctre dans les nuages (AR) Navoir pas les pieds sur terre (TL)

Cuadro nn 2

se pueden observar varias expresiones que significan praacutecticamente lo mismo si nos ateshynemos a las definiciones que de ellas dan los diccionarios (DUE DRAE) estar distraiacutedo no enterarse de algo Sin embargo estas locuciones no son utilizadas indistintamente por las distintas generaciones de usuarios que componen la populacioacuten total activa que utiliza una determinada lengua Asiacute sorprendentemente seguacuten una encuesta que hemos realizado entre nuestros alumnos en la U de Alicante las expresiones estar en Babia en las Batueshycas incluso estar en Beleacuten asiacute como Mirar a las musarantildeas o a las telerantildeas ya no son comprendidas por la mayoriacutea de los joacutevenes estudiantes de 20 antildeos

Por otro lado existe justamente el fenoacutemeno inverso Es decir que la lengua activa de una determinada fase linguumliacutestica crea otra unidades que no aparecen en los diccionarios que suelen tardar bastante tiempo en incorporar las nuevas creaciones o adaptaciones de la lengua Eacutestos las excluyen debido a su inestabilidad o a su caducidad en la lengua pues numerosas UFS aparecen son utilizadas cierto tiempo Ej

mdash estar de ir de guateque y posteriormente son reemplazadas por otras maacutes modernas

mdash estar de ir de guerra hacer la ruta (del bacalao) mdash estar hasta el punto com10 Tambieacuten es verdad que en otras ocasiones los diccionarios que como hemos sentildealado

anteriormente suelen reflejar una lengua estaacutendar no incorporan expresiones que se manshytienen en la lengua colectiva durante mucho tiempo debido a diferentes niveles de uso Pondremos como ejemplo la expresiones

mdash ser maacutes agarrado que un tango y ser maacutes agarrado que un catalaacuten de uso corriente que no aparecen mientras que

mdash ser maacutes agarrado que un chotis siacute que aparece en el DRAE Otro ejemplo representativo podriacutea ser la serie de expresiones parasinoacutenimas de estar harto de algo o alguien (Ver cuadro 3) que tienen escasa repercusioacuten en los diccionarios claacutesicos que no incluyen las expresiones siguientes que figuran por deacutebashy

lo Esta expresioacuten seria un ejemplo de muy reciente aparicioacuten en ia lengua activa Soacutelo con el paso del tiempo podremos saber su eacutexito real en la lengua

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 387

jo de la liacutenea horizontal (estar hasta los huevos hasta el cono etc) que sin embargo tienen gran representatividad en la lengua activa de los joacutevenes y de los no tan joacutevenes

Estar hasta el coco de (DUE) Estar hasta los cojones de ( DUE) Estar hasta la coronilla de (DUE) Estar hasta el culo de (DUE) Estar hasta el gollete de (RAE) Estar hasta el gorro de (DUE) Estar hasta el montildeo de (DUE) Estar hasta las narices de (DUE) Estar hasta la punta de los pelos (DUE) Estar hasta los pelos de (DUE) Estar hasta por encima de la cabeza de (DUE)

Estar hasta el cono de Estar hasta el punto com de Estar hasta los huevos de Estar hasta los mismiacutesismos de Estar hasta el nabo de Estar hasta los ovarios de Estar hasta el pini de Estar hasta el pilo de

En avoir assez(AR) En avoir marre (fam AR) En avoir par dessus la tecircte (fam AR) En avoir par dessus les eacutepaules (famAR) En avoir plein les bottes (famPR) En avoir plein le cul (fam AR) En avoir plein le dos (famAR) En avoir ras-lc-bol (famAR) En avoir son bol (famAR) En avoir (son) pied (Arg AR) bn avoir soupe (famTL)

En avoir ras le baba En avoir ras la casquette En avoir ras les couilles En avoir ras le jonc En avoir ras les pacircquerettes

Cuadro ndeg 3

Convendriacutea pues que los diccionarios tratasen debidamente estas UFS ya que al no estar debidamente recogidos por los diccionarios estos desfases entre el uso de la lengua activa estaacutendar claacutesica popular etc su escasa representatividad y clasificacioacuten en los diccionashyrios dificultan el conocimiento de numerosas foacutermulas a

mdash usuarios de un idioma mdash estudiantes que desean aprender ese idioma mdash traductores que no saben realmente cual de las combinaciones es el equivalente real

de traduccioacuten Ademaacutes de estos desfases de incorporacioacuten de las unidades fraseoloacutegicas tambieacuten cabriacutea

referirse al tratamiento que se les da con la escasa informacioacuten de caraacutecter gramatical y la mala gestioacuten o presentacioacuten de esta misma en efecto se suelen ordenar las UFS alfabeacutetishycamente sin aplicar una estructuracioacuten sistemaacutetica para no mezclar los distintos grupos de unidades fraseoloacutegicas Estas obras deberiacutean cuanto menos tratarlas y dar la misma cantidad de mformacioacuten que para el resto de las unidades simples no fijadas de la lengua para permishytirle a los usuarios disponer de toda la informacioacuten morfosintaacutectica necesaria para utilizarlas correctamente Asiacute por ejemplo la gran variedad estructural de UFS no viene tratada ya que los diccionarios las incorporan de forma desordenada Por otro lado existen varias deficienshycias en la presentacioacuten de estas formas Asiacute I Santamariacutea (2003 48) aprecia

388 PrDRO MoGORROacuteN HUBRTA

mdash indecisioacuten en la forma de la expresioacuten aportando una uacutenica de las variantes graacuteficas sin que esta sea siempre la maacutes usual (a boca de jarro en lugar de abocajarro)

mdash Indecisioacuten a la hora de lematizar la expresioacuten que una veces aparece con un verbo con el que se combina frecuentemente otras aparece sin forma verbal (de estampiacutea salir de estampiacutea

mdash Inclusioacuten de las expresiones con o sin preposiciones en ajamas ayunas Recientemente se estaacuten elaborando versiones comerciales de estos diccionarios en soshy

porte informaacutetico DUE DRAE Enciclopedia Larousse Petit Robert Enciclopedia Britaacuteshynica etc Sin embargo ese cambio de soporte no ha supuesto ninguacuten cambio apreciabie en la estructura o en el contenido de estas obras pues las uacutenicas diferencias que se han podido observar han sido la rapidez de las consultas a realizar la posibilidad de navegar por los artiacuteculos asiacute como la de seleccionar y buscar estructuras con pequentildeos localizadores ya que tanto la estructuracioacuten de la informacioacuten como la de los contenidos siguen siendo praacutecticashymente similares

3 APARICIOacuteN DE LOS DICCIONARIOS ELECTROacuteNICOS

Por otro lado y tambieacuten recientemente ha hecho su aparicioacuten en el mundo de la linguumliacutesshytica otro tipo de diccionarios cuya elaboracioacuten estaacute relacionada con posibles aplicaciones al tratamiento automaacutetico de textos en el campo de la linguumliacutestica aplicada Se trata de los diccionarios electroacutenicos Al contrario de lo que habiacutea ocurrido con la elaboracioacuten y el conshytenido parcial de los diccionarios generales claacutesicos ya desde sus inicios la concepcioacuten de este nuevo tipo de diccionarios se estaacute realizando asumiendo como objetivo a alcanzar el de la maacutexima exhaustividad posible En efecto un diccionario electroacutenico no es una sencilla lista alfabeacutetica muy completa de palabras simples o compuestas que se podraacute posteriormente aplicar al anaacutelisis automaacutetico de textos No Un diccionario electroacutenico es mucho maacutes que eso Se trata de una base de datos que contiene una enorme cantidad de datos recogidos por los lexicoacutegrafos que deberaacute ser gestionada por la informaacutetica en funcioacuten de las necesidades que se hallan programado y que se deseen alcanzar

Para poder entender las posibilidades de los diccionarios electroacutenicos hay que saber que se basan en torno a dos piedras angulares Por un lado tendremos una base linguumliacutestica y por otro lado la parte informaacutetica que se va a encargar de gestionar lo maacutes eficazmente posible toda la cantidad de informacioacuten linguumliacutestica recogida por los especialistas en lengua Eacutesta poshydraacute ser por lo tanto morfoloacutegica sintaacutectica foneacutetica semaacutentica etc Sin embargo la parte informaacutetica solamente podraacute analizar la informacioacuten que la base de datos linguumliacutestica haya recopilado y estructurado y realizar procesos selectivos de buacutesqueda sobre eacutesta Es decir que el mejor programa informaacutetico no podraacute hacer maravillas por mucho que se quiera a la hora de gestionar la informacioacuten para buscar resultados y posibles aplicaciones Son pues dos procesos que deben ir a la par El linguumlista debe saber lo que necesita el informaacutetico y el informaacutetico a su vez lo que desea conseguir el linguumlista Una vez esteacuten definidos entre los dos los objetivos a alcanzar se deben crear una serie de ficheros informaacuteticos que conshytendraacuten toda la informacioacuten en forma de entradas leacutexicas (simples o complejas) en forma de coacutedigos morfoloacutegicos identificablcs por los programas

LOS DICCIONARIOS ELECTROacuteNICOS KHASKOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 389

31 Diccionarios electroacutenicos desarrollados para sistemas de TAL (Tratamiento Autoshymaacutetico del Lenguaje)

Las aplicaciones contempladas por los diccionarios electroacutenicos son muy numerosas pero van a depender en gran parte de la informacioacuten y del tratamiento que se le haya dado a eacutesta En efecto la utilizacioacuten de la informacioacuten en tratamiento automaacutetico de textos exige que las palabras pertenecientes a los textos que se han introducido esteacuten etiquetadas de mashynera que el diccionario pueda catalogarlas A partir de teacutecnicas basadas en el procesamiento del lenguaje natural se han desarrollado sistemas para la lematizacioacuten es decir para el etishyquetado automaacutetico morfoloacutegico y sintaacutectico de los textos de un corpus que consisten en la lectura y en la divisioacuten del texto en unidades relevantes que seraacuten maacutes tarde utilizadas para trabajar el anaacutelisis de la palabra Las caracteriacutesticas que normalmente se indican durante este etiquetado hacen referencia a

mdash Aspectos de estructuras de texto marcas tipograacuteficas divisiones textuales paacuterrafos citas tiacutetulos

mdash las propiedades morfosintaacutecticas de la palabra y puede ir desde los datos necesarios a la conjugacioacuten de un verbo hasta todos los datos necesarios para poder realizar un anaacutelisis textual

mdash Caracterizacioacuten de las unidades leacutexicas leacutexico en general extranjerismos nombres propiacuteos siglas abreviaciones

mdash Funciones sintaacutecticas de cada constituyente y representacioacuten por medio de aacuterboles sintaacutecticos Etc

De esta forma dependiendo de la aplicacioacuten planteada se podraacute por ejemplo realizar una comprobacioacuten ortograacutefica un anaacutelisis sintaacutectico de una frase o de un texto la buacutesqueda de un corpus para poder contrastar y verificar los elementos analizados asiacute como la frecuencia de aparicioacuten de eacutestos mismos proporcionando datos acerca de la frecuencia de aparicioacuten de las palabras en teacuterminos cuantitativos y del tipo de textos en que aparece Finamente se podraacuten como veremos posteriormente aplicar toda la informacioacuten a procesos de aprendizaje y traduccioacuten automaacuteticos11

32 Diccionarios electroacutenicos concebidos para realizar una descripcioacuten gramatical completa del leacutexico y de la sintaxis

Se han elaborado numerosos prototipos de analizadores textuales pero sin embargo ninguno de ellos incorpora un tratamiento completo del leacutexico y de la gramaacutetica Desde prinshycipios del siglo XX los linguumlistas pareciacutean haber renunciado a constituir inventarios pues por ejemplo los estudios transformacionalistas se basaban en pequentildeos grupos de ejemplos estos uacuteltimos sin embargo seraacuten fundamentales para Maurice Gross (197520)

Leacutetude systeacutematique des proprieacuteteacutes syntaxiques simpose aujourdhui pour des raisons diverses Lexistence de theacuteories transformatiomielles fait quune eacutetude systeacutematique peut ecirctre deacutelimiteacutee avec beaucoup plus de preacutecisions quagrave linteacuterieur des cadres traditionnels Dautre part la situation preacutesente de la syntaxe transformationnelle est particuliegravere Apregraves

11 Los dos sistemas de TAL maacutes representativos son SYSTRAN y SADAW

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 4: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

384 PEDRO MOGORROacuteN HUERTA

Por lo tanto queremos dejar patente que aunque el conjunto de unidades fraseoloacutegicas o fijaciones seleccionados y presentes tanto en los diccionarios monolingues como bilinshyguumles constituye una parte importante del sistema leacutexico sin embargo esa presencia se ha plasmado generalmente en la incorporacioacuten de laquocierto nuacutemero de unidadesraquo a menudo muy reducido siguiendo un proceso de seleccioacuten y descripcioacuten uacutenicamente alfabeacutetico fiuto de la propia intuicioacuten y competencia linguumliacutestica del o de los lexicoacutegrafos encargados de la elaboshyracioacuten de la obra y ademaacutes sin ninguacuten criterio de clasificacioacuten exhaustivo Esas limitaciones han acotado el uso de la lengua analizada y utilizada en los diccionarios reduciendo eacutesta a una lengua llamada estaacutendar que recoge las unidades leacutexicas y fraseoloacutegicas maacutes frecuentes y compartidas por la mayor parte de los usuarios Este proceso y criterios de seleccioacuten han dejado de lado numerosas otras expresiones que poseen dentro del macromodelo diasis-temaacutetico6 una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc Ej

Modelo de mareaje diasistemaacutetico

diastraacutetico

diatoacutepico

diacrogravenico

diaintegrativo

dianonnativo

diaconnotativo

diamediaacutetico

diafaacutesico

diatextual

diateacutecnico

diafrecuencia

estaacutendar culto familiar popular coloquial vulgar argoacutetico

americanismos dialectologiacutea regionalismo

arcaico neologismo

latiacuten argot

correcto incorrecto

infantil peyorativo apreciativo

oral escrito

formal informal

periodiacutestico administrativo literario

lenguaje de especialidad

raro frecuente

Cuadro 1

Existe pues frecuentemente un desfase considerable entre el continuo e imparable proshyceso de remodelacioacuten de los actos de comunicacioacuten constantemente obligados a readaptarse y el material que los lexicoacutegrafos insertan en los diccionarios En efecto por un lado estaacuten las UFS de la lengua claacutesica a menudo ya en desuso por pertenecer a un uso no ya de otras generaciones sino tambieacuten a una concepcioacuten diacrogravenica y que por lo tanto ya no son representativas de los usos y estados linguumliacutesticos que se van sucediendo Por otro lado se halla el uso presente marcadamente innovador de la lengua que se debe ir transformando y adaptando a los constantes cambios que se producen en la lengua por los usos generacioshynales y las diferentes necesidades y realidades sociales que se plasma en nuevos vocablos y expresiones Este desfase que es una de las deficiencias que nos proponemos paliar con los diccionarios electroacutenicos es muy patente en los diccionarios claacutesicos

6 Una de las descripciones del modelo diasistemaacutetico mas completa ha sido realizada por FJ Haussman ver para ello Blanco (2001 5253)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 385

En efecto numerosas UFS que aparecen en los diccionarios son las huellas de eacutepocas pashysadas ya no son representativas del estado vigente de la lengua activa pues pertenecen a un uso generacional caduco a menudo diacrogravenico a una concepcioacuten social y laboral diferente7 Esa falta de adecuacioacuten conceptual o composicional supone que el hablante utiliza unidades fraseoloacutegicas que le suponen los siguientes problemas de comprensioacuten e interpretacioacuten

mdash Se usan expresiones con palabras que solamente se utilizan ya en la lengua en esas expresiones Ej bull Salir de naja bull Prendre la poudre descampette

mdash Se usan expresiones que pertenecen a otras realidades vocabulario del campo refrashynes meteoroloacutegicos mundo laboral ya caduco como es el caso con todo lo referido al campo del caballo y que ya no son sentidas como propias por los usuarios de la lengua al no saber a que se refieren exactamente al no conocer el posible hecho histoacuterico en el que se basan Ej bull Cumplir con la parroquia8 (DUE)= Comulgar por Pascua bull Costar un Potosiacute (DUE) = Costar algo mucho dinero referencia a la colonizashy

cioacuten espantildeola de Hispanoameacuterica bull Colgarle a alguien el un Sambenito San-Benito (DUE) = Acusar injustamente

a alguien bull De casta le viene al galgo el ser rabilargo (DUE) = La cualidad de una persona

le viene de familia bull Poner a alguien a los pies de los caballos (DUE) = desairar humillar maltrashy

tar bull Pasar maacutes hambre que un maestro de escuela9

Este fenoacutemeno se puede apreciar auacuten con mayor claridad en los grupos de expresiones parasinoacutenimas (Ver Cuadro 2 y 3) En el primer cuadro

7 Seguacuten Rey-Debove (1971 98) laquoEn Synchronie pure cest agrave dire dans linstant des contemporains de tous les acircges compris entre 15 et 75 ans ont des eacutechanges reacuteels Mais une personne de 75 ans garde les habitudes de langage de sa jeunesse correspondant agrave un autre systegraveme lexical et qui persiste gracircce agrave la meacutemoire et aux eacutechanges avec les personnes du mecircme acircge Une grande partie du vocabulaire actif de ses 15 ans (communication avec les personnes acircgeacutees) lui ne fonctionne plus dans aucun eacutechange faute dinterlocuteurs Cest de cette maniegravere que la langue perd dun cocircteacute ce quelle acquiert de lautreraquo 8 Las siglas de las obras referenciadas corresponden a 1 Diccionario de la Real Academia Espantildeola de la lengua para RAE al diccionario de uso del espantildeol para DUE Gran diccionario Larousse Espantildeol-Franceacutes Franceacutes-espashyntildeol para LBI Dictionnaire des Expressions et Locutions de Alain Rey para AR Thesaurus Larousse para TL PR para Petit Robert Tambieacuten hay que sentildealar que las locuciones verbales que figuran por debajo de la liacutenea horizontal y que no tienen referencia no han sido encontradas en diccionarios pero sin embargo son bastante frecuentes en la lengua activa espantildeola o francesa 9 No viene referenciada esta locucioacuten muy conocida y muy usada en los diccionarios que hemos consultado (DUE DRAE En Larousse)

386 PEDRO MOGORROacuteN HUERTA

Estar en Babia (DUE) Estar en las Batuecas (DUE) Estar en Beleacuten (DUE) Estar en la higuera (DUE) Estar en el limbo (DUE) Estar en la luna (DUE) Estar en las nubes (DUE) Mirar a las musarantildeas (DUE) Mirar las telarantildeas (LBI)

Estar en la parra

Bayer aux corneilles(AR) Etre dans les limbes (AR) Ecirctre dans la lune (AR) Ecirctre dans les nuages (AR) Navoir pas les pieds sur terre (TL)

Cuadro nn 2

se pueden observar varias expresiones que significan praacutecticamente lo mismo si nos ateshynemos a las definiciones que de ellas dan los diccionarios (DUE DRAE) estar distraiacutedo no enterarse de algo Sin embargo estas locuciones no son utilizadas indistintamente por las distintas generaciones de usuarios que componen la populacioacuten total activa que utiliza una determinada lengua Asiacute sorprendentemente seguacuten una encuesta que hemos realizado entre nuestros alumnos en la U de Alicante las expresiones estar en Babia en las Batueshycas incluso estar en Beleacuten asiacute como Mirar a las musarantildeas o a las telerantildeas ya no son comprendidas por la mayoriacutea de los joacutevenes estudiantes de 20 antildeos

Por otro lado existe justamente el fenoacutemeno inverso Es decir que la lengua activa de una determinada fase linguumliacutestica crea otra unidades que no aparecen en los diccionarios que suelen tardar bastante tiempo en incorporar las nuevas creaciones o adaptaciones de la lengua Eacutestos las excluyen debido a su inestabilidad o a su caducidad en la lengua pues numerosas UFS aparecen son utilizadas cierto tiempo Ej

mdash estar de ir de guateque y posteriormente son reemplazadas por otras maacutes modernas

mdash estar de ir de guerra hacer la ruta (del bacalao) mdash estar hasta el punto com10 Tambieacuten es verdad que en otras ocasiones los diccionarios que como hemos sentildealado

anteriormente suelen reflejar una lengua estaacutendar no incorporan expresiones que se manshytienen en la lengua colectiva durante mucho tiempo debido a diferentes niveles de uso Pondremos como ejemplo la expresiones

mdash ser maacutes agarrado que un tango y ser maacutes agarrado que un catalaacuten de uso corriente que no aparecen mientras que

mdash ser maacutes agarrado que un chotis siacute que aparece en el DRAE Otro ejemplo representativo podriacutea ser la serie de expresiones parasinoacutenimas de estar harto de algo o alguien (Ver cuadro 3) que tienen escasa repercusioacuten en los diccionarios claacutesicos que no incluyen las expresiones siguientes que figuran por deacutebashy

lo Esta expresioacuten seria un ejemplo de muy reciente aparicioacuten en ia lengua activa Soacutelo con el paso del tiempo podremos saber su eacutexito real en la lengua

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 387

jo de la liacutenea horizontal (estar hasta los huevos hasta el cono etc) que sin embargo tienen gran representatividad en la lengua activa de los joacutevenes y de los no tan joacutevenes

Estar hasta el coco de (DUE) Estar hasta los cojones de ( DUE) Estar hasta la coronilla de (DUE) Estar hasta el culo de (DUE) Estar hasta el gollete de (RAE) Estar hasta el gorro de (DUE) Estar hasta el montildeo de (DUE) Estar hasta las narices de (DUE) Estar hasta la punta de los pelos (DUE) Estar hasta los pelos de (DUE) Estar hasta por encima de la cabeza de (DUE)

Estar hasta el cono de Estar hasta el punto com de Estar hasta los huevos de Estar hasta los mismiacutesismos de Estar hasta el nabo de Estar hasta los ovarios de Estar hasta el pini de Estar hasta el pilo de

En avoir assez(AR) En avoir marre (fam AR) En avoir par dessus la tecircte (fam AR) En avoir par dessus les eacutepaules (famAR) En avoir plein les bottes (famPR) En avoir plein le cul (fam AR) En avoir plein le dos (famAR) En avoir ras-lc-bol (famAR) En avoir son bol (famAR) En avoir (son) pied (Arg AR) bn avoir soupe (famTL)

En avoir ras le baba En avoir ras la casquette En avoir ras les couilles En avoir ras le jonc En avoir ras les pacircquerettes

Cuadro ndeg 3

Convendriacutea pues que los diccionarios tratasen debidamente estas UFS ya que al no estar debidamente recogidos por los diccionarios estos desfases entre el uso de la lengua activa estaacutendar claacutesica popular etc su escasa representatividad y clasificacioacuten en los diccionashyrios dificultan el conocimiento de numerosas foacutermulas a

mdash usuarios de un idioma mdash estudiantes que desean aprender ese idioma mdash traductores que no saben realmente cual de las combinaciones es el equivalente real

de traduccioacuten Ademaacutes de estos desfases de incorporacioacuten de las unidades fraseoloacutegicas tambieacuten cabriacutea

referirse al tratamiento que se les da con la escasa informacioacuten de caraacutecter gramatical y la mala gestioacuten o presentacioacuten de esta misma en efecto se suelen ordenar las UFS alfabeacutetishycamente sin aplicar una estructuracioacuten sistemaacutetica para no mezclar los distintos grupos de unidades fraseoloacutegicas Estas obras deberiacutean cuanto menos tratarlas y dar la misma cantidad de mformacioacuten que para el resto de las unidades simples no fijadas de la lengua para permishytirle a los usuarios disponer de toda la informacioacuten morfosintaacutectica necesaria para utilizarlas correctamente Asiacute por ejemplo la gran variedad estructural de UFS no viene tratada ya que los diccionarios las incorporan de forma desordenada Por otro lado existen varias deficienshycias en la presentacioacuten de estas formas Asiacute I Santamariacutea (2003 48) aprecia

388 PrDRO MoGORROacuteN HUBRTA

mdash indecisioacuten en la forma de la expresioacuten aportando una uacutenica de las variantes graacuteficas sin que esta sea siempre la maacutes usual (a boca de jarro en lugar de abocajarro)

mdash Indecisioacuten a la hora de lematizar la expresioacuten que una veces aparece con un verbo con el que se combina frecuentemente otras aparece sin forma verbal (de estampiacutea salir de estampiacutea

mdash Inclusioacuten de las expresiones con o sin preposiciones en ajamas ayunas Recientemente se estaacuten elaborando versiones comerciales de estos diccionarios en soshy

porte informaacutetico DUE DRAE Enciclopedia Larousse Petit Robert Enciclopedia Britaacuteshynica etc Sin embargo ese cambio de soporte no ha supuesto ninguacuten cambio apreciabie en la estructura o en el contenido de estas obras pues las uacutenicas diferencias que se han podido observar han sido la rapidez de las consultas a realizar la posibilidad de navegar por los artiacuteculos asiacute como la de seleccionar y buscar estructuras con pequentildeos localizadores ya que tanto la estructuracioacuten de la informacioacuten como la de los contenidos siguen siendo praacutecticashymente similares

3 APARICIOacuteN DE LOS DICCIONARIOS ELECTROacuteNICOS

Por otro lado y tambieacuten recientemente ha hecho su aparicioacuten en el mundo de la linguumliacutesshytica otro tipo de diccionarios cuya elaboracioacuten estaacute relacionada con posibles aplicaciones al tratamiento automaacutetico de textos en el campo de la linguumliacutestica aplicada Se trata de los diccionarios electroacutenicos Al contrario de lo que habiacutea ocurrido con la elaboracioacuten y el conshytenido parcial de los diccionarios generales claacutesicos ya desde sus inicios la concepcioacuten de este nuevo tipo de diccionarios se estaacute realizando asumiendo como objetivo a alcanzar el de la maacutexima exhaustividad posible En efecto un diccionario electroacutenico no es una sencilla lista alfabeacutetica muy completa de palabras simples o compuestas que se podraacute posteriormente aplicar al anaacutelisis automaacutetico de textos No Un diccionario electroacutenico es mucho maacutes que eso Se trata de una base de datos que contiene una enorme cantidad de datos recogidos por los lexicoacutegrafos que deberaacute ser gestionada por la informaacutetica en funcioacuten de las necesidades que se hallan programado y que se deseen alcanzar

Para poder entender las posibilidades de los diccionarios electroacutenicos hay que saber que se basan en torno a dos piedras angulares Por un lado tendremos una base linguumliacutestica y por otro lado la parte informaacutetica que se va a encargar de gestionar lo maacutes eficazmente posible toda la cantidad de informacioacuten linguumliacutestica recogida por los especialistas en lengua Eacutesta poshydraacute ser por lo tanto morfoloacutegica sintaacutectica foneacutetica semaacutentica etc Sin embargo la parte informaacutetica solamente podraacute analizar la informacioacuten que la base de datos linguumliacutestica haya recopilado y estructurado y realizar procesos selectivos de buacutesqueda sobre eacutesta Es decir que el mejor programa informaacutetico no podraacute hacer maravillas por mucho que se quiera a la hora de gestionar la informacioacuten para buscar resultados y posibles aplicaciones Son pues dos procesos que deben ir a la par El linguumlista debe saber lo que necesita el informaacutetico y el informaacutetico a su vez lo que desea conseguir el linguumlista Una vez esteacuten definidos entre los dos los objetivos a alcanzar se deben crear una serie de ficheros informaacuteticos que conshytendraacuten toda la informacioacuten en forma de entradas leacutexicas (simples o complejas) en forma de coacutedigos morfoloacutegicos identificablcs por los programas

LOS DICCIONARIOS ELECTROacuteNICOS KHASKOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 389

31 Diccionarios electroacutenicos desarrollados para sistemas de TAL (Tratamiento Autoshymaacutetico del Lenguaje)

Las aplicaciones contempladas por los diccionarios electroacutenicos son muy numerosas pero van a depender en gran parte de la informacioacuten y del tratamiento que se le haya dado a eacutesta En efecto la utilizacioacuten de la informacioacuten en tratamiento automaacutetico de textos exige que las palabras pertenecientes a los textos que se han introducido esteacuten etiquetadas de mashynera que el diccionario pueda catalogarlas A partir de teacutecnicas basadas en el procesamiento del lenguaje natural se han desarrollado sistemas para la lematizacioacuten es decir para el etishyquetado automaacutetico morfoloacutegico y sintaacutectico de los textos de un corpus que consisten en la lectura y en la divisioacuten del texto en unidades relevantes que seraacuten maacutes tarde utilizadas para trabajar el anaacutelisis de la palabra Las caracteriacutesticas que normalmente se indican durante este etiquetado hacen referencia a

mdash Aspectos de estructuras de texto marcas tipograacuteficas divisiones textuales paacuterrafos citas tiacutetulos

mdash las propiedades morfosintaacutecticas de la palabra y puede ir desde los datos necesarios a la conjugacioacuten de un verbo hasta todos los datos necesarios para poder realizar un anaacutelisis textual

mdash Caracterizacioacuten de las unidades leacutexicas leacutexico en general extranjerismos nombres propiacuteos siglas abreviaciones

mdash Funciones sintaacutecticas de cada constituyente y representacioacuten por medio de aacuterboles sintaacutecticos Etc

De esta forma dependiendo de la aplicacioacuten planteada se podraacute por ejemplo realizar una comprobacioacuten ortograacutefica un anaacutelisis sintaacutectico de una frase o de un texto la buacutesqueda de un corpus para poder contrastar y verificar los elementos analizados asiacute como la frecuencia de aparicioacuten de eacutestos mismos proporcionando datos acerca de la frecuencia de aparicioacuten de las palabras en teacuterminos cuantitativos y del tipo de textos en que aparece Finamente se podraacuten como veremos posteriormente aplicar toda la informacioacuten a procesos de aprendizaje y traduccioacuten automaacuteticos11

32 Diccionarios electroacutenicos concebidos para realizar una descripcioacuten gramatical completa del leacutexico y de la sintaxis

Se han elaborado numerosos prototipos de analizadores textuales pero sin embargo ninguno de ellos incorpora un tratamiento completo del leacutexico y de la gramaacutetica Desde prinshycipios del siglo XX los linguumlistas pareciacutean haber renunciado a constituir inventarios pues por ejemplo los estudios transformacionalistas se basaban en pequentildeos grupos de ejemplos estos uacuteltimos sin embargo seraacuten fundamentales para Maurice Gross (197520)

Leacutetude systeacutematique des proprieacuteteacutes syntaxiques simpose aujourdhui pour des raisons diverses Lexistence de theacuteories transformatiomielles fait quune eacutetude systeacutematique peut ecirctre deacutelimiteacutee avec beaucoup plus de preacutecisions quagrave linteacuterieur des cadres traditionnels Dautre part la situation preacutesente de la syntaxe transformationnelle est particuliegravere Apregraves

11 Los dos sistemas de TAL maacutes representativos son SYSTRAN y SADAW

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 5: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 385

En efecto numerosas UFS que aparecen en los diccionarios son las huellas de eacutepocas pashysadas ya no son representativas del estado vigente de la lengua activa pues pertenecen a un uso generacional caduco a menudo diacrogravenico a una concepcioacuten social y laboral diferente7 Esa falta de adecuacioacuten conceptual o composicional supone que el hablante utiliza unidades fraseoloacutegicas que le suponen los siguientes problemas de comprensioacuten e interpretacioacuten

mdash Se usan expresiones con palabras que solamente se utilizan ya en la lengua en esas expresiones Ej bull Salir de naja bull Prendre la poudre descampette

mdash Se usan expresiones que pertenecen a otras realidades vocabulario del campo refrashynes meteoroloacutegicos mundo laboral ya caduco como es el caso con todo lo referido al campo del caballo y que ya no son sentidas como propias por los usuarios de la lengua al no saber a que se refieren exactamente al no conocer el posible hecho histoacuterico en el que se basan Ej bull Cumplir con la parroquia8 (DUE)= Comulgar por Pascua bull Costar un Potosiacute (DUE) = Costar algo mucho dinero referencia a la colonizashy

cioacuten espantildeola de Hispanoameacuterica bull Colgarle a alguien el un Sambenito San-Benito (DUE) = Acusar injustamente

a alguien bull De casta le viene al galgo el ser rabilargo (DUE) = La cualidad de una persona

le viene de familia bull Poner a alguien a los pies de los caballos (DUE) = desairar humillar maltrashy

tar bull Pasar maacutes hambre que un maestro de escuela9

Este fenoacutemeno se puede apreciar auacuten con mayor claridad en los grupos de expresiones parasinoacutenimas (Ver Cuadro 2 y 3) En el primer cuadro

7 Seguacuten Rey-Debove (1971 98) laquoEn Synchronie pure cest agrave dire dans linstant des contemporains de tous les acircges compris entre 15 et 75 ans ont des eacutechanges reacuteels Mais une personne de 75 ans garde les habitudes de langage de sa jeunesse correspondant agrave un autre systegraveme lexical et qui persiste gracircce agrave la meacutemoire et aux eacutechanges avec les personnes du mecircme acircge Une grande partie du vocabulaire actif de ses 15 ans (communication avec les personnes acircgeacutees) lui ne fonctionne plus dans aucun eacutechange faute dinterlocuteurs Cest de cette maniegravere que la langue perd dun cocircteacute ce quelle acquiert de lautreraquo 8 Las siglas de las obras referenciadas corresponden a 1 Diccionario de la Real Academia Espantildeola de la lengua para RAE al diccionario de uso del espantildeol para DUE Gran diccionario Larousse Espantildeol-Franceacutes Franceacutes-espashyntildeol para LBI Dictionnaire des Expressions et Locutions de Alain Rey para AR Thesaurus Larousse para TL PR para Petit Robert Tambieacuten hay que sentildealar que las locuciones verbales que figuran por debajo de la liacutenea horizontal y que no tienen referencia no han sido encontradas en diccionarios pero sin embargo son bastante frecuentes en la lengua activa espantildeola o francesa 9 No viene referenciada esta locucioacuten muy conocida y muy usada en los diccionarios que hemos consultado (DUE DRAE En Larousse)

386 PEDRO MOGORROacuteN HUERTA

Estar en Babia (DUE) Estar en las Batuecas (DUE) Estar en Beleacuten (DUE) Estar en la higuera (DUE) Estar en el limbo (DUE) Estar en la luna (DUE) Estar en las nubes (DUE) Mirar a las musarantildeas (DUE) Mirar las telarantildeas (LBI)

Estar en la parra

Bayer aux corneilles(AR) Etre dans les limbes (AR) Ecirctre dans la lune (AR) Ecirctre dans les nuages (AR) Navoir pas les pieds sur terre (TL)

Cuadro nn 2

se pueden observar varias expresiones que significan praacutecticamente lo mismo si nos ateshynemos a las definiciones que de ellas dan los diccionarios (DUE DRAE) estar distraiacutedo no enterarse de algo Sin embargo estas locuciones no son utilizadas indistintamente por las distintas generaciones de usuarios que componen la populacioacuten total activa que utiliza una determinada lengua Asiacute sorprendentemente seguacuten una encuesta que hemos realizado entre nuestros alumnos en la U de Alicante las expresiones estar en Babia en las Batueshycas incluso estar en Beleacuten asiacute como Mirar a las musarantildeas o a las telerantildeas ya no son comprendidas por la mayoriacutea de los joacutevenes estudiantes de 20 antildeos

Por otro lado existe justamente el fenoacutemeno inverso Es decir que la lengua activa de una determinada fase linguumliacutestica crea otra unidades que no aparecen en los diccionarios que suelen tardar bastante tiempo en incorporar las nuevas creaciones o adaptaciones de la lengua Eacutestos las excluyen debido a su inestabilidad o a su caducidad en la lengua pues numerosas UFS aparecen son utilizadas cierto tiempo Ej

mdash estar de ir de guateque y posteriormente son reemplazadas por otras maacutes modernas

mdash estar de ir de guerra hacer la ruta (del bacalao) mdash estar hasta el punto com10 Tambieacuten es verdad que en otras ocasiones los diccionarios que como hemos sentildealado

anteriormente suelen reflejar una lengua estaacutendar no incorporan expresiones que se manshytienen en la lengua colectiva durante mucho tiempo debido a diferentes niveles de uso Pondremos como ejemplo la expresiones

mdash ser maacutes agarrado que un tango y ser maacutes agarrado que un catalaacuten de uso corriente que no aparecen mientras que

mdash ser maacutes agarrado que un chotis siacute que aparece en el DRAE Otro ejemplo representativo podriacutea ser la serie de expresiones parasinoacutenimas de estar harto de algo o alguien (Ver cuadro 3) que tienen escasa repercusioacuten en los diccionarios claacutesicos que no incluyen las expresiones siguientes que figuran por deacutebashy

lo Esta expresioacuten seria un ejemplo de muy reciente aparicioacuten en ia lengua activa Soacutelo con el paso del tiempo podremos saber su eacutexito real en la lengua

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 387

jo de la liacutenea horizontal (estar hasta los huevos hasta el cono etc) que sin embargo tienen gran representatividad en la lengua activa de los joacutevenes y de los no tan joacutevenes

Estar hasta el coco de (DUE) Estar hasta los cojones de ( DUE) Estar hasta la coronilla de (DUE) Estar hasta el culo de (DUE) Estar hasta el gollete de (RAE) Estar hasta el gorro de (DUE) Estar hasta el montildeo de (DUE) Estar hasta las narices de (DUE) Estar hasta la punta de los pelos (DUE) Estar hasta los pelos de (DUE) Estar hasta por encima de la cabeza de (DUE)

Estar hasta el cono de Estar hasta el punto com de Estar hasta los huevos de Estar hasta los mismiacutesismos de Estar hasta el nabo de Estar hasta los ovarios de Estar hasta el pini de Estar hasta el pilo de

En avoir assez(AR) En avoir marre (fam AR) En avoir par dessus la tecircte (fam AR) En avoir par dessus les eacutepaules (famAR) En avoir plein les bottes (famPR) En avoir plein le cul (fam AR) En avoir plein le dos (famAR) En avoir ras-lc-bol (famAR) En avoir son bol (famAR) En avoir (son) pied (Arg AR) bn avoir soupe (famTL)

En avoir ras le baba En avoir ras la casquette En avoir ras les couilles En avoir ras le jonc En avoir ras les pacircquerettes

Cuadro ndeg 3

Convendriacutea pues que los diccionarios tratasen debidamente estas UFS ya que al no estar debidamente recogidos por los diccionarios estos desfases entre el uso de la lengua activa estaacutendar claacutesica popular etc su escasa representatividad y clasificacioacuten en los diccionashyrios dificultan el conocimiento de numerosas foacutermulas a

mdash usuarios de un idioma mdash estudiantes que desean aprender ese idioma mdash traductores que no saben realmente cual de las combinaciones es el equivalente real

de traduccioacuten Ademaacutes de estos desfases de incorporacioacuten de las unidades fraseoloacutegicas tambieacuten cabriacutea

referirse al tratamiento que se les da con la escasa informacioacuten de caraacutecter gramatical y la mala gestioacuten o presentacioacuten de esta misma en efecto se suelen ordenar las UFS alfabeacutetishycamente sin aplicar una estructuracioacuten sistemaacutetica para no mezclar los distintos grupos de unidades fraseoloacutegicas Estas obras deberiacutean cuanto menos tratarlas y dar la misma cantidad de mformacioacuten que para el resto de las unidades simples no fijadas de la lengua para permishytirle a los usuarios disponer de toda la informacioacuten morfosintaacutectica necesaria para utilizarlas correctamente Asiacute por ejemplo la gran variedad estructural de UFS no viene tratada ya que los diccionarios las incorporan de forma desordenada Por otro lado existen varias deficienshycias en la presentacioacuten de estas formas Asiacute I Santamariacutea (2003 48) aprecia

388 PrDRO MoGORROacuteN HUBRTA

mdash indecisioacuten en la forma de la expresioacuten aportando una uacutenica de las variantes graacuteficas sin que esta sea siempre la maacutes usual (a boca de jarro en lugar de abocajarro)

mdash Indecisioacuten a la hora de lematizar la expresioacuten que una veces aparece con un verbo con el que se combina frecuentemente otras aparece sin forma verbal (de estampiacutea salir de estampiacutea

mdash Inclusioacuten de las expresiones con o sin preposiciones en ajamas ayunas Recientemente se estaacuten elaborando versiones comerciales de estos diccionarios en soshy

porte informaacutetico DUE DRAE Enciclopedia Larousse Petit Robert Enciclopedia Britaacuteshynica etc Sin embargo ese cambio de soporte no ha supuesto ninguacuten cambio apreciabie en la estructura o en el contenido de estas obras pues las uacutenicas diferencias que se han podido observar han sido la rapidez de las consultas a realizar la posibilidad de navegar por los artiacuteculos asiacute como la de seleccionar y buscar estructuras con pequentildeos localizadores ya que tanto la estructuracioacuten de la informacioacuten como la de los contenidos siguen siendo praacutecticashymente similares

3 APARICIOacuteN DE LOS DICCIONARIOS ELECTROacuteNICOS

Por otro lado y tambieacuten recientemente ha hecho su aparicioacuten en el mundo de la linguumliacutesshytica otro tipo de diccionarios cuya elaboracioacuten estaacute relacionada con posibles aplicaciones al tratamiento automaacutetico de textos en el campo de la linguumliacutestica aplicada Se trata de los diccionarios electroacutenicos Al contrario de lo que habiacutea ocurrido con la elaboracioacuten y el conshytenido parcial de los diccionarios generales claacutesicos ya desde sus inicios la concepcioacuten de este nuevo tipo de diccionarios se estaacute realizando asumiendo como objetivo a alcanzar el de la maacutexima exhaustividad posible En efecto un diccionario electroacutenico no es una sencilla lista alfabeacutetica muy completa de palabras simples o compuestas que se podraacute posteriormente aplicar al anaacutelisis automaacutetico de textos No Un diccionario electroacutenico es mucho maacutes que eso Se trata de una base de datos que contiene una enorme cantidad de datos recogidos por los lexicoacutegrafos que deberaacute ser gestionada por la informaacutetica en funcioacuten de las necesidades que se hallan programado y que se deseen alcanzar

Para poder entender las posibilidades de los diccionarios electroacutenicos hay que saber que se basan en torno a dos piedras angulares Por un lado tendremos una base linguumliacutestica y por otro lado la parte informaacutetica que se va a encargar de gestionar lo maacutes eficazmente posible toda la cantidad de informacioacuten linguumliacutestica recogida por los especialistas en lengua Eacutesta poshydraacute ser por lo tanto morfoloacutegica sintaacutectica foneacutetica semaacutentica etc Sin embargo la parte informaacutetica solamente podraacute analizar la informacioacuten que la base de datos linguumliacutestica haya recopilado y estructurado y realizar procesos selectivos de buacutesqueda sobre eacutesta Es decir que el mejor programa informaacutetico no podraacute hacer maravillas por mucho que se quiera a la hora de gestionar la informacioacuten para buscar resultados y posibles aplicaciones Son pues dos procesos que deben ir a la par El linguumlista debe saber lo que necesita el informaacutetico y el informaacutetico a su vez lo que desea conseguir el linguumlista Una vez esteacuten definidos entre los dos los objetivos a alcanzar se deben crear una serie de ficheros informaacuteticos que conshytendraacuten toda la informacioacuten en forma de entradas leacutexicas (simples o complejas) en forma de coacutedigos morfoloacutegicos identificablcs por los programas

LOS DICCIONARIOS ELECTROacuteNICOS KHASKOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 389

31 Diccionarios electroacutenicos desarrollados para sistemas de TAL (Tratamiento Autoshymaacutetico del Lenguaje)

Las aplicaciones contempladas por los diccionarios electroacutenicos son muy numerosas pero van a depender en gran parte de la informacioacuten y del tratamiento que se le haya dado a eacutesta En efecto la utilizacioacuten de la informacioacuten en tratamiento automaacutetico de textos exige que las palabras pertenecientes a los textos que se han introducido esteacuten etiquetadas de mashynera que el diccionario pueda catalogarlas A partir de teacutecnicas basadas en el procesamiento del lenguaje natural se han desarrollado sistemas para la lematizacioacuten es decir para el etishyquetado automaacutetico morfoloacutegico y sintaacutectico de los textos de un corpus que consisten en la lectura y en la divisioacuten del texto en unidades relevantes que seraacuten maacutes tarde utilizadas para trabajar el anaacutelisis de la palabra Las caracteriacutesticas que normalmente se indican durante este etiquetado hacen referencia a

mdash Aspectos de estructuras de texto marcas tipograacuteficas divisiones textuales paacuterrafos citas tiacutetulos

mdash las propiedades morfosintaacutecticas de la palabra y puede ir desde los datos necesarios a la conjugacioacuten de un verbo hasta todos los datos necesarios para poder realizar un anaacutelisis textual

mdash Caracterizacioacuten de las unidades leacutexicas leacutexico en general extranjerismos nombres propiacuteos siglas abreviaciones

mdash Funciones sintaacutecticas de cada constituyente y representacioacuten por medio de aacuterboles sintaacutecticos Etc

De esta forma dependiendo de la aplicacioacuten planteada se podraacute por ejemplo realizar una comprobacioacuten ortograacutefica un anaacutelisis sintaacutectico de una frase o de un texto la buacutesqueda de un corpus para poder contrastar y verificar los elementos analizados asiacute como la frecuencia de aparicioacuten de eacutestos mismos proporcionando datos acerca de la frecuencia de aparicioacuten de las palabras en teacuterminos cuantitativos y del tipo de textos en que aparece Finamente se podraacuten como veremos posteriormente aplicar toda la informacioacuten a procesos de aprendizaje y traduccioacuten automaacuteticos11

32 Diccionarios electroacutenicos concebidos para realizar una descripcioacuten gramatical completa del leacutexico y de la sintaxis

Se han elaborado numerosos prototipos de analizadores textuales pero sin embargo ninguno de ellos incorpora un tratamiento completo del leacutexico y de la gramaacutetica Desde prinshycipios del siglo XX los linguumlistas pareciacutean haber renunciado a constituir inventarios pues por ejemplo los estudios transformacionalistas se basaban en pequentildeos grupos de ejemplos estos uacuteltimos sin embargo seraacuten fundamentales para Maurice Gross (197520)

Leacutetude systeacutematique des proprieacuteteacutes syntaxiques simpose aujourdhui pour des raisons diverses Lexistence de theacuteories transformatiomielles fait quune eacutetude systeacutematique peut ecirctre deacutelimiteacutee avec beaucoup plus de preacutecisions quagrave linteacuterieur des cadres traditionnels Dautre part la situation preacutesente de la syntaxe transformationnelle est particuliegravere Apregraves

11 Los dos sistemas de TAL maacutes representativos son SYSTRAN y SADAW

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 6: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

386 PEDRO MOGORROacuteN HUERTA

Estar en Babia (DUE) Estar en las Batuecas (DUE) Estar en Beleacuten (DUE) Estar en la higuera (DUE) Estar en el limbo (DUE) Estar en la luna (DUE) Estar en las nubes (DUE) Mirar a las musarantildeas (DUE) Mirar las telarantildeas (LBI)

Estar en la parra

Bayer aux corneilles(AR) Etre dans les limbes (AR) Ecirctre dans la lune (AR) Ecirctre dans les nuages (AR) Navoir pas les pieds sur terre (TL)

Cuadro nn 2

se pueden observar varias expresiones que significan praacutecticamente lo mismo si nos ateshynemos a las definiciones que de ellas dan los diccionarios (DUE DRAE) estar distraiacutedo no enterarse de algo Sin embargo estas locuciones no son utilizadas indistintamente por las distintas generaciones de usuarios que componen la populacioacuten total activa que utiliza una determinada lengua Asiacute sorprendentemente seguacuten una encuesta que hemos realizado entre nuestros alumnos en la U de Alicante las expresiones estar en Babia en las Batueshycas incluso estar en Beleacuten asiacute como Mirar a las musarantildeas o a las telerantildeas ya no son comprendidas por la mayoriacutea de los joacutevenes estudiantes de 20 antildeos

Por otro lado existe justamente el fenoacutemeno inverso Es decir que la lengua activa de una determinada fase linguumliacutestica crea otra unidades que no aparecen en los diccionarios que suelen tardar bastante tiempo en incorporar las nuevas creaciones o adaptaciones de la lengua Eacutestos las excluyen debido a su inestabilidad o a su caducidad en la lengua pues numerosas UFS aparecen son utilizadas cierto tiempo Ej

mdash estar de ir de guateque y posteriormente son reemplazadas por otras maacutes modernas

mdash estar de ir de guerra hacer la ruta (del bacalao) mdash estar hasta el punto com10 Tambieacuten es verdad que en otras ocasiones los diccionarios que como hemos sentildealado

anteriormente suelen reflejar una lengua estaacutendar no incorporan expresiones que se manshytienen en la lengua colectiva durante mucho tiempo debido a diferentes niveles de uso Pondremos como ejemplo la expresiones

mdash ser maacutes agarrado que un tango y ser maacutes agarrado que un catalaacuten de uso corriente que no aparecen mientras que

mdash ser maacutes agarrado que un chotis siacute que aparece en el DRAE Otro ejemplo representativo podriacutea ser la serie de expresiones parasinoacutenimas de estar harto de algo o alguien (Ver cuadro 3) que tienen escasa repercusioacuten en los diccionarios claacutesicos que no incluyen las expresiones siguientes que figuran por deacutebashy

lo Esta expresioacuten seria un ejemplo de muy reciente aparicioacuten en ia lengua activa Soacutelo con el paso del tiempo podremos saber su eacutexito real en la lengua

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 387

jo de la liacutenea horizontal (estar hasta los huevos hasta el cono etc) que sin embargo tienen gran representatividad en la lengua activa de los joacutevenes y de los no tan joacutevenes

Estar hasta el coco de (DUE) Estar hasta los cojones de ( DUE) Estar hasta la coronilla de (DUE) Estar hasta el culo de (DUE) Estar hasta el gollete de (RAE) Estar hasta el gorro de (DUE) Estar hasta el montildeo de (DUE) Estar hasta las narices de (DUE) Estar hasta la punta de los pelos (DUE) Estar hasta los pelos de (DUE) Estar hasta por encima de la cabeza de (DUE)

Estar hasta el cono de Estar hasta el punto com de Estar hasta los huevos de Estar hasta los mismiacutesismos de Estar hasta el nabo de Estar hasta los ovarios de Estar hasta el pini de Estar hasta el pilo de

En avoir assez(AR) En avoir marre (fam AR) En avoir par dessus la tecircte (fam AR) En avoir par dessus les eacutepaules (famAR) En avoir plein les bottes (famPR) En avoir plein le cul (fam AR) En avoir plein le dos (famAR) En avoir ras-lc-bol (famAR) En avoir son bol (famAR) En avoir (son) pied (Arg AR) bn avoir soupe (famTL)

En avoir ras le baba En avoir ras la casquette En avoir ras les couilles En avoir ras le jonc En avoir ras les pacircquerettes

Cuadro ndeg 3

Convendriacutea pues que los diccionarios tratasen debidamente estas UFS ya que al no estar debidamente recogidos por los diccionarios estos desfases entre el uso de la lengua activa estaacutendar claacutesica popular etc su escasa representatividad y clasificacioacuten en los diccionashyrios dificultan el conocimiento de numerosas foacutermulas a

mdash usuarios de un idioma mdash estudiantes que desean aprender ese idioma mdash traductores que no saben realmente cual de las combinaciones es el equivalente real

de traduccioacuten Ademaacutes de estos desfases de incorporacioacuten de las unidades fraseoloacutegicas tambieacuten cabriacutea

referirse al tratamiento que se les da con la escasa informacioacuten de caraacutecter gramatical y la mala gestioacuten o presentacioacuten de esta misma en efecto se suelen ordenar las UFS alfabeacutetishycamente sin aplicar una estructuracioacuten sistemaacutetica para no mezclar los distintos grupos de unidades fraseoloacutegicas Estas obras deberiacutean cuanto menos tratarlas y dar la misma cantidad de mformacioacuten que para el resto de las unidades simples no fijadas de la lengua para permishytirle a los usuarios disponer de toda la informacioacuten morfosintaacutectica necesaria para utilizarlas correctamente Asiacute por ejemplo la gran variedad estructural de UFS no viene tratada ya que los diccionarios las incorporan de forma desordenada Por otro lado existen varias deficienshycias en la presentacioacuten de estas formas Asiacute I Santamariacutea (2003 48) aprecia

388 PrDRO MoGORROacuteN HUBRTA

mdash indecisioacuten en la forma de la expresioacuten aportando una uacutenica de las variantes graacuteficas sin que esta sea siempre la maacutes usual (a boca de jarro en lugar de abocajarro)

mdash Indecisioacuten a la hora de lematizar la expresioacuten que una veces aparece con un verbo con el que se combina frecuentemente otras aparece sin forma verbal (de estampiacutea salir de estampiacutea

mdash Inclusioacuten de las expresiones con o sin preposiciones en ajamas ayunas Recientemente se estaacuten elaborando versiones comerciales de estos diccionarios en soshy

porte informaacutetico DUE DRAE Enciclopedia Larousse Petit Robert Enciclopedia Britaacuteshynica etc Sin embargo ese cambio de soporte no ha supuesto ninguacuten cambio apreciabie en la estructura o en el contenido de estas obras pues las uacutenicas diferencias que se han podido observar han sido la rapidez de las consultas a realizar la posibilidad de navegar por los artiacuteculos asiacute como la de seleccionar y buscar estructuras con pequentildeos localizadores ya que tanto la estructuracioacuten de la informacioacuten como la de los contenidos siguen siendo praacutecticashymente similares

3 APARICIOacuteN DE LOS DICCIONARIOS ELECTROacuteNICOS

Por otro lado y tambieacuten recientemente ha hecho su aparicioacuten en el mundo de la linguumliacutesshytica otro tipo de diccionarios cuya elaboracioacuten estaacute relacionada con posibles aplicaciones al tratamiento automaacutetico de textos en el campo de la linguumliacutestica aplicada Se trata de los diccionarios electroacutenicos Al contrario de lo que habiacutea ocurrido con la elaboracioacuten y el conshytenido parcial de los diccionarios generales claacutesicos ya desde sus inicios la concepcioacuten de este nuevo tipo de diccionarios se estaacute realizando asumiendo como objetivo a alcanzar el de la maacutexima exhaustividad posible En efecto un diccionario electroacutenico no es una sencilla lista alfabeacutetica muy completa de palabras simples o compuestas que se podraacute posteriormente aplicar al anaacutelisis automaacutetico de textos No Un diccionario electroacutenico es mucho maacutes que eso Se trata de una base de datos que contiene una enorme cantidad de datos recogidos por los lexicoacutegrafos que deberaacute ser gestionada por la informaacutetica en funcioacuten de las necesidades que se hallan programado y que se deseen alcanzar

Para poder entender las posibilidades de los diccionarios electroacutenicos hay que saber que se basan en torno a dos piedras angulares Por un lado tendremos una base linguumliacutestica y por otro lado la parte informaacutetica que se va a encargar de gestionar lo maacutes eficazmente posible toda la cantidad de informacioacuten linguumliacutestica recogida por los especialistas en lengua Eacutesta poshydraacute ser por lo tanto morfoloacutegica sintaacutectica foneacutetica semaacutentica etc Sin embargo la parte informaacutetica solamente podraacute analizar la informacioacuten que la base de datos linguumliacutestica haya recopilado y estructurado y realizar procesos selectivos de buacutesqueda sobre eacutesta Es decir que el mejor programa informaacutetico no podraacute hacer maravillas por mucho que se quiera a la hora de gestionar la informacioacuten para buscar resultados y posibles aplicaciones Son pues dos procesos que deben ir a la par El linguumlista debe saber lo que necesita el informaacutetico y el informaacutetico a su vez lo que desea conseguir el linguumlista Una vez esteacuten definidos entre los dos los objetivos a alcanzar se deben crear una serie de ficheros informaacuteticos que conshytendraacuten toda la informacioacuten en forma de entradas leacutexicas (simples o complejas) en forma de coacutedigos morfoloacutegicos identificablcs por los programas

LOS DICCIONARIOS ELECTROacuteNICOS KHASKOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 389

31 Diccionarios electroacutenicos desarrollados para sistemas de TAL (Tratamiento Autoshymaacutetico del Lenguaje)

Las aplicaciones contempladas por los diccionarios electroacutenicos son muy numerosas pero van a depender en gran parte de la informacioacuten y del tratamiento que se le haya dado a eacutesta En efecto la utilizacioacuten de la informacioacuten en tratamiento automaacutetico de textos exige que las palabras pertenecientes a los textos que se han introducido esteacuten etiquetadas de mashynera que el diccionario pueda catalogarlas A partir de teacutecnicas basadas en el procesamiento del lenguaje natural se han desarrollado sistemas para la lematizacioacuten es decir para el etishyquetado automaacutetico morfoloacutegico y sintaacutectico de los textos de un corpus que consisten en la lectura y en la divisioacuten del texto en unidades relevantes que seraacuten maacutes tarde utilizadas para trabajar el anaacutelisis de la palabra Las caracteriacutesticas que normalmente se indican durante este etiquetado hacen referencia a

mdash Aspectos de estructuras de texto marcas tipograacuteficas divisiones textuales paacuterrafos citas tiacutetulos

mdash las propiedades morfosintaacutecticas de la palabra y puede ir desde los datos necesarios a la conjugacioacuten de un verbo hasta todos los datos necesarios para poder realizar un anaacutelisis textual

mdash Caracterizacioacuten de las unidades leacutexicas leacutexico en general extranjerismos nombres propiacuteos siglas abreviaciones

mdash Funciones sintaacutecticas de cada constituyente y representacioacuten por medio de aacuterboles sintaacutecticos Etc

De esta forma dependiendo de la aplicacioacuten planteada se podraacute por ejemplo realizar una comprobacioacuten ortograacutefica un anaacutelisis sintaacutectico de una frase o de un texto la buacutesqueda de un corpus para poder contrastar y verificar los elementos analizados asiacute como la frecuencia de aparicioacuten de eacutestos mismos proporcionando datos acerca de la frecuencia de aparicioacuten de las palabras en teacuterminos cuantitativos y del tipo de textos en que aparece Finamente se podraacuten como veremos posteriormente aplicar toda la informacioacuten a procesos de aprendizaje y traduccioacuten automaacuteticos11

32 Diccionarios electroacutenicos concebidos para realizar una descripcioacuten gramatical completa del leacutexico y de la sintaxis

Se han elaborado numerosos prototipos de analizadores textuales pero sin embargo ninguno de ellos incorpora un tratamiento completo del leacutexico y de la gramaacutetica Desde prinshycipios del siglo XX los linguumlistas pareciacutean haber renunciado a constituir inventarios pues por ejemplo los estudios transformacionalistas se basaban en pequentildeos grupos de ejemplos estos uacuteltimos sin embargo seraacuten fundamentales para Maurice Gross (197520)

Leacutetude systeacutematique des proprieacuteteacutes syntaxiques simpose aujourdhui pour des raisons diverses Lexistence de theacuteories transformatiomielles fait quune eacutetude systeacutematique peut ecirctre deacutelimiteacutee avec beaucoup plus de preacutecisions quagrave linteacuterieur des cadres traditionnels Dautre part la situation preacutesente de la syntaxe transformationnelle est particuliegravere Apregraves

11 Los dos sistemas de TAL maacutes representativos son SYSTRAN y SADAW

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 7: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 387

jo de la liacutenea horizontal (estar hasta los huevos hasta el cono etc) que sin embargo tienen gran representatividad en la lengua activa de los joacutevenes y de los no tan joacutevenes

Estar hasta el coco de (DUE) Estar hasta los cojones de ( DUE) Estar hasta la coronilla de (DUE) Estar hasta el culo de (DUE) Estar hasta el gollete de (RAE) Estar hasta el gorro de (DUE) Estar hasta el montildeo de (DUE) Estar hasta las narices de (DUE) Estar hasta la punta de los pelos (DUE) Estar hasta los pelos de (DUE) Estar hasta por encima de la cabeza de (DUE)

Estar hasta el cono de Estar hasta el punto com de Estar hasta los huevos de Estar hasta los mismiacutesismos de Estar hasta el nabo de Estar hasta los ovarios de Estar hasta el pini de Estar hasta el pilo de

En avoir assez(AR) En avoir marre (fam AR) En avoir par dessus la tecircte (fam AR) En avoir par dessus les eacutepaules (famAR) En avoir plein les bottes (famPR) En avoir plein le cul (fam AR) En avoir plein le dos (famAR) En avoir ras-lc-bol (famAR) En avoir son bol (famAR) En avoir (son) pied (Arg AR) bn avoir soupe (famTL)

En avoir ras le baba En avoir ras la casquette En avoir ras les couilles En avoir ras le jonc En avoir ras les pacircquerettes

Cuadro ndeg 3

Convendriacutea pues que los diccionarios tratasen debidamente estas UFS ya que al no estar debidamente recogidos por los diccionarios estos desfases entre el uso de la lengua activa estaacutendar claacutesica popular etc su escasa representatividad y clasificacioacuten en los diccionashyrios dificultan el conocimiento de numerosas foacutermulas a

mdash usuarios de un idioma mdash estudiantes que desean aprender ese idioma mdash traductores que no saben realmente cual de las combinaciones es el equivalente real

de traduccioacuten Ademaacutes de estos desfases de incorporacioacuten de las unidades fraseoloacutegicas tambieacuten cabriacutea

referirse al tratamiento que se les da con la escasa informacioacuten de caraacutecter gramatical y la mala gestioacuten o presentacioacuten de esta misma en efecto se suelen ordenar las UFS alfabeacutetishycamente sin aplicar una estructuracioacuten sistemaacutetica para no mezclar los distintos grupos de unidades fraseoloacutegicas Estas obras deberiacutean cuanto menos tratarlas y dar la misma cantidad de mformacioacuten que para el resto de las unidades simples no fijadas de la lengua para permishytirle a los usuarios disponer de toda la informacioacuten morfosintaacutectica necesaria para utilizarlas correctamente Asiacute por ejemplo la gran variedad estructural de UFS no viene tratada ya que los diccionarios las incorporan de forma desordenada Por otro lado existen varias deficienshycias en la presentacioacuten de estas formas Asiacute I Santamariacutea (2003 48) aprecia

388 PrDRO MoGORROacuteN HUBRTA

mdash indecisioacuten en la forma de la expresioacuten aportando una uacutenica de las variantes graacuteficas sin que esta sea siempre la maacutes usual (a boca de jarro en lugar de abocajarro)

mdash Indecisioacuten a la hora de lematizar la expresioacuten que una veces aparece con un verbo con el que se combina frecuentemente otras aparece sin forma verbal (de estampiacutea salir de estampiacutea

mdash Inclusioacuten de las expresiones con o sin preposiciones en ajamas ayunas Recientemente se estaacuten elaborando versiones comerciales de estos diccionarios en soshy

porte informaacutetico DUE DRAE Enciclopedia Larousse Petit Robert Enciclopedia Britaacuteshynica etc Sin embargo ese cambio de soporte no ha supuesto ninguacuten cambio apreciabie en la estructura o en el contenido de estas obras pues las uacutenicas diferencias que se han podido observar han sido la rapidez de las consultas a realizar la posibilidad de navegar por los artiacuteculos asiacute como la de seleccionar y buscar estructuras con pequentildeos localizadores ya que tanto la estructuracioacuten de la informacioacuten como la de los contenidos siguen siendo praacutecticashymente similares

3 APARICIOacuteN DE LOS DICCIONARIOS ELECTROacuteNICOS

Por otro lado y tambieacuten recientemente ha hecho su aparicioacuten en el mundo de la linguumliacutesshytica otro tipo de diccionarios cuya elaboracioacuten estaacute relacionada con posibles aplicaciones al tratamiento automaacutetico de textos en el campo de la linguumliacutestica aplicada Se trata de los diccionarios electroacutenicos Al contrario de lo que habiacutea ocurrido con la elaboracioacuten y el conshytenido parcial de los diccionarios generales claacutesicos ya desde sus inicios la concepcioacuten de este nuevo tipo de diccionarios se estaacute realizando asumiendo como objetivo a alcanzar el de la maacutexima exhaustividad posible En efecto un diccionario electroacutenico no es una sencilla lista alfabeacutetica muy completa de palabras simples o compuestas que se podraacute posteriormente aplicar al anaacutelisis automaacutetico de textos No Un diccionario electroacutenico es mucho maacutes que eso Se trata de una base de datos que contiene una enorme cantidad de datos recogidos por los lexicoacutegrafos que deberaacute ser gestionada por la informaacutetica en funcioacuten de las necesidades que se hallan programado y que se deseen alcanzar

Para poder entender las posibilidades de los diccionarios electroacutenicos hay que saber que se basan en torno a dos piedras angulares Por un lado tendremos una base linguumliacutestica y por otro lado la parte informaacutetica que se va a encargar de gestionar lo maacutes eficazmente posible toda la cantidad de informacioacuten linguumliacutestica recogida por los especialistas en lengua Eacutesta poshydraacute ser por lo tanto morfoloacutegica sintaacutectica foneacutetica semaacutentica etc Sin embargo la parte informaacutetica solamente podraacute analizar la informacioacuten que la base de datos linguumliacutestica haya recopilado y estructurado y realizar procesos selectivos de buacutesqueda sobre eacutesta Es decir que el mejor programa informaacutetico no podraacute hacer maravillas por mucho que se quiera a la hora de gestionar la informacioacuten para buscar resultados y posibles aplicaciones Son pues dos procesos que deben ir a la par El linguumlista debe saber lo que necesita el informaacutetico y el informaacutetico a su vez lo que desea conseguir el linguumlista Una vez esteacuten definidos entre los dos los objetivos a alcanzar se deben crear una serie de ficheros informaacuteticos que conshytendraacuten toda la informacioacuten en forma de entradas leacutexicas (simples o complejas) en forma de coacutedigos morfoloacutegicos identificablcs por los programas

LOS DICCIONARIOS ELECTROacuteNICOS KHASKOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 389

31 Diccionarios electroacutenicos desarrollados para sistemas de TAL (Tratamiento Autoshymaacutetico del Lenguaje)

Las aplicaciones contempladas por los diccionarios electroacutenicos son muy numerosas pero van a depender en gran parte de la informacioacuten y del tratamiento que se le haya dado a eacutesta En efecto la utilizacioacuten de la informacioacuten en tratamiento automaacutetico de textos exige que las palabras pertenecientes a los textos que se han introducido esteacuten etiquetadas de mashynera que el diccionario pueda catalogarlas A partir de teacutecnicas basadas en el procesamiento del lenguaje natural se han desarrollado sistemas para la lematizacioacuten es decir para el etishyquetado automaacutetico morfoloacutegico y sintaacutectico de los textos de un corpus que consisten en la lectura y en la divisioacuten del texto en unidades relevantes que seraacuten maacutes tarde utilizadas para trabajar el anaacutelisis de la palabra Las caracteriacutesticas que normalmente se indican durante este etiquetado hacen referencia a

mdash Aspectos de estructuras de texto marcas tipograacuteficas divisiones textuales paacuterrafos citas tiacutetulos

mdash las propiedades morfosintaacutecticas de la palabra y puede ir desde los datos necesarios a la conjugacioacuten de un verbo hasta todos los datos necesarios para poder realizar un anaacutelisis textual

mdash Caracterizacioacuten de las unidades leacutexicas leacutexico en general extranjerismos nombres propiacuteos siglas abreviaciones

mdash Funciones sintaacutecticas de cada constituyente y representacioacuten por medio de aacuterboles sintaacutecticos Etc

De esta forma dependiendo de la aplicacioacuten planteada se podraacute por ejemplo realizar una comprobacioacuten ortograacutefica un anaacutelisis sintaacutectico de una frase o de un texto la buacutesqueda de un corpus para poder contrastar y verificar los elementos analizados asiacute como la frecuencia de aparicioacuten de eacutestos mismos proporcionando datos acerca de la frecuencia de aparicioacuten de las palabras en teacuterminos cuantitativos y del tipo de textos en que aparece Finamente se podraacuten como veremos posteriormente aplicar toda la informacioacuten a procesos de aprendizaje y traduccioacuten automaacuteticos11

32 Diccionarios electroacutenicos concebidos para realizar una descripcioacuten gramatical completa del leacutexico y de la sintaxis

Se han elaborado numerosos prototipos de analizadores textuales pero sin embargo ninguno de ellos incorpora un tratamiento completo del leacutexico y de la gramaacutetica Desde prinshycipios del siglo XX los linguumlistas pareciacutean haber renunciado a constituir inventarios pues por ejemplo los estudios transformacionalistas se basaban en pequentildeos grupos de ejemplos estos uacuteltimos sin embargo seraacuten fundamentales para Maurice Gross (197520)

Leacutetude systeacutematique des proprieacuteteacutes syntaxiques simpose aujourdhui pour des raisons diverses Lexistence de theacuteories transformatiomielles fait quune eacutetude systeacutematique peut ecirctre deacutelimiteacutee avec beaucoup plus de preacutecisions quagrave linteacuterieur des cadres traditionnels Dautre part la situation preacutesente de la syntaxe transformationnelle est particuliegravere Apregraves

11 Los dos sistemas de TAL maacutes representativos son SYSTRAN y SADAW

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 8: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

388 PrDRO MoGORROacuteN HUBRTA

mdash indecisioacuten en la forma de la expresioacuten aportando una uacutenica de las variantes graacuteficas sin que esta sea siempre la maacutes usual (a boca de jarro en lugar de abocajarro)

mdash Indecisioacuten a la hora de lematizar la expresioacuten que una veces aparece con un verbo con el que se combina frecuentemente otras aparece sin forma verbal (de estampiacutea salir de estampiacutea

mdash Inclusioacuten de las expresiones con o sin preposiciones en ajamas ayunas Recientemente se estaacuten elaborando versiones comerciales de estos diccionarios en soshy

porte informaacutetico DUE DRAE Enciclopedia Larousse Petit Robert Enciclopedia Britaacuteshynica etc Sin embargo ese cambio de soporte no ha supuesto ninguacuten cambio apreciabie en la estructura o en el contenido de estas obras pues las uacutenicas diferencias que se han podido observar han sido la rapidez de las consultas a realizar la posibilidad de navegar por los artiacuteculos asiacute como la de seleccionar y buscar estructuras con pequentildeos localizadores ya que tanto la estructuracioacuten de la informacioacuten como la de los contenidos siguen siendo praacutecticashymente similares

3 APARICIOacuteN DE LOS DICCIONARIOS ELECTROacuteNICOS

Por otro lado y tambieacuten recientemente ha hecho su aparicioacuten en el mundo de la linguumliacutesshytica otro tipo de diccionarios cuya elaboracioacuten estaacute relacionada con posibles aplicaciones al tratamiento automaacutetico de textos en el campo de la linguumliacutestica aplicada Se trata de los diccionarios electroacutenicos Al contrario de lo que habiacutea ocurrido con la elaboracioacuten y el conshytenido parcial de los diccionarios generales claacutesicos ya desde sus inicios la concepcioacuten de este nuevo tipo de diccionarios se estaacute realizando asumiendo como objetivo a alcanzar el de la maacutexima exhaustividad posible En efecto un diccionario electroacutenico no es una sencilla lista alfabeacutetica muy completa de palabras simples o compuestas que se podraacute posteriormente aplicar al anaacutelisis automaacutetico de textos No Un diccionario electroacutenico es mucho maacutes que eso Se trata de una base de datos que contiene una enorme cantidad de datos recogidos por los lexicoacutegrafos que deberaacute ser gestionada por la informaacutetica en funcioacuten de las necesidades que se hallan programado y que se deseen alcanzar

Para poder entender las posibilidades de los diccionarios electroacutenicos hay que saber que se basan en torno a dos piedras angulares Por un lado tendremos una base linguumliacutestica y por otro lado la parte informaacutetica que se va a encargar de gestionar lo maacutes eficazmente posible toda la cantidad de informacioacuten linguumliacutestica recogida por los especialistas en lengua Eacutesta poshydraacute ser por lo tanto morfoloacutegica sintaacutectica foneacutetica semaacutentica etc Sin embargo la parte informaacutetica solamente podraacute analizar la informacioacuten que la base de datos linguumliacutestica haya recopilado y estructurado y realizar procesos selectivos de buacutesqueda sobre eacutesta Es decir que el mejor programa informaacutetico no podraacute hacer maravillas por mucho que se quiera a la hora de gestionar la informacioacuten para buscar resultados y posibles aplicaciones Son pues dos procesos que deben ir a la par El linguumlista debe saber lo que necesita el informaacutetico y el informaacutetico a su vez lo que desea conseguir el linguumlista Una vez esteacuten definidos entre los dos los objetivos a alcanzar se deben crear una serie de ficheros informaacuteticos que conshytendraacuten toda la informacioacuten en forma de entradas leacutexicas (simples o complejas) en forma de coacutedigos morfoloacutegicos identificablcs por los programas

LOS DICCIONARIOS ELECTROacuteNICOS KHASKOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 389

31 Diccionarios electroacutenicos desarrollados para sistemas de TAL (Tratamiento Autoshymaacutetico del Lenguaje)

Las aplicaciones contempladas por los diccionarios electroacutenicos son muy numerosas pero van a depender en gran parte de la informacioacuten y del tratamiento que se le haya dado a eacutesta En efecto la utilizacioacuten de la informacioacuten en tratamiento automaacutetico de textos exige que las palabras pertenecientes a los textos que se han introducido esteacuten etiquetadas de mashynera que el diccionario pueda catalogarlas A partir de teacutecnicas basadas en el procesamiento del lenguaje natural se han desarrollado sistemas para la lematizacioacuten es decir para el etishyquetado automaacutetico morfoloacutegico y sintaacutectico de los textos de un corpus que consisten en la lectura y en la divisioacuten del texto en unidades relevantes que seraacuten maacutes tarde utilizadas para trabajar el anaacutelisis de la palabra Las caracteriacutesticas que normalmente se indican durante este etiquetado hacen referencia a

mdash Aspectos de estructuras de texto marcas tipograacuteficas divisiones textuales paacuterrafos citas tiacutetulos

mdash las propiedades morfosintaacutecticas de la palabra y puede ir desde los datos necesarios a la conjugacioacuten de un verbo hasta todos los datos necesarios para poder realizar un anaacutelisis textual

mdash Caracterizacioacuten de las unidades leacutexicas leacutexico en general extranjerismos nombres propiacuteos siglas abreviaciones

mdash Funciones sintaacutecticas de cada constituyente y representacioacuten por medio de aacuterboles sintaacutecticos Etc

De esta forma dependiendo de la aplicacioacuten planteada se podraacute por ejemplo realizar una comprobacioacuten ortograacutefica un anaacutelisis sintaacutectico de una frase o de un texto la buacutesqueda de un corpus para poder contrastar y verificar los elementos analizados asiacute como la frecuencia de aparicioacuten de eacutestos mismos proporcionando datos acerca de la frecuencia de aparicioacuten de las palabras en teacuterminos cuantitativos y del tipo de textos en que aparece Finamente se podraacuten como veremos posteriormente aplicar toda la informacioacuten a procesos de aprendizaje y traduccioacuten automaacuteticos11

32 Diccionarios electroacutenicos concebidos para realizar una descripcioacuten gramatical completa del leacutexico y de la sintaxis

Se han elaborado numerosos prototipos de analizadores textuales pero sin embargo ninguno de ellos incorpora un tratamiento completo del leacutexico y de la gramaacutetica Desde prinshycipios del siglo XX los linguumlistas pareciacutean haber renunciado a constituir inventarios pues por ejemplo los estudios transformacionalistas se basaban en pequentildeos grupos de ejemplos estos uacuteltimos sin embargo seraacuten fundamentales para Maurice Gross (197520)

Leacutetude systeacutematique des proprieacuteteacutes syntaxiques simpose aujourdhui pour des raisons diverses Lexistence de theacuteories transformatiomielles fait quune eacutetude systeacutematique peut ecirctre deacutelimiteacutee avec beaucoup plus de preacutecisions quagrave linteacuterieur des cadres traditionnels Dautre part la situation preacutesente de la syntaxe transformationnelle est particuliegravere Apregraves

11 Los dos sistemas de TAL maacutes representativos son SYSTRAN y SADAW

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 9: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

LOS DICCIONARIOS ELECTROacuteNICOS KHASKOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 389

31 Diccionarios electroacutenicos desarrollados para sistemas de TAL (Tratamiento Autoshymaacutetico del Lenguaje)

Las aplicaciones contempladas por los diccionarios electroacutenicos son muy numerosas pero van a depender en gran parte de la informacioacuten y del tratamiento que se le haya dado a eacutesta En efecto la utilizacioacuten de la informacioacuten en tratamiento automaacutetico de textos exige que las palabras pertenecientes a los textos que se han introducido esteacuten etiquetadas de mashynera que el diccionario pueda catalogarlas A partir de teacutecnicas basadas en el procesamiento del lenguaje natural se han desarrollado sistemas para la lematizacioacuten es decir para el etishyquetado automaacutetico morfoloacutegico y sintaacutectico de los textos de un corpus que consisten en la lectura y en la divisioacuten del texto en unidades relevantes que seraacuten maacutes tarde utilizadas para trabajar el anaacutelisis de la palabra Las caracteriacutesticas que normalmente se indican durante este etiquetado hacen referencia a

mdash Aspectos de estructuras de texto marcas tipograacuteficas divisiones textuales paacuterrafos citas tiacutetulos

mdash las propiedades morfosintaacutecticas de la palabra y puede ir desde los datos necesarios a la conjugacioacuten de un verbo hasta todos los datos necesarios para poder realizar un anaacutelisis textual

mdash Caracterizacioacuten de las unidades leacutexicas leacutexico en general extranjerismos nombres propiacuteos siglas abreviaciones

mdash Funciones sintaacutecticas de cada constituyente y representacioacuten por medio de aacuterboles sintaacutecticos Etc

De esta forma dependiendo de la aplicacioacuten planteada se podraacute por ejemplo realizar una comprobacioacuten ortograacutefica un anaacutelisis sintaacutectico de una frase o de un texto la buacutesqueda de un corpus para poder contrastar y verificar los elementos analizados asiacute como la frecuencia de aparicioacuten de eacutestos mismos proporcionando datos acerca de la frecuencia de aparicioacuten de las palabras en teacuterminos cuantitativos y del tipo de textos en que aparece Finamente se podraacuten como veremos posteriormente aplicar toda la informacioacuten a procesos de aprendizaje y traduccioacuten automaacuteticos11

32 Diccionarios electroacutenicos concebidos para realizar una descripcioacuten gramatical completa del leacutexico y de la sintaxis

Se han elaborado numerosos prototipos de analizadores textuales pero sin embargo ninguno de ellos incorpora un tratamiento completo del leacutexico y de la gramaacutetica Desde prinshycipios del siglo XX los linguumlistas pareciacutean haber renunciado a constituir inventarios pues por ejemplo los estudios transformacionalistas se basaban en pequentildeos grupos de ejemplos estos uacuteltimos sin embargo seraacuten fundamentales para Maurice Gross (197520)

Leacutetude systeacutematique des proprieacuteteacutes syntaxiques simpose aujourdhui pour des raisons diverses Lexistence de theacuteories transformatiomielles fait quune eacutetude systeacutematique peut ecirctre deacutelimiteacutee avec beaucoup plus de preacutecisions quagrave linteacuterieur des cadres traditionnels Dautre part la situation preacutesente de la syntaxe transformationnelle est particuliegravere Apregraves

11 Los dos sistemas de TAL maacutes representativos son SYSTRAN y SADAW

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 10: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

390 PEDRO MOGORROacuteN HUERTA

une peacuteriode ougrave des succegraves ont pu laisser croire que lemploi des transformations dans les descriptions allait reacutegulariser consideacuterablement ces derniegraveres il est devenu clair que les nouvelles regravegles continuaient agrave comporter des exceptions en nombre sensible

Este gran numero de excepciones que dificultan el estudio y el conocimiento de las lenguas va a ser pues el que va a provocar un cambio radical en el objetivo y por lo tanto en la estructuracioacuten y en la cantidad de informacioacuten necesaria Para ello se va a tratar toda la informacioacuten fijaacutendose como meta una descripcioacuten ortograacutefica fonoloacutegica morfoloacutegica sintaacutectica y textual utilizando como meacutetodo de trabajo un sistema muy lineal esquemaacutetico y riguroso de tal forma que en esta descripcioacuten de las unidades leacutexicas de la lengua prime la transparencia de las unidades de significacioacuten para evitar posibles confusiones en torno a la polisemia y a la fijacioacuten leacutexica

Este marco teoacuterico y metodoloacutegico elaborado por Maurice Gross y su equipo del LADL12

ha sido llamado Lexique-Grammaire y su objetivo principal es la construccioacuten conjunta de la gramaacutetica y del leacutexico de una lengua dada describiendo las propiedades sintaacutecticas distribucionales y transformacionales de las unidades leacutexicas (verbos nombres adjetivos adverbios etc) para proporcionar datos linguumliacutesticos sobre el funcionamiento en el marco de las frases de cada elemento susceptible de ser integrado en sistemas informaacuteticos para poder ser analizados automaacuteticamente en aplicaciones para el tratamiento automaacutetico de textos Para conseguir toda la informacioacuten necesaria se organiza el leacutexico a analizar integraacutendolo en tablas en las que se averigua si eacuteste acepta una serie de propiedades distribucionales y transformacionales MGross (1975150)

Nous avons repreacutesente un segment de la grammaire du franccedilais au moyen de matrices binaires [ chaque matrice cest-agrave-dire chaque table correspond agrave une classe de structures [ une ligne correspond agrave une entreacutee verbale une colonne agrave une proprieacuteteacute syntaxique Le signe + agrave lintersection dune ligneV et dune colonne P indique que le verbe V a la proprieacuteteacute P le signe - indique que v na pas la proprieacuteteacute P

Siguiendo estos procedimientos se han elaborado varios diccionarios electroacutenicos mdash DEacuteLAS (diccionario de las formas simples con maacutes de 90000 entradas) mdash DELAF ( diccionario de las formas flexionadas) mdash DELAC (diccionario de las formas complejas con maacutes de 100000 nombres comshy

puestos y maacutes de 7000 adverbios) mdash DELAP (diccionario de transcripciones foneacuteticas)

Hay que sentildealar que numerosos grupos de investigadores Integrados dentro de la red Relex httpinfolinguuniv-mlvfrRelexdictionarieshtml han desarrollado o estaacuten desashyrrollando en la actualidad diccionarios electroacutenicos utilizando el sistema DELA del LADL En Portugal dirigido por ERanchood en la Universidad de Lisboa En Italia dirigido por A Elia en la Universidad de Salerno en Espantildea el grupo de linguumliacutestica aplicada a las lenguas

12 Laboratoire dAutomatique Documentaire et Linguistique Este grupo de investigacioacuten constituye la UR ndeg 819 del CNRS dirido por Maurice Gross se ubicoacute primero en Paris VII y se ha integrado a la muerte del mismo en el IGM de la Universidad de Marne La Valleacutee HYPERLINK laquohttpwww-igmuniv-mlvfrraquo httpwww-igm univ-mlvfr

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 11: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

IOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 391

romaacutenicas de la UAB dirigido por Xavier Blanco httpoaiduabeslexsen en alemaacuten el sistma CISLEX diccionario electroacutenico coordinado por el CIS Centrum fur Informations und Sprachverarbeitung (LMU-Muumlnchen) httpcisuni-muenchende ha seguido el modeshylo DELA ademaacutes podriacuteamos sentildealar tambieacuten la construccioacuten de sistemas similares para el griego el coreano el malgache etc

33 Las unidades fraseoloacutegicas en los diccionarios electroacutenicos

Si examinamos los nombres de los diccionarios electroacutenicos mencionados hasta ahora y las unidades leacutexicas tratadas observamos que auacuten no hemos mencionado el tratamiento dado a aquellas ULS cuyo significado no se derivaba de la suma de sus componentes Falshytariacutea pues un diccionario electroacutenico fraseoloacutegico que analizase estas UFS aunque quizaacutes seriacutea maacutes adecuado y realista debido a la gran diversidad de UFS existentes y a la enorme cantidad de eacutestas elaborar varios diccionarios dependiendo de su estructura y denominashycioacuten

Esa parece ser la liacutenea de trabajo e investigacioacuten decidida y elegida Asiacute MGross elaboroacute un diccionario electroacutenico de maacutes de 45000 laquoexpressions figeacutees13raquo debidamente clasificashydas seguacuten su tipo y nuacutemero de complementos y analizadas sintaacutecticamente siguiendo los mismos criterios de los DELA que estaacute siendo terminado por los miembros de su equipo Ej Cuadro 4 tabla CPP14

+

+

---

--+

+

+

-----

ltEgt

ltEgt

ltEgt

ltEgt

ltEgt

changer

choisir

circuler

circuler

circuler

+

+

---

-----

-----

de

entre

de

de

de

le

la

ltEgt

ltEgt

ltEgt

tout

peste

bouche

bouche

main

-----

agrave

et

en

agrave

en

le

le

ltEgt

ltEgt

ltEgt

tout

choleacutera

bouche

oreille

main

-----

-----

Cuadro 4

Tambieacuten estaacuten elaborando la descripcioacuten de un proyecto llamado BFQS15 en el que se analizan todas aquellas variaciones diatoacutepicas de las expresiones ntildejas que aparecen en los cuatro paiacuteses mencionados intentando unificar bajo un mismo diccionario la descripcioacuten de todas las formas Ej Ver cuadro 5

13 Quizaacutes el uacutenico punto flaco de este inventario es que reuacutene bajo una misma catalogacioacuten a estructuras con valores muy diferentes pero tambieacuten es verdad que todas ellas responden al concepto comuacuten de fijacioacuten 14 Las siglas CPP significan en Lexique-Grammaire que las expresiones tienen todas la estructura siguiente NO V Preposicioacuten 1 Constante 1 Preposicioacuten 2 Constante 2 15 B de Beacutelgica F de Francia Q de Queacutebec S de Suiza

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 12: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

392 PKIIgraveHO MoCiORROacuteN HUERTA

Table CP1D-F

jouer des coudes

cracher en lair

baigner dans lhuile

rouler au super

aller agrave la selle

aller aux asperges

B

+

+

+

---

F

+

+

+

+

+

+

Q +

+

-+

+

-

s +

-+

+

--

Traduction

se frayer un chemin

faire qqch dinutile

marcher bien

rouler agrave lessence laquosuperraquo

aller deacutefeacutequer

aller se prostituer

classe

BFQS

BFQ

BFS

FQS

FQ

F

Cuadro 5

Tal y como habiacuteamos sentildealado para los diccionarios DELA en italiano portugueacutes coreano alemaacuten se estaacuten realizando actualmente clasificaciones de estas estructuras Las locuciones adverbiales debido con toda probabilidad a su nuacutemero maacutes reducido han podishydo ya ser analizadas en varios idiomas M Gross para el franceacutes (1986) J Baptista para el portugueacutes (2002) M de Gioia para el italiano (2001) D Caacutetala en un tesis doctoral en (2003) para el espantildeol Tambieacuten Mirella Connena (U de Bariacute) estaacute realizando desde hace numerosos antildeos un inventario y su clasificacioacuten de los refranes en italiano y franceacutes desde una perspectiva comparada y traductoloacutegica

Vemos pues como poco a poco se van elaborando diccionarios electroacutenicos de las leacutexicas fraseoloacutegicas y de su gramaacutetica que palian paulatinamente el tradicional vaciacuteo que existiacutea en el estudio de estas formas

34 Aparicioacuten de la Onomasiologiacutea en los diccionarios electroacutenicos

Otra de las novedades maacutes interesantes que ha aportado el perfeccionamiento de la linshyguumliacutestica informaacutetica ha sido la posibilidad de cambiar el tradicional criterio de ordenacioacuten alfabeacutetica de las unidades seleccionadas En efecto aunque ya en el pasado algunos claacutesicos (Comenius Francis Bacon) defendieron la necesidad de una clasificacioacuten onomasiologravegica hasta ahora las clasificaciones semiasoloacutegicas que parten del significante para llegar al significado habiacutean ganado siempre la partida y se utilizaban por su indiscutible objetividad c imparcialidad frente a la siempre discutible subjetividad de las clasificaciones extralin-guumliacutesticas16 Una base de datos con una clasificacioacuten temaacutetica exhaustiva en campos leacutexicos nos permitiraacute encontrar en deacutecimas de segundo las expresiones de los cuadros 2 y 3 que son parasinoacutenimas e incluso de expresiones que sean antoacutenimas e incluso hipoacutenimas Ahora bien esta otra posibilidad de clasificacioacuten supone un esfuerzo de anaacutelisis del leacutexico muy riguroso para no caer en posibles errores contradicciones y lagunas como muy bien explica Antonio Pamies8 (1998 208)

16 Ademaacutes hay que sentildealar que ese tipo de clasificacioacuten que suponiacutea una catalogacioacuten muy costosa por parte del lexicoacutegrafo tambieacuten suponiacutea una labor de consulta lenta e incierta para el usuario que debiacutea a menudo someterse a un aprendizaje previo para consultar y utilizar correctamente esas clasificaciones 17 La nocioacuten de campo leacutexico tomada de la linguumliacutestica alemana que habla de campo semaacutentico desde Jost Trier ha sido seguida por nuacutemeros lexicoacutelogos como Wartburg G Matoreacute P Guiraud E Coseriu bien en una lengua o en varias lenguas consiguiendo de esla forma estructuras diferenciadas diferencias morfosemaacutenticas socioculturales histoacutericas etimoloacutegicas etc 18 Criterios para una fraseografiacutea onomasiologravegica automatizablc (1998)

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 13: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 393

El primer peligro procede de la sinonimia entre descriptores pej el lexicoacutegrafo puede asignar en un momento dado el descriptor DINERO a un refraacuten como lo barato sale caro iquestpero queacute garantiacutea tenemos de que el usuario no pregunte por COMERCIO Tampoco hay garantiacuteas de que el mismo lexicoacutegrafo asigne unos meses maacutes tarde el descriptor ECONOshyMIacuteA o incluso AVARICIA a un duro es un duro con lo cual ambas expresiones quedariacutean desconectadas para siempre en el pozo sin fondo de la base de datos

4 PROPUESTA DE CONTENIDOS DE UN DICCIONARIO ELECTROacuteNICO DE UFS

Acabamos de pasar revista a los diferentes modelos de diccionarios electroacutenicos utishylizados en linguumliacutestica computacional que nos van servir a continuacioacuten para elaborar un diccionario electroacutenico de locuciones verbales19 multilingue que sea por un lado una obra de referencia y de consulta para cada idioma debido a su exhaustividad y que facilite por otro lado la traduccioacuten la comprensioacuten y la correcta utilizacioacuten gramatical y contextual de estas formas en las lenguas analizadas

La primera fase de este diccionario seriacutea la de elaborar individualmente en cada una de las lenguas de trabajo un repertorio lo maacutes completo posible que supla las deficiencias de contenido en materia fraseoloacutegica de losdiccionarios claacutesicos

mdash Sumando los contenidos de varios de ellos (por ej DUE DRAE LBI Enciclopedia Larousse etc) Que a veces presentan notables diferencias Ver I Santamariacutea (2003 105-107) en las que presenta una propuesta sobre las unidades fraseoloacutegicas de la entrada agua elaborada a partir de las subentradas de varios diccionarios manejados en su obra

mdash Incorporando las creaciones de la lengua activa realizando filtros a partir de nuestra competencia leacutexica y haciendo encuestas a personas de diferentes regiones de cada paiacutes para estar seguros de que no se trata de localismos

Conviene insistir en que en este tipo de trabajos aunque su finalidad sea un diccionario fraseoloacutegico multilingue esta primera fase debe realizarse primero individualmente para cada uno de los idiomas pues si se parte de una uacutenica lengua de trabajo se corre el riego de privilegiar uno de los idiomas que seriacutea tomado como referente dejando de lado un gran nuacutemero de locuciones verbales que podremos a continuacioacuten denominar LV(S) propias y caracteriacutesticas a la idiosincrasia histoacuterica y cultural de la comunidad linguumliacutestica de cada una de las otras lenguas2 Posteriormente en una segunda etapa se realizaraacute una puesta en comuacuten en la que siacute se deberaacuten realizar cruces entre los diferentes inventarios linguumliacutesticos y en la que alternativamente cada idioma seraacute considerado como lengua de trabajo para inshytentar incorporar Locuciones verbales de uso frecuente y conocidas que se hubiesen podido olvidar

A la par que se elabora el repertorio se puede iniciar tambieacuten otra parte de este dicshycionario electroacutenico que consistiraacute en clasificar cada LV en clases sintaacutecticas en funcioacuten de sus componentes para poder averiguar las propiedades distribucionales y transforma-

19 Se podriacutea aplicar exactamente el mismo proceso de anaacutelisis y trabajo a las demaacutes UFS Que tradicionalmente se han dividido las locuciones seguacuten su funcioacuten oracional (nominal adverbial adjetival verbal) Ver Corpas 1996 93-94 20 Los trabajos de lexicologiacutea plurilinguumles realizados a partir de un idioma padecen de lo que Alain Rey (1992 102) ha llamado laquoTerminologie de deacutepartraquo

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 14: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

394 PEDRO MOGOKROacuteN HIJIRTA

cionales que poseen (sujeto humano o no humano reacutegimen preposicional posibilidad de transformacioacuten en forma pasiva etc) Queremos recordar que el soporte informaacutetico en sus muacuteltiples buacutesquedas solamente analizaraacute y trataraacute la informacioacuten sintaacutectica que el lexicoacutegrafo linguumlista le hayan clasificado Por lo tanto esta labor es maacutes importante de lo que pueda parecer pues sin ella durante el tratamiento de textos no se reconoceriacutean muchas de las formas tratadas que estuviesen utilizando en ese momento alguna de las propiedades transformacionales Ademaacutes permite consultar las posibles construcciones de las unidades leacutexicas en caso de duda pues siempre se representan en el diccionario electroacutenico bajo su forma maacutes extensa

Un vez terminado el anaacutelisis sintaacutectico de las clases en cada idioma se dispondraacute en cada lengua de una cantidad enorme de informacioacuten linguumliacutestica que el soporte informaacutetico podraacute gestionar en una labor de siacutentesis estableciendo

mdash para cada lengua el tipo de estructura maacutes utilizado las palabras leacutexicas maacutes utishylizadas la cantidad de LVS que admiten la posibilidad de modificar su estructura parcialmente con variantes paradigmaacuteticas sin cambiar de significado y sin dejar de ser una unidad leacutexica fijada etc

mdash Estudios y paralelismos contrastivos acerca de numerosiacutesimos aspectos linguumliacutesticos las preposiciones y su correspondencia la determinacioacuten maacutes utilizadas como ejemshyplo pondremos la mayor utilizacioacuten por parte del franceacutes de determinantes posesivos que en espantildeol ver cuadro 6

Hablar entre sus dientes

Echar agua al vino

Comerse las palabras

Bajarse los pantalones

Meter las narices en algo

Parler entre ses dents

Mettre de leau dans son vin

Manger ses mots

Baisser son pantalon

Mettre son nez dans

Cuadro 6

Simultaacuteneamente a la recopilacioacuten y a la clasificacioacuten sintaacutectica se procederaacute tambieacuten a un tercer tipo de clasificacioacuten para cada entrada Esta vez se trata de una clasificacioacuten semantica mediante la cual se agruparan las LV en campos leacutexico-fraseoloacutegicos En estos campos se realiza la descripcioacuten sintaacutectica y semaacutentica de cada entrada articulaacutendola de forshyma maacutes precisa en subclases llamadas geneacutericamente clases de objeto o clases semaacutenticas Se procederaacute asiacute a utilizar unos macro campos temaacuteticos por ejemplo el de las locuciones verbales de los actos del discurso A su vez se dividiraacuten estos macro campos en clases de obshyjetos especificando sus argumentos conceptuales orden insulto afirmacioacuten agradecimiento disculpas acusacioacuten felicitacioacuten etc Si se sistematiza la caracterizacioacuten de los diferentes empleos de las unidades leacutexicas analizadas en clases semaacutenticas se podriacutea resolver gran nuacutemero de ambiguumledades debida a la polisemia ya que cada UL se integra dentro del tratashymiento automaacutetico mediante un marcado de argumento

La constitucioacuten de estos campos temaacuteticos van a permitir establecer con toda claridad relaciones de polisemia antonimia sinonimia hiponfmia etc que seraacuten muy importantes para poder encontrar la unidad fraseoloacutegica maacutes equivalente en traduccioacuten

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 15: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

L o s DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 3 9 5

Los anaacutelisis y las agrupaciones conceptuales o temaacuteticas de las UFS resultan muy neshycesarios y uacutetiles para la fraseologiacutea Tanto para en una determinada lengua como en fraseoshylogiacutea comparada ya que se pueden entonces al tomar el campo temaacutetico al completo como punto de referencia realizar numerosas observaciones similitudes diferencias entre los sisshytemas linguumliacutesticos analizados Pero quizaacutes la maacutes interesante de todas ellas sea la de intentar encontrar entre las diferencias linguumliacutesticas y culturales que presentan las lenguas entre siacute las huellas de que a pesar de esas grandes variaciones debe existir tambieacuten un nuacutecleo comuacuten del entendimiento entre los seres humanos basado en una conceptualization al menos parshycialmente comuacuten y que podriacutea tambieacuten tener algunos patrones gramaticales comunes coinshycidentes En efecto no en vano Lakoff (1987448) destacaba ya la importancia que suponiacutea para la fraseologiacutea y la traduccioacuten el que numerosas UFS fuesen signos motivados

41 Localization y presentacioacuten de las LV en el diccionario electroacutenico

La inclusioacuten de las LV o de cualquier UF en los diccionarios claacutesicos le plantea al lexishycoacutegrafo los consabidos problemas de lugar ordenacioacuten y bajo queacute entradas hacerlas figurar Sin duda la mejor opcioacuten para el usuario de los diccionarios habriacutea consistido en hacer aparecer las locuciones en cada uno de los componentes que tenga un significado leacutexico21 aunque esta solucioacuten no ha sido utilizada hasta ahora porque habriacutea supuesto obras poco rentables econoacutemicamente debido a sus considerables dimensiones Por el contrario los diccionarios electroacutenicos permiten gracias a la informaacutetica superar esas dificultades y hacer figurar cualquier locucioacuten bajo todos los componentes de la expresioacuten con la excepcioacuten de los componentes gramaticales como preposiciones determinantes etc Si mientras que las LV

mdash cantar(le) las cuarenta a alguien mdash arrimar el ascua a su sardina mdash venirse el ciclo abajo figuran en el DRAE y en el DUE bajo las entradas cuarenta ascua y cielo en el

diccionario electroacutenico que estamos elaborando se podraacuten encontrar gracias a todos sus componentes leacutexicos es decir cantar cuarenta arrimar ascua sardina venirse cielo y hasta abajo Pero ademaacutes no tenemos que olvidamos de la clasificacioacuten semaacutentica que hemos avanzado y que permitiraacute a su vez buscar las LV por contenido semaacutentico en el caso de no recordar alguna forma pero siacute el concepto

Ciertas UFS tambieacuten plantean problemas de localization y de presentacioacuten en los dicshycionarios tradicionales Se trata de aquellas unidades que presentan variantes paradigmaacutetishycas22 es decir que se pueden cambiar elementos sin alterar el significado Mogorroacuten (2002 63-64)

mdash seguir (mantenerse permanecer) en sus trece mdash Ganarse la vida (las habichuelas el cocido) Deberaacuten figurar todas las posibles variantes que a menudo no aparecen en los diccionashy

rios claacutesicos ver cuadros 2 y 3 para facilitar la labor de buacutesqueda Ademaacutes deberemos a

21 Ya en 1971 Zgusta sugeriacutea la posibilidad de incluir las Unidades fraseoloacutegicas bajo la entrada de cada uno de sus componentes que tuviese significado leacutexico Estas unidades seguacuten la terminologiacutea de L Tcsniegravere (1959 53) se podriacutean llamar laquomots pleinsraquo en oposicioacuten agrave los laquomots-videsraquo non reacutefeacuterentiels 22 Variantes en sentido estricto seguacuten Zuluaga (1980)

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 16: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

396 PEDRO MOGORROacuteN HUERTA

partir de una buacutesqueda en corpus (ver apartado siguiente) averiguar cual de las variantes es la maacutes utilizada para indicarlo a los usuarios y aprendices

42 Informacioacuten diasistemaacutetica

Ahora bien dado que la finalidad del diccionario electroacutenico de locuciones verbales que estamos realizando estaacute orientada principalmente a la traduccioacuten su conceptualizacioacuten y elaboracioacuten exigiraacute no solamente (como ya hemos presentado) unas clasificaciones y unos anaacutelisis morfoloacutegicos sintaacutecticos y semaacutenticos lo maacutes completos posibles sino que ademaacutes deberaacute disponer de cierta informacioacuten igualmente imprescindible para esa finalidad para poder ajustarse a otras caracteriacutesticas propias a cada lengua Se trata de toda la informacioacuten llamada diasistemaacutetica (Ver cuadro 1 paacuteg 5) Pues en toda lengua cada unidad leacutexica estaacute caracterizada ademaacutes de por su significado por una serie de informaciones linguumliacutesticas o de connotaciones contextuacuteales usadas por los miembros de las comunidades linguumliacutesticas a veces conscientemente a veces inconscientemente que deben ser sin embargo tenidas en cuentas en el proceso de traduccioacuten pues sino se corre el riesgo de traducir uacutenicamente el significado general de la UL sin reflejar una marcas caracteriacutesticas de grupos sociales usos regionales generacionales frecuencias de uso expresiones en desuso etc

La mayoriacutea de estas caracteriacutesticas no vienen reflejadas ni en los diccionarios generales ni en los bilinguumles por lo que se dificulta loacutegicamente el acto de traduccioacuten De todas ellas pensamos que nuestro diccionario electroacutenico deberiacutea mencionar al menos las siguientes diastraacutetico23 diatoacutepico diacrogravenico diateacutecnico diatextual diafrecuencia

Estas informaciones diasistemaacuteticas de las que nos gustariacutea poder disponer nos situacutean de lleno frente a otro de los grandes problemas de los trabajos lexicograacuteficos A saber el de la frecuencia y vigencia de uso de las unidades que componen el diccionario Tenemos que catalogar cada LV de tal forma que sepamos por un lado si constituye una muestra represhysentativa de la lengua utilizada por una comunidad linguumliacutestica en una determinada eacutepoca y ademaacutes por otro lado su frecuencia de uso para averiguar la importancia relativa de esa misma UL en el conjunto del vocabulario de una lengua No tenemos que olvidar que todo sistema linguumliacutestico estaacute en continua transformacioacuten y readaptacioacuten y que esa informacioacuten debe estar disponible para que el usuario sea capaz de interpretarla y de adecuarla a otro sisshytema linguumliacutestico Para ello deberemos hacer uso de los corpus linguumliacutesticos Se trata de unos conjuntos de textos en formato electroacutenico (podraacuten ser documentos completos o conjuntos de fragmentos de mayor o menor extensioacuten) que son una muestra representativa de la lenshygua y que permiten al lexicoacutegrafo realizar una investigacioacuten con datos objetivos24 Gracias a la rapidez y fiabilidad de la informaacutetica ya se pueden consultar hoy en diacutea diferentes tipos

23 Si bien los niveles estaacutendar y culto no presentan demasiados problemas de identificacioacuten convendriacutea quizaacutes a la vista de los desfases existentes en los diferentes diccionarios consultados ya citados limitar el nuacutemero de los siguientes registros familiar popular coloquial algeacutetico) (Ver Mogorroacuten 2002 67-71) y proceder a una unificashycioacuten de criterios que permita realizar una valoracioacuten y catalogacioacuten rigurosa 24 El procesamiento de todos los datos de los corpus permite en un tiempo record detectar fenoacutemenos y pashytrones incluso de baja frecuencia que las muestras no permiten a simple vista detectar determinar la vigencia de los fenoacutemenos gramaticales analizar su distribucioacuten a lo largo de la evolucioacuten de una lengua almacenar grandes cantidades de textos para despueacutes analizarlos seleccionar los textos maacutes representativos para enfocar la investigashycioacuten a desarrollar etc

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 17: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 397

de Corpus en funcioacuten de la idiosincrasia y de las necesidades de cada diccionario Asiacute el Corpus diacrogravenico del espantildeol (CORDE) que refleja la evolucioacuten histoacuterica de la lengua espantildeola el Corpus de referencia del espantildeol actual (CREA) que presenta una enorme cantidad de textos escritos y orales de todos los paiacuteses de habla hispana con maacutes de 100 Millones de palabras

Sentildealamos ademaacutes como muestra los siguientes corpus

FRANTEXT

British National Corpus

Brown Corpus

Cobuild

150 M de palabras para el idioma franceacutes

100 M de palabras en Ingleacutes

100 M de palabras en Ingleacutes americano

450 m de palabras en ingleacutes

Los medios mediaacuteticos son utilizados actualmente cada vez con maacutes frecuencia para la elaboracioacuten de corpus y que de todos los medios mediaacuteticos sin ninguna duda el que brilla con luz propia es el macro medio representado por Internet Hay que sentildealar los enormes recursos disponibles en Internet y la posibilidad de utilizar buscadores para localizar los documentos uacutetiles Ademaacutes se estaacuten formando laboratorios de linguumliacutestica informatizada especializados en convertir los textos de numerosas versiones electroacutenicas de perioacutedicos en corpus electroacutenicos Sentildealamos entre ellos a GlossaNet que utilizando unos programas con amplios recursos linguumliacutesticos enviacutea los resultados de las buacutesquedas por e-mail

5 LA TRADUCCIOacuteN DE LAS LV Y EL DICCIONARIO ELECTROacuteNICO

Traducir significa buscar la mejor forma posible de pasar de un idioma a otro un texto en el que el traductor tiene que conseguir reconstruir el mensaje Ademaacutes tiene que intentar reproducir abundante informacioacuten de tipo linguumliacutestico estiliacutestico cultural social etc que suele estar presente en todo enunciado Para traducir los traductores suelen consultar tanto los diccionarios monolingues como los bilinguumles en busca de esa tan preciada informacioacuten Sin embargo a pesar de la importancia de la informacioacuten que debe figurar en los diccionashyrios el escaso tratamiento dado a las UFS por estos uacuteltimos ha permitido no solamente que eacutestas siguiesen siendo unas grandes desconocidas para el usuario en general debido a las dificultades de consulta y aprendizaje sino que ademaacutes ese desconocimiento llegoacute a hacer pensar a algunos teoacutericos que las expresiones idiomaacuteticas eran generalmente intraducibies

Toda la informacioacuten (morfoloacutegica sintaacutectica diasistemaacutetica semaacutentica) que vamos a recabar durante la elaboracioacuten de nuestro diccionario electroacutenico para cada LV nos permitishyraacute conslituir un banco de datos de incalculables prestaciones Lo que siacute estaacute claro es que un trabajo de esa magnitud es muy necesario pues va a permitir por un lado a los usuarios de la lengua conocer la gran mayoriacutea de las LV existentes con sus significados y sus variantes Por otro lado tambieacuten va a permitir a los traductores y a los estudiantes extranjeros al reashylizar el mismo trabajo individualizadamente para no privilegiar o permitir que un idioma de partida influyese sobre los otros que eacutestos encuentren la traduccioacuten mas adecuada

Para ello se utilizaraacuten dos fases En una primera fase gracias al diccionario electroacutenico y a su soporte informaacutetico reashy

lizaremos una buacutesqueda alfabeacutetica y semaacutentica de una determinada LV y de las LVS que

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 18: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

398 PUDRO MOGORROacuteN HIIHRTA

dentro del mismo campo semaacutentico sean sinoacutenimas antoacutenimas hipoacutenimas25 Esta es una traduccioacuten sistemaacutetica que tiene por objeto encontrar gracias a la elaboracioacuten de un paradigshyma de unidades leacutexicas relacionadas por el significado en la lengua fuente y a un paradigma similar para la lengua meta el equivalente maacutes proacuteximo de las LV que queramos traducir Ejemplo cuando algo vale mucho dinero hemos encontrado los paradigmas siguientes en espantildeol y en franceacutes

13 CostarValer un ojo de la cara (DUE) 14 Costar un rintildeon (DUE) 15 Costar un Potosiacute (DUE)

16 Costar un huevo (y la yema del otro) 17 Costar un cojoacuten 18 Costar maacutes que una querida 19 Costar maacutes que un hijo tonto

1 Coucircter un prix fou 2 Coucircter les yeux de la tecircte (PR fam) 3 Coucircter la peau du dos (th 1 fam) 4 Coucircter la peau des fesses (AR tregraves fam) 5 Coucircter la peau du cul (AR tregraves fam) 6 Coucircter la peau des miches (AR tregraves fam) 7 Coucircter la peau des couilles (ARtregraves fam)

Podemos observar las siguientes caracteriacutesticas En las expresiones espantildeolas la ndeg 15 costar un Potosiacute pertenece al tipo de expresiones

que tienen una palabra diacriacutetica o al menos una referencia a su pasado histoacuterico mientras que en las palabras francesas no hay ninguna de las expresiones con alguna palabra de este tipo

Las expresiones espantildeolas 13 y 14 y la nuacutemero 1 francesa pertenecen al mismo registro de lengua estaacutendar

Las expresiones espantildeolas 16 17 18 y 19 no aparecen en los diccionarios espantildeoles y pertenecen por lo tanto a la lengua oral y familiar (pero no hay ninguna indicacioacuten que nos indique a queacute registro de lengua exacto pertenecen)

Las expresiones francesas 2 y 3 pertenecen al registro familiar Las expresiones francesas 4 5 6 y 7 pertenecen al registro muy familiar En una segunda fase en la que tendremos en cuenta que no se deben en la medida de

lo posible traducir palabras aisladas aplicaremos ese criterio a la traduccioacuten de las LVS En efecto en la praacutectica el traductor no se enfrenta generalmente a estas unidades de forma aislada sino dentro de un contexto Por lo tanto realizaremos o buscaremos contextos para estas U leacutexicas Esta operacioacuten que se ha llegado a realizar manualmente26 en un costoso proceso de lectura supondriacutea para un corpus de unas 20000 locuciones verbales como el que estamos elaborando una investigacioacuten imposible de realizar debido al coste en tiempo y personal necesario para localizar esos textos Sin embargo hoy en diacutea esas operaciones se pueden realizar como hemos visto en el apartado anterior con la elaboracioacuten de los corpus mecaacutenicamente en un raacutepido proceso gracias a las posibilidades de gestioacuten y localizacioacuten de datos de los programas informaacuteticos

25 Toda la informacioacuten del diccionario electroacutenico que estamos elaborando en varios idiomas nos va a permitir realizar operaciones de fraseologiacutea conlrasuumlva Eacutesta persigue como objetivo general la determinacioacuten de las semeshyjanzas y diferencias existentes entre los diferentes sistemas fraseoloacutegicos analizados estudiando las correspondenshycias sintaacutecticas y las relaciones semaacutenticas de cada lengua analizada 26 Hoy en diacutea en aquellos corpus basados en obras literarias con derecho de autor auacuten se tiene que hacer mashynualmente

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 19: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

LOS DICCIONARIOS ELECTROacuteNICOS FRASEOLOacuteGICOS PERSPECTIVAS PARA LA LENGUA Y LA TRADUCCIOacuteN 399

Los diccionarios electroacutenicos permiten ademaacutes gracias a su gran capacidad de memoshyria incorporar esos corpus con referencias a fuentes textuales en las que se han encontrado esas expresiones y almacenarlas almacenarlas y tratar solamente una parte de esa informashycioacuten o tratarla en su totalidad sin que ello afecte en nada el volumen de la obra cosa que un diccionario en soporte papel no permite debido a la importancia que representa en su concepcioacuten el tamantildeo del soporte papel Hasta la aparicioacuten y el perfeccionamiento de la informaacutetica no se podiacutea sontildear con poder realizar todos esos procesos tan necesarios para poder sacar conclusiones apoyadas en ejemplos

6 RECAPITULATIVO Y PERSPECTIVAS

La traduccioacuten de las unidades fraseoloacutegicas supone para cualquier traductor que se precie de serlo un verdadero reto debido al escaso tratamiento que han tenido en los diccioshynarios y a la escasa informacioacuten que se puede conseguir acerca de las propiedades de estas unidades leacutexicas Despueacutes de mostrar esas deficiencias en la primera parte de este trabajo hemos expuesto los diferentes tipos de diccionarios electroacutenicos surgidos recientemente que combinan a la par la lengua y la informaacutetica para el tratamiento automaacutetico del lenguaje (TAL) para elaborar gramaacuteticas electroacutenicas (Lexique-grammaire) y diccionarios semasioshyloacutegicos en los que la semaacutentica hace su aparicioacuten Ahora bien la elaboracioacuten de un diccioshynario representa una labor meticulosa y compleja que se inserta en un proyecto ambicioso que debe desarrollarse a largo plazo maacutexime cuando como el que nosotros proponemos y estamos ya realizando reuacutene caracteriacutesticas de los tres simultaacuteneamente

Con vistas al futuro se estaacuten desarrollando proyectos relacionados con el aprendizaje aushytomaacutetico con el disentildeo de sistemas capaces de procesar y etiquetar informacioacuten multimedia y tambieacuten capaces de tratar esa informacioacuten para aplicarla en traduccioacuten automaacutetica recoshynocimiento de palabras y construccioacuten de corpus Por lo tanto o mucho nos equivocamos o los diccionarios electroacutenicos estaacuten destinados a ser utilizados en un futuro cada vez maacutes por estudiantes de un idioma extranjero usuarios de ese idioma traductores que deseen servirse de una herramienta de trabajo potente y raacutepida que les facilite mucho la labor manual que en numerosos casos veniacutean desarrollando hasta la fecha

REFERENCIAS BIBLIOGRAacuteFICAS

Alvar Ezquerra M (1981) laquoLos diccionarios bilinguumles su contenidoraquo Linguumlistica Espantildeola Actual II 1 175-196 (Reeditado en el capiacutetulo 8 de Lexicografiacutea descriptiva 1993 Barcelona biblio-graf)

Alvar Ezquerra M (2002) Los diccionarios de ayer y hoy Granada Comares Bally C (1909=1951) Traiteacute de stylistique franccedilaise Vol1 Paris Librairie Klincksieck Baptista J Caacutetala D (2002) laquoCompound temporal Adverbs in Portuguese and in Spanishraquo Adshy

vanced in Natural Language Processing Berlin Springer paacutegs 173-176 Blanco Escoda X (1999) laquoiquestCoacutemo leer un diccionario Algunos aportes de la linguumliacutestica informaacutetishy

caraquo Cenariacuteas Interactivos Arte e tecnologiacutea Escola Superior de Educaccedilagraveo Santarem paacutegs 117-127

Blanco X (2002) laquoLes deacuteterminants figeacutesraquo Langages 145 paacutegs 61-81 Casas Goacutemez M (1999) Las relaciones leacutexicas Tubingen Max Niemeyer Verlag Caacutetala Guitart D (2003) Les adverbes composeacutes Approches contrastives en linguistique appliqueacutee

Thegravese de doctorat UAB

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang

Page 20: LOS DICCIONARIOS ELECTRÓNICOS FRASEOLÓGICOS, · 2012-10-23 · usuarios de un diccionario son la polisemia y la fijación léxica, «escribir » o «leer» un dic cionario consiste

400 PEDRO MOGORROacuteN HUERTA

Corpas Pastor G (1997) Manual de fraseologiacutea espantildeola Madrid Gredos Corpas Pastor G (2003) Diez antildeos de investigacioacuten en fraseologiacutea Vervuert Linguumliacutestica Iberoashy

mericana De Gioia M (2001) Avverbi idiomatici dellitaliano Analisi lessico-grammaticale Torino

LHarmattan Italia Escoda Cabreacute M (2004) Preclasificaciocircn automaacutetica de las secuencias NA para la elaboracioacuten de

diccionarios electroacutenicos multilingues Trabajo de investigacioacuten de 3er ciclo y magravester Europeo TALN UAB

Garciacutea Page M (1998) laquoExpresioacuten Aja y sinonimiaraquo GWotjak eacuted Estudios de fraseologiacutea y fraseo-grafiacutea del espagnol actual Frankfurt am Main-Madrid Vervuert-Iberoamericana paacutegs 195-201

Gross M (1982) Une classification des phrases laquofigeacuteesraquo du franccedilais Revue Queacutebeacutecoise de linguisshytique vol 11 ndeg 2 paacutegs 151-185

Gross M (1986) Grammaire transformationnelle du franccedilais Syntaxe de ladverbe Paris ASS-TRIL

Gonzalez Rey I (2002) La phraseacuteologie du franccedilais Toulouse Presses Universitaires du Mirail Guiraud P (1955=1969) La seacutemantique Paris PUF Jespersen O (1926) The philosophy of grammar London Allen amp Unwin Ltd Lakoff G (1987) Women Fire and Dangerous Things What categories Reveal about the Mind

University of Chicago Lamiroy B Ledere C Klein J-R Labelle J (2003) laquoLes expressions verbales figeacutees dans quashy

tre varieacuteteacutes du franccedilais Le projet laquoBFQSraquoraquo Cahiers de Lexicologie 83 Paris Champion paacutegs 153-172

Luque Duran J de D A Pamies Bertraacuten (eds) (1998) Leacutexico y fraseologia serie Collectae Grashynada

Martiacuten R (1996) laquoSur les facteurs du figement lexicalraquo La locution entre langue et usage Paris Eacuteditions Fontenay saint-Cloud

Mejri S (2003) laquoTraduction linguistique Problegraveme terminologique ou construction conceptuelleraquo En Salah Mcjri Taiumleb Baccouche Andreacute Class Gaston Gross (dirs) Traduire lu langue Traduire la culture Tunis Maisonneuves amp Larose paacutegs 177 191

Melcuk I (1984) Dictionnaire explicatif et comhinatoire du franccedilais contemporain Recherches iexclexico-seacutemanliques vol 1 Les presses de luniversiteacute de Montreacuteal

Mogorroacuten Huerta P (1996) laquoLes expressions figeacutees des verbes ser et estar suivies de Preacutep x Linguis-ticae iexclnvestigationes XX 1 AmsterdamPhiladelphia John Benjamins 3-32

Mogorroacuten Huerta P (2002) La expresividad en las locuciones verbales en franceacutes y en espantildeol Pushyblicaciones de la Universidad de Alicante

Pamies A Baacutelmacz M y Inesta E (1998) Criterios para una fraseografigravea onomasiologravegica auio-matizable

Penadcs Martinez I (2002) Diccionario de locuciones verbales Madrid ArcoLibros Rey A (1979=992) La terminologie Noms et notions Presses Universitaires de France Rey-Debove J (1971) Etude linguistique et seacutemiotique des dictionnaires franccedilais contemporains

Pariacutes-La Haya Mouton Ruiz Gurillo L (1997) Aspectos de fraseologiacutea teoacuterica espantildeola Valencia Universidad Santamariacutea Peacuterez I (2003J La fraseologiacutea espantildeola en el diccionario bilinguumle espantildeol-catalaacuten

aplicaciones y contrastes Publicaciones Universidad de Alicante Zgusta (1971) Manual of lexicography The Hague - Paris Mouton Zuluaga A (1980)- Introduccioacuten al estudio de las expresiones fijas Frankfort ndeg 10 de Studia Roshy

mancia Verlag Peter Lang