abstract from "cataloging in the era of the semantic web: arabic, cyrillic and chinese...

86
ABEI - Associazione bibliotecari ecclesiastici italiani Giornata di studio 2010 La catalogazione nell’era del web 3.0 Introduzione agli strumenti d’uso per la catalogazione del materiale in alfabeto cirillico, arabo, cinese. relatore dr. Paolo Tentori, novantiqua multimedia MARC21

Upload: paolo-tentori

Post on 12-Jan-2015

3.069 views

Category:

Education


1 download

DESCRIPTION

Abstract della giornata di studio in preparazione per l'ABEI sulla catalogazione multilinguistica.

TRANSCRIPT

Page 1: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

ABEI - Associazione bibliotecari ecclesiastici italiani

Giornata di studio 2010

La catalogazione nell’era del web 3.0Introduzione agli strumenti d’uso per la catalogazione

del materiale in alfabeto cirillico, arabo, cinese.

relatore dr. Paolo Tentori, novantiqua multimedia

MARC21

Page 2: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

Introduzione

Questa giornata di studio nasce per rispondere ad una richiesta sempre più pressante che si presenta in ambito bibliotecario: l’aumento di utenti stranieri con esigenza di accedere a libri in lingua d’origine e l’abbondante disponibilità di letteratura circolante in alfabeti diversi da quello latino. Se è giusto ribadire che internet non è il ‘sostituto’ degli strumenti scientifici che si acquisiscono in modo specialistico nel proprio iter di studi (biblioteconomia, codicologia, paleografia, filologia) resta vero che oggi è possibile usare mezzi nuovi che ci aiutano ad ottimizzare il ‘lavoro’ di bibliotecari.La presente giornata di studio è propedeutica ad un corso vero e proprio di catalogazione delle risorse. Da un punto di vista biblioteconomico, per i partecipanti, sono necessarie basi scientifiche già acquisite mentre per l’aspetto linguistico non si richiederebbe che l’apprendimento ‘agevole’ dell’alfabeto cirillico ed arabo (che è cosa ben diversa dalla padronanza delle rispettive lingue che rappresentano, come ad es. il russo o l’arabo classico). Questa conoscenza non ‘ruberebbe’ che poche settimane di studio per essere acquisita. Un po’ diverso il discorso per il cinese di cui comunque si spiegano i rudimenti per muoversi agevolmente in traduzioni automatiche per quanto riguarda la letteratura basata su font accessibili (documenti testuali di diversa natura: doc, pdf, txt. Il testo su immagini può comunque essere trasformato in font ed essere rielaborato usando gli strumenti spiegati in seguito).

Page 3: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE

Per traslitterazione, o translitterazione, in senso stretto si intende la trascrizione di una parola, di una locuzione o di un testo mediante un sistema alfabetico di arrivo diverso dall’originale, seguendo uno specifico schema di trasformazione che fa corrispondere a ciascuna lettera (o a ciascuno di taluni particolari gruppi di lettere) una o più lettere, in modo da permettere la ricostruzione del testo originale anche solo in base alla conoscenza del suddetto schema.

Questa operazione può portare a scritture che lette nella lingua di arrivo vengono pronunciate con suoni sensibilmente diversi da quelli della lettura nella lingua originaria.

Una trasformazione del testo originario volta a rispettare il più possibile la pronuncia viene invece chiamata trascrizione.

Va osservato che il termine traslitterazione viene usato in senso lato per esprimere anche la trascrizione.

In italiano si usa traslitterare le parole greche, quelle delle lingue che usano caratteri cirillici, le arabe, l’ebraico e delle altre lingue, parlate o del passato, di cui la maggioranza dei lettori non conosce il sistema di segni grafici.

Il cinese è traslitterato attraverso il sistema Hànyǔ Pīnyīn.

Bibliografia: http://it.wikipedia.org/wiki/Traslitterazione

Page 4: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE: GLI STANDARD

Il problema degli standard di traslitterazione tra le varie lingue è molto sentito dagli organismi internazionali ed è anche un ambito strategico per una catalogazione normata a livello mondiale. Questo punto viene accennato di sfuggita nella presente conferenza mentre farà parte di una sezione vera e propria del corso. Si ricordano velocemente i principali standard. Per l’arabo: ALA-LC (American Library Association - Library of Congress), ISO 233 e ISO233/2.Per le lingue slave: RICA ISO R9; traslitterazione scientifica; traslitterazione anglosassone.Per il cinese: Hànyǔ Pīnyīn (ISO 7098:1982, sostituito dall’ ISO 7098:1991), ALA-LC.

Bibliografia: http://archive.ifla.org http://www.iccu.sbn.it

Page 5: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

UN ESEMPIO DI APPLICAZIONE DEGLI STANDARD INTERNAZIONALI NELLA CATALOGAZIONE MULTILINGUE

A livello biblioteconomico si è ormai in una fase ampiamente oltre la semplice traslitterazione. Applicando alcuni standard come MARC21 e UNICODE è possibile catalogare su più alfabeti in versione originale. Riportiamo alcuni esempi gentilmente forniti da Vittorio Merlo e contenuti presso la Bibliothèque de la Cour de justice de l’UE in Lussemburgo. Il catalogo non è al momento accessibile al pubblico mentre esempi di abstract dalle schede sono visibili in più lingue (tra cui cirillico e greco) nella sezione Bibliographie courante del sito curia.europa.eu.

Bibliografia: http://curia.europa.eu

Page 6: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

UN ESEMPIO DI APPLICAZIONE DEGLI STANDARD INTERNAZIONALI NELLA CATALOGAZIONE MULTILINGUE

Un esempio di record (in compilazione) per una pubblicazione in bulgaro.

Bibliografia: http://curia.europa.eu

Page 7: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

UN ESEMPIO DI APPLICAZIONE DEGLI STANDARD INTERNAZIONALI NELLA CATALOGAZIONE MULTILINGUE

Il record coi campi compilati in lingua originale. Software usato Simphony di SirsiDynix.

Bibliografia: http://curia.europa.eu http://www.sirsidynix.com

Page 8: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

PROBLEMATICHE DI TRASLITTERAZIONE IN LINGUE DIVERSE

Come riferito dai coordinatori di GUMARC 21 (Gruppo Utenti MARC 21 di lingua italiana), Alejandro Gadea Raga e Angela Contessi, ospitato presso la Biblioteca dell’Università Cattolica, la questione traslitterazione/trascrizione è piuttosto complessa in riferimento a lingue diverse. Ci sono standard per la traslitterazione, ma essendoci alla base un approccio fonetico normalmente il modo di traslitterare differisce nelle varie lingue: solitamente gli standard servono per l’inglese.Ad esempio, la traslitterazione di un autore russo moderno, pur impiegando le stesse regole di catalogazione, sarà diversa in francese, spagnolo, catalano e inglese. Più complessa ancora la descrizione dei titoli.

Bibliografia: http://millennium.unicatt.it/ http://www.loc.gov/marc/translations.html

Page 9: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

PROBLEMATICHE DI TRASLITTERAZIONE IN LINGUE DIVERSE

Quindi, la traslitterazione rischia di essere troppo locale, filologica, e molto probabilmente lontana dall’utente, che è quello che vuole accedere al documento. La soluzione che offrono i formati MARC è ottima, con i campi raddoppiati: consente la “traslitterazione / trascrizione” (anche la “trascrizione / traslitterazione”, solo trascrizione oppure solo traslitterazione) secondo l’interesse dell’agenzia catalografica, condizionata ovviamente dagli utenti e dalle disponibilità economiche.Nel Catalogo UCSC, ad esempio, si lavora alla catalogazione multilingue per la collezione cirillica.Pur non avendo indicizzato l’alfabeto cirillico i catalogatori si sforzano di derivare buone registrazioni in cui venga offerta oltre alla traslitterazione la descrizione in alfabeto cirillico con impiego dei campi MARC 880.Al di là di una buona traslitterazione, quando possibile, questo è sicuramente utile per gli specialisti, per cui è sempre meglio offrire la registrazione anche nell’alfabeto originale.

Bibliografia: http://millennium.unicatt.it/ http://www.loc.gov/marc/translations.html

Page 10: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

PROBLEMATICHE DI TRASLITTERAZIONE IN LINGUE DIVERSE

Sempre secondo i coordinatori di GUMARC 21: “Troviamo sicuramente una lunga tradizione di registrazioni MARC 21 multilingue nel catalogo della Library of Congress.Es.: LC Control No.: 2004391219 [cinese]Si può avviare la ricerca utilizzando il titolo cinese del presente record (trad.:La catalogazione in MARC della letteratura scientifica, di Wei Yi-chang): http://catalog.loc.gov/cgi-bin/Pwebrecon.cgi?Search_Arg=2004391219&Search_Code=STNO&PID=lrGz2FG-

Bibliografia: http://millennium.unicatt.it/ http://www.loc.gov/marc/translations.html

Page 11: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

PROBLEMATICHE DI TRASLITTERAZIONE IN LINGUE DIVERSE

E osservare ottime soluzioni nei cataloghi di Innovative Interfaces (Millennium e Encore), di ExLibris (Aleph) e SirsiDynix (Symphony-Unicorn):http://www.iii.com/solutions/university_hongkong.shtmlhttp://library.hku.hk/search/t “.

Bibliografia: http://millennium.unicatt.it/ http://www.loc.gov/marc/translations.html

Page 12: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

PROBLEMATICHE DI TRASLITTERAZIONE IN LINGUE DIVERSE

E anche Encore: Dragon 2.0http://encore.hku.hk/iii/encore/home?lang=eng “.

Bibliografia: http://millennium.unicatt.it/ http://www.loc.gov/marc/translations.html

Page 13: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONEEsempi di translitterazione:

ARABO Tra le diverse traslitterazioni usate nei paesi non-arabofoni, la seguente è una di quelle suggerite in un congresso internazionale degli orientalisti svoltosi a Roma nel 1938 (ma il problema traslitterazione e trascrizione per l’arabo è abbastanza complesso. Un buon articolo a proposito a cura di Enrico Galoppini è consultabile on line a questo sito http://www.corsiarabo.com/?p=143 :

A (alef) - ا ; B (ba) - ب ; T (ta) - ت ; TH (sa) - ث ; J - Ğ (gym) - ج ; H - Ḥ (ha) - ح ; KH (kha) - خ ;

D (dal) - د ; DH (dhal) - ذ ;

R (ra) - ر ; Z (za) - ز ; S (sin) - س ; SH - Š (schin) - ش ; Sad - Ṣ (sad) - ص ;

Dad - Ḍ (dad) - ض ; Ta enfatica - Ṭ (ta) - ط ; Za enfatica - Ẓ (zha) - ظ ;

Ayn -ʿ(ain) - ع ; GH - Ġ (gain) - غ ; F (fa) - ف ; Q (qaf) - ق ; K (ka) - ك ;

L (lam) - ل ; M (min) - م ; N (nun) - ن ;

Ha hafifa (ha’) - ه ; W (waw) - و ; Y (ja) - ي .

Gli allungamenti vocalici sono per la fatha ā - Ā; per la kasra ī - Ī e per la damma ū - Ū.

Bibliografia: http://it.wikipedia.org/wiki/Traslitterazione http://www.corsiarabo.com/?p=143

Page 14: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE

Bibliografia: http://www.musulmanesandaluces.org/ ( per le prime nozioni sull’alfabeto entrare nel link “MADRASA” e Lecciones: 1).

Schema di translitterazioneALA LC:

Page 15: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE

Esempi di translitterazione:

RUSSO Per traslitterare l’alfabeto cirillico della lingua russa si può fare riferimento al sistema raccomandato dall’ONU approvato nel 1987. Le coppie sono:

А - a, Б - b, В - v, Г - g, Д - d, Е - e, Ё -je, Ж - ž, З - z, И - i, Й - j, К - k, Л - l,

М - m, Н - n, О - o, П - p, Р - r, С - s, Т - t, У - u, Ф - f, Х - h, Ц - c, Ч - č,

Ш - š, Щ - šč, Ъ - “, Ы - y, Ь - ‘, Э - è, Ю - ju, Я - ja.

Molte le risorse on line per imparare l’alfabeto russo (basta scrivere “alfabeto russo” su Google).

Bibliografia: http://listen2russian.com/lesson01/a/index.html

Page 16: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE

Esempi di translitterazione:

CINESE Il discorso viene approfondito in seguito. Per un’introduzione al problema segnaliamo questi siti:

Bibliografia: http://www.omniglot.com/writing/mandarin_pts.htm http://www.pinyin.info/index.html

Page 17: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

ESEMPI DI TRASLITTERAZIONE DA CATALOGHI DI BIBLIOTECHE ITALIANE

Provincia di Ferrara - Schede bibliografiche bilingui per la letteratura russa:

Sito di riferimento: http://www.ibisweb.it/cdsfe/

Page 18: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

ESEMPI DI TRASLITTERAZIONE DA CATALOGHI DI BIBLIOTECHE ITALIANE

Università di Pisa - Schede catalografiche letteratura slava:

Bibliografia: catalogo unico Università di Pisa

Page 19: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

ESEMPI DI TRASLITTERAZIONE DA CATALOGHI DI BIBLIOTECHE ESTERE

Duke University Libraries - Schede bibliografiche per la letteratura cinese:

Sito di riferimento: http://find.library.duke.edu

Page 20: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

ESEMPI DI TRASLITTERAZIONE DA CATALOGHI DI BIBLIOTECHE ESTERE

Duke University Libraries - Schede bibliografiche per la letteratura russa:

Sito di riferimento: http://find.library.duke.edu

Page 21: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

ESEMPI DI TRASLITTERAZIONE DA CATALOGHI DI BIBLIOTECHE ESTERE

Duke University Libraries - Schede bibliografiche per la letteratura araba:

Sito di riferimento: http://find.library.duke.edu

Page 22: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

I LIMITI DELLA TRASLITTERAZIONE / TRASCRIZIONE SENZA RIFERIMENTO ALL’ALFABETO ORIGINALE

Negli esempi precedenti abbiamo visto varie proposte di soluzione per schede catalografiche on line. Ad es. per quanto riguarda l’Uni Pisa con il semplice uso del mouse è possibile passare dalla descrizioni standard ai dati UNIMARC. Il titolo è traslitterato secondo le norme UNI che verranno spiegate in seguito. Se noi volessimo risalire però al libro in lingua originale (archiviato on line in alcune digital library) avremmo seri problemi senza una conoscenza del russo o del bulgaro in quanto anche un traduttore automatico si basa su un principio di correlazione semantica tra le diverse lingue e non ci fornirebbe alcuna trascrizione da parole non semanticamente rilevanti perché staccate dall’alfabeto di origine (in questo caso il cirillico). Facciamo comunque subito una carrellata sugli strumenti immediatamente disponibili sul computer ed on line per la traslitterazione e traduzione tra diverse lingue.Lo strumento “lingua e testo” di MAC (che può essere preso come esempio per strumenti simili su PC, anche se un po’ più complessi nell’installazione) ed il traduttore automatico di Google (che vede un miglioramento costante nell’applicazione dell’algoritmo matematico di correlazione tra concetti semantici in lingue diverse. Va comunque sempre usato in modo critico):

Page 23: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOSTRUMENTI ON LINE

Prendiamo come esempio una frase che ha molte occorrenze sia in alfabeto latino che arabo: “Libro delle mille e una notte”. La scriviamo in Google search da “Traduci in italiano” verso “Traduci in arabo” e otterremo la traduzione corretta: (per facilitare chi non conosce l’arabo ecco la frase senza legature tra sillabe: كتاب ٱلف ليلة وليلة e la traslitterazione in alfabeto latino: Kitāb Alf Layla wa-Layla. Si tenga presente che l’arabo si legge da destra a sinistra e che le vocali, di norma, non sono scritte.

Bibliografia: Transliteration and Transcription Technology http://www.kanji.org/cjk/trans/transsum.htm

Page 24: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOSTRUMENTI ON LINE

Un buon modo per allenarsi a leggere l’alfabeto arabo (o per eliminare dubbi di lettura) è quello di sciogliere le legature delle frasi tradotte. Basta fare un copia e incolla della frase dal browser (nel nostro caso: ) ad un editor di testo che riconosca i caratteri arabi (Word, TextEdit, NeoOffice, ecc.). Copiata la frase saltate col tabulatore sillaba per sillaba e cliccate ogni volta sulla barra spaziatrice vedrete così le singole consonanti sciolte come da esempio nelle prossime pagine.

Bibliografia: Transliteration and Transcription Technology http://www.kanji.org/cjk/trans/transsum.htm

Page 25: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOSTRUMENTI ON LINE

Troviamo così la radice del nome (ktb ad es. per kitāb = libro) e così via per le altre parole della frase:

Bibliografia: Transliteration and Transcription Technology http://www.kanji.org/cjk/trans/transsum.htm

Page 26: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOSTRUMENTI ON LINE

Per dimostrare la potenzialità di lettura guardate la stessa frase in Fārsì (persiano): la cui traslitterazione è: hezār-o yek šab. Poco importa se non capite il significato, l’importante per noi è imparare a leggere l’alfabeto (e tra arabo e persiano ci sono poche differenze trascurabili al momento per il nostro scopo).Cercate nella tabellina le consonanti dell’esempio in persiano.

Page 27: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOSTRUMENTI ON LINE

È possibile fare dei controlli incrociati della nostra frase traducendo in e da altre lingue. Non sempre le occorrenze di Google sono precise, è pur sempre uno strumento automatico e quindi un po’ rigido...

Bibliografia: Transliteration and Transcription Technology http://www.kanji.org/cjk/trans/transsum.htm

Page 28: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOSTRUMENTI ON LINE

Essendo una delle difficoltà dell’arabo l’individuazione delle vocali (non scritte normalmente) è possibile utilizzare on line strumenti di traslitterazione per latinizzare le frasi o dizionari che riportano segni vocalici. Le proposte non sono mai univoche e richiedono discernimento tra le varie soluzioni. Si veda comunque il risultato sulla parola “mille” (alf) del nostro esempio sottoposto al sito “sakhr” che usa mettere le vocali brevi (arakat) sulle parole.

Bibliografia: http://qamoos.sakhr.com/

Page 29: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOSTRUMENTI ON LINE

Un altro esempio dal sito di stevenmorse.org sul nome dello scrittore libanese Georges Corm . Lo stesso cognome sottoposto al sito di prima ci dà una soluzione più facilmente interpretabile con la presenza del segno diacritico della sukūn (mancanza della vocale nella consonante seguente).

Bibliografia: http://stevemorse.org http://qamoos.sakhr.com/

Page 30: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOSTRUMENTI ON LINE

Facciamo un primo esempio di traslitterazione dei dati su un frontespizio da libro. È un documento pdf che contiene file immagine delle pagine per cui non possiamo fare un copia incolla delle righe testuali. Siamo quindi obbligati a scrivere il testo in un editor per poi trasportarlo in Google traduttore.

Bibliografia: Transliteration and Transcription Technology http://www.kanji.org/cjk/trans/transsum.htm

Page 31: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOCOMPILAZIONE DEI DATI NELLA SCHEDA BIBLIOGRAFICA

I dati sono misti arabo/inglese. La parte in arabo traduce semplicemente il “Made Easy” del titolo in inglese (nella prima parola troviamo la radice di facile, semplice: shl. Ma anche senza saperlo il lavoro di traduzione lo fa per noi Google). In basso viene riportato l’editore: la scuola islamica di Benoni. Manca l’autore e la data di edizione. Possiamo ipotizzare un abbozzo di scheda bibliografica.

SCHEDA BIBLIOGRAFICA

Autore: senza indicazione.

Titolo di rinvio: Prontuario facilitato di grammatica - sintassi araba.

Titolo originale: Arabic grammar syntax made easy.

Editore: Madrasah Islaamyyah

Luogo: Benoni (South Africa)

Data: senza indicazione.

Page 32: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOCOMPILAZIONE DEI DATI NELLA SCHEDA BIBLIOGRAFICA

CAMPO AUTOREI cognomi degli autori possono generare delle dubbie interpretazioni. A volte per risolvere il problema basta fare una ricerca per autore in Google ed usare il campo traduci pagina per scoprire nome e cognome originale dell’autore traslitterato solamente e non tradotto. Ecco un esempio:

a i d i ou S b i b (a)H

Autore: Souaïdia Habib.Titolo di rinvio: La guerra sporca.Titolo originale: Al harb al qazra

Il cognome Souaïdia verrebbe tradotto “Svezia” dal traduttore automatico (così come si può notare in molte recensioni tradotte in automatico. Riportare solo la traslitterazione.

Page 33: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOCOMPILAZIONE DEI DATI NELLA SCHEDA BIBLIOGRAFICA ESEMPIO DI LINGUE MULTIPLE

Le edizioni multilingue possono aiutare molto nella traslitterazione. Vediamo un caso di titolo in arabo, rumeno, inglese. Più complesso il problema della schedatura. Per le regole di catalogazione REICAT il titolo uniforme da adottare è quello della lingua principale, gli altri sono titoli di rinvio. L’argomento in casi come questo va approfondito.

Autore: Mezyed Munir, Settar Abdul, Latif Abdul; Tudor Dona, Chelaru Marius; Adleby Bahija. Titolo originale: Tales of two cities.Titolo originale: Povești despre două orașe.Titolo originale: Hikâya madanîtâyni.

Titolo di rinvio: Favole di due città.

Editore: Proema, Bucarest. Anno: 2008.

In arabo esiste il duale. Solo per curiosità si ricorda per quanto riguarda il nostro titolo che città (madîna al nominativo) al duale, per il femminile, perde la tâ’ marbûTa e prende la desinenza “tâyni” (al genitivo). A parte la traslitterazione che in questo caso richiede la conoscenza dell’arabo, tutto il resto è compilabile con la semplice comprensione dell’alfabeto.

Page 34: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOCOMPILAZIONE DEI DATI NELLA SCHEDA BIBLIOGRAFICA

ESEMPIO DI EDIZIONI MULTIPLE IN PIÚ LINGUEAlcuni libri hanno edizioni multiple in lingue diverse. Il semplice confronto tra i frontespizi aiuta nella compilazione della scheda bibliografica.

Autore: Georges Corm Titolo originale:

Titolo di rinvio: Storia del Medio Oriente. Dall’antichità ai nostri giorni

Scomposizione legature del titolo per facilitarela lettura ai non esperti:

Page 35: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DALL’ARABOCOMPILAZIONE DEI DATI NELLA SCHEDA BIBLIOGRAFICA

SCRITTURE ELABORATE ED ORNATEUna caratteristica dell’alfabeto arabo è quella della raffinatezza della scrittura ornamentale. Per il non esperto questo può rappresentare spesso un limite insormontabile. Si riporta un esempio di media difficoltà da un libro moderno.

SCHEDA BIBLIOGRAFICA

Autore: Khalid Habib Al-Rawi. Titolo originale:

Traslitterazione: Ta-rikhî al idhâha wa tilifîzyûn fî al IrâqiTitolo di rinvio: Storia della radio e della televisione in Iraq.Editore: sconosciuto. Anno: 1997.

Nonostante la traduzione sia relativamente semplice il traduttore automatico di Google questa volta va fuori tema. Scrivere parola per parola aiuta allora nella giusta traduzione.

Page 36: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESESTRUMENTI ON LINE

Naturalmente lo scopo di questo lavoro non è quello di sostituire un corso di lingue, ma mostrarvi come, applicando in modo rigoroso l’uso di strumenti potenti, possiate riuscire ad arrivare a risultati accettabili nel campo della traslitterazione/trascrizione e anche traduzione. L’esempio del cinese è ancora più esemplare per le molte sfumature che appartengono al suo thesaurus linguistico. Vi faccio un esempio un po’ più complesso di traduzione dall’italiano al cinese che ha un grado di possibilità di analisi approfondita anche se venisse effettuato da un bibliotecario con conoscenze linguistiche minime del cinese. È l’uso degli strumenti che fa la differenza.Decidiamo di tradurre il titolo dell’ultima biblioteca digitale a cui ho lavorato (una raccolta di foto e documenti di montagna) il cui acronimo è MOdiSCA (MOntagne di SCAtti).

Page 37: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESESTRUMENTI ON LINE

Il testo completo di descrizione della biblioteca in italiano è il seguente:Modisca (MOntagne di SCAtti) è una biblioteca digitale che raccoglie foto, documenti, filmati, interviste a personaggi dell’alpinismo lombardo e materiale sulla vita montana. Il patrimonio attualmente acquisito è di circa 25.000 foto, 30 filmati storici, 12.000 scansioni da riviste e libri storici, 30 interviste filmate a personaggi dell’alpinismo lombardo, basi di dati e 500 pagine di cronaca alpinistica. Il materiale è distribuito sotto licenza Creative Commons.Conosciamo già il traduttore automatico di Google. Sottoponiamo il testo e avremo la seguente traduzione.

Page 38: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESESTRUMENTI ON LINE

Dopo che avete in mano questa traduzione (o qualsiasi altra eseguita da un traduttore professionista) che possibilità reale avete di fare un controllo affidabile senza una conoscenza solida del cinese?Sottoponete la traduzione al “Character Dictionary” nel Chinese-English Dictionary del sito mbdg.net.

Page 39: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESESTRUMENTI ON LINE

Otterrete un’analisi puntuale di ogni carattere cinese del vostro testo. Vantaggi immediati: traslitterazione in Pinyin dei caratteri cinesi, individuazione del radicale, definizione concettuale del carattere.Limiti: i segni vengono analizzati singolarmente, per cui in caso di parole composte da più di un segno non ne possiamo ricavare una traduzione (non è un traduttore automatico, che troviamo invece alla sezione “translate”).

Page 40: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESESTRUMENTI ON LINE

Il nostro testo cinese sottoposto alla sezione “translate” viene invece analizzato parola per parola. Notevole la corrispondenza anche concettuale col nostro titolo in italiano: “montagne di scatti”. Possiamo però giocare anche sull’aspetto bivalente: montagne di foto/ foto di montagna ed effettuare quindi una sostituzione delle prime due parole (Pinyin: pāishè shān).

Page 41: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESESTRUMENTI ON LINE

Da “montagne di foto” (Pinyin: pāishè shān) passiamo a tradurre quindi “foto di montagna” e otterremo:Pinyin: Shān de zhāo piàn che andrà a sostituire pāishè shān. Entrambe le traduzioni sarebbero accettabili.

Page 42: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESESTRUMENTI ON LINE

La traduzione generale di un testo che vada al di là di un titolo e di un sottotitolo necessita di un controllo più accurato (nel nostro caso effettuato insieme a persona madrelingua cinese).

Bibliografia: http://us.mdbg.net/chindict/chindict.php Viviane Alleton, La grammatica cinese, Astrolabio 2004. Yuan Huaqing, Grammatica cinese, Vallardi 2007.

Traduzione finale affidabile.

Page 43: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESESTRUMENTI DI RICONOSCIMENTO CARATTERI

Nella traslitterazione/traduzione del cinese il riconoscimento dei radicali è la base per ogni tipo di comprensione. Questo richiede una conoscenza e una familiarità approfondita del cinese per cui, in caso si debbano trascrivere i caratteri direttamente da libro a computer esistono poche alternative allo studio, comunque abbastanza efficaci.1 - Scrittura col trackpad (prove effettuate su MAC OS X 10.6.xx).Apple ha sviluppato un riconoscimento caratteri con semplice scrittura dei tratti da trackpad. Il procedimento però ha ancora molti miglioramenti da effettuare. Una buona soluzione è quella (per MAC e WIN) presentata alla pagina successiva.

Bibliografia: http://osxdaily.com/2009/11/27/chinese-character-input-in-mac-os-x/

Page 44: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESESTRUMENTI DI RICONOSCIMENTO CARATTERI

2 - Penna scannerLa tecnologia di riconoscimento caratteri a scanner è in continua evoluzione. Una buona soluzione per il riconoscimento dei caratteri cinesi con relativo trasferimento in font è quella di I.R.I.S. Il vantaggio pratico, per chi non conosca il cinese, è di trovarsi i caratteri elaborati tramite OCR e quindi immediatamente trasferibili in database per traslitterazione o traduzione. Nel caso di titoli di libri e dati di copertine/frontespizi in lingua cinese la cosa funziona in modo abbastanza affidabile. La penna è gestibile da software sia per WIN che per MAC OSX.

Bibliografia: http://www.iriscorporate.com/

Сканер IRISPen™ Executive 6 является самым современным перьевым сканером, предназначенным для распознавания текста.

Достаточно просто провести им по печатной информации.С помощью курсора Вы получите полностью редактируемый текст.

Самый интуитивный электронный маркер

для Windows и Macintosh

Source: http://www.flickr.com/photos/livatlantis/

Page 45: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESEESEMPI DI SCHEDA BIBLIOGRAFICA

2 - Penna scannerUna volta acquisiti i dati (in questo caso il titolo sulla copertina è in caratteri troppo grandi per essere letto dalla penna scanner che ha un margine di lettura intorno a 1,5 cm. È possibile comunque lavorare anche sul frontespizio interno) si immette il testo nei campi di traduzione. Ecco sotto il risultato dei dati essenziali. Fino a questo livello non si richiede una conoscenza professionale della lingua cinese.

Titolo:

Editore:

Autore e traduttore:

Page 46: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESEESEMPI DI SCHEDA BIBLIOGRAFICA

2 - Penna scannerPorre sempre attenzione alla verifica della traduzione automatica. Nel caso del libro sotto il traduttore automatico ci dà una soluzione discutibile. L’analisi della frase ci porta facilmente ad una soluzione più adeguata confermata anche da schede bibliografiche on line. Titolo: Pinyin: Hú Lánchéng de jīnshēng jīnshì

Analisi del titolo:

Google translate:

Titolo tradotto: Hu Lancheng. La sua vita, il suo tempo.

Page 47: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESEESEMPI DI SCHEDA BIBLIOGRAFICA

3 - Handwriting input di MDBGDei tre metodi proposti è il più funzionale ed il più economico. Per velocizzare la ricerca dei caratteri bisogna il più possibile rispettare la sequenza canonica dei tratti per il cinese. Anche con una scrittura approssimativa i risultati di ritorno dei caratteri sono ottimi. Si veda la sequenza di ricerca di questo esempio con titolo corto ma sicuramente introvabile in altro modo per chi non conosca il cinese.

Bibliografia: http://us.mdbg.net

Page 48: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESEESEMPI DI SCHEDA BIBLIOGRAFICA

3 - Handwriting input di MDBG

Bibliografia: http://us.mdbg.net

Page 49: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESEESEMPI DI SCHEDA BIBLIOGRAFICA

3 - Handwriting input di MDBG

Bibliografia: http://us.mdbg.net

Page 50: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESEESEMPI DI SCHEDA BIBLIOGRAFICA

3 - Handwriting input di MDBGEd ecco il risultato di traslitterazione e traduzione del nostro titolo. Al di là del raffinamento della traduzione la conoscenza della lingua cinese per arrivare dalla frase su copertina a caratteri font interpretabili in automatico è a livello assolutamente elementare e quindi alla portata di qualsiasi bibliotecario.

Bibliografia: http://us.mdbg.net

Page 51: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESERICERCA DELLE SCHEDE BIBLIOGRAFICHE ON LINE

Confronto dei nostri dati con la bibliografia on lineUna volta tradotto il nostro titolo e i dati che ci sembrano significativi possiamo tentare di confrontare i nostri dati con quelli reperibili on line in database catalografici. Riprendiamo come esempio il libro su Hú Lánchéng Titolo: Pinyin: Hú Lánchéng de jīnshēng jīnshì

Titolo tradotto: Hu Lancheng. La sua vita, il suo tempo.

Page 52: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESERICERCA DELLE SCHEDE BIBLIOGRAFICHE ON LINE

Confronto dei nostri dati con la bibliografia on lineOn line esistono metaOPAC di valenza mondiale in cui quindi è possibile inserire titoli in alfabeti anche diversi dal latino. Un link del genere è cliccabile ad esempio dalla sezione biblioteca nel sito del CESMEO.

Bibliografia: http://www.cesmeo.it

Page 53: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESERICERCA DELLE SCHEDE BIBLIOGRAFICHE ON LINE

Confronto dei nostri dati con la bibliografia on lineCliccando sul link “Il principale metaOPAC mondiale” ci troviamo nell’interfaccia di ricerca del sito di WorldCat. Facciamo un semplice copia incolla del titolo che abbiamo scritto sulla nostra scheda e avviamo la ricerca. Titolo:

Bibliografia: http://www.worldcat.org

Page 54: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESERICERCA DELLE SCHEDE BIBLIOGRAFICHE ON LINE

Confronto dei nostri dati con la bibliografia on lineGià nei dati immediati del primo record possiamo ricavare: traslitterazione in Pinyin; nome dell’autore cinese; editore; città di stampa; data di edizione. Titolo:

Bibliografia: http://www.worldcat.org

Page 55: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESERICERCA DELLE SCHEDE BIBLIOGRAFICHE ON LINE

Confronto dei nostri dati con la bibliografia on lineEntrati nel record riusciamo ad ottenere ulteriori dati (tra cui il numero ISBN). È possibile approfondire ed evidenziari informazioni sull’autore del libro. Titolo:

Bibliografia: http://www.worldcat.org

Page 56: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL RUSSOSTRUMENTI ON LINE

Delle tre lingue prese in considerazione quello russo è l’alfabeto che presenta meno difficoltà di lettura. Si fornisce comunque una carrellata di strumenti on line a disposizione sia per la traslitterazione che per la traduzione. Russian Transliterate Tool di Russian lesson.net: funziona sia su parole singole che su frasi. Fornisce una traslitterazione in alfabeto latino (e viceversa per il cirillico) di qualsiasi brano venga inserito nel box apposito. Non viene generata alcuna traduzione.

Bibliografia: http://www.russianlesson.net

Page 57: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL RUSSOSTRUMENTI ON LINE

On line dictionary di reverso.net: funziona solo su parole singole e non su frasi. Bisogna conoscere le radici dei nomi, in particolar modo per quanto riguarda le forme verbali per avere delle occorrenze di ritorno affidabili. Nell’esempio che attiene alla scheda di un libro trattata in seguito il risultato della scrittura del semplice aggettivo porta al sostantivo “dinamite” che poco ha a che fare con la “dinamica poetica” della frase di origine. Usare sempre lo strumento in modo critico.

Bibliografia: http://dictionary.reverso.net/

Page 58: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL RUSSOESEMPIO DI SCHEDA BIBLIOGRAFICA

Abbiamo già preso confidenza per il cinese degli strumenti che ci aiutano nella traslitterazione. La metodica da seguire per il russo è del tutto simile. Facciamo un piccolo esempio su un libro moderno. Partiamo come sempre dai dati di copertina o del frontespizio. Riportiamo dapprima il titolo in Google traduttore e ne ricaviamo una traduzione un po’ dubbia che è però facilmente emendabile. Ormai siamo esperti. Andiamo subito a cercare una scheda di confronto in una delle biblioteche che conosciamo.

Sito di riferimento: http://find.library.duke.edu

Page 59: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL RUSSOESEMPIO DI SCHEDA BIBLIOGRAFICA

Abbiamo tutta una serie di dati (in questo caso in inglese) che ci facilita il lavoro di confronto nella stesura della scheda del nostro libro.

Sito di riferimento: http://find.library.duke.edu

Page 60: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL RUSSOESEMPIO DI SCHEDA BIBLIOGRAFICA

Possiamo anche facilmente arrivare al sito dell’editore o di book store on line che ci forniscono ulteriori dati di verifica sul nostro libro. È possibile avere subito in automatico da Google la traduzione grossolana dell’intera pagina di riferimento (si noti l’incertezza persistente per l’aggettivo del titolo riportato stavolta in inglese).I dati sono comunque ricchi: numero ISBN, anno di edizione, editore, ecc. Anche con una conoscenza minima del russo siamo in grado di compilare una scheda bibliografica attendibile.

Sito di riferimento: http://ozone.ru

Page 61: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL RUSSOESEMPIO DI SCHEDA BIBLIOGRAFICA

Per diramare i dubbi del nostro titolo basta andare semplicemente su un vocabolario. Arriviamo velocemente all’aggettivo pertinente per l’argomento in questione: lo svolgersi nel tempo della poetica nella letteratura russa. Alcuni siti accademici fanno un po’ quello che fa il sito dell’Accademia della Crusca. Le risposte sono anche in inglese e a volte in italiano e quindi non bisogna sapere per forza il russo perfettamente. Si veda a proposito il sito dic.academic.ru a cui abbiamo sottoposto il nostro titolo.

Sito di riferimento: http://dic.academic.ru

Page 62: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL RUSSOESEMPIO DI COPERTINA ARTISTICA

La copertina originale di un nuovo libro (che racconta tra l’altro del disorientamento dei russi di fronte “all’assalto” di neologismi e prestiti da altre lingue. I bibliotecari “alle prime armi” col russo possono trarne quindi consolazione...). Si tenga presente che alcune lettere in corsivo nel russo cambiano forma. Si arriva comunque facilmente alla scheda bibliografica in internet semplicemente digitando autore e prima parte del titolo. Di seguito traduzione, traslitterazione e titolo originale:Krongauz Maxim, Lingua russa sull’orlo di una crisi di nervi, Znak 2009.Кронгауз Максим, Русский язык на грани нервного срыва, Знак 2009.Krongauz Maxim, Russkij jazyk na grani nervnogo sryva, Znak 2009.

Sito di riferimento: http://annaviva.com/content/il-reset-della-lingua-russa-la-russia-ha-nominato-le-parole-ed-espressioni-del-anno-2009

Parola dell’anno in Russia nel 2009:perezagruzka = reset

Page 63: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

INTERVALLO DI META’ GIORNATA (ore 12.30)Rilassiamoci col “linguaggio” di casa nostra...Appunti sul film: “L’uomo che verrà” in bolognese/italianodal sito “ http://www.bulgnais.com/nuvite.html”

L’Uomo che verrà, film di Giorgio Diritti

Giän sóbbit che a nuèter dal Sît Bulgnaiṡ ste fíllm al s é piaṡó, parché l é fât bän es al trâta d una stòria ch’l é méi ch’a n s la dscurdaggna brîṡa. Fôrsi al n é brîṡa un fíllm stòric, mo pió una spêzie d un fíllm in custómm mudêren ch’al vôl fèr da vàdder cum l’êra la vétta int al nòstr Apenén durànt la Secånnda guèra mundièl, prémma che al månnd al canbiéss cum l à fât da pôc. ...Purtròp, dal pónt ed véssta dal dialàtt ste “Albero de-gli Zoccoli” bulgnaiṡ al cunvénz pôc. La żänt in sèla i bruntlèven parché i gêvn acsé che al bulgnaiṡ al n é brîṡa acsé, o parché la prunónzia di atûr l’êra piotòst catîva. Però al pónt al n é brîṡa quasst: al dialàtt da druvèr naturalmänt al n êra brîṡa quall ed Bulåggna, mo quall dla muntâgna, e anzi d un sît particolèr dla muntâgna. Che pò la prunónzia di cínno o däl ragâzi żåuvni la n fóss brîṡa bôna, quall lé as pôl capîr par-ché as trâta ed żänt ch’i n én brîṡa nèd in dialàtt (anc se, da di atûr profesionéssta, as pôl pretànnder ch’i i stâg-n un pô pió drî). Nå, la créttica vaira l’é par la gramâtica: ai êra di atûr ch’i adruvèven al plurèl metafonêtic, di èter al plurèl invariè (come, defâti as fà in socuànti pèrt dla muntâgna), ai êra chi dscurêva coi ditóng e chi sänza, acsé bâsta ch’séppa, e tótt, sänza eceziån o quèṡi, i ṡbaglièven a fèr äl dmand: int i dialétt dl’Emégglia-Rumâgna, e sicuramänt a Bulåggna e int la sô muntâgna ed mèż, äl dmand äl

L òmen ch’l à da vgnîr,film di Giorgio Diritti

Diciamo subito che a noi del Sito Bolognese il film è piaciuto, perché fatto bene e relativo a una vicenda che non bisogna dimenticare. Più che un film storico ci è sembrato una specie di moderno film in costume, che mostra la vita sull’Appennino bolognese duran-te la Seconda guerra mondiale, prima che il mondo cambiasse completamente. ...Purtroppo, dal punto di vista dialettale, questo “Al-bero degli Zoccoli” bolognese non convince. In sala si sentiva protestare che il bolognese non è così, o che la pronuncia non era affatto buona. Però il pro-blema secondo noi non è questo: il dialetto da usare naturalmente non era quello di Bologna città, ma quello, diverso, della montagna, anzi di un suo pun-to ben preciso. Che poi la pronuncia dei bambini o delle ragazze giovani non fosse buona si può capire, trattandosi di non madrelingua (anche se ci si potreb-be aspettare più cura da attori professionisti). No, la vera critica riguarda la morfosintassi: alcuni attori usavano il plurale metafonetico mentre altri, secon-do la regola di varie parti della montagna, lo man-tenevano invariato rispetto al singolare, c’era chi usava i dittonghi e chi no, alla rinfusa, e tutti, pra-ticamente senza eccezioni, sbagliavano le domande: nei dialetti dell’Emilia-Romagna, e sicuramente in bolognese e in quelli della montagna media, le do-mande richiedono inversione, e non farla è un vero e

proprio errore, che sicuramente gli abitanti di Monte Sole, in quanto madrelingua, non commettevano. Il prete poi dice: “Csa i êl?” e anche quello è uno sci-volone notevole, perché si tratta di uno dei pochi casi in cui l’inversione non ci vuole. Insomma, è stata fat-ta dove non ci voleva e viceversa. Nasce spontanea una domanda: ma in questi casi non sarebbe meglio seguire l’esempio degli americani, che impiegano un “dialect coach”, cioè una figura professionale che insegna agli attori i diversi accenti dell’inglese? Nel nostro caso sarebbe stato anche più importante, dato che qui dialetto non significava pronuncia diversa, ma sistema linguistico intero distinto da quello ita-liano. Si vede che la filologia non è presa abbastanza sul serio, neanche quando il prete supposto dialet-tofono parlando in italiano dice “la chièsa”, con la e aperta, quando quell’emiliano che dice “chièsa” e non “chiésa” è introvabile, e ancor più doveva es-serlo allora. Oggi poi il congiuntivo è in ritirata, ma l’italiano di coloritura emiliana l’ha sempre avuto, e in gran parte ce l’ha ancora, e questo sarebbe dovu-to emergere anche se i personaggi del film sono di

Page 64: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

Senza ul cines te ve mia tant de luntan.... (il nonno di Alberto, estate 2002)

Senza il cinese non andrai molto lontano.... (il nonno di Alberto, estate 2002)

(il nonno di Alberto, estate 2002)

Image source: http://www.flickr.com/photos/mauricedb/1598756932/

Page 65: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESECREAZIONE DI UNA SCHEDA BIBLIOGRAFICA

L’importanza di farsi trovare...Dopo questa prima panoramica facciamo un esempio pratico di immissione di una scheda ex novo nei circuiti di catalogo internazionale. Lavoreremo su un libro scritto in italiano, cinese, inglese ed edito in Italia.

Troviamo facilmente tramite Google un link al sistema bibliotecario della provincia lecchese che ci fornisce nell’OPAC questa scheda. Viene riportato il titolo solo in italiano (titolo principale secondo le regole REICAT) e la nota della presenza di testo anche in inglese e cinese.

Titolo: Terre lariane specchio del cielo, Lario Country reflection of the sky,

Page 66: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESECREAZIONE DI UNA SCHEDA BIBLIOGRAFICA

La stessa ricerca in WorldCat (sia in italiano che inglese e cinese) non dà risultati. Viene evidenziata una scheda alla digitazione del nome dell’autore ma si riferisce ad altra pubblicazione. Tenere presente comunque che WorldCat riporta solo schede di biblioteche che aderiscono al suo consorzio.

Page 67: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESECREAZIONE DI UNA SCHEDA BIBLIOGRAFICA

Non ci resta altro da fare che trascriverci in proprio il nostro titolo. Ci risulterà più facile di quanto non sembri usando la metodica già vista prima usando gli strumenti del sito di MDBG.

Bibliografia: http://us.mdbg.net

Page 68: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESECREAZIONE DI UNA SCHEDA BIBLIOGRAFICA

Adesso non ci resta che passare i dati all’OPAC del sistema lecchese perché vengano immessi sulla scheda nel database (se il software lo permette). Se vogliamo invece inserire i dati in WorldCat dobbiamo registrarci come biblioteca utente.

Page 69: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

TRASLITTERAZIONE / TRASCRIZIONE DAL CINESECREAZIONE DI UNA SCHEDA BIBLIOGRAFICA

Anche se non conosciamo il cinese possiamo renderci conto della bravura della nostra traduttrice che usa finezze possibili solo a un madrelingua come l’uso di zhī anziché de per la particella attributiva di cielo (sky’s) e poi sappiamo anche come si dice Como, lago, specchio e cielo... Basta far effettuare da MDBG la traduzione in cinese del testo in inglese e giocare un po’ coi confronti.

Bibliografia: http://us.mdbg.net

Page 70: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI

Guardiamo un po’ più nel dettaglio i risultati nelle schede di catalogazione di un titolo in arabo della Library of Congress. Se provate a fare qualche ricerca vi accorgerete che sui titoli in arabo viene data la traslitterazione ma non la traduzione in inglese. Noi però vogliamo la traduzione di questo libro a tutti i costi (in italiano). Come fare?Ecco la pagina base (brief record) del libro sul sito della Library of Congress:

Bibliografia: http://catalog.loc.gov/

Page 71: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI

ed il record coi tag MARC:

Bibliografia: http://catalog.loc.gov/

Page 72: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI

Google ci dà questa prima traduzione da raffinare:

Bibliografia: http://translate.google.it

Page 73: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI

Il titolo in arabo inserito in Google search ci porta ad una serie di pagine che trattano dell’argomento:

Bibliografia: http://www.google.it

Page 74: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI

Entrati nel primo link ci troviamo nella pagina di un professore di biblioteconomia dell’Università del Cairo che riporta una notasul libro che ci interessa:

Bibliografia: http://translate.google.it

Page 75: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI

Possiamo andare avanti nell’argomento e visto che il libro tratta proprio del formato MARC21 cercare di scoprire cosa ne pensa il prof.Gonheim. Anche nei Paesi Arabiil problema degli standard dicatalogazione è molto sentito.

Bibliografia: http://translate.google.it

Page 76: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI Naturalmente i problemi possono essere molto più complessi. Vi lascio un esempio di difficile soluzione. La scheda di un libro in urdu (l’alfabeto è simile all’arabo ma la lingua, come per l’esempio in persiano che abbiamo già visto, è un’altra). Provate a fare qualche tentativo di soluzione per la traduzione del titolo...

Bibliografia: http://catalog.loc.gov/

Page 77: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI Per curiosità potete andare a vedere le specificità dei caratteri in urdu rispetto a quelli arabi e fārsi.

Bibliografia: http://www.omniglot.com/writing/urdu.htm

Page 78: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI Tenete presente che Google non fa una traduzione automatica dall’urdu ad altre lingue. L’unica possibilità è un dizionario on line. Interessante questo dell’Università di Chicago. Le parole vanno sottoposte singolarmente.

Bibliografia: http://dsal.uchicago.edu/dictionaries/platts/

Page 79: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI Ecco la prima e la seconda ricerca per suḵẖan e ma’kūs: discorso/parola e “alla rovescia”. Sarfarāz Shāid è famoso come compositore di poemi umoristici (mettete il suo nome in Google). La traduzione non è facile ma dovreste essere sulla buona strada... È comunque un esempio di difficile soluzione per chi non abbia la conoscenza dell’urdu, per cui non preoccupatevi del risultato. L’esempio serve a mostrarvi la potenzialità degli strumenti, che non sempre sono però sufficienti per avere una soluzione sicura.

Bibliografia: http://dsal.uchicago.edu/dictionaries/platts/

Page 80: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI E per finire vi mostro come sia possibile dare contributi fondamentali anche a biblioteche importanti che tralasciano per ovvie ragioni di costo/benefici la ricerca della traduzione o traslitterazione per certe lingue. È il caso di una scheda su un libro norvegese - pashto. Nessuna delle biblioteche visitate on line riporta il titolo orginale in afghano, ma solo la versione norvegese. Potete notare subito dall’immagine di sinistra che i caratteri dell’afgano rispetto a quelli dell’arabo sono molto più numerosi.

Bibliografia: http://omniglot.com

Page 81: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI Bisogna installare il set di caratteri del pastho (che spiegheremo in un altro momento) ma in seguito usando lo stesso metodo dell’arabo trascriviamo in un editor i dati che ci interessano come sotto. Vi lascio anche le frasi con le sillabe slegate per capire meglio l‘esempio in corso di elaborazione.

Page 82: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

SCHEDE IN MARC 21 NEI CATALOGHI ON LINE RIFLESSIONI ED ESERCIZI Ed ecco il risultato messo in ordine. Nel caso lavorassimo per un’agenzia catalografica o per un OPAC potremmo comunicare facilmente i dati ad altre biblioteche. Come sempre per arrivare a questo risultato bisogna avere capacità tecnica sulla scrittura dell’alfabeto (un po’ di più che nel caso dell’arabo) , la questione della conoscenza dell’afgano è un’altra cosa.

Page 83: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

UN ESEMPIO VELOCE DI REFERENCE PROFESSIONALE SU RISORSE ATTUALI IN LINGUA CINESE

Per mostrarvi la potenzialità degli strumenti fin qui spiegati immaginate che un giovane musicista venga nella vostra biblioteca e voglia sapere qualcosa di più di una notizia passata sui giornali o in tv: “Un’orchestra virtuale per una sinfonia on line”. L’utente vi fornisce solo il nome del presunto ideatore: Tan Dun. Vi sembrerà incredibile ma con una ricerca veloce il sito di MDBG sa esattamente di chi stiamo parlando.

Page 84: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

UN ESEMPIO VELOCE DI REFERENCE PROFESSIONALE SU RISORSE ATTUALI IN LINGUA CINESE

Scriviamo quindi una frase di circostanza sulla musica cinese e inseriamo il nome del nostro compositore in MDBG. Ci verrà dato il nome originale del compositore.

Page 85: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

UN ESEMPIO VELOCE DI REFERENCE PROFESSIONALE SU RISORSE ATTUALI IN LINGUA CINESE

A questo punto, in base alle esigenze del nostro utente, possiamo effettuare una ricerca nei siti cinesi dedicati alla musica e scoprire di più sul nostro musicista. Il traduttore automatico di Google è sufficientemente valido per la lettura immediata e la comprensione generale degli argomenti della pagina.

Page 86: Abstract from "Cataloging in the era of the semantic web: Arabic, Cyrillic and Chinese resources". Catalogazione nell'era del web semantico: risorse in arabo, cirillico e cinese

PREVISIONE RISULTATI PER IL CORSO: CATALOGAZIONE IN ALFABETI NON LATINI Per la frequentazione è necessaria una conoscenza elementare dell’alfabeto arabo e cirillico. Per il cinese è sufficiente l’uso degli strumenti presentati e la lettura del Pīnyīn. I risultati sono ottenibili con l’uso incrociato di più risorse di riferimento on line e non si basano sulla conoscenza linguistica dei corsisti.

Lingua CINESE RUSSO ARABO

Obbiettivo

1 - Lettura dei dati sulla copertina Discreto Discreto Discreto di un libro e comprensione del significato.

2 - Traslitterazione in alfabeto latino Buono Buono Insuf.

3 - Traduzione dei dati Suf. Suf. Suf.

4 - Ricerca on line di schede bibliografiche Buono Buono Buono

5 - Servizio di reference ad utenti stranieri Buono Buono Buono

6- Catalogazione uniforme Buono Buono Buono Regole REICAT, norme UNI, ecc.

Nota: l’unica lingua in cui si incontrano problemi seri di traslitterazione è l’arabo in quanto le vocali non sono scritte ed è quindi necessario conoscere la grammatica per l’individuazione dei casi. L’unica possibilità per chi non conosca la lingua è ricercare schede on line con traslitterazione già normata (diffuse per esempio nei siti di biblioteche francesi). Gli altri obbiettivi: traduzione, ricerca schede, ecc. sono comunque raggiungibili in modo sufficiente anche per le risorse in arabo.