2000 ~2002 kormarc kormarc -0- romanization of kormarc data - for the international korean...

17
-1- 2000 년 ~2002 년 년년년년년년년년 KORMARC KORMARC 년년년 년년년 년년 년년 년년년 년년년 년년 년년 ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography The National Library of Korea

Upload: daniel-price

Post on 27-Mar-2015

223 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-1-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography –

The National Library of Korea

Page 2: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

1 PURPOSE AND NECESSITY 1 PURPOSE AND NECESSITY

2 PRESENT STATUS 2 PRESENT STATUS

KORMARC DATA ROMANIZATON RULES

KORMARC DATA ROMANIZATON RULES

Future Plans Future Plans

CONTENTS

44

33

Page 3: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-3-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

The National Library of Korea should standardize Kormarc by sharing romanized Kormarc data with all the libraries of the world.

• In order to do this, we mu

st change Korean bibliography data into romanizaton.

• Foreigners can

use Korean

materials more

easily therefore

we can increase

the user of

Korean

bibliography.

• The need for Kormarc data will be increased from abroad.

1. PURPOSE AND NECESSITY

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

Page 4: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-4-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

2. THE PRESENT STATUS

NLK announced romanization of the Korean language at the CEAL 2004.

2004 년

로마나이즈 규칙에 따라 로마자 번자 시스템 개발

2005 년

• We finished testing 1,000 items of Kormarc data using developed romanization system.

• NLK made romanization rules that could express sentences.

• According to these romanization rules, We developed romanization system.

• By the result, NLK completed Kormarc data romanizaton rules.

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

Page 5: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-5-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

• Follow the rules of Korean spelling.• Follow the Korean spacing words.

• Follow the rules of Korean spelling.• Follow the Korean spacing words.

Basic Principles of Romanization

• Romanization is based on standard Korean pronunciation.

• Romanization is based on standard Korean pronunciation.

• The ROMAN CHARACTER DICTIONARY is not applied. • The ROMAN CHARACTER DICTIONARY is not applied.

• Romanize sentence by words.• Romanize sentence by words.

• Use original spelling of foreign language from foreign dictionaries.

• Use original spelling of foreign language from foreign dictionaries.

Romanization of Korean which is established by Ministry of Culture and Tourism in 2000 is applied.

3. KORMARC DATA ROMANIZATON RULES

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

Page 6: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-6-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

1) Spacing words. spacing a word not by a unit.

한국 근대 문학 Hanguk geundae munhak 불국사 삼층 석탑 Bulguksa samcheung seoktap

3.1 Rules

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

NLK announced romanization words last year. I will introduce romanization of sentences now.

Page 7: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-7-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

2) The numerals ㅇ A number over one hundred In a number over one hundred, separate by hyphens every unit of ten,hundred, thousand, etc. 1592 ilcheon-obaek-gusip-I ㅇ The Specific day In the case of expressing the specific day write a hyphen between a month and day. Do not indicate phonetical changes after the hyphen. 6 ㆍ 25 Yuk-io 8 ㆍ 15 Pal-iro

ㅇ Marking of units In the case of combining numbers and units word, write a hyphen in between. 1992 년 ilcheon-gubaek-gusip-i-nyeon 10 주년 sip-junyeon 제 5 권 je-o-gwon

3.1 Rules

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

Page 8: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-8-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

3) An abbreviation ㅇ Write hyphens between shorten words. 중고등 학교 jung-godeung hakgyo 중단편 jung-danpyeon ㅇ Write shortened words as they are pronounced. 전경련 Jeongyeongnyeon 대한교련 Daehangyoryeon

ㅇ Use hyphen when a single letter has its own meaning. 영한 yeong-han 청일 Chong-Il

4) A foreign language ㅇ Write original spelling on foreign language. 포크 poke 커피 coffee 텔레비전 television

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

3.1. Rules

Page 9: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-9-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

5) Mark of particle word ㅇ Use '-' between particles and nouns. 사람이 많다 saram-i manta 나는 집에 간다 na-neun jip-e ganda ㅇ When particle words are combined, use '-' between the two. 여기에서부터 yeogi eseo-buteo 저기까지만 가자 jeogi kkaji-man gaja

6) Mark of affix ㅇ Mark of Suffix When suffix is used after foreign language use '-' before suffix. It does not reflect changes of phoneme. 유머집 humor-jip ㅇ The other prefix and suffix are used with before and behind word or radix. 대선배 daeseonbae 총정리 chongjeongni 햇과일 haetgwail

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

3.1. Rules

Page 10: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-10-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

7) Mark of dependent noun and pre-noun ㅇ Between dependence noun and before word leave space. 내 것 nae geot 우리 측 uri cheuk 세 마리 se mari ㅇ When use pre-noun, leave space in behind word. 새 신발 sae sinbal 현 상황 hyeon sanghwang 8) Mark of Proper noun ㅇ Mark of name Leave space between sir name and first name. The principle is to write name without space but ‘-’ can be used between syllables. 한복남 Han Boknam (Han Bok-nam) ㅇ Between sir name and title, sir name and pen name, and sir name and position leave space. 김 선생 Kim seonsaeng 박 여사 Park yeosa 최 국장 Choe gukjang 이 충무공 Lee Chungmugong ㅇ Mark of group Words that indicate group, company, organization leave space in before word. 조선어 학회 Joseoneo hakhoe 사랑 교회 Sarang gyohoe

3.1. 변환규칙KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES 3.1. Rules

Page 11: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-11-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

9) Mark of geographical name ㅇ Nature name and construction name mark as it is pronounced. 한강 Hangang 백두산 Baekdusan ㅇ Mark district such as ‘do, si, gun, gu, eup, myeon,ri, dong, ga’ by unit. 경기도 Gyeonggi-do 서귀포시 Seogwipo-si 10) Capital letter ㅇ Mark of name Sir name and first letter of first name mark with capital letter. 김홍도 Gim Hongdo (Gim Hong-do) 허균 Heo Gyun ㅇ Mark of geographical name Mark capital letter in first letter of the word. Unit of district mark with small letter. 태백산 Taebaeksan 서울시 Seoul-si

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES 3.1. Rules

Page 12: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-12-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

Field Tag

1XX

100

110

111

130

20X 240

24X 245

25X 250

26X 260

4XX440

490

5XX

500

501

502

503

504

505

3.2. The Romanaize field.

Field Tag

5XX

506

510

520

521

533

534

536

580

586

6XX

600

610

611

630

650

651

653

Field Tag

7XX

700

710

711

730

740

770

772

773

775

776

780

785

787

8XX 830

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

Page 13: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-13-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

24520$a( 상당히 구체적이고 일목요연한 ) 부자파파의 머니테크 /$d 베른트 W. 클뢰크너 지음 ;$e 김세나 옮김24520$a(sangdanghi guchejeok-igo ilmogyoyeonhan)bujapapa-ui meonitekeu/$dBereunteu W. keulloekeuneo jieum; $eGimse-na omgim260 $a 서울 : $b 가야넷 , $c2003260 $aSeoul: $bGayanet,$c20036508$a 재테크650 8$aJaetekeu653 $a 부자파파 $a 머니테크 $aSYSTEMATISCH$aREICH$a 재테크653 $aBujapapa$aMeonitekeu$aSYSTEMATISCH$aREICH$aJaetekeu7001 $a 김세나7001 $aGimse-na

Result

3.3 The Results

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

Page 14: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-14-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

24520$a( 상당히 구체적이고 일목요연한 ) 부자파파의 머니테크 /$d 베른트 W. 클뢰크너지음 ;$e 김세나 옮김

24520$a(sangdanghi guchejeok-igo ilmogyoyeonhan)bujapapa-ui meonitekeu/$dBereunteu W. keulloekeuneo jieum; $eGimse-na omgim

260 $a 서울 : $b 가야넷 , $c2003260 $aSeoul: $bGayanet,$c2003650 8$a 재테크 [E--]650 8$aJaetekeu[jae--]653 $a 부자파파 $a 머니테크 $aSYSTEMATISCH$aREICH$a 재테크653 $aBujapapa$aMeonitekeu$aSYSTEMATISCH$aREICH$aJaetekeu7001 $a 김세나7001 $aGimse-na

3.4 변환결과 검증결과 예시KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

Kormarc romanizaion rules error correct

Standard Korean pronunciation

ilmogyoyeonhan ilmognyoyeonhan

Foreign language Bereunteu W. Keulloekeuneo meonitekeu papa

Bernd W. Klockner

moneytech

Name Gimse-na Gim Sena (Kim Sena)

3.4 Analysis of the results.  

Page 15: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-15-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

Types of errorNumber of

error Percentage

Korean Standard pronunciation. 30 3%

Roman Mark

mark ㅎ 147 14.7%

 Administrative units 74 7.4%

Capital and small

letter

Name 700 70%

Geographical name

255 25.5%

Proper noun 138 13.8%

Mark of particle

Word+particle 359 35.9%

Word+particle+particle  14 14%

Mark of the others '-' 68 6.8%

Foreign language 479 47.9%

Average error 23.9%

3.5 The percentage of the error.  

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

Page 16: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-16-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

4  Future plans

Discussion and exchange ideas about 1000 error types and application rules after organization of working group with Korean librarians in abroad.

The results are gathered after discussion in working group and it will be reflected in the system after discussion with the National Institute of the Korean Language.

NLK will promote romanization step by step to meet our goal.

KORMARC DATA ROMANIZATON RULES KORMARC DATA ROMANIZATON RULES

Page 17: 2000 ~2002 KORMARC KORMARC -0- ROMANIZATION OF KORMARC DATA - For the International Korean Bibliography – The National Library of Korea

-17-

2000 년 ~2002 년 도서관정보화사업 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙 KORMARC KORMARC 데이타 로마자 변환 규칙데이타 로마자 변환 규칙

Thank you

The National Library of Korea