iso/iec jtc 1/sc 2 n 3091 - unicode · 2001. 2. 21. · iso/iec jtc 1/sc 2 n 3091 date: 1998-05-21...

26
ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN (JISC) DOC TYPE: Text for FDIS ballot TITLE: Final Text of FCD 8859-15: Information Technology -- 8-bit single-byte coded graphic character sets -- Part 15: Latin alphabet No. 9/Technologies de l’information – Jeux de caractères à huit bits codés sur un seul octet Partie 15 : Alphabet latin n° 9 SOURCE: A. LaBonte, Project Editor PROJECT: JTC1.02.20.15 STATUS: In accordance with Resolution M08.17 adopted at the eighth plenary meeting of SC 2, Redmond, Washington USA, 1998-03-24/25, this document has been submitted to the ITTF for FDIS processing. Disposition of Comments Report is contained in SC 2 N 3071. ACTION ID: ITTF DUE DATE: DISTRIBUTION: P, O and L Members of ISO/IEC JTC 1/SC 2 WG Conveners and Secretariats Secretariat, ISO/IEC JTC 1 ISO/IEC ITTF NO. OF PAGES: 26 (Cover + English: 12 pages + French: 13 pages) ACCESS LEVEL: Def WEB ISSUE #: 018 Contact: Secretariat ISO/IEC JTC 1/SC 2 - Toshiko KIMURA IPSJ/ITSCJ (Information Processing Society of Japan/Information Technology Standards Commission of Japan)* Room 308-3, Kikai-Shinko-Kaikan Bldg., 3-5-8, Shiba-Koen, Minato-ku, Tokyo 105 JAPAN Tel: +81 3 3431 2808; Fax: +81 3 3431 6493; Telex: 2425340 IPSJ J; email: [email protected] *A Standard Organization accredited by JISC

Upload: others

Post on 17-Aug-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

ISO/IEC JTC 1/SC 2 N 3091Date: 1998-05-21

Replaces SC 2 N 2946

ISO/IEC JTC 1/SC 2

CODED CHARACTER SETS

SECRETARIAT: JAPAN (JISC)

DOC TYPE: Text for FDIS ballot

TITLE: Final Text of FCD 8859-15: Information Technology -- 8-bit single-byte codedgraphic character sets -- Part 15: Latin alphabet No. 9/Technologies del’information – Jeux de caractères à huit bits codés sur un seul octet Partie 15 :Alphabet latin n° 9

SOURCE: A. LaBonte, Project Editor

PROJECT: JTC1.02.20.15

STATUS: In accordance with Resolution M08.17 adopted at the eighth plenary meeting ofSC 2, Redmond, Washington USA, 1998-03-24/25, this document has been submitted to the ITTF for FDIS processing. Disposition of Comments Report iscontained in SC 2 N 3071.

ACTION ID: ITTF

DUE DATE:

DISTRIBUTION: P, O and L Members of ISO/IEC JTC 1/SC 2WG Conveners and SecretariatsSecretariat, ISO/IEC JTC 1ISO/IEC ITTF

NO. OF PAGES: 26 (Cover + English: 12 pages + French: 13 pages)

ACCESS LEVEL: Def

WEB ISSUE #: 018

Contact: Secretariat ISO/IEC JTC 1/SC 2 - Toshiko KIMURAIPSJ/ITSCJ (Information Processing Society of Japan/Information Technology Standards Commission of Japan)*Room 308-3, Kikai-Shinko-Kaikan Bldg., 3-5-8, Shiba-Koen, Minato-ku, Tokyo 105 JAPANTel: +81 3 3431 2808; Fax: +81 3 3431 6493; Telex: 2425340 IPSJ J; email: [email protected]*A Standard Organization accredited by JISC

Page 2: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

Source: Alain LaBonté and Michael Everson

Date: 1998-04-29

Title: FDIS of Latin alphabet No. 9

Status: For consideration by ISO/IEC JTC1 SC2/WG3

TITLE PAGETo be provided by ITTF

© ISO/IEC FDIS for ISO/IEC 8859-15:1998 (E)

Page 3: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

FDIS for ISO/IEC 8859-15:1998 (E) © ISO/IEC

ii

Contents

Page

Foreword. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

1 Scope . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2 Conformance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

3 Normative references . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

4 Definitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

5 Notation, code table and character names. . . . . . . . . . . . . . . 2

6 Specification of the coded character set . . . . . . . . . . . . . . . . 3

7 Identification of the character set . . . . . . . . . . . . . . . . . . . . . . 6

Annex A Coverage of languages by parts 1 to 10 and

13 to 15 of ISO/IEC 8859. . . . . . . . . . . . . . . . . . . . . . . . . 7

Annex B Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

© ISO/IEC 1998

All rights reserved. Unless otherwise specified, no part of this publication may bereproduced or utilized in any form or by any means, electronic or mechanical,including photocopying and microfilm, without permission in writing from the publisher.

ISO/IEC Copyright Office • Case Postale 56 • CH-1211 Genève 20 • Switzerland

Printed in Switzerland

Page 4: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

Foreword

ISO (the International Organization for Standardization) and IEC (theInternational Electrotechnical Commission) form the specialized systemfor worldwide standardization. National bodies that are members of ISO orIEC participate in the development of International Standards throughtechnical committees established by the respective organization to dealwith particular fields of technical activity. ISO and IEC technicalcommittees collaborate in fields of mutual interest. Other internationalorganizations, governmental and nongovernmental, in liaison with ISOand IEC, also take part in the work.

In the field of information technology, ISO and IEC have established ajoint technical committee, ISO/IEC JTC1. Draft International Standardsadopted by the joint technical committee are circulated to the memberbodies for voting. Publication as an International Standard requiresapproval by at least 75% of the national bodies casting a vote.

International Standard ISO/IEC 8859-15 was prepared by Joint TechnicalCommittee ISO/IEC JTC1, Information technology, Subcommittee SC2,Coded character sets.

ISO/IEC 8859 consists of the following parts, under the general titleInformation technology – 8-bit single-byte coded graphic character sets:

– Part 1: Latin alphabet No. 1– Part 2: Latin alphabet No. 2– Part 3: Latin alphabet No. 3– Part 4: Latin alphabet No. 4– Part 5: Latin/Cyrillic alphabet– Part 6: Latin/Arabic alphabet– Part 7: Latin/Greek alphabet– Part 8: Latin/Hebrew alphabet– Part 9: Latin alphabet No. 5– Part 10: Latin alphabet No. 6– Part 11: Latin/Thai alphabet – Part 12: (unassigned)– Part 13: Latin alphabet No. 7 (Baltic Rim)– Part 14: Latin alphabet No. 8 (Celtic)– Part 15: Latin alphabet No. 9

Annexes A and B of this part of ISO/IEC 8859 are for information only.

© ISO/IEC FDIS for ISO/IEC 8859-15:1998 (E)

iii

Page 5: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

Introduction

ISO/IEC 8859 consists of several parts. Each part specifies a set of up to191 graphic characters and the coded representation of these charactersby means of a single 8-bit byte. Each set is intended for use for aparticular group of languages.

FDIS for ISO/IEC 8859-15:1998 (E) © ISO/IEC

iv

Page 6: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

Information technology — 8-bit single-byte coded graphic character sets

Part 15: Latin alphabet No. 9

INTERNATIONAL STANDARD © ISO/IEC FDIS for ISO/IEC 8859-15:1998 (E)

1

1 Scope

This part of ISO/IEC 8859 specifies a set of 191coded graphic characters identified as Latinalphabet No. 9.

This set of coded graphic characters is intended foruse in data and text processing applications andalso for information interchange.

The set contains graphic characters used forgeneral purpose applications in typical officeenvironments in at least the following languages:

Albanian, Basque, Breton, Catalan, Danish, Dutch,English, Estonian, Faroese, Finnish, French,Frisian, Galician, German, Greenlandic, Icelandic,Irish Gaelic (new orthography), Italian, Latin,Luxemburgish, Norwegian, Portuguese, Rhaeto-Romanic, Scottish Gaelic, Spanish, and Swedish.

This set of coded graphic characters may beregarded as a version of an 8-bit code according toISO/IEC 2022 or ISO/IEC 4873 at level 1.

This part of ISO/IEC 8859 may not be used inconjunction with any other parts of ISO/IEC 8859. If coded characters from more than one part are tobe used together, by means of code extensiontechniques, the equivalent coded character setsfrom ISO/IEC 10367 should be used instead withina version of ISO/IEC 4873 at level 2 or level 3.

The coded characters in this set may be used inconjunction with coded control functions selectedfrom ISO/IEC 6429. However, control functions arenot used to create composite graphic symbols fromtwo or more graphic characters (see clause 6).

NOTE – ISO/IEC 8859 is not intended for use withTelematic services defined by ITU-T. If information codedaccording to ISO/IEC 8859 is to be transferred to suchservices, it will have to conform to the requirements ofthose services at the access-point.

2 Conformance

2.1 Conformance of information interchange

A coded-character-data-element (CC-data-element) within coded information for interchangeis in conformance with this part of ISO/IEC 8859 ifall the coded representations of graphic characterswithin that CC-data-element conform to the

requirements of clause 6.

2.2 Conformance of devices

A device is in conformance with this part ofISO/IEC 8859 if it conforms to the requirements of2.2.1, and either or both of 2.2.2 and 2.2.3. A claimof conformance shall identify the document whichcontains the description specified in 2.2.1.

2.2.1 Device description

A device that conforms to this part of ISO/IEC 8859shall be the subject of a description that identifiesthe means by which the user may supplycharacters to the device, or may recognize themwhen they are made available to him, as specifiedrespectively in 2.2.2 and 2.2.3.

2.2.2 Originating devices

An originating device shall allow its user to supplyany sequence of characters from those specified inclause 6, and shall be capable of transmitting theircoded representations within a CC-data-element.

2.2.3 Receiving devices

A receiving device shall be capable of receiving andinterpreting any coded representations of charactersthat are within a CC-data-element, and that conformto clause 6, and shall make the correspondingcharacters available to its user in such a way thatthe user can identify them from among thosespecified there, and can distinguish them from eachother.

3 Normative references

The following standards contain provisions which,through reference in this text, constitute provisionsof this part of ISO/IEC 8859. At the time of publica-tion, the editions indicated were valid. All standardsare subject to revision, and parties to agreementsbased on this part of ISO/IEC 8859 are encouragedto investigate the possibility of applying the mostrecent editions of the standards listed below.Members of IEC and ISO maintain registers ofcurrently valid International Standards.

Page 7: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

FDIS for ISO/IEC 8859-15:1998 (E) © ISO/IEC

2

ISO/IEC 2022:1994, Information technology –Character code structure and extension techniques.

ISO/IEC 4873:1991, Information technology – ISO8-bit code for information interchange – Structureand rules for implementation.

ISO/IEC 8824-1:1995, Information technology –Abstract Syntax Notation One (ASN.1):Specification of basic notation.

4 Definitions

For the purposes of this part of ISO/IEC 8859 thefollowing definitions apply:

4.1 bit combination: An ordered set of bits usedfor the representation of characters. (fr: 4.3)

4.2 byte: A bit string that is operated upon as aunit. (fr: 4.2)

4.3 character: A member of a set of elementsused for the organization, control, or representationof data. (fr: 4.1)

4.4 code table: A table showing the charactersallocated to each bit combination in a code. (fr: 4.9)

4.5 coded character set; code: A set ofunambiguous rules that establishes a character setand the one-to-one relationship between thecharacters of the set and their bit combinations. (fr:4.5)

4.6 coded-character-data-element (CC-data-element): An element of interchanged informationthat is specified to consist of a sequence of codedrepresentations of characters, in accordance withone or more identif ied standards for codedcharacter sets. (fr: 4.4)

4.7 graphic character: A character, other than acontrol function, that has a visual representationnormally handwritten, printed or displayed, and thathas a coded representation consisting of one ormore bit combinations. (fr: 4.2)

NOTE – In ISO/IEC 8859 a single bit combination is usedto represent each character.

4.8 graphic symbol: A visual representation of agraphic character or of a control function. (fr: 4.8)

4.9 position: That part of a code table identifiedby its column and row coordinates. (fr: 4.7)

5 Notation, code table and names

5.1 Notation

The bits of the bit combinations of the 8-bit code areidentified by b8, b7, b6, b5, b4, b3, b2, and b1, whereb8 is the highest-order, or most-significant bit and b1

is the lowest-order, or least-significant bit.

The bit combinations may be interpreted to representnumbers in binary notation by attributing thefollowing weights to the individual bits:

Using these weights, the bit combinations areidentified by notations of the form xx/yy, where xxand yy are numbers in the range 00 to 15. Thecorrespondence between the notations of the formxx/yy and the bit combinations consisting of the bitsb8 to b1 is as follows:

• xx is the number represented by b8, b7, b6 and b5

where these bits are given the weights 8, 4, 2, and1 respectively.

• yy is the number represented by b4, b3, b2 and b1

where these bits are given the weights 8, 4, 2, and1 respectively.

The bit combinations are also identified by notationsof the form hk, where h and k are numbers in therange 0 to F in hexadecimal notation. The numberh is the same as the number xx described above,and the number k is the same as the number yydescribed above.

5.2 Layout of the code table

An 8-bit code table consists of 256 positionsarranged in 16 columns and 16 rows. The columnsand the rows are numbered 00 to 15. In hexa-decimal notation the columns and the rows arenumbered 0 to F.

The code table positions are identified by notationsof the form xx/yy, where xx is the column numberand yy is the row number. The column and rownumbers are shown at the top and left edges of thetable respectively. The code table positions arealso identified by notations of the form hk, where his the column number and k is the row number inhexadecimal notation. The column and rownumbers are shown at the bottom and right edges ofthe table respectively.

The positions of the code table are in one-to-onecorrespondence with the bit combinations of thecode. The notation of a code table position, of theform xx/yy, or of the form hk, is the same as that ofthe corresponding bit combination.

5.3 Names and meanings

This part of ISO/IEC 8859 assigns a unique nameand a unique identifier to each graphic character.

Bit

Weight

b8

128 64 32 16 8 4 2 1

b7 b6 b5 b4 b3 b2 b1

Page 8: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

These names and identifiers have been taken fromISO/IEC 10646-1 (E). This part of ISO/IEC 8859also specifies an acronym for each of thecharacters SPACE, NO-BREAK SPACE and SOFTHYPHEN. For acronyms only Latin capital letters Ato Z are used. It is intended that the acronyms beretained in all translations of the text.

Except for SPACE (SP), NO-BREAK SPACE(NBSP) and SOFT HYPHEN (SHY), this part ofISO/IEC 8859 does not define and does not restrictthe meanings of graphic characters.

This part of ISO/IEC 8859 specifies a graphicsymbol for each graphic character. This symbol isshown in the corresponding position of the codetable. However, this part, or any other part, ofISO/IEC 8859 does not specify a particular style orfont design for imaging graphic characters. AnnexB of ISO/IEC 10367 gives further information onthis subject.

5.3.1 SPACE (SP)

A graphic character the visual representation ofwhich consists of the absence of a graphic symbol.

5.3.2 NO-BREAK SPACE (NBSP)

A graphic character the visual representation ofwhich consists of the absence of a graphic symbol,for use when a line break is to be prevented in thetext as presented.

5.3.3 SOFT HYPHEN (SHY)

A graphic character that is imaged by a graphicsymbol identical with, or similar to, that representingHYPHEN, for use when a line break has beenestablished within a word.

6 Specification of the codedcharacter set

This part of ISO/IEC 8859 specifies 191 charactersallocated to the bit combinations of the code table (table 2). None of these characters are combiningcharacters.

NOTE – Combining characters are described in ISO/IEC2022:1994 subclause 6.3.3.

Control functions, such as BACKSPACE orCARRIAGE RETURN, shall not be used to createcomposite graphic symbols, which are made upfrom the graphic representations of two or morecharacters.

6.1 Characters of the set and their codedrepresentation

See table 1.

Table 1 – Character set, coded representation

© ISO/IEC FDIS for ISO/IEC 8859-15:1998 (E)

3

SPACEEXCLAMATION MARKQUOTATION MARKNUMBER SIGNDOLLAR SIGNPERCENT SIGNAMPERSANDAPOSTROPHELEFT PARENTHESISRIGHT PARENTHESISASTERISKPLUS SIGNCOMMAHYPHEN-MINUSFULL STOPSOLIDUSDIGIT ZERODIGIT ONEDIGIT TWODIGIT THREEDIGIT FOURDIGIT FIVEDIGIT SIXDIGIT SEVENDIGIT EIGHTDIGIT NINECOLONSEMICOLONLESS-THAN SIGNEQUALS SIGNGREATER-THAN SIGNQUESTION MARKCOMMERCIAL ATLATIN CAPITAL LETTER ALATIN CAPITAL LETTER BLATIN CAPITAL LETTER CLATIN CAPITAL LETTER DLATIN CAPITAL LETTER ELATIN CAPITAL LETTER FLATIN CAPITAL LETTER GLATIN CAPITAL LETTER HLATIN CAPITAL LETTER ILATIN CAPITAL LETTER JLATIN CAPITAL LETTER KLATIN CAPITAL LETTER LLATIN CAPITAL LETTER MLATIN CAPITAL LETTER NLATIN CAPITAL LETTER OLATIN CAPITAL LETTER PLATIN CAPITAL LETTER QLATIN CAPITAL LETTER RLATIN CAPITAL LETTER SLATIN CAPITAL LETTER TLATIN CAPITAL LETTER ULATIN CAPITAL LETTER VLATIN CAPITAL LETTER WLATIN CAPITAL LETTER XLATIN CAPITAL LETTER YLATIN CAPITAL LETTER ZLEFT SQUARE BRACKETREVERSE SOLIDUSRIGHT SQUARE BRACKETCIRCUMFLEX ACCENTLOW LINE

02/0002/0102/0202/0302/0402/0502/0602/0702/0802/0902/1002/1102/1202/1302/1402/1503/0003/0103/0203/0303/0403/0503/0603/0703/0803/0903/1003/1103/1203/1303/1403/1504/0004/0104/0204/0304/0404/0504/0604/0704/0804/0904/1004/1104/1204/1304/1404/1505/0005/0105/0205/0305/0405/0505/0605/0705/0805/0905/1005/1105/1205/1305/1405/15

Bitcombi-nation

NameHex

202122232425262728292A2B2C2D2E2F303132333435363738393A3B3C3D3E3F404142434445464748494A4B4C4D4E4F505152535455565758595A5B5C5D5E5F

U+0020U+0021U+0022U+0023U+0024U+0025U+0026U+0027U+0028U+0029U+002AU+002BU+002CU+002DU+002EU+002FU+0030U+0031U+0032U+0033U+0034U+0035U+0036U+0037U+0038U+0039U+003AU+003BU+003CU+003DU+003EU+003FU+0040U+0041U+0042U+0043U+0044U+0045U+0046U+0047U+0048U+0049U+004AU+004BU+004CU+004DU+004EU+004RU+0050U+0051U+0052U+0053U+0054U+0055U+0056U+0057U+0058U+0059U+005AU+005BU+005CU+005DU+005EU+005F

Identifier

Page 9: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

4

Table 1 (continued) Table 1 (concluded)

FDIS for ISO/IEC 8859-15:1998 (E) © ISO/IEC

06/0006/0106/0206/0306/0406/0506/0606/0706/0806/0906/1006/1106/1206/1306/1406/1507/0007/0107/0207/0307/0407/0507/0607/0707/0807/0907/1007/1107/1207/1307/14

10/0010/0110/0210/0310/0410/0510/0610/0710/0810/0910/1010/1110/1210/1310/1410/1511/0011/0111/0211/0311/0411/0511/0611/0711/0811/0911/1011/1111/1211/1311/1411/15

GRAVE ACCENTLATIN SMALL LETTER ALATIN SMALL LETTER BLATIN SMALL LETTER CLATIN SMALL LETTER DLATIN SMALL LETTER ELATIN SMALL LETTER FLATIN SMALL LETTER GLATIN SMALL LETTER HLATIN SMALL LETTER ILATIN SMALL LETTER JLATIN SMALL LETTER KLATIN SMALL LETTER LLATIN SMALL LETTER MLATIN SMALL LETTER NLATIN SMALL LETTER OLATIN SMALL LETTER PLATIN SMALL LETTER QLATIN SMALL LETTER RLATIN SMALL LETTER SLATIN SMALL LETTER TLATIN SMALL LETTER ULATIN SMALL LETTER VLATIN SMALL LETTER WLATIN SMALL LETTER XLATIN SMALL LETTER YLATIN SMALL LETTER ZLEFT CURLY BRACKETVERTICAL LINERIGHT CURLY BRACKETTILDE

NO-BREAK SPACEINVERTED EXCLAMATION MARKCENT SIGN POUND SIGNEURO SIGNYEN SIGNLATIN CAPITAL LETTER S WITH CARONSECTION SIGNLATIN SMALL LETTER S WITH CARONCOPYRIGHT SIGNFEMININE ORDINAL INDICATORLEFT-POINTING DOUBLE ANGLE QUOTATION MARKNOT SIGNSOFT HYPHENREGISTERED SIGNMACRONDEGREE SIGNPLUS-MINUS SIGNSUPERSCRIPT TWOSUPERSCRIPT THREELATIN CAPITAL LETTER Z WITH CARONMICRO SIGNPILCROW SIGNMIDDLE DOTLATIN SMALL LETTER Z WITH CARONSUPERSCRIPT ONEMASCULINE ORDINAL INDICATORRIGHT-POINTING DOUBLE ANGLE QUOTATION MARKLATIN CAPITAL LIGATURE OELATIN SMALL LIGATURE OELATIN CAPITAL LETTER Y WITH DIAERESISINVERTED QUESTION MARK

12/0012/0112/0212/0312/0412/0512/0612/0712/0812/0912/1012/1112/1212/1312/1412/1513/0013/0113/0213/0313/0413/0513/0613/0713/0813/0913/1013/1113/1213/1313/1413/1514/0014/0114/0214/0314/0414/0514/0614/0714/0814/0914/1014/1114/1214/1314/1414/1515/0015/0115/0215/0315/0415/0515/0615/0715/0815/0915/1015/1115/1215/1315/1415/15

LATIN CAPITAL LETTER A WITH GRAVE LATIN CAPITAL LETTER A WITH ACUTE LATIN CAPITAL LETTER A WITH CIRCUMFLEX LATIN CAPITAL LETTER A WITH TILDE LATIN CAPITAL LETTER A WITH DIAERESIS LATIN CAPITAL LETTER A WITH RING ABOVE LATIN CAPITAL LETTER AE LATIN CAPITAL LETTER C WITH CEDILLA LATIN CAPITAL LETTER E WITH GRAVE LATIN CAPITAL LETTER E WITH ACUTE LATIN CAPITAL LETTER E WITH CIRCUMFLEX LATIN CAPITAL LETTER E WITH DIAERESIS LATIN CAPITAL LETTER I WITH GRAVE LATIN CAPITAL LETTER I WITH ACUTE LATIN CAPITAL LETTER I WITH CIRCUMFLEX LATIN CAPITAL LETTER I WITH DIAERESIS LATIN CAPITAL LETTER ETH LATIN CAPITAL LETTER N WITH TILDE LATIN CAPITAL LETTER O WITH GRAVE LATIN CAPITAL LETTER O WITH ACUTE LATIN CAPITAL LETTER O WITH CIRCUMFLEX LATIN CAPITAL LETTER O WITH TILDE LATIN CAPITAL LETTER O WITH DIAERESIS MULTIPLICATION SIGNLATIN CAPITAL LETTER O WITH STROKE LATIN CAPITAL LETTER U WITH GRAVELATIN CAPITAL LETTER U WITH ACUTELATIN CAPITAL LETTER U WITH CIRCUMFLEXLATIN CAPITAL LETTER U WITH DIAERESISLATIN CAPITAL LETTER Y WITH ACUTE LATIN CAPITAL LETTER THORN LATIN SMALL LETTER SHARP S LATIN SMALL LETTER A WITH GRAVE LATIN SMALL LETTER A WITH ACUTE LATIN SMALL LETTER A WITH CIRCUMFLEX LATIN SMALL LETTER A WITH TILDE LATIN SMALL LETTER A WITH DIAERESIS LATIN SMALL LETTER A WITH RING ABOVE LATIN SMALL LETTER AE LATIN SMALL LETTER C WITH CEDILLA LATIN SMALL LETTER E WITH GRAVE LATIN SMALL LETTER E WITH ACUTE LATIN SMALL LETTER E WITH CIRCUMFLEX LATIN SMALL LETTER E WITH DIAERESIS LATIN SMALL LETTER I WITH GRAVE LATIN SMALL LETTER I WITH ACUTE LATIN SMALL LETTER I WITH CIRCUMFLEX LATIN SMALL LETTER I WITH DIAERESIS LATIN SMALL LETTER ETH LATIN SMALL LETTER N WITH TILDE LATIN SMALL LETTER O WITH GRAVE LATIN SMALL LETTER O WITH ACUTE LATIN SMALL LETTER O WITH CIRCUMFLEX LATIN SMALL LETTER O WITH TILDE LATIN SMALL LETTER O WITH DIAERESIS DIVISION SIGN LATIN SMALL LETTER O WITH STROKE LATIN SMALL LETTER U WITH GRAVE LATIN SMALL LETTER U WITH ACUTE LATIN SMALL LETTER U WITH CIRCUMFLEX LATIN SMALL LETTER U WITH DIAERESIS LATIN SMALL LETTER Y WITH ACUTE LATIN SMALL LETTER THORN LATIN SMALL LETTER Y WITH DIAERESIS

Bitcombi-nation

NameBitcombi-nation

NameHex

606162636465666768696A6B6C6D6E6F707172737475767778797A7B7C7D7E

A0A1A2A3A4A5A6A7A8A9AAABACADAEAFB0B1B2B3B4B5B6B7B8B9BABBBCBDBEBF

Identifier

U+0060U+0061U+0062U+0063U+0064U+0065U+0066U+0067U+0068U+0069U+006AU+006BU+006CU+006DU+006EU+006FU+0070U+0071U+0072U+0073U+0074U+0075U+0076U+0077U+0078U+0079U+007AU+007BU+007CU+007DU+007E

U+00A0U+00A1U+00A2U+00A3U+20ACU+00A5U+0160U+00A7U+0161U+00A9U+00AAU+00ABU+00ACU+00ADU+00AEU+00AFU+00B0U+00B1U+00B2U+00B3U+017DU+00B5U+00B6U+00B7U+017EU+00B9U+00BAU+00BBU+0152U+0153U+0178U+00BF

Hex

C0C1C2C3C4C5C6C7C8C9CACBCCCDCECFD0D1D2D3D4D5D6D7D8D9DADBDCDDDEDFE0E1E2E3E4E5E6E7E8E9EAEBECEDEEEFF0F1F2F3F4F5F6F7F8F9FAFBFCFDFEFF

Identifier

U+00C0U+00C1U+00C2U+00C3U+00C4U+00C5U+00C6U+00C7U+00C8U+00C9U+00CAU+00CBU+00CCU+00CDU+00CEU+00CFU+00D0U+00D1U+00D2U+00D3U+00D4U+00D5U+00D6U+00D7U+00D8U+00D9U+00DAU+00DBU+00DCU+00DDU+00DEU+00DFU+00E0U+00E1U+00E2U+00E3U+00E4U+00E5U+00E6U+00E7U+00E8U+00E9U+00EAU+00EBU+00ECU+00EDU+00EEU+00EFU+00F0U+00F1U+00F2U+00F3U+00F4U+00F5U+00F6U+00F7U+00F8U+00F9U+00FAU+00FBU+00FCU+00FDU+00FEU+00FF

Page 10: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

hex

© ISO/IEC FDIS for ISO/IEC 8859-15:1998 (E)

5

6.2 Code table

For each character in the set the code table (table 2)shows a graphic symbol at the position in the codetable corresponding to the bit combination specifiedin table 1.

The shaded positions in the code table correspond tobit combinations that do not represent graphiccharacters. Their use is outside the scope of ISO/IEC8859; it is specified in other International Standards,for example ISO/IEC 6429.

00

0

0

0b8

b7

b6

b5

0

01

0

1

0

0

02

1

0

0

0

03

1

1

0

0

04

0

0

0

1

05

0

1

0

1

06

1

0

0

1

07

1

1

0

1

08

0

0

1

0

09

0

1

1

0

10

1

0

1

0

11

1

1

1

0

12

0

0

1

1

13

0

1

1

1

14

1

0

1

1

15

1

1

1

1

000 00

b4 b3 b2 b1

0

010 10 0

021 00 0

031 10 0

040 00 1

050 10 1

061 00 1

071 10 1

080 01 0

090 11 0

101 01 0

111 11 0

120 01 1

130 11 1

141 01 1

151 11 1

SP 0 @ P ` p NBSP ° À Ð à ð

! 1 A Q a q ¡ ± Á Ñ á ñ

" 2 B R b r ¢ ² Â Ò â ò

# 3 C S c s £ ³ Ã Ó ã ó

$ 4 D T d t ¤ ´ Ä Ô ä ô

% 5 E U e u ¥ µ Å Õ å õ

& 6 F V f v ¦ ¶ Æ Ö æ ö

' 7 G W g w § · Ç × ç ÷

( 8 H X h x ¨ ¸ È Ø è ø

) 9 I Y i y © ¹ É Ù é ù

* : J Z j z ª º æ Ú ê ú

+ ; K [ k { « » Ë Û ë û

, < L \ l | ¬ ¼ Ì Ü ì ü

- = M ] m } SHY ½ Í Ý í ý

. > N ^ n ~ ® ¾ Î Þ î þ

/ ? O _ o ¯ ¿ Ï ß ï ÿ

Table 2 – Code table of Latin alphabet No. 9

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

FEDCBA9876543210

Page 11: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

FDIS for ISO/IEC 8859-15:1998 (E) © ISO/IEC

6

7 Identification of the character set

7.1 Identification according to ISO/IEC 2022and ISO/IEC 4873

The graphic characters of this part of ISO/IEC 8859constitute a single coded character set. However inaccordance with ISO/IEC 2022 and ISO/IEC 4873the code table of this part of ISO/IEC 8859 may beconsidered to consist of the following components:

• The character SPACE represented by bitcombination 02/00;

• a 94-character G0 graphic character setrepresented by bit combinations 02/01 to 07/14;

• a 96-character G1 graphic character setrepresented by bit combinations 10/00 to 15/15.

When the identification methods of ISO/IEC 2022 orISO/IEC 4873 are used this part of ISO/IEC 8859shall be identif ied by the following pair ofdesignation functions:

GZD4 04/02 (ESC 02/08 04/02)G1D6 06/02 (ESC 02/13 06/02)

NOTE – The corresponding escape sequences areshown in parentheses.

7.2 Identification according to ISO/IEC 8824-1(ASN.1)

In the terminology of ISO/IEC 8824-1 the characterset of this part of ISO/IEC 8859 and thecorresponding coded representations are distinct,and are known as the “character abstract syntax”and the “character transfer syntax” respectively.

When the identification methods of ISO/IEC 8824-1are used this part of ISO/IEC 8859 shall beidentified by the following object identifiers:

• character set{ iso standard 8859 15 abstract-syntax (1) }

• coded representations{ iso standard 8859 15 transfer-syntax (0) }

The corresponding object descriptions shall be:

• character set “ISO 8859 part 15 repertoire”

• coded representations “ISO 8859 part 15 code”

7.3 Identification using the ISO Internationalregister of coded character sets to be used withescape sequences

According to 7.1 above the character set of thispart of ISO/IEC 8859 may be considered to consistof the character SPACE, a 94-character G0 graphiccharacter set, and a 96-character G1 graphiccharacter set. The G0 and G1 graphic charactersets may be identified by the use of the RegistrationNumbers from the ISO International register ofcoded character sets to be used with escapesequences.

When these registration numbers are used this partof ISO/IEC 8859 shall be identifed by the followingpair of registration numbers:

• G0 graphic character set ISO-IR 6• G1 graphic character set ISO-IR 203

Page 12: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

© ISO/IEC FDIS for ISO/IEC 8859-15:1998 (E)

7

A.1 Languages of European origin written in Latinscript

The following parts 1–15 of ISO/IEC 8859 specifycoded character sets which comprise variousdifferent selections of characters based on the Latinalphabet. These sets are identified by the numbers 1to 9 as shown.

ISO/IEC 8859-1 Latin alphabet No. 1ISO/IEC 8859-2 Latin alphabet No. 2ISO/IEC 8859-3 Latin alphabet No. 3

ISO/IEC 8859-4 Latin alphabet No. 4ISO/IEC 8859-9 Latin alphabet No. 5ISO/IEC 8859-10 Latin alphabet No. 6ISO/IEC 8859-13 Latin alphabet No. 7 (Baltic Rim)ISO/IEC 8859-14 Latin alphabet No. 8 (Celtic)ISO/IEC 8859-15 Latin alphabet No. 9

The following official and regional languages writtenin Europe are known to be covered by the Latinalphabets 1–9 as indicated by number in table A.1:

Annexe A (informative)

Coverage of languages by parts 1 to 10 and 13 to 15 of ISO/IEC 8859

Table A.1 – Language coverage

NOTES

1 The list of languages in table A.1 is not exhaustive. Itshows the languages that are included in the Scopeclause of each part of ISO/IEC 8859.

2 For writing French three characters (Œ, œ, Ÿ), notcovered in parts 1, 3, 9, and 14, are included in part 15.For writing Finnish four characters (S, s, Z, z), not coveredin parts 1, 9, and 14, are included in parts 4, 10, 13, and 15.

3 According to the Romanian Standards Institute, thecharacters LATIN CAPITAL LETTER S WITH COMMABELOW, LATIN SMALL LETTER S WITH COMMA BELOW,LATIN CAPITAL LETTER T WITH COMMA BELOW, andLATIN SMALL LETTER T WITH COMMA BELOW (S,, s, , T, , t, )in use in Romania, are different from the correspondingcharacters LATIN CAPITAL LETTER S WITH CEDILLA,LATIN SMALL LETTER S WITH CEDILLA, LATIN CAPITALLETTER T WITH CEDILLA, and LATIN SMALL LETTER T

WITH CEDILLA (S, s, T, t) that are specified in part 2 ofISO/IEC 8859. However, subject to the agreement oforiginator and receiver in information interchange theletters WITH CEDILLA in part 2 may be used to substitutefor the letters WITH COMMA BELOW.

4 The various Sámi languages use partly differingorthographies. The character sets in parts 4 and 10 coverthe requirements of the Sámi languages most commonlyused in Finland, Norway and Sweden. For the Skolt Sámilanguage used in Finland and Norway additionalcharacters are needed. These are included in ISO-IR158 and 197.

5 There are several official written languages outsideEurope that are covered by Latin alphabet No. 1.Examples are Indonesian/Malay, Tagalog (Philippines),Swahili, Afrikaans.

6 Use of Latin alphabet No. 3 for Turkish is deprecated.

AlbanianBasqueBretonCatalanCornishCroatianCzechDanishDutchEnglishEsperantoEstonianFaroeseFinnishFrenchFrisianGalicianGermanGreenlandicHungarianIcelandicIrish Gaelic

(new orthography)

Irish Gaelic(old orthography)

ItalianLatinLatvianLithuanianLuxemburgishMalteseManx GaelicNorwegianPolishPortugueseRhaeto-RomanicRomanianSámiScottish GaelicSlovakSlovenianSorbianSpanishSwedishTurkishWelsh

Language Covered by alphabet(s) Language Covered by alphabet(s)

1 2 5 8 91 5 8 91 5 8 91 5 8 91 5 8

22

1 4 5 6 8 91 5 91 2 3 4 5 6 7 8 9

34 6 7 9

1 6 9(1) 4 (5)6 7 (8)9(1) (3) (5) (8)91 5 91 5 8 91 2 3 4 5 6 8 91 4 5 6 8 9

21 6 91 5 6 8 9

8

1 3 5 8 91 2 3 4 5 6 7 8 9

4 74 6 7

1 5 8 93

81 4 5 6 7 8 9

21 3 5 8 91 5 8 9

(2)4 6

1 5 8 922 4 62

1 5 8 91 4 5 6 8 9

(3) 58

Page 13: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

FDIS for ISO/IEC 8859-15:1998 (E) © ISO/IEC

8

A.2 Languages written in non-Latin scripts

The following parts of ISO/IEC 8859 specify codedcharacter sets which include characters fromalphabets other than the Latin alphabet:

ISO/IEC 8859-5 Latin/Cyrillic alphabetISO/IEC 8859-6 Latin/Arabic alphabetISO/IEC 8859-7 Latin/Greek alphabetISO/IEC 8859-8 Latin/Hebrew alphabetCD 8859-11 Latin/Thai alphabet

The following official and regional languages arecovered by these alphabets:

The Cyrillic characters included in part 5 coverBulgarian, Byelorussian, (Slavic) Macedonian,Russian, Serbian, and Ukrainian (as written up to1990, see also Scope of part 5).

The Arabic characters included in part 6 coverArabic. The Greek characters included in part 7cover Greek (monotonikó orthography). TheHebrew characters included in part 8 coverHebrew. The Thai characters included in part 11cover Thai.

Annex B(informative)

Bibliography

ISO/IEC 6429:1992, Information technology –Control functions for coded character sets.

ISO/IEC 10367:1991, Information technology –Standardized coded graphic character sets for usein 8-bit codes.

ISO/IEC 10646-1:1993, Information technology –Universal Multiple-Octet Coded Character Set(UCS) - Part 1: Architecture and Basic MultilingualPlane.

ISO International register of coded character setsto be used with escape sequences.

Page 14: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

Source: Alain LaBonté, Michael Everson, Bernard Chauvois

Titre: FDIS pour l’alphabet latin n° 9

Date: 1998-04-29

Statut: À titre d’information pour l’ISO/CEI JTC1 SC2/GT3

PAGE-TITREà fournir par l’ITTF

© ISO/CEI FDIS pour ISO/CEI 8859-15:1998 (F)

Page 15: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

FDIS pour l’ISO/CEI 8859-15:1998 (F) © ISO/CEI

ii

Contenu

Page

Avant-propos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

1 Domaine d’application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2 Conformité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

3 Références normatives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

4 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

5 Notation, table de code et noms de caractères . . . . . . . . . . . 2

6 Caractéristiques du jeu de caractères codés. . . . . . . . . . . . . 3

7 Identification du jeu de caractères . . . . . . . . . . . . . . . . . . . . . 6

Annexe A Langues couvertes par les parties 1 à 10 et

13 à 15 de l’ISO/CEI 8859 . . . . . . . . . . . . . . . . . . . . . . . . 7

Annexe B Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

© ISO/CEI 1998

Droits de reproduction réservés. Sauf prescription différente, aucune partie de cettepublication ne peut être reproduite ni utilisée sous quelque forme que ce soit et paraucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms,sans l’accord écrit de l’éditeur.

ISO/CEI Copyright Office • Case postale 56 • CH–1211 Genève 20 • Suisse

Imprimé en Suisse

Page 16: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

Avant-propos

L’ISO (Organisation internationale de normalisation) et la CEI(Commission électrotechnique internationale) constituent les organismesspécialisés en normalisation sur le plan mondial. Des organismesnationaux membres de l’ISO ou de la CEI participent au développementdes normes internationales par l’entremise de comités techniques. Cescomités sont formés par les deux organisations pour agir dans deschamps d’intérêt mutuel. En accord avec l’ISO et la CEI d’autresorganismes internationaux, gouvernementaux et non gouvernementaux,prennent aussi part à ce travail.

Dans le domaine des technologies de l’information, l’ISO et la CEI ontétabli un comité technique conjoint connu sous le nom de ISO/CEI JTC1.Des ébauches de normes internationales adoptées par le comitétechnique sont soumises aux organismes nationaux pour approbation.Afin d’être publiée, une norme internationale doit avoir obtenu au moins75 % des votes des organismes nationaux.

La présente partie 15 de la norme internationale ISO/CEI 8859 a étépréparée par le Comité technique conjoint ISO/CEI JTC1, Technologiesde l’information, Sous-comité SC2, Jeux de caractères et codage del’information.

L’ISO/CEI 8859 comprend les parties suivantes, sous le titre généralTechnologies de l’information – jeux de caractères à huit bits codés surun seul octet:

- Partie 1: Alphabet latin n° 1- Partie 2: Alphabet latin n° 2- Partie 3: Alphabet latin n° 3- Partie 4: Alphabet latin n° 4- Partie 5: Alphabet latin/cyrillique- Partie 6: Alphabet latin/arabe- Partie 7: Alphabet latin/grec- Partie 8: Alphabet latin/hébreu- Partie 9: Alphabet latin n° 5- Partie 10: Alphabet latin n° 6- Partie 11: Alphabet latin/thaï- Partie 12: (non attribuée)- Partie 13: Alphabet latin n° 7 (pourtour baltique)- Partie 14: Alphabet latin n° 8 (celte)- Partie 15: Alphabet latin n° 9

Les annexes A et B de la présente partie de l’ISO/CEI 8859 sont donnéesuniquement à titre d’information.

© ISO/CEI ISO/CEI 8859-14:1998 (F)

iii

Page 17: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

Introduction

L’ISO/CEI 8859 comprend plusieurs parties. Chaque partie décrit un jeupouvant aller jusqu’à 191 caractères graphiques et leur représentationcodée au moyen d’un seul octet de 8 bits. Chaque jeu est destiné àl’usage d’un groupe particulier de langues.

FDIS pour l’ISO/CEI 8859-15:1998 (F) © ISO/CEI

iv

Page 18: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

Technologies de l’information – Jeux de caractères à huit bits codés sur un seul octet

Partie 15 : Alphabet latin n° 9

NORME INTERNATIONALE © ISO/CEI FDIS pour l’ISO/CEI 8859-15:1998 (F)

1

1 Domaine d’application

La présente partie de l’ISO/CEI 8859 décrit un jeude 191 caractères graphiques codés. Ce jeu estdésigné sous le nom d’alphabet latin n° 9.

Ce jeu de caractères graphiques codés est destinéaux applications de traitement de données et detraitement de texte de même qu’aux échangesd’information.

Ce jeu comprend des caractères graphiquesutilisés pour des applications générales dans desenvironnements de type bureautique au moinspour les langues suivantes :

albanais, allemand, anglais, basque, breton,catalan, danois, espagnol, estonien, féroïen,finnois, français, frison, gaélique écossais, gaéliqueirlandais (nouvelle orthographe), galicien, gallois,groenlandais, islandais, italien, latin, luxem-bourgeois, néerlandais, norvégien, portugais,romanche et suédois.

Ce jeu de caractères graphiques codés peut êtreconsidéré comme une version d’un code à huit bitsen vertu de l’ISO/CEI 2022 ou de l’ISO/CEI 4873au niveau 1.

La présente partie de l’ISO/CEI 8859 ne peut êtreutilisée conjointement avec d’autres parties del’ISO/CEI 8859. Si l’on veut utiliser ensemble, aumoyen des techniques d’extension de codes, desjeux de caractères codés appartenant à plus d’unepartie, les jeux de caractères codés de l’ISO/CEI10367 devraient plutôt être utilisées dans le cadred’une version de l’ISO/CEI 4873 aux niveaux 2 ou3.

Les caractères codés de ce jeu peuvent êtreutilisés conjointement avec des fonctions decommandes choisies parmi celles de l’ISO/CEI6429. Toutefois, l’on ne peut utiliser les fonctionsde commande pour créer des symboles graphiquescomposites à partir de la superposition de deuxcaractères graphiques ou plus (voir l’article 6).

NOTE – La norme ISO/CEI 8859 n’est pas destiné à unusage télématique prescrit par l’UIT-T. Si l’on doittransférer de l’information codée selon l’ISO/CEI 8859 àde tels services, cette information devra être conformeaux prescriptions de ces services au point d’accès.

2 Conformité

2.1 Conformité des échanges d’information

Un élément de données à caractères codés(élément-de-données-CC) inclus dans del’ information destinée à être échangée estconforme à la présente partie de l’ISO/CEI 8859 sitoutes les représentations codées des caractèresgraphiques à l’ intérieur de cet élément-de-données-CC sont conformes aux prescriptions del’article 6.

2.2 Conformité d’un dispositif

Un dispositif est conforme à la présente partie del’ISO/CEI 8859 s’il est conforme aux prescriptionsen 2.2.1, et à celles en 2.2.2 ou en 2.2.3 ou desdeux. Une déclaration de conformité doit identifierle document qui contient la description visée en2.2.1.

2.2.1 Description du dispositif

Un dispositif conforme à la présente partie del’ISO/CEI 8859 doit faire l’objet d’une descriptionqui identifie les moyens par lesquels l’utilisateurpeut présenter des caractères au dispositif, ou parlesquels il peut les reconnaître quand ils lui sontprésentés, tel que cela est prescrit respectivementen 2.2.2 et en 2.2.3.

2.2.2 Dispositifs émetteurs

Un dispositif émetteur doit permettre à sonutil isateur de présenter toute séquence decaractères parmi ceux qui sont décrits à l’article 6,et doit être capable de transmettre leurreprésentation codée à l’intérieur d’un élément-de-données-CC.

2.2.3 Dispositifs récepteurs

Un dispositif récepteur doit être capable de recevoiret d’interpréter toute représentation codée descaractères à l’intérieur d’un élément-de-données-CC conforme à l’article 6, et doit restituer lescaractères correspondants à son utilisateur d’unemanière telle que ce dernier puisse les identifierparmi ceux qui y sont décrits, et d’une manière tellequ’il puisse aussi les distinguer les uns des autres.

Page 19: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

FDIS pour l’ISO/CEI 8859-15:1998 (F) © ISO/CEI

2

3 Références normatives

Les normes suivantes contiennent des dispositionsqui, par suite de la référence qui y est faite,constituent des dispositions valables pour laprésente partie de l’ISO/CEI 8859. Au moment dela publication, les éditions indiquées étaient envigueur. Toute norme est sujette à révision et lesparties prenantes aux accords fondés sur laprésente partie de l’ISO/CEI 8859 sont invitées àrechercher la possibilité d’appliquer les éditions lesplus récentes des normes indiquées ci-après. Lesmembres de la CEI et de l’ISO tiennent à jour leregistre des normes internationales en vigueur à unmoment donné.

ISO/CEI 2022:1994, Technologies de l’information– Structure d’un code de caractères et techniquesd’extension de code.

ISO/CEI 4873:1991, Technologies de l’information– Code à 8 bits pour l’échange d’information –Structure et règles d’implantation.

ISO/CEI 8824-1:1995 Technologies de l’infor-mation – Notation de syntaxe abstraite numéro un(ASN.1) : Spécification de la notation de base

4 Définitions

Dans le cadre de cette partie de l’ISO/CEI 8859,les définitions suivantes s’appliquent :

4.1 caractère : un membre d’un ensembled’éléments uti l isés pour l ’organisation, lacommande ou la représentation de données.(en : 4.3)

4.2 caractère graphique : un caractère, autrequ’une fonction de commande, qui comporte unereprésentation visuelle normalement manuscrite,imprimée ou affichée, et dont la représentationcodée consiste en une ou plusieurs combinaisonsbinaires. (en : 4.7)

NOTE – Dans l’ISO/CEI 8859 une seule combinaisonbinaire représente chaque caractère.

4.3 combinaison binaire : une série de bitsutilisée pour la représentation de caractères.(en : 4.1)

4.4 élément de données à caractères codés(élément-de-données-CC) : un élément d’infor-mation à échanger consistant en une séquence dereprésentations codées de caractères, en accordavec une ou plusieurs normes de jeux decaractères codés dûment identifiées. (en : 4.6)

4.5 jeu de caractères codés ; code : unensemble de règles non-ambiguës qui établissent

un jeu de caractères et la relation bi-univoque entreles caractères du jeu et leur combinaison binaire.(en : 4.5)

4.6 octet : une chaîne binaire considéréecomme unité. (en : 4.2)

4.7 position : une partie d’une table de codeidentifiée par les coordonnées de sa rangée et desa colonne. (en : 4.9)

4.8 symbole graphique : une représentationvisuelle d’un caractère graphique ou d’une fonctionde commande. (en : 4.8)

4.9 table de code : une table montrant lescaractères attribués à chaque combinaison binairedans un code. (en : 4.4)

5 Notation, table de code et noms

5.1 Notation

Les bits des combinaisons binaires du code à 8 bitssont identifiés par b8, b7, b6, b5, b4, b3, b2, et b1, oùb8 est le bit le plus significatif, et b1 est le bit lemoins significatif.

Une combinaison binaire représente un nombre ennotation binaire, interprété en attribuant un poidsaux bits individuels de la manière suivante :

En utilisant ces poids, les combinaisons sontnotées sous la forme xx/yy, où xx et yy sont desnombres compris entre 00 et 15. La correspon-dance entre la notation de forme xx/yy et unecombinaison binaire b8 à b1 s’établit comme suit :

• xx est le nombre représenté par b8, b7, b6 et b5

où ces bits ont comme poids respectif 8, 4, 2 et1.

• yy est le nombre représenté par b4, b3, b2 et b1

où ces bits ont comme poids respectif 8, 4, 2 et1.

L’on identifie aussi les combinaisons binaires sousla forme hk, où h et k sont des nombres comprisentre 0 et F en notation hexadécimale ; h et kreprésentent respectivement les mêmes nombresque xx et yy décrits précédemment.

5.2 Présentation de la table de code

La table d’un code à 8 bits comprend 256 positionsarrangées en 16 colonnes et en 16 rangées. Lescolonnes et les rangées sont numérotées de 00 à15. En notation hexadécimale, les colonnes et les

Bit

Poids

b8

128 64 32 16 8 4 2 1

b7 b6 b5 b4 b3 b2 b1

Page 20: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

rangées sont numérotées de 0 à F.

L’on utilise la notation xx/yy pour noter les positionsde la table de code ; dans ce cas, xx représente lenuméro de la colonne et yy le numéro de la rangée.Selon cette notation, la colonne et la ligne sontindiquées respectivement au-dessus et sur le côtégauche de la table. L’on utilise aussi une autrenotation, sous forme hk, pour noter les mêmespositions ; dans ce cas, h représente le numéro dela colonne et k le numéro de la rangée en notationhexadécimale. Selon cette deuxième notation, lacolonne et la l igne sont alors indiquéesrespectivement en-dessous et sur le côté droit dela table.

Les positions de la table de code correspondent demanière bi-univoque avec les combinaisonsbinaires du code. La notation d’une position de latable de code, qu’elle soit de forme xx/yy ou deforme hk, est la même que celle de la combinaisonbinaire correspondante.

5.3 Les noms et leur signification

La présente partie de l’ISO/CEI 8859 attribue unnom unique et un identifiant unique à chaquecaractère graphique. Ces noms et ces identifiantssont tirés de l’ISO/CEI 10646-1 (F). La présentepartie de l’ISO/CEI 8859 définit aussi un acronymepour les caractères ESPACE, ESPACEINSÉCABLE et TRAIT D’UNION VIRTUEL. Pourles acronymes, seules les lettres majusculeslatines de A à Z sont utilisées. Ces acronymesdevront être retenus dans toutes les traductions dutexte.

Sauf pour les caractères ESPACE (SP), ESPACEINSÉCABLE (NBSP) et TRAIT D’UNION VIRTUEL(SHY), la présente partie de l’ISO/CEI 8859 nedéfinit ni ne restreint la signification d’aucuncaractère graphique.

La présente partie de l’ISO/CEI 8859 présente unsymbole graphique pour chaque caractèregraphique. La position correspondante de la tablede code montre ce symbole. Toutefois, ni laprésente partie, ni aucune des autre parties del’ISO/CEI 8859 ne prescrit un style ou une policede caractères particuliers pour la présentation descaractères graphiques. L’annexe B de l’ISO/CEI10367 donne de plus amples informations à cepropos.

5.3.1 ESPACE (SP)

Un caractère graphique dont la représentationvisuelle consiste en l’absence de symbolegraphique.

5.3.2 ESPACE INSÉCABLE (NBSP)

Un caractère graphique dont la représentationvisuelle consiste en l’absence de symbolegraphique, et que l’on utilise pour éviter que deuxportions de texte soit séparées par un changementde ligne.

5.3.3 TRAIT D’UNION VIRTUEL (SHY)

Un caractère graphique dont la représentationvisuelle est identique ou similaire à celle du TRAITD’UNION, et que l’on utilise lorsque il est établiqu’une coupure de mot peut survenir en fin deligne.

6 Caractéristiques du jeu decaractères

La présente partie de l’ISO/CEI 8859 associe uncaractère à chacune de 191 combinaisons binairesde la table de code (table 2). Aucun de cescaractères n’est un caractère combinatoire.

NOTE – Les caractères combinatoires sont décrits ausous-paragraphe 6.3.3 de l’ISO/CEI 2022:1994.

Les fonctions de commande, telles que l’ESPACEARRIÈRE ou le RETOUR DE CHARIOT, nedoivent pas être utilisées pour créer des symbolesgraphiques composites, qui sont des symbolesfabriqués à partir de la représentation graphique dedeux caractères ou plus.

6.1 Caractères du jeu et leur représentationgraphique

Voir la table 1.

© ISO/CEI FDIS pour l’ISO/CEI 8859-15:1998 (F)

3

Page 21: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

FDIS pour l’ISO/CEI 8859-15:1998 (F) © ISO/CEI

4

Table 1 – Jeu de caractères, représentation codée Table 1 (suite)

06/0006/0106/0206/0306/0406/0506/0606/0706/0806/0906/1006/1106/1206/1306/1406/1507/0007/0107/0207/0307/0407/0507/0607/0707/0807/0907/1007/1107/1207/1307/14

10/0010/0110/0210/0310/0410/0510/0610/0710/0810/0910/1010/1110/1210/1310/1410/1511/0011/0111/0211/0311/0411/0511/0611/0711/0811/0911/1011/1111/1211/1311/1411/15

ACCENT GRAVE (avec chasse)LETTRE MINUSCULE LATINE ALETTRE MINUSCULE LATINE BLETTRE MINUSCULE LATINE CLETTRE MINUSCULE LATINE DLETTRE MINUSCULE LATINE ELETTRE MINUSCULE LATINE FLETTRE MINUSCULE LATINE GLETTRE MINUSCULE LATINE HLETTRE MINUSCULE LATINE ILETTRE MINUSCULE LATINE JLETTRE MINUSCULE LATINE KLETTRE MINUSCULE LATINE LLETTRE MINUSCULE LATINE MLETTRE MINUSCULE LATINE NLETTRE MINUSCULE LATINE OLETTRE MINUSCULE LATINE PLETTRE MINUSCULE LATINE QLETTRE MINUSCULE LATINE RLETTRE MINUSCULE LATINE SLETTRE MINUSCULE LATINE TLETTRE MINUSCULE LATINE ULETTRE MINUSCULE LATINE VLETTRE MINUSCULE LATINE WLETTRE MINUSCULE LATINE XLETTRE MINUSCULE LATINE YLETTRE MINUSCULE LATINE ZACCOLADE GAUCHEBARRE VERTICALEACCOLADE DROITETILDE (avec chasse)

ESPACE INSÉCABLEPOINT D’EXCLAMATION INVERSÉSYMBOLE CENTIMESYMBOLE LIVRESYMBOLE EUROSYMBOLE YENLETTRE MAJUSCULE LATINE S CARONPARAGRAPHE (alinéa)LETTRE MINUSCULE LATINE S CARONSYMBOLE COPYRIGHTINDICATEUR ORDINAL FÉMININGUILLEMET GAUCHESIGNE NÉGATION (symbole non)TRAIT D’UNION VIRTUEL (tiret conditionnel)SYMBOLE MARQUE DÉPOSÉEMACRON (avec chasse)SYMBOLE DEGRÉSYMBOLE PLUS-MOINSEXPOSANT DEUXEXPOSANT TROISLETTRE MAJUSCULE LATINE Z CARONSYMBOLE MICROPIED DE MOUCHE (fin de paragraphe)POINT MÉDIAN (point central, point au milieu)LETTRE MINUSCULE LATINE Z CARONEXPOSANT UNINDICATEUR ORDINAL MASCULINGUILLEMET DROITDIGRAMME SOUDÉ MAJUSCULE LATIN OEDIGRAMME SOUDÉ MINUSCULE LATIN OELETTRE MAJUSCULE LATINE Y TRÉMAPOINT D’INTERROGATION INVERSÉ

Combi-naisonbinaire

Nom du caractère

ESPACEPOINT D’EXCLAMATIONGUILLEMET ANGLAISDIÈSE-SYMBOLE NUMÉRO (croisillon)SYMBOLE DOLLARSYMBOLE POUR CENTPERLUÈTE (esperluète, esperluette)APOSTROPHEPARENTHÈSE GAUCHEPARENTHÈSE DROITEASTÉRISQUESIGNE PLUSVIRGULETIRET-TRAIT D’UNION-SIGNE MOINSPOINTBARRE OBLIQUE (cotice)CHIFFRE ZÉROCHIFFRE UNCHIFFRE DEUXCHIFFRE TROISCHIFFRE QUATRECHIFFRE CINQCHIFFRE SIXCHIFFRE SEPTCHIFFRE HUITCHIFFRE NEUFDEUX-POINTSPOINT-VIRGULESIGNE INFÉRIEUR ÀSIGNE ÉGAL ÀSIGNE SUPÉRIEUR ÀPOINT D’INTERROGATIONARROBE (à commercial, arobas, arobase, arrobas)LETTRE MAJUSCULE LATINE ALETTRE MAJUSCULE LATINE BLETTRE MAJUSCULE LATINE CLETTRE MAJUSCULE LATINE DLETTRE MAJUSCULE LATINE ELETTRE MAJUSCULE LATINE FLETTRE MAJUSCULE LATINE GLETTRE MAJUSCULE LATINE HLETTRE MAJUSCULE LATINE ILETTRE MAJUSCULE LATINE JLETTRE MAJUSCULE LATINE KLETTRE MAJUSCULE LATINE LLETTRE MAJUSCULE LATINE MLETTRE MAJUSCULE LATINE NLETTRE MAJUSCULE LATINE OLETTRE MAJUSCULE LATINE PLETTRE MAJUSCULE LATINE QLETTRE MAJUSCULE LATINE RLETTRE MAJUSCULE LATINE SLETTRE MAJUSCULE LATINE TLETTRE MAJUSCULE LATINE ULETTRE MAJUSCULE LATINE VLETTRE MAJUSCULE LATINE WLETTRE MAJUSCULE LATINE XLETTRE MAJUSCULE LATINE YLETTRE MAJUSCULE LATINE ZCROCHET GAUCHEBARRE OBLIQUE INVERSÉE (contre-cotice)CROCHET DROITACCENT CIRCONFLEXE (avec chasse)TRAIT BAS

02/0002/0102/0202/0302/0402/0502/0602/0702/0802/0902/1002/1102/1202/1302/1402/1503/0003/0103/0203/0303/0403/0503/0603/0703/0803/0903/1003/1103/1203/1303/1403/1504/0004/0104/0204/0304/0404/0504/0604/0704/0804/0904/1004/1104/1204/1304/1404/1505/0005/0105/0205/0305/0405/0505/0605/0705/0805/0905/1005/1105/1205/1305/1405/15

Combi-naisonbinaire

Nom du caractèreHexa

202122232425262728292A2B2C2D2E2F303132333435363738393A3B3C3D3E3F404142434445464748494A4B4C4D4E4F505152535455565758595A5B5C5D5E5F

U+0020U+0021U+0022U+0023U+0024U+0025U+0026U+0027U+0028U+0029U+002AU+002BU+002CU+002DU+002EU+002FU+0030U+0031U+0032U+0033U+0034U+0035U+0036U+0037U+0038U+0039U+003AU+003BU+003CU+003DU+003EU+003FU+0040U+0041U+0042U+0043U+0044U+0045U+0046U+0047U+0048U+0049U+004AU+004BU+004CU+004DU+004EU+004RU+0050U+0051U+0052U+0053U+0054U+0055U+0056U+0057U+0058U+0059U+005AU+005BU+005CU+005DU+005EU+005F

Identi-fiant

Hexa

606162636465666768696A6B6C6D6E6F707172737475767778797A7B7C7D7E

A0A1A2A3A4A5A6A7A8A9AAABACADAEAFB0B1B2B3B4B5B6B7B8B9BABBBCBDBEBF

Identi-fiant

U+0060U+0061U+0062U+0063U+0064U+0065U+0066U+0067U+0068U+0069U+006AU+006BU+006CU+006DU+006EU+006FU+0070U+0071U+0072U+0073U+0074U+0075U+0076U+0077U+0078U+0079U+007AU+007BU+007CU+007DU+007E

U+00A0U+00A1U+00A2U+00A3U+20ACU+00A5U+0160U+00A7U+0161U+00A9U+00AAU+00ABU+00ACU+00ADU+00AEU+00AFU+00B0U+00B1U+00B2U+00B3U+017DU+00B5U+00B6U+00B7U+017EU+00B9U+00BAU+00BBU+0152U+0153U+0178U+00BF

Page 22: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

© ISO/CEI FDIS pour l’ISO/CEI 8859-15:1998 (F)

5

Table 1 (fin)

12/0012/0112/0212/0312/0412/0512/0612/0712/0812/0912/1012/1112/1212/1312/1412/1513/0013/0113/0213/0313/0413/0513/0613/0713/0813/0913/1013/1113/1213/1313/1413/1514/0014/0114/0214/0314/0414/0514/0614/0714/0814/0914/1014/1114/1214/1314/1414/1515/0015/0115/0215/0315/0415/0515/0615/0715/0815/0915/1015/1115/1215/1315/1415/15

LETTRE MAJUSCULE LATINE A ACCENT GRAVELETTRE MAJUSCULE LATINE A ACCENT AIGULETTRE MAJUSCULE LATINE A ACCENT CIRCONFLEXELETTRE MAJUSCULE LATINE A TILDELETTRE MAJUSCULE LATINE A TRÉMALETTRE MAJUSCULE LATINE A ROND EN CHEFLETTRE MAJUSCULE LATINE AELETTRE MAJUSCULE LATINE C CÉDILLELETTRE MAJUSCULE LATINE E ACCENT GRAVELETTRE MAJUSCULE LATINE E ACCENT AIGULETTRE MAJUSCULE LATINE E ACCENT CIRCONFLEXELETTRE MAJUSCULE LATINE E TRÉMALETTRE MAJUSCULE LATINE I ACCENT GRAVELETTRE MAJUSCULE LATINE I ACCENT AIGULETTRE MAJUSCULE LATINE I ACCENT CIRCONFLEXELETTRE MAJUSCULE LATINE I TRÉMALETTRE MAJUSCULE LATINE EDLETTRE MAJUSCULE LATINE N TILDELETTRE MAJUSCULE LATINE O ACCENT GRAVELETTRE MAJUSCULE LATINE O ACCENT AIGULETTRE MAJUSCULE LATINE O ACCENT CIRCONFLEXELETTRE MAJUSCULE LATINE O TILDELETTRE MAJUSCULE LATINE O TRÉMASIGNE MULTIPLICATIONLETTRE MAJUSCULE LATINE O BARRÉ OBLIQUEMENTLETTRE MAJUSCULE LATINE U ACCENT GRAVELETTRE MAJUSCULE LATINE U ACCENT AIGULETTRE MAJUSCULE LATINE U ACCENT CIRCONFLEXELETTRE MAJUSCULE LATINE U TRÉMALETTRE MAJUSCULE LATINE Y ACCENT AIGULETTRE MAJUSCULE LATINE THORNLETTRE MINUSCULE LATINE S DURLETTRE MINUSCULE LATINE A ACCENT GRAVELETTRE MINUSCULE LATINE A ACCENT AIGULETTRE MINUSCULE LATINE A ACCENT CIRCONFLEXELETTRE MINUSCULE LATINE A TILDELETTRE MINUSCULE LATINE A TRÉMALETTRE MINUSCULE LATINE A ROND EN CHEFLETTRE MINUSCULE LATINE AELETTRE MINUSCULE LATINE C CÉDILLELETTRE MINUSCULE LATINE E ACCENT GRAVELETTRE MINUSCULE LATINE E ACCENT AIGULETTRE MINUSCULE LATINE E ACCENT CIRCONFLEXELETTRE MINUSCULE LATINE E TRÉMALETTRE MINUSCULE LATINE I ACCENT GRAVELETTRE MINUSCULE LATINE I ACCENT AIGULETTRE MINUSCULE LATINE I ACCENT CIRCONFLEXELETTRE MINUSCULE LATINE I TRÉMALETTRE MINUSCULE LATINE EDLETTRE MINUSCULE LATINE N TILDELETTRE MINUSCULE LATINE O ACCENT GRAVELETTRE MINUSCULE LATINE O ACCENT AIGULETTRE MINUSCULE LATINE O ACCENT CIRCONFLEXELETTRE MINUSCULE LATINE O TILDELETTRE MINUSCULE LATINE O TRÉMASIGNE DIVISIONLETTRE MINUSCULE LATINE O BARRÉ OBLIQUEMENTLETTRE MINUSCULE LATINE U ACCENT GRAVELETTRE MINUSCULE LATINE U ACCENT AIGULETTRE MINUSCULE LATINE U ACCENT CIRCONFLEXELETTRE MINUSCULE LATINE U TRÉMALETTRE MINUSCULE LATINE Y ACCENT AIGULETTRE MINUSCULE LATINE THORNLETTRE MINUSCULE LATINE Y TRÉMA

Combi-naisonbinaire

Nom du caractèreHexa

C0C1C2C3C4C5C6C7C8C9CACBCCCDCECFD0D1D2D3D4D5D6D7D8D9DADBDCDDDEDFE0E1E2E3E4E5E6E7E8E9EAEBECEDEEEFF0F1F2F3F4F5F6F7F8F9FAFBFCFDFEFF

Identi-fiant

U+00C0U+00C1U+00C2U+00C3U+00C4U+00C5U+00C6U+00C7U+00C8U+00C9U+00CAU+00CBU+00CCU+00CDU+00CEU+00CFU+00D0U+00D1U+00D2U+00D3U+00D4U+00D5U+00D6U+00D7U+00D8U+00D9U+00DAU+00DBU+00DCU+00DDU+00DEU+00DFU+00E0U+00E1U+00E2U+00E3U+00E4U+00E5U+00E6U+00E7U+00E8U+00E9U+00EAU+00EBU+00ECU+00EDU+00EEU+00EFU+00F0U+00F1U+00F2U+00F3U+00F4U+00F5U+00F6U+00F7U+00F8U+00F9U+00FAU+00FBU+00FCU+00FDU+00FEU+00FF

Page 23: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

hexa

FDIS pour l’ISO/CEI 8859-15:1998 (F) © ISO/CEI

6

6.2 Table de code

Pour chaque caractère du jeu, la table de code (table2) montre un symbole graphique à la position de latable de code correspondant à la combinaisonbinaire précisée à la table 1.

Les positions ombrées dans la table de codecorrespondent aux combinaisons binaires nereprésentant pas de caractères graphiques. Leurusage n’appartient pas au champ d’application del’ISO/CEI 8859; cet usage est prescrit dans d’autresnormes internationales, comme par exemple dansl’ISO/CEI 6429.

00

0

0

0b8

b7

b6

b5

0

01

0

1

0

0

02

1

0

0

0

03

1

1

0

0

04

0

0

0

1

05

0

1

0

1

06

1

0

0

1

07

1

1

0

1

08

0

0

1

0

09

0

1

1

0

10

1

0

1

0

11

1

1

1

0

12

0

0

1

1

13

0

1

1

1

14

1

0

1

1

15

1

1

1

1

000 00

b4 b3 b2 b1

0

010 10 0

021 00 0

031 10 0

040 00 1

050 10 1

061 00 1

071 10 1

080 01 0

090 11 0

101 01 0

111 11 0

120 01 1

130 11 1

141 01 1

151 11 1

SP 0 @ P ` p NBSP ° À Ð à ð

! 1 A Q a q ¡ ± Á Ñ á ñ

" 2 B R b r ¢ ² Â Ò â ò

# 3 C S c s £ ³ Ã Ó ã ó

$ 4 D T d t ¤ ´ Ä Ô ä ô

% 5 E U e u ¥ µ Å Õ å õ

& 6 F V f v ¦ ¶ Æ Ö æ ö

' 7 G W g w § · Ç × ç ÷

( 8 H X h x ¨ ¸ È Ø è ø

) 9 I Y i y © ¹ É Ù é ù

* : J Z j z ª º æ Ú ê ú

+ ; K [ k { « » Ë Û ë û

, < L \ l | ¬ ¼ Ì Ü ì ü

- = M ] m } SHY ½ Í Ý í ý

. > N ^ n ~ ® ¾ Î Þ î þ

/ ? O _ o ¯ ¿ Ï ß ï ÿ

Table 2 – Table de code de l’alphabet latin n° 9

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

FEDCBA9876543210

Page 24: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

© ISO/CEI FDIS pour l’ISO/CEI 8859-15:1998 (F)

7

7 Identification du jeu de caractères

7.1 Identification selon l’ISO/CEI 2022 etl’ISO/CEI 4873

Les caractères graphiques de la présente partie del’ISO/CEI 8859 constituent un seul jeu de caractère.Toutefois, en accord avec l’ISO/CEI 2022 et avecl’ISO/CEI 4873 la table de code de la présente partiede l’ISO/CEI 8859 peut être considérée comme étantformée des composantes suivantes :

• Le caractère ESPACE représenté par lacombinaison binaire 02/00;

• un jeu G0 de 94 caractères graphiquesreprésenté par les combinaisons binaires de02/01 à 07/14;

• un jeu G1 de 96 caractères graphiquesreprésenté par les combinaisons binaires de10/00 à 15/15.

Quand l’on utilise les méthodes d’identification del’ISO/CEI 2022 ou de l’ISO/CEI 4873, la présentepartie de l’ISO/CEI 8859 doit être représentée par lapaire suivante de fonctions de désignation :

GZD4 04/02 (ESC 02/08 04/02)G1D6 06/02 (ESC 02/13 06/02)

NOTE – Les séquences d’échappement figurent entreparenthèses.

7.2 Identification selon l’ISO/CEI 8824-1(ASN.1)

Selon la terminologie de l’ISO/CEI 8824-1, le jeu decaractères de la présente partie de l’ISO/CEI 8859 etles représentations codées correspondantes sontdes concepts distincts, et on les désigne sous lesvocables respectifs de « syntaxe abstraite descaractères » et de « syntaxe de transfert descaractères ».

Quand l’on utilise les méthodes d’identification del’ISO/CEI 8824-1, la présente partie de l’ISO/CEI8859 doit être représentée par les identifiantsd’objets suivants :

• pour le jeu de caractères :{ iso standard 8859 15 abstract-syntax (1) }

• pour les représentations codées : { iso standard 8859 15 transfer-syntax (0) }

Les descriptions correspondantes des objets doiventêtre :

• pour le jeu de caractères : “ISO 8859 part 15 repertoire”

• pour les représentations codées : “ISO 8859 part 15 code”

7.3 Identification selon le registre inter-national des jeux de caractères de l’ISO à utiliseravec séquences d’échappement

Selon 7.1, le jeu de caractères de la présente partiede l’ISO/CEI 8859 peut être considéré comme untout composé du caractère ESPACE, d’un jeu G0 de94 caractères graphiques et d’un jeu G1 de 96caractères graphiques. Les jeux de caractèresgraphiques G0 et G1 peuvent être identifiés par lesnuméros d’enregistrement qui leur sont attribuésdans le registre international des jeux de caractèresde l’ISO à utiliser avec des séquences d’échappe-ment.

Quand l’on utilise ces numéros d’enregistrement, laprésente partie de l’ISO/CEI 8859 doit être identifiéepar la paire suivante de numéros d’enregistrement :

• le jeu G0 de caractères graphiques ISO-IR 6• le jeu G1 de caractères graphiques ISO-IR 203

Page 25: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

FDIS pour l’ISO/CEI 8859-15:1998 (F) © ISO/CEI

8

A.1 Langues d’origine européenne utilisantl’écriture latine

Les parties suivantes (numérotées 1 à 15) del’ISO/CEI 8859 prescrivent des jeux de caractèresqui comprennent divers choix de caractères baséssur l’alphabet latin. Ces jeux sont connus comme lesalphabets latins numérotés de 1 à 9.

ISO/CEI 8859-1 Alphabet latin n° 1ISO/CEI 8859-2 Alphabet latin n° 2ISO/CEI 8859-3 Alphabet latin n° 3ISO/CEI 8859-4 Alphabet latin n° 4

ISO/CEI 8859-9 Alphabet latin n° 5ISO/CEI 8859-10 Alphabet latin n° 6ISO/CEI 8859-13 Alphabet latin n° 7 (pourtour baltique)ISO/CEI 8859-14 Alphabet latin n° 8 (celte)ISO/CEI 8859-15 Alphabet latin n° 9

La table A.1 indique, à l’aide de ces numérosd’alphabets latins, la couverture des languesofficielles et régionales d’Europe.

Annexe A (informative)

Langues couvertes par les parties 1 à 15 de l’ISO/CEI 8859

Table A.1 – Couverture linguistique

NOTES

1 La liste des langues de la table A.1 n’est pasexhaustive. Elle se limite aux langues incluses dans ledomaine d’application de chaque partie de l’ISO/CEI8859.

2. Pour l’écriture du français, trois caractères (Œ, œ, Ÿ),ne sont pas couverts dans les parties 1, 3, 9 et 14, maissont inclus dans la partie 15. Pour l’écriture du finnois,quatre caractères (S, s, Z, z), ne sont pas couverts dansles parties 1, 9, et 14, mais sont inclus dans les parties 4,10, 13, et 15.

3 Selon l’Institut roumain de normalisation, les caractèresLETTRE LATINE MAJUSCULE S VIRGULE SOUSCRITE,LETTRE LATINE MINUSCULE S VIRGULE SOUSCRITE,

LETTRE LATINE MAJUSCULE T VIRGULE SOUSCRITE, etLETTRE LATINE MINUSCULE T VIRGULE SOUSCRITE (S, , s, ,T, , t, ) en usage en Roumanie, sont différents descaractères LETTRE LATINE MAJUSCULE S CÉDILLE,LETTRE LATINE MINUSCULE S CÉDILLE, LETTRE LATINEMAJUSCULE T CÉDILLE, et LETTRE LATINE MINUSCULE TCÉDILLE (S, s, T, t) décrits à la partie 2 de l’ISO/CEI 8859.Toutefois, à condition qu’il y ait un accord préalableentre l’expéditeur et le destinataire pour l’échanged’information, les lettres avec CÉDILLE de la partie 2peuvent être utilisées comme substituts des lettres avecVIRGULE SOUSCRITE.

4 Les langues laponnes (sames) utilisent différentesorthographes. Les jeux de caractères des parties 4 et 10couvrent les besoins des langues laponnes les plusfréquemment employées en Finlande, en Norvège et en

albanaisallemandanglaisbasquebretoncatalancorniquecroatedanoisespagnolespérantoestonienféroïenfinnoisfrançaisfrisongaélique de l'Île de Mangaélique écossaisgaélique irlandais

(ancienne orthographe)gaélique irlandais

(nouvelle orthographe)galicien

galloisgroenlandaishongroisislandaisitalienlapon (same)latinlettonlithuanienluxembourgeoismaltaisnéerlandaisnorvégienpolonaisportugaisromancheroumainslovaqueslovènesorbesuédoistchèqueturc

Langue Couverte(s) par l'alphabet n° Langue Couverte(s) par l'alphabet n°

1 2 5 8 91 2 3 4 5 6 8 91 2 3 4 5 6 7 8 91 5 8 91 5 8 91 5 8 91 5 8

21 4 5 6 8 91 5 8 9

34 6 7 9

1 6 9(1) 4 (5)6 7 (8)9(1) (3) (5) (8)91 5 91 5 81 5 8 9

8

1 5 6 8 9

1 5 8 9

81 4 5 6 8 9

21 6 91 3 5 8 9

4 61 2 3 4 5 6 7 8 9

4 74 6 7

1 5 8 93

1 5 91 4 5 6 7 8 9

21 3 5 8 91 5 8 9

(2)22 4 62

1 4 5 6 8 92

(3) 5

Page 26: ISO/IEC JTC 1/SC 2 N 3091 - Unicode · 2001. 2. 21. · ISO/IEC JTC 1/SC 2 N 3091 Date: 1998-05-21 Replaces SC 2 N 2946 ISO/IEC JTC 1/SC 2 CODED CHARACTER SETS SECRETARIAT: JAPAN

Suède. Pour la langue laponne skolt employée en Finlandeet en Norvège, d’autres caractères sont requis. Ils sontinclus dans les jeux de caractères ISO-IR 158 et 197 duregistre ISO 2375.

5 Quelques langues officielles écrites hors d’Europe sontcouvertes par l’alphabet latin n° 1, comme par exemplel’indonésien/malais, le tagal (Philippines), le swahili etl’afrikaans.

6 L’usage de l’alphabet latin n° 3 pour le turc estdéconseillé.

A.2 Langues écrites avec d’autres systèmesd’écriture

Les parties suivantes de l’ISO/CEI 8859 prescriventdes jeux de caractères codés qui comprennent descaractères non inclus dans l’écriture latine :

ISO/CEI 8859-5 Alphabet latin/cyrilliqueISO/CEI 8859-6 Alphabet latin/arabeISO/CEI 8859-7 Alphabet latin/grecISO/CEI 8859-8 Alphabet latin/hébreuCD 8859-11 Alphabet latin/thaï

Ces alphabets couvrent les langues officielles etrégionales suivantes :

Les caractères cyrilliques de la partie 5 couvrent lebulgare, le biélorusse, le macédonien (slave), lerusse, le serbe et l’ukrainien (jusqu’à 1990, voir aussile domaine d’application de la partie 5).

Les caractères arabes de la partie 6 couvrentl’arabe. Les caractères grecs de la partie 7 couvrentle grec (orthographe monotonique). Les caractèreshébraïques de la partie 8 couvrent l’hébreu. Lescaractères siamois de la partie 11 couvrent le thaï.

Annexe B(informative)

Bibliographie

ISO/CEI 6429:1992 Technologies de l’information –Fonctions de commande pour les jeux de caractères.

ISO/CEI 10367:1991 Technologies de l’information –Jeux de caractères normalisés pour utilisation dansdes codes à 8 bits.

ISO/CEI 10646-1:1993 Technologies de l’information– Jeu universel de caractères codés sur plusieursoctets (JUC) – partie 1: Architecture et planmultilingue de base.

Registre international des jeux de caractères del’ISO utilisés avec séquences d’échappement.

© ISO/CEI FDIS pour l’ISO/CEI 8859-15:1998 (F)

9