Codes for the representation of names of languages - Part 4: General principles of coding of the representation of names of languages and related entities, and application guidelines

ISO 639-4:2010 gives the general principles of language coding using the codes that are specified in the other parts of ISO 639 and their combination with other codes. It also lays down guidelines for the use of any combination of the parts of ISO 639. The terminology and general descriptions of ISO 639-4 are intended to replace corresponding text of other parts of ISO 639 as relevant in future revisions. Relevant metadata for the description of linguistic entities are given, as a framework for databases of linguistic data to support the ISO 639 series.

Codes pour la représentation des noms de langue — Partie 4: Principes généraux pour le codage de la représentation des noms de langue et d'entités connexes, et lignes directrices pour la mise en oeuvre

L'ISO 639-4:2010 fournit les principes généraux de codage des langues à l'aide des codes spécifiés dans les autres parties de l'ISO 639, ainsi que leur combinaison avec d'autres codes. De plus, elle établit des règles d'utilisation de n'importe quelle combinaison des parties de l'ISO 639. La terminologie et les descriptions générales de l'ISO 639-4:2010 sont destinées à remplacer le texte correspondant des autres parties de l'ISO 639, selon le cas, dans de futures révisions. Les métadonnées pertinentes pour la description des entités linguistiques sont également fournies et servent de cadre de travail pour les bases de données linguistiques qui accompagnent la série de Normes internationales ISO 639.

Kode za predstavljanje imen jezikov - 4. del: Splošna načela kodiranja predstavitve imen jezikov in sorodnih entitet ter smernice za uporabo

Ta del ISO 639 podaja splošna načela kodiranja jezikov z uporabo kod, ki so določene v drugih delih ISO 639, ter njihovih kombinacij z drugimi kodami. Poleg tega ta del ISO 639 določa smernice za uporabo katere koli kombinacije delov ISO 639. Terminologija in splošni opisi tega dela ISO 639 so namenjeni temu, da primerno nadomestijo ustrezno besedilo drugih delov ISO 639 za prihodnje revizije. Prav tako so podani pomembni metapodatki za opis lingvističnih entitet kot okvir za podatkovne zbirke lingvističnih podatkov v podporo seriji mednarodnih standardov ISO 639.

General Information

Status
Withdrawn
Publication Date
15-Jul-2010
Current Stage
9599 - Withdrawal of International Standard
Start Date
08-Nov-2023
Completion Date
13-Dec-2025

Relations

Standard
ISO 639-4:2010
English language
33 pages
sale 10% off
Preview
sale 10% off
Preview
e-Library read for
1 day
Standard
ISO 639-4:2010 - Codes for the representation of names of languages
English language
28 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 639-4:2010 - Codes pour la représentation des noms de langue
French language
28 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 639-4:2010 - Codes pour la représentation des noms de langue
French language
28 pages
sale 15% off
Preview
sale 15% off
Preview

Frequently Asked Questions

ISO 639-4:2010 is a standard published by the International Organization for Standardization (ISO). Its full title is "Codes for the representation of names of languages - Part 4: General principles of coding of the representation of names of languages and related entities, and application guidelines". This standard covers: ISO 639-4:2010 gives the general principles of language coding using the codes that are specified in the other parts of ISO 639 and their combination with other codes. It also lays down guidelines for the use of any combination of the parts of ISO 639. The terminology and general descriptions of ISO 639-4 are intended to replace corresponding text of other parts of ISO 639 as relevant in future revisions. Relevant metadata for the description of linguistic entities are given, as a framework for databases of linguistic data to support the ISO 639 series.

ISO 639-4:2010 gives the general principles of language coding using the codes that are specified in the other parts of ISO 639 and their combination with other codes. It also lays down guidelines for the use of any combination of the parts of ISO 639. The terminology and general descriptions of ISO 639-4 are intended to replace corresponding text of other parts of ISO 639 as relevant in future revisions. Relevant metadata for the description of linguistic entities are given, as a framework for databases of linguistic data to support the ISO 639 series.

ISO 639-4:2010 is classified under the following ICS (International Classification for Standards) categories: 01.140.20 - Information sciences. The ICS classification helps identify the subject area and facilitates finding related standards.

ISO 639-4:2010 has the following relationships with other standards: It is inter standard links to ISO 16967:2015, ISO 639:2023. Understanding these relationships helps ensure you are using the most current and applicable version of the standard.

You can purchase ISO 639-4:2010 directly from iTeh Standards. The document is available in PDF format and is delivered instantly after payment. Add the standard to your cart and complete the secure checkout process. iTeh Standards is an authorized distributor of ISO standards.

Standards Content (Sample)


SLOVENSKI STANDARD
01-november-2010
.RGH]DSUHGVWDYOMDQMHLPHQMH]LNRYGHO6SORãQDQDþHODNRGLUDQMDSUHGVWDYLWYH
LPHQMH]LNRYLQVRURGQLKHQWLWHWWHUVPHUQLFH]DXSRUDER
Codes for the representation of names of languages - Part 4: General principles of
coding of the representation of names of languages and related entities, and application
guidelines
Codes pour la représentation des noms de langue - Partie 4: Principes généraux pour le
codage de la représentation des noms de langue et d'entités connexes, et lignes
directrices pour la mise en oeuvre
Ta slovenski standard je istoveten z: ISO 639-4:2010
ICS:
01.140.20 Informacijske vede Information sciences
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.

INTERNATIONAL ISO
STANDARD 639-4
First edition
2010-07-15
Codes for the representation of names of
languages —
Part 4:
General principles of coding of the
representation of names of languages
and related entities, and application
guidelines
Codes pour la représentation des noms de langue —
Partie 4: Principes généraux pour le codage de la représentation des
noms de langue et d'entités connexes, et lignes directrices pour la mise
en œuvre
Reference number
©
ISO 2010
PDF disclaimer
This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but
shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In
downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat
accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation
parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In
the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.

©  ISO 2010
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2010 – All rights reserved

Contents Page
Foreword .iv
Introduction.v
1 Scope.1
2 Normative references.1
3 Terms and definitions .2
4 Fundamental concepts of language coding .5
4.1 Language identifiers and languages.5
4.2 Individual languages .6
4.3 Macrolanguages .6
4.4 Linguistic norm.7
4.5 Dialects.7
4.6 Collective language code elements and language groups.7
4.7 Extinct, ancient and historic languages.8
4.8 Artificial languages .8
4.9 Writing systems and scripts.8
5 Relationship between the parts of ISO 639.8
5.1 Parts of ISO 639 .8
5.2 ISO 639 as one code space .8
5.3 Principles.9
5.4 Common maintenance and language coding database .9
6 Implementation issues.9
6.1 Applications .9
6.2 Subsets of the code table.10
6.3 Language groups .10
7 Combining language identifiers with other standards and codes .11
7.1 Combining ISO 639 with ISO 3166 .11
7.2 Combining ISO 639 with ISO 19111 and ISO 19112 .11
7.3 Combining ISO 639 with ISO 15924 .12
7.4 Other code combinations .12
7.5 Formats of combined identifiers.12
8 Language description format (LDF) .13
8.1 Compatibilities between the ISO 639 model and ISO 12620 .13
8.1.1 General .13
8.1.2 Identification .15
8.1.3 Description of an ISO 639 language identifier.16
8.2 Extensions to ISO 12620 for ISO 639 LDF.20
8.2.1 Representation .20
8.2.2 Documentation .21
8.3 Language information.23
Annex A (informative) Overall steering of ISO 639.26
Bibliography.28

Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the
International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 639-4 was prepared by Technical Committee ISO/TC 37, Terminology and other language and content
resources, Subcommittee SC 2, Terminographical and lexicographical working methods.
ISO 639 consists of the following parts, under the general title Codes for the representation of names of
languages:
⎯ Part 1: Alpha-2 code
⎯ Part 2: Alpha-3 code
⎯ Part 3: Alpha-3 code for comprehensive coverage of languages
⎯ Part 4: General principles of coding of the representation of names of languages and related entities, and
application guidelines
⎯ Part 5: Alpha-3 code for language families and groups
⎯ Part 6: Alpha-4 code for comprehensive coverage of language variants

iv © ISO 2010 – All rights reserved

Introduction
ISO 639 provides codes for the identification and specification of individual languages, language variants, and
language groups. The identifiers may be used in a variety of applications, including specification of the
language used in a text, the language of terms or words in a dictionary or terminological database, the
language used in a spoken presentation, language proficiency, language capabilities of software, localization,
etc. The various parts of ISO 639 are expected to be implemented in a number of environments.
Parts 1, 2, 3, and 5 of ISO 639 all contain some information about implementation issues. However, it is
deemed necessary to expand those descriptions, and to have the implementation rules in a separate
document. In future revisions of the other parts of ISO 639, it is expected that those standards will reference
this part of ISO 639 rather than duplicating the information.

INTERNATIONAL STANDARD ISO 639-4:2010(E)

Codes for the representation of names of languages —
Part 4:
General principles of coding of the representation of names of
languages and related entities, and application guidelines
1 Scope
This part of ISO 639 gives the general principles of language coding using the codes that are specified in the
other parts of ISO 639 and their combination with other codes. Furthermore, this part of ISO 639 lays down
guidelines for the use of any combination of the parts of ISO 639.
The terminology and general descriptions of this part of ISO 639 are intended to replace corresponding text of
other parts of ISO 639 as relevant in future revisions.
Relevant metadata for the description of linguistic entities are also given, as a framework for databases of
linguistic data to support the ISO 639 series of International Standards.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced
document (including any amendments) applies.
ISO 639-1:2002, Codes for the representation of names of languages — Part 1: Alpha-2 code
ISO 639-2:1998, Codes for the representation of names of languages — Part 2: Alpha-3 code
ISO 639-3:2007, Codes for the representation of names of languages — Part 3: Alpha-3 code for
comprehensive coverage of languages
ISO 639-5:2008, Codes for the representation of names of languages — Part 5: Alpha-3 code for language
families and groups
ISO 3166-1:2006, Codes for the representation of names of countries and their subdivisions — Part 1:
Country codes
ISO 3166-2:2007, Codes for the representation of names of countries and their subdivisions — Part 2:
Country subdivision code
ISO 3166-3:1999, Codes for the representation of names of countries and their subdivisions — Part 3: Code
for formerly used names of countries
ISO 8601:2004, Data elements and interchange formats — Information interchange — Representation of
dates and times
ISO/IEC 11179-1:2004, Information technology — Metadata registries (MDR) — Part 1: Framework
ISO/IEC 11179-2:2005, Information technology — Metadata registries (MDR) — Part 2: Classification
ISO/IEC 11179-3:2003, Information technology — Metadata registries (MDR) — Part 3: Registry metamodel
and basic attributes
ISO/IEC 11179-4:2004, Information technology — Metadata registries (MDR) — Part 4: Formulation of data
definitions
ISO/IEC 11179-5:2005, Information technology — Metadata registries (MDR) — Part 5: Naming and
identification principles
ISO/IEC 11179-6:2005, Information technology — Metadata registries (MDR) — Part 6: Registration
ISO 12620:2009, Terminology and other language and content resources — Specification of data categories
and management of a Data Category Registry for language resources
ISO 15924:2004, Information and documentation — Codes for the representation of names of scripts
ISO 19111:2007, Geographic information — Spatial referencing by coordinates
ISO 19112:2003, Geographic information — Spatial referencing by geographic identifiers
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
In future versions of other parts of ISO 639, it is expected that some or all of the terms and definitions will be
replaced by a reference to the terms and definitions in this part of ISO 639.
NOTE The definitions in this part of ISO 639 are intended for practical use within the context of the various parts of
ISO 639 and their applications. For various linguistic purposes, there are needs for more detailed, and possibly deviating,
definitions.
3.1
code
data transformed or represented in different forms according to a pre-established set of rules
NOTE The usage of the term “code” is not uniform in all standardized coding systems. According to the usage that is
defined in this part of ISO 639, a “code” is to be understood as a code table (3.2) and the set of rules relating to the code
table. Each individual row in a code table is a code element (3.4) (e.g. “de - German - allemand - Deutsch” in Part 1 of
ISO 639), while the item “de” is the language identifier (3.5).
3.2
code table
table of code elements (3.4) as part of a code (3.1)
3.3
code space
totality of possible values for a set of identifiers within a code (3.1)
EXAMPLE All sequences of two letters (a–z) form the code space of the alpha-2 language code as specified in
part 1 of ISO 639.
NOTE The alpha-3 language codes that are specified in parts 2, 3, and 5 of ISO 639 share the same code space, i.e.
no language identifier assigned in one of the parts may be assigned to a different item in another part.
2 © ISO 2010 – All rights reserved

3.4
code element
individual entry in a code (3.1)
NOTE In the language codes of ISO 639, each code element consists of a language identifier and the names of the
language.
3.5
language identifier
language symbol
string of characters assigned to a linguistic entity for the purpose of uniquely representing it
NOTE 1 In the language codes of Parts 1, 2, 3, and 5 of ISO 639, each language identifier is composed of two or three
letters.
NOTE 2 See 4.1.
3.6
language
systematic use of sounds, characters, symbols or signs to express or communicate meaning or a message
between humans
NOTE 1 This definition is intended to serve as a working definition for the purpose of the ISO 639 series of
International Standards, not as a universal definition of this concept.
NOTE 2 See also 4.1 and 4.2.
3.7
individual language
language (3.6) that is distinctly different from another language
NOTE See 4.2.
3.8
dialect
language variant (3.14) specific to a geographical region or a group of language users
NOTE See 4.5.
3.9
macrolanguage
language (3.6) that for some purpose may be subdivided into two or more individual languages (3.7)
NOTE See 4.3.
3.10
language group
two or more individual languages (3.7) that for a specific purpose may suitably be treated as a unit
NOTE See 4.6.
3.11
language family
two or more individual languages (3.7) that are related to each other through having common ancestry
NOTE In exceptional cases, a language family may have only one individual language as a member.
3.12
remainder group
language group (3.10) with the explicit exclusion of specified languages
NOTE See 4.6.
3.13
language variation
continuous variation within and between individual languages (3.7)
NOTE Language variation is seen and may be described as variation over time, space, cultural affiliation, etc.
3.14
language variant
variant of an individual language (3.7) that may be identified and named
3.15
standard variant
language variant (3.14) with a high degree of status and normalization
NOTE A standard variant of a language may typically be used in official or public communication and in
communication between users of different language variants.
3.16
writing system
system for writing a language (3.6), including the script (3.17) and character set used
NOTE See also 4.9.
3.17
script
set of graphic characters used for the written form of one or more languages (3.6)
[ISO 15924:2004 and ISO/IEC 10646:2003]
NOTE See also 4.9.
3.18
orthography
set of rules for accepted spelling of words and text in one or more languages (3.6)
3.19
transcription
system for representing text in a different script (3.17) than that in which the text was originally represented
NOTE The resulting text is also referred to as a “transcription”.
3.20
transliteration
transcription (3.19) that enables the reconstruction of the original script (3.17) without any loss of
information about graphic characters
NOTE The resulting text is also referred to as a “transliteration”.
3.21
written language
individual language (3.7) or language variant (3.14) that is commonly represented in writing with a relatively
normalized orthography (3.18)
4 © ISO 2010 – All rights reserved

3.22
spoken language
individual language (3.7) or language variant (3.14) that is represented in spoken form
NOTE Any spoken language may be represented in writing using a phonetic writing system, where characters
represent sounds (phones or phonemes) directly.
3.23
living language
individual language (3.7) or language variant (3.14) in present-day use, in particular as a spoken
language (3.22)
3.24
extinct language
individual language (3.7) or language variant (3.14) that is no longer in use and that has no present-day
descendant
NOTE See 4.7.
3.25
ancient language
extinct language (3.24) with a distinct literature and special status in the scholarly community
NOTE See 4.7.
3.26
historical language
known earlier historical stage of a living language (3.23) or an extinct language (3.24)
EXAMPLE “Old English” and “Middle English” as historical stages of “English”.
NOTE See 4.7.
3.27
natural language
language (3.6) for human communication that is not an artificial language (3.28)
3.28
artificial language
language (3.6) for human communication that has been artificially devised
NOTE See also 4.8.
4 Fundamental concepts of language coding
4.1 Language identifiers and languages
Language identifiers are composed of the following 26 letters of the Latin alphabet in lower case: a, b, c, d, e, f,
g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. No diacritical marks or modified characters are used.
A language identifier represents a language, which may also be represented by one or more language names.
The objects of identification are languages themselves; language names are the means by which the
languages denoted by language identifiers are designated.
Languages are not static objects every instantiation of which is identical to every other. Every language
corresponds to some range of variation in linguistic expression. In ISO 639, a language identifier denotes
some range of language variation. The range of variation that is denoted can have three different scopes:
individual language, macrolanguage or language group. Also, languages that are represented can be of
various types: living languages, ancient languages, artificially constructed languages, etc. The following
provides further explanation regarding assignment of identifiers for different scopes or to different types of
languages in ISO 639.
4.2 Individual languages
Identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to denote distinct individual languages, unless the
language name explicitly refers to a language group.
There is no one definition of a “language” that is agreed upon by all and appropriate for all purposes. As a
result, there can be disagreement, even among speakers of the language or experts in linguistics, as to
whether two variants represent dialects of a single language or two distinct languages. For ISO 639,
judgments regarding when two variants are considered to be the same or different languages are based on a
number of factors, including linguistic similarity, intelligibility, a common literature, the views of speakers
concerning the relationship between language and identity, and other factors. The following basic criteria are
followed.
⎯ Two related variants are normally considered variants of the same language if speakers of each variant
have inherent understanding of the other variant (that is, can understand based on knowledge of their
own variant without needing to learn the other variant) at a functional level.
⎯ Where spoken intelligibility between variants is marginal, the existence of a common literature or of a
common ethnolinguistic identity with a central variant that both understand can be strong indicators that
they should nevertheless be considered variants of the same language.
⎯ Where there is enough intelligibility between variants to enable communication, the existence of well-
established distinct ethnolinguistic identities can be a strong indicator that they should nevertheless be
considered to be different languages.
Some of the distinctions made on this basis may not be considered appropriate by some users or for certain
applications. However, these basic criteria are thought to best fit the intended range of applications.
4.3 Macrolanguages
Parts 1 and 2 of ISO 639 include identifiers that correspond in a one-to-many manner with individual language
identifiers in Part 3 of ISO 639. For instance, Part 3 of ISO 639 contains over 30 identifiers designated as
individual language identifiers for distinct variants of Arabic, while Parts 1 and 2 each contain only one
identifier for Arabic, “ar” and “ara” respectively, which are designated as individual language identifiers in
those parts of ISO 639. It is assumed here that the single identifiers for Arabic in Parts 1 and 2 of ISO 639
correspond to the many identifiers collectively for distinct variants of Arabic in Part 3 of ISO 639.
In this example, it may appear that the single identifiers in Parts 1 and 2 of ISO 639 should be designated as
collective language identifiers. That is not assumed, however. In various parts of the world, there are clusters
of closely-related language variants that, based on the criteria discussed in 4.2, can be considered individual
languages, yet in certain usage contexts a single language identity for all is needed. Typical situations in
which this need can occur include the following.
⎯ There is one variant that is more developed and that tends to be used for wider communication by
speakers of various closely-related languages; as a result, there is a perceived common linguistic identity
across these languages. For instance, there are several distinct spoken Arabic languages, but Standard
Arabic is generally used in business and media across all of these communities, and is also an important
aspect of a shared ethno-religious unity. As a result, a perceived common linguistic identity exists.
⎯ There is a common written form used for multiple closely-related languages. For instance, multiple
Chinese languages share a common written form.
6 © ISO 2010 – All rights reserved

⎯ There is a transitional sociolinguistic situation in which sub-communities of a single language community
are diverging, creating a need for some purposes to recognise distinct languages while, for other
purposes, a single common identity is still valid. For instance, in some business contexts it is necessary
to make a distinction between the languages Bosnian, Croatian, and Serbian; yet there are other contexts
in which these distinctions are not discernable in language resources that are in use.
Where such situations exist, an identifier for the single, common language identity is considered to be a
macrolanguage identifier.
Macrolanguages are distinguished from language groups in that the individual languages that correspond to a
macrolanguage must be very closely related, and there must be some domain in which only a single language
identity is recognized.
4.4 Linguistic norm
Some linguistic forms are “normalized” or “standardized” by official or private bodies like academies or
language councils. This normalization may be applied to any elements: orthography, morphology, syntax,
semantics, phonology, etc. The degree of normalization varies greatly from one language to another.
Languages or forms of languages may be considered to have some sort of official status within countries or
regions. Language status may be established through acts of parliament or through other formal procedures,
giving a language status as “national language”, “official language”, “regional language”, etc.
4.5 Dialects
The linguistic variants denoted by each of the identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to be
distinct languages and not dialects of other languages, even though for some purposes some users may
consider a variant listed in Part 1 or 2, or in particular Part 3 of ISO 639 to be a “dialect” rather than a
“language” (see 4.2 and 4.3). In ISO 639, the term dialect is used as in the field of linguistics where it identifies
any sub-variant of a language such as might be based on geographic region, age, gender, social class, time
period, etc.
The dialects of a language are included within the denotation represented by the identifier for that language.
Thus, each language identifier represents the complete range of all the spoken or written variants of that
language, including any standardized form.
For applications in which it is necessary to identify dialects, a separate standard may be developed that
provides identifiers for dialects, or that combines identifiers from ISO 639 with other distinguishing
identificational qualifiers.
4.6 Collective language code elements and language groups
Part 2 of ISO 639 includes alpha-3 identifiers for collections of languages, and Part 5 is especially dedicated
to language groups and language families. Parts 1 and 3 provide identifiers for individual languages and
macrolanguages only.
Some of the code elements in Part 2 specify remainder groups. These items have the word “other” in their
English names (and “autres” in their French names). The same alpha-3 identifiers are included in Part 5 of
ISO 639 denoting the language group or family as a whole. For applications using Part 2 only, the remainder
group identifiers shall be used for languages that belong to the language group or family in question, but that
do not have an individual-language identifier in Part 2. Applications using Parts 2 and 5 and applications using
Parts 2 and 3 and 5 shall use the collective language code elements in the sense specified in Part 5, allowing
for hierarchies of language identifiers.
4.7 Extinct, ancient and historic languages
ISO 639 includes identifiers that denote extinct languages as well as living languages. In order to qualify for
inclusion in ISO 639, the language must have an attested literature or be well-documented as a language
known to have been spoken by some particular community at some point in history; it may not be a
reconstructed language inferred from historical-comparative analysis. The code also includes identifiers that
denote historic languages that are considered to be distinct from any modern languages that may be
descended from them; for instance, Old English and Middle English. Here, too, the criterion is that the
language has a literature that is treated distinctly by the scholarly community.
4.8 Artificial languages
ISO 639 includes identifiers that denote artificial (or constructed) languages that meet the following criteria:
⎯ the language has a literature; and
⎯ the language is designed for the purpose of human communication.
Specifically excluded from ISO 639 are reconstructed languages, computer programming languages, and
mark-up languages.
4.9 Writing systems and scripts
A single language identifier is provided for a language even though the language may be written in more than
one writing system. ISO 639 language identifiers may be combined with script identifiers from ISO 15924
(see 7.3).
5 Relationship between the parts of ISO 639
5.1 Parts of ISO 639
The parts of ISO 639 form one coordinated set of language coding standards.
⎯ Part 1 assigns alpha-2 identifiers to a limited number of languages (currently 186), in particular languages
with a long-standing scientific literature and developed terminology and lexicography.
⎯ Part 2 assigns alpha-3 identifiers to a somewhat larger number of languages (currently 484), in particular
languages with a significant body of literature in central libraries and documentation holdings.
⎯ Part 3 assigns alpha-3 identifiers to most individual languages of the world (currently about 7000).
⎯ Part 5 assigns alpha-3 identifiers to language groups and language families.
⎯ Part 6 enables the encoding of items on a more detailed level than “individual language”.
5.2 ISO 639 as one code space
All language identifiers that are specified in Parts 2, 3, and 5 of this International Standard share a single code
space. This has the implication that one language identifier always denotes one specific item regardless of
which of the parts it is included in.
All language identifiers of Part 1 of ISO 639, furthermore, denote exactly the same items as corresponding
language identifiers with the same reference name that are specified in Parts 2, 3, and 5.
8 © ISO 2010 – All rights reserved

5.3 Principles
The following principles apply to each of the parts of ISO 639 and their interrelation.
⎯ The set of languages included in Part 1 is a subset of the set of languages included in Part 2. The
extension of any single item in Part 1 is exactly the same as the extension of the corresponding item in
Part 2. An alpha-3 identifier in Part 2 and the corresponding alpha-2 identifier in Part 1 shall be
considered synonyms. In cases where the “B table” and the “T table” of Part 2 have different alpha-3
identifiers, these identifiers shall be considered synonyms.
EXAMPLE 1 The language identifiers “en” and “eng” designate exactly the same language.
EXAMPLE 2 The language identifiers “fra” and “fre” (and “fr”) designate exactly the same language.
Implementations should, whenever possible, allow free choice between such synonyms.
⎯ Some items are included in Part 2 and in Part 5 with slightly different designations. Example: “gem”
designates “Germanic (other)” in Part 2 and “Germanic languages” in Part 5. In the context of Part 2,
“gem” shall be used to identify the set of languages that fall into the group “Germanic languages”, and
that has no individual language identifier in Part 2. In other contexts, “gem” may be used to identify the
language group “Germanic languages” as a linguistic entity.
⎯ The alpha-3 code of Parts 2, 3, and 5 forms one single code space. No alpha-3 identifier assigned in any
one of these parts has been assigned or will be assigned to another item.
⎯ Code elements of Part 3 may also be included in Part 2 following the procedures of the Joint Advisory
Committee (see 6.2).
5.4 Common maintenance and language coding database
While the various parts of ISO 639 have been developed and published as individual and separate parts of the
International Standard, their maintenance is fully coordinated.
It is expected that a future revision of the ISO 639 series will be published as one integrated database utilizing
the meta-structure that is specified in Clause 8.
6 Implementation issues
6.1 Applications
ISO 639 and its parts may be implemented in a variety of applications. It is expected that few or none of these
applications will utilize the totality of the language codes of all parts of this International Standard. As part of
the implementation process it may be needed to specify usage relating to some of the issues that are listed
in 6.2 and 6.3.
Some types of applications are listed below. The numbers of this list are referenced in 6.2 and 6.3 in the
format “6.1: 1”. These references are intended for guidance only.
Language identifiers from the various parts of ISO 639 may be used in connection with, for example:
a) multilingual terminological or lexicographical databases to identify the language of an individual piece of
information, e.g. a word, a term, a context, or a definition;
b) a text document or a set of text documents to identify the language of the entire text or of text segments,
e.g. quotations;
c) bibliographical documents or databases (in general) to identify the language(s) of the bibliographic entries
or the language(s) of the referenced documents;
d) linguistics and bibliographical documents or databases of linguistic or lexicographical documents to
identify the language(s) that are the object of description in the documents (e.g. “source language”,
“target language”, “description language”, “described language”, etc.);
e) translated documents to identify the source language for the translation;
f) translation and interpretation services to identify languages covered by the service;
g) notes or minutes of meetings to identify language(s) actually used during the meeting;
h) registries of individuals or organizations to identify language proficiencies or preferences;
i) software to identify language capabilities of, for example, character set handling, built-in grammar control,
and dictionaries; and
j) localization in general, comprising a number of the types of applications above, but being in itself a major
user of ISO 639; see also Clause 7.
A well-defined and much used implementation of the code tables of ISO 639 is designed by the Internet
Engineering Task Force (IETF, see http://www.ietf.org/). Its repository RFC 4646 (which has replaced
RFC 3066 and RFC 1766) defines the use of ISO 639 alpha-2 and alpha-3 language identifiers in combination
with other information elements to identify the language of documents and text segments.
6.2 Subsets of the code table
The specification of any implementation of ISO 639 shall include information about which subset of the totality
of the ISO 639 code tables is used. Some of the recommended options are:
⎯ Part 1 only [6.1: a) to i), if all languages in question are included in Part 1];
⎯ Part 1 and Part 2, using Part 2 only for items not included in Part 1 (or a user-defined subset of Part 1);
⎯ Part 2 only [6.1: c)];
⎯ Part 2 and Part 3;
⎯ Part 2 and Part 5, using items included in both parts in the sense specified in Part 5 (see also 6.3)
[6.1: d)];
⎯ Part 1, Part 2, and Part 5, using items included in both Parts 2 and 5 in the sense specified in Part 5
(see also 6.3) [(6.1: d)];
⎯ Part 2, Part 3, and Part 5, using items included in both Parts 2 and 5 in the sense specified in Part 5
(see also 6.3); and
⎯ a user-defined subset of any of the parts or any combination of parts.
Part 5 is expected to be used only in combination with other parts of ISO 639.
It is expected that a mechanism will be developed in the future for naming and registering defined subsets of
the totality of the ISO 639 language code.
6.3 Language groups
As discussed in 5.3, second list item, the simultaneous application of Part 2 and Part 5 of ISO 639 will require
implementation-level specification.
10 © ISO 2010 – All rights reserved

There are currently 64 items that are included both in Part 2 and in Part 5 (listed in Annex A of Part 5). Of
these items, 29 items are identical in the two parts (e.g. “alg – Algonquian languages”). The remaining
35 items are intended to cover remainder groups in Part 2 and entire language groups in Part 5 (e.g. “afa –
Afro-Asiatic (Other)” in Part 2 and “afa – Afro-Asiatic languages” in Part 5).
According to the principles of Part 2, the identifier “afa” will be assigned only to a document or information in
(or about) an Afro-Asiatic language that does not have an individual-language identifier in Part 2, and that
does not fall into the remainder groups “ber – Berber (Other)”, “cus – Cushitic (Other)”, or “sem – Semitic
(Other)”, all of which are Afro-Asiatic language groups.
According to the principles of Part 5, the identifier “afa” may be assigned to a document or information in (or
about) any Afro-Asiatic language. The use of “afa”, “sem”, or “ara” in a concrete case relating to Arabic,
depends on the purpose of the encoding, as specified in the implementation.
The use of identifiers from Part 5 will depend on the purpose of the application. It is expected that user-
defined subsets of the items in Part 5 will frequently be used in combination with, for example, the totality or
defined subsets of Part 2 or Part 3.
7 Combining language identifiers with other standards and codes
7.1 Combining ISO 639 with ISO 3166
The language identifiers of ISO 639 may be combined with country and country subdivision identifiers of
ISO 3166 (all parts) to denote the area in which a word, term, phrase, or language variant is (or has been)
used.
NOTE 1 In ISO 3166, the term “code element” is used to refer to the concept of “identifier” according to ISO 639
terminology.
NOTE 2 Some applications may not allow the use of the country subdivision code of ISO 3166-2, because of the
variable format of that code.
EXAMPLE
⎯ “eng US” (or “en US”, “eng USA”, “en USA”, “eng 840”, “en 840”) indicates English of the United States of America;
⎯ “eng US-NY” indicates English of the state of New York;
⎯ “fra FR” (or “fre FR”, “fr FR”, “fra FRA”, “fre FRA”, “fr FRA” ”, “fra 250”, “fre 250”, “fr 250”) indicates French of France;
⎯ “fra FR-75” indicates French of Paris.
NOTE 3 Applications may define a default region for each language and use ISO 3166 identifiers to specify usage
outside this region only.
7.2 Combining ISO 639 with ISO 19111 and ISO 19112
The language identifiers of ISO 639 may also be combined with spatial referencing information in accordance
with ISO 19111 and ISO 19112 to denote the area in which a word, term, phrase, language, or language
variant is used.
ISO 19111 and ISO 19112 complement ISO 3166 in that they allow spatial referencing independent of political
and administrative considerations.
7.3 Combining ISO 639 with ISO 15924
The language identifiers of ISO 639 may be combined with script identifiers of ISO 15924 to indicate which
script is used in a document, text segment, language, or language variant.
EXAMPLE
⎯ “deu Latf” (or “ger Latf” or “de Latf”) indicates German in Latin Fraktur script;
⎯ “kur Cyrl” (or “ku Cyrl”) indicates Kurdish in Cyrillic script.
NOTE Applications may define a default script for each language and use ISO 15924 identifiers to specify the use of
scripts other than the default.
7.4 Other code combinations
The language identifiers of ISO 639 may be combined with any other standardized or user-defined code to
establish combined identifiers suitable for given purposes.
The usage of such combined identifiers and combination codes shall be documented in each individual case.
The intension of the individual language identifiers and the ISO 639 language code shall remain unchanged
by such combinations.
7.5 Formats of combined identifiers
This International Standard does not require a specific format of combined identifiers. The format used in 7.1
and 7.2 is intended as an example only.
Each application shall specify the format of combined identifiers. The specification may include one or more of
the following:
⎯ the order of the elements,
⎯ a separation character between elements,
⎯ prefixes or other indicators to some or all of the elements,
⎯ structuring features, such as XML tagging.
Depending on the specification of the application, a combined language identifier for a text in German in Latin
Fraktur script, originating from Austria, could for instance be encoded in one of the following ways:
⎯ de Latf AT
⎯ de_Latf_AT
⎯ de_AT_Latf
⎯ de-C:AT-S:Latf
⎯ language=“de” script=“L
...


INTERNATIONAL ISO
STANDARD 639-4
First edition
2010-07-15
Codes for the representation of names of
languages —
Part 4:
General principles of coding of the
representation of names of languages
and related entities, and application
guidelines
Codes pour la représentation des noms de langue —
Partie 4: Principes généraux pour le codage de la représentation des
noms de langue et d'entités connexes, et lignes directrices pour la mise
en œuvre
Reference number
©
ISO 2010
PDF disclaimer
This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but
shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In
downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat
accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation
parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In
the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.

©  ISO 2010
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2010 – All rights reserved

Contents Page
Foreword .iv
Introduction.v
1 Scope.1
2 Normative references.1
3 Terms and definitions .2
4 Fundamental concepts of language coding .5
4.1 Language identifiers and languages.5
4.2 Individual languages .6
4.3 Macrolanguages .6
4.4 Linguistic norm.7
4.5 Dialects.7
4.6 Collective language code elements and language groups.7
4.7 Extinct, ancient and historic languages.8
4.8 Artificial languages .8
4.9 Writing systems and scripts.8
5 Relationship between the parts of ISO 639.8
5.1 Parts of ISO 639 .8
5.2 ISO 639 as one code space .8
5.3 Principles.9
5.4 Common maintenance and language coding database .9
6 Implementation issues.9
6.1 Applications .9
6.2 Subsets of the code table.10
6.3 Language groups .10
7 Combining language identifiers with other standards and codes .11
7.1 Combining ISO 639 with ISO 3166 .11
7.2 Combining ISO 639 with ISO 19111 and ISO 19112 .11
7.3 Combining ISO 639 with ISO 15924 .12
7.4 Other code combinations .12
7.5 Formats of combined identifiers.12
8 Language description format (LDF) .13
8.1 Compatibilities between the ISO 639 model and ISO 12620 .13
8.1.1 General .13
8.1.2 Identification .15
8.1.3 Description of an ISO 639 language identifier.16
8.2 Extensions to ISO 12620 for ISO 639 LDF.20
8.2.1 Representation .20
8.2.2 Documentation .21
8.3 Language information.23
Annex A (informative) Overall steering of ISO 639.26
Bibliography.28

Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the
International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 639-4 was prepared by Technical Committee ISO/TC 37, Terminology and other language and content
resources, Subcommittee SC 2, Terminographical and lexicographical working methods.
ISO 639 consists of the following parts, under the general title Codes for the representation of names of
languages:
⎯ Part 1: Alpha-2 code
⎯ Part 2: Alpha-3 code
⎯ Part 3: Alpha-3 code for comprehensive coverage of languages
⎯ Part 4: General principles of coding of the representation of names of languages and related entities, and
application guidelines
⎯ Part 5: Alpha-3 code for language families and groups
⎯ Part 6: Alpha-4 code for comprehensive coverage of language variants

iv © ISO 2010 – All rights reserved

Introduction
ISO 639 provides codes for the identification and specification of individual languages, language variants, and
language groups. The identifiers may be used in a variety of applications, including specification of the
language used in a text, the language of terms or words in a dictionary or terminological database, the
language used in a spoken presentation, language proficiency, language capabilities of software, localization,
etc. The various parts of ISO 639 are expected to be implemented in a number of environments.
Parts 1, 2, 3, and 5 of ISO 639 all contain some information about implementation issues. However, it is
deemed necessary to expand those descriptions, and to have the implementation rules in a separate
document. In future revisions of the other parts of ISO 639, it is expected that those standards will reference
this part of ISO 639 rather than duplicating the information.

INTERNATIONAL STANDARD ISO 639-4:2010(E)

Codes for the representation of names of languages —
Part 4:
General principles of coding of the representation of names of
languages and related entities, and application guidelines
1 Scope
This part of ISO 639 gives the general principles of language coding using the codes that are specified in the
other parts of ISO 639 and their combination with other codes. Furthermore, this part of ISO 639 lays down
guidelines for the use of any combination of the parts of ISO 639.
The terminology and general descriptions of this part of ISO 639 are intended to replace corresponding text of
other parts of ISO 639 as relevant in future revisions.
Relevant metadata for the description of linguistic entities are also given, as a framework for databases of
linguistic data to support the ISO 639 series of International Standards.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced
document (including any amendments) applies.
ISO 639-1:2002, Codes for the representation of names of languages — Part 1: Alpha-2 code
ISO 639-2:1998, Codes for the representation of names of languages — Part 2: Alpha-3 code
ISO 639-3:2007, Codes for the representation of names of languages — Part 3: Alpha-3 code for
comprehensive coverage of languages
ISO 639-5:2008, Codes for the representation of names of languages — Part 5: Alpha-3 code for language
families and groups
ISO 3166-1:2006, Codes for the representation of names of countries and their subdivisions — Part 1:
Country codes
ISO 3166-2:2007, Codes for the representation of names of countries and their subdivisions — Part 2:
Country subdivision code
ISO 3166-3:1999, Codes for the representation of names of countries and their subdivisions — Part 3: Code
for formerly used names of countries
ISO 8601:2004, Data elements and interchange formats — Information interchange — Representation of
dates and times
ISO/IEC 11179-1:2004, Information technology — Metadata registries (MDR) — Part 1: Framework
ISO/IEC 11179-2:2005, Information technology — Metadata registries (MDR) — Part 2: Classification
ISO/IEC 11179-3:2003, Information technology — Metadata registries (MDR) — Part 3: Registry metamodel
and basic attributes
ISO/IEC 11179-4:2004, Information technology — Metadata registries (MDR) — Part 4: Formulation of data
definitions
ISO/IEC 11179-5:2005, Information technology — Metadata registries (MDR) — Part 5: Naming and
identification principles
ISO/IEC 11179-6:2005, Information technology — Metadata registries (MDR) — Part 6: Registration
ISO 12620:2009, Terminology and other language and content resources — Specification of data categories
and management of a Data Category Registry for language resources
ISO 15924:2004, Information and documentation — Codes for the representation of names of scripts
ISO 19111:2007, Geographic information — Spatial referencing by coordinates
ISO 19112:2003, Geographic information — Spatial referencing by geographic identifiers
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
In future versions of other parts of ISO 639, it is expected that some or all of the terms and definitions will be
replaced by a reference to the terms and definitions in this part of ISO 639.
NOTE The definitions in this part of ISO 639 are intended for practical use within the context of the various parts of
ISO 639 and their applications. For various linguistic purposes, there are needs for more detailed, and possibly deviating,
definitions.
3.1
code
data transformed or represented in different forms according to a pre-established set of rules
NOTE The usage of the term “code” is not uniform in all standardized coding systems. According to the usage that is
defined in this part of ISO 639, a “code” is to be understood as a code table (3.2) and the set of rules relating to the code
table. Each individual row in a code table is a code element (3.4) (e.g. “de - German - allemand - Deutsch” in Part 1 of
ISO 639), while the item “de” is the language identifier (3.5).
3.2
code table
table of code elements (3.4) as part of a code (3.1)
3.3
code space
totality of possible values for a set of identifiers within a code (3.1)
EXAMPLE All sequences of two letters (a–z) form the code space of the alpha-2 language code as specified in
part 1 of ISO 639.
NOTE The alpha-3 language codes that are specified in parts 2, 3, and 5 of ISO 639 share the same code space, i.e.
no language identifier assigned in one of the parts may be assigned to a different item in another part.
2 © ISO 2010 – All rights reserved

3.4
code element
individual entry in a code (3.1)
NOTE In the language codes of ISO 639, each code element consists of a language identifier and the names of the
language.
3.5
language identifier
language symbol
string of characters assigned to a linguistic entity for the purpose of uniquely representing it
NOTE 1 In the language codes of Parts 1, 2, 3, and 5 of ISO 639, each language identifier is composed of two or three
letters.
NOTE 2 See 4.1.
3.6
language
systematic use of sounds, characters, symbols or signs to express or communicate meaning or a message
between humans
NOTE 1 This definition is intended to serve as a working definition for the purpose of the ISO 639 series of
International Standards, not as a universal definition of this concept.
NOTE 2 See also 4.1 and 4.2.
3.7
individual language
language (3.6) that is distinctly different from another language
NOTE See 4.2.
3.8
dialect
language variant (3.14) specific to a geographical region or a group of language users
NOTE See 4.5.
3.9
macrolanguage
language (3.6) that for some purpose may be subdivided into two or more individual languages (3.7)
NOTE See 4.3.
3.10
language group
two or more individual languages (3.7) that for a specific purpose may suitably be treated as a unit
NOTE See 4.6.
3.11
language family
two or more individual languages (3.7) that are related to each other through having common ancestry
NOTE In exceptional cases, a language family may have only one individual language as a member.
3.12
remainder group
language group (3.10) with the explicit exclusion of specified languages
NOTE See 4.6.
3.13
language variation
continuous variation within and between individual languages (3.7)
NOTE Language variation is seen and may be described as variation over time, space, cultural affiliation, etc.
3.14
language variant
variant of an individual language (3.7) that may be identified and named
3.15
standard variant
language variant (3.14) with a high degree of status and normalization
NOTE A standard variant of a language may typically be used in official or public communication and in
communication between users of different language variants.
3.16
writing system
system for writing a language (3.6), including the script (3.17) and character set used
NOTE See also 4.9.
3.17
script
set of graphic characters used for the written form of one or more languages (3.6)
[ISO 15924:2004 and ISO/IEC 10646:2003]
NOTE See also 4.9.
3.18
orthography
set of rules for accepted spelling of words and text in one or more languages (3.6)
3.19
transcription
system for representing text in a different script (3.17) than that in which the text was originally represented
NOTE The resulting text is also referred to as a “transcription”.
3.20
transliteration
transcription (3.19) that enables the reconstruction of the original script (3.17) without any loss of
information about graphic characters
NOTE The resulting text is also referred to as a “transliteration”.
3.21
written language
individual language (3.7) or language variant (3.14) that is commonly represented in writing with a relatively
normalized orthography (3.18)
4 © ISO 2010 – All rights reserved

3.22
spoken language
individual language (3.7) or language variant (3.14) that is represented in spoken form
NOTE Any spoken language may be represented in writing using a phonetic writing system, where characters
represent sounds (phones or phonemes) directly.
3.23
living language
individual language (3.7) or language variant (3.14) in present-day use, in particular as a spoken
language (3.22)
3.24
extinct language
individual language (3.7) or language variant (3.14) that is no longer in use and that has no present-day
descendant
NOTE See 4.7.
3.25
ancient language
extinct language (3.24) with a distinct literature and special status in the scholarly community
NOTE See 4.7.
3.26
historical language
known earlier historical stage of a living language (3.23) or an extinct language (3.24)
EXAMPLE “Old English” and “Middle English” as historical stages of “English”.
NOTE See 4.7.
3.27
natural language
language (3.6) for human communication that is not an artificial language (3.28)
3.28
artificial language
language (3.6) for human communication that has been artificially devised
NOTE See also 4.8.
4 Fundamental concepts of language coding
4.1 Language identifiers and languages
Language identifiers are composed of the following 26 letters of the Latin alphabet in lower case: a, b, c, d, e, f,
g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. No diacritical marks or modified characters are used.
A language identifier represents a language, which may also be represented by one or more language names.
The objects of identification are languages themselves; language names are the means by which the
languages denoted by language identifiers are designated.
Languages are not static objects every instantiation of which is identical to every other. Every language
corresponds to some range of variation in linguistic expression. In ISO 639, a language identifier denotes
some range of language variation. The range of variation that is denoted can have three different scopes:
individual language, macrolanguage or language group. Also, languages that are represented can be of
various types: living languages, ancient languages, artificially constructed languages, etc. The following
provides further explanation regarding assignment of identifiers for different scopes or to different types of
languages in ISO 639.
4.2 Individual languages
Identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to denote distinct individual languages, unless the
language name explicitly refers to a language group.
There is no one definition of a “language” that is agreed upon by all and appropriate for all purposes. As a
result, there can be disagreement, even among speakers of the language or experts in linguistics, as to
whether two variants represent dialects of a single language or two distinct languages. For ISO 639,
judgments regarding when two variants are considered to be the same or different languages are based on a
number of factors, including linguistic similarity, intelligibility, a common literature, the views of speakers
concerning the relationship between language and identity, and other factors. The following basic criteria are
followed.
⎯ Two related variants are normally considered variants of the same language if speakers of each variant
have inherent understanding of the other variant (that is, can understand based on knowledge of their
own variant without needing to learn the other variant) at a functional level.
⎯ Where spoken intelligibility between variants is marginal, the existence of a common literature or of a
common ethnolinguistic identity with a central variant that both understand can be strong indicators that
they should nevertheless be considered variants of the same language.
⎯ Where there is enough intelligibility between variants to enable communication, the existence of well-
established distinct ethnolinguistic identities can be a strong indicator that they should nevertheless be
considered to be different languages.
Some of the distinctions made on this basis may not be considered appropriate by some users or for certain
applications. However, these basic criteria are thought to best fit the intended range of applications.
4.3 Macrolanguages
Parts 1 and 2 of ISO 639 include identifiers that correspond in a one-to-many manner with individual language
identifiers in Part 3 of ISO 639. For instance, Part 3 of ISO 639 contains over 30 identifiers designated as
individual language identifiers for distinct variants of Arabic, while Parts 1 and 2 each contain only one
identifier for Arabic, “ar” and “ara” respectively, which are designated as individual language identifiers in
those parts of ISO 639. It is assumed here that the single identifiers for Arabic in Parts 1 and 2 of ISO 639
correspond to the many identifiers collectively for distinct variants of Arabic in Part 3 of ISO 639.
In this example, it may appear that the single identifiers in Parts 1 and 2 of ISO 639 should be designated as
collective language identifiers. That is not assumed, however. In various parts of the world, there are clusters
of closely-related language variants that, based on the criteria discussed in 4.2, can be considered individual
languages, yet in certain usage contexts a single language identity for all is needed. Typical situations in
which this need can occur include the following.
⎯ There is one variant that is more developed and that tends to be used for wider communication by
speakers of various closely-related languages; as a result, there is a perceived common linguistic identity
across these languages. For instance, there are several distinct spoken Arabic languages, but Standard
Arabic is generally used in business and media across all of these communities, and is also an important
aspect of a shared ethno-religious unity. As a result, a perceived common linguistic identity exists.
⎯ There is a common written form used for multiple closely-related languages. For instance, multiple
Chinese languages share a common written form.
6 © ISO 2010 – All rights reserved

⎯ There is a transitional sociolinguistic situation in which sub-communities of a single language community
are diverging, creating a need for some purposes to recognise distinct languages while, for other
purposes, a single common identity is still valid. For instance, in some business contexts it is necessary
to make a distinction between the languages Bosnian, Croatian, and Serbian; yet there are other contexts
in which these distinctions are not discernable in language resources that are in use.
Where such situations exist, an identifier for the single, common language identity is considered to be a
macrolanguage identifier.
Macrolanguages are distinguished from language groups in that the individual languages that correspond to a
macrolanguage must be very closely related, and there must be some domain in which only a single language
identity is recognized.
4.4 Linguistic norm
Some linguistic forms are “normalized” or “standardized” by official or private bodies like academies or
language councils. This normalization may be applied to any elements: orthography, morphology, syntax,
semantics, phonology, etc. The degree of normalization varies greatly from one language to another.
Languages or forms of languages may be considered to have some sort of official status within countries or
regions. Language status may be established through acts of parliament or through other formal procedures,
giving a language status as “national language”, “official language”, “regional language”, etc.
4.5 Dialects
The linguistic variants denoted by each of the identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to be
distinct languages and not dialects of other languages, even though for some purposes some users may
consider a variant listed in Part 1 or 2, or in particular Part 3 of ISO 639 to be a “dialect” rather than a
“language” (see 4.2 and 4.3). In ISO 639, the term dialect is used as in the field of linguistics where it identifies
any sub-variant of a language such as might be based on geographic region, age, gender, social class, time
period, etc.
The dialects of a language are included within the denotation represented by the identifier for that language.
Thus, each language identifier represents the complete range of all the spoken or written variants of that
language, including any standardized form.
For applications in which it is necessary to identify dialects, a separate standard may be developed that
provides identifiers for dialects, or that combines identifiers from ISO 639 with other distinguishing
identificational qualifiers.
4.6 Collective language code elements and language groups
Part 2 of ISO 639 includes alpha-3 identifiers for collections of languages, and Part 5 is especially dedicated
to language groups and language families. Parts 1 and 3 provide identifiers for individual languages and
macrolanguages only.
Some of the code elements in Part 2 specify remainder groups. These items have the word “other” in their
English names (and “autres” in their French names). The same alpha-3 identifiers are included in Part 5 of
ISO 639 denoting the language group or family as a whole. For applications using Part 2 only, the remainder
group identifiers shall be used for languages that belong to the language group or family in question, but that
do not have an individual-language identifier in Part 2. Applications using Parts 2 and 5 and applications using
Parts 2 and 3 and 5 shall use the collective language code elements in the sense specified in Part 5, allowing
for hierarchies of language identifiers.
4.7 Extinct, ancient and historic languages
ISO 639 includes identifiers that denote extinct languages as well as living languages. In order to qualify for
inclusion in ISO 639, the language must have an attested literature or be well-documented as a language
known to have been spoken by some particular community at some point in history; it may not be a
reconstructed language inferred from historical-comparative analysis. The code also includes identifiers that
denote historic languages that are considered to be distinct from any modern languages that may be
descended from them; for instance, Old English and Middle English. Here, too, the criterion is that the
language has a literature that is treated distinctly by the scholarly community.
4.8 Artificial languages
ISO 639 includes identifiers that denote artificial (or constructed) languages that meet the following criteria:
⎯ the language has a literature; and
⎯ the language is designed for the purpose of human communication.
Specifically excluded from ISO 639 are reconstructed languages, computer programming languages, and
mark-up languages.
4.9 Writing systems and scripts
A single language identifier is provided for a language even though the language may be written in more than
one writing system. ISO 639 language identifiers may be combined with script identifiers from ISO 15924
(see 7.3).
5 Relationship between the parts of ISO 639
5.1 Parts of ISO 639
The parts of ISO 639 form one coordinated set of language coding standards.
⎯ Part 1 assigns alpha-2 identifiers to a limited number of languages (currently 186), in particular languages
with a long-standing scientific literature and developed terminology and lexicography.
⎯ Part 2 assigns alpha-3 identifiers to a somewhat larger number of languages (currently 484), in particular
languages with a significant body of literature in central libraries and documentation holdings.
⎯ Part 3 assigns alpha-3 identifiers to most individual languages of the world (currently about 7000).
⎯ Part 5 assigns alpha-3 identifiers to language groups and language families.
⎯ Part 6 enables the encoding of items on a more detailed level than “individual language”.
5.2 ISO 639 as one code space
All language identifiers that are specified in Parts 2, 3, and 5 of this International Standard share a single code
space. This has the implication that one language identifier always denotes one specific item regardless of
which of the parts it is included in.
All language identifiers of Part 1 of ISO 639, furthermore, denote exactly the same items as corresponding
language identifiers with the same reference name that are specified in Parts 2, 3, and 5.
8 © ISO 2010 – All rights reserved

5.3 Principles
The following principles apply to each of the parts of ISO 639 and their interrelation.
⎯ The set of languages included in Part 1 is a subset of the set of languages included in Part 2. The
extension of any single item in Part 1 is exactly the same as the extension of the corresponding item in
Part 2. An alpha-3 identifier in Part 2 and the corresponding alpha-2 identifier in Part 1 shall be
considered synonyms. In cases where the “B table” and the “T table” of Part 2 have different alpha-3
identifiers, these identifiers shall be considered synonyms.
EXAMPLE 1 The language identifiers “en” and “eng” designate exactly the same language.
EXAMPLE 2 The language identifiers “fra” and “fre” (and “fr”) designate exactly the same language.
Implementations should, whenever possible, allow free choice between such synonyms.
⎯ Some items are included in Part 2 and in Part 5 with slightly different designations. Example: “gem”
designates “Germanic (other)” in Part 2 and “Germanic languages” in Part 5. In the context of Part 2,
“gem” shall be used to identify the set of languages that fall into the group “Germanic languages”, and
that has no individual language identifier in Part 2. In other contexts, “gem” may be used to identify the
language group “Germanic languages” as a linguistic entity.
⎯ The alpha-3 code of Parts 2, 3, and 5 forms one single code space. No alpha-3 identifier assigned in any
one of these parts has been assigned or will be assigned to another item.
⎯ Code elements of Part 3 may also be included in Part 2 following the procedures of the Joint Advisory
Committee (see 6.2).
5.4 Common maintenance and language coding database
While the various parts of ISO 639 have been developed and published as individual and separate parts of the
International Standard, their maintenance is fully coordinated.
It is expected that a future revision of the ISO 639 series will be published as one integrated database utilizing
the meta-structure that is specified in Clause 8.
6 Implementation issues
6.1 Applications
ISO 639 and its parts may be implemented in a variety of applications. It is expected that few or none of these
applications will utilize the totality of the language codes of all parts of this International Standard. As part of
the implementation process it may be needed to specify usage relating to some of the issues that are listed
in 6.2 and 6.3.
Some types of applications are listed below. The numbers of this list are referenced in 6.2 and 6.3 in the
format “6.1: 1”. These references are intended for guidance only.
Language identifiers from the various parts of ISO 639 may be used in connection with, for example:
a) multilingual terminological or lexicographical databases to identify the language of an individual piece of
information, e.g. a word, a term, a context, or a definition;
b) a text document or a set of text documents to identify the language of the entire text or of text segments,
e.g. quotations;
c) bibliographical documents or databases (in general) to identify the language(s) of the bibliographic entries
or the language(s) of the referenced documents;
d) linguistics and bibliographical documents or databases of linguistic or lexicographical documents to
identify the language(s) that are the object of description in the documents (e.g. “source language”,
“target language”, “description language”, “described language”, etc.);
e) translated documents to identify the source language for the translation;
f) translation and interpretation services to identify languages covered by the service;
g) notes or minutes of meetings to identify language(s) actually used during the meeting;
h) registries of individuals or organizations to identify language proficiencies or preferences;
i) software to identify language capabilities of, for example, character set handling, built-in grammar control,
and dictionaries; and
j) localization in general, comprising a number of the types of applications above, but being in itself a major
user of ISO 639; see also Clause 7.
A well-defined and much used implementation of the code tables of ISO 639 is designed by the Internet
Engineering Task Force (IETF, see http://www.ietf.org/). Its repository RFC 4646 (which has replaced
RFC 3066 and RFC 1766) defines the use of ISO 639 alpha-2 and alpha-3 language identifiers in combination
with other information elements to identify the language of documents and text segments.
6.2 Subsets of the code table
The specification of any implementation of ISO 639 shall include information about which subset of the totality
of the ISO 639 code tables is used. Some of the recommended options are:
⎯ Part 1 only [6.1: a) to i), if all languages in question are included in Part 1];
⎯ Part 1 and Part 2, using Part 2 only for items not included in Part 1 (or a user-defined subset of Part 1);
⎯ Part 2 only [6.1: c)];
⎯ Part 2 and Part 3;
⎯ Part 2 and Part 5, using items included in both parts in the sense specified in Part 5 (see also 6.3)
[6.1: d)];
⎯ Part 1, Part 2, and Part 5, using items included in both Parts 2 and 5 in the sense specified in Part 5
(see also 6.3) [(6.1: d)];
⎯ Part 2, Part 3, and Part 5, using items included in both Parts 2 and 5 in the sense specified in Part 5
(see also 6.3); and
⎯ a user-defined subset of any of the parts or any combination of parts.
Part 5 is expected to be used only in combination with other parts of ISO 639.
It is expected that a mechanism will be developed in the future for naming and registering defined subsets of
the totality of the ISO 639 language code.
6.3 Language groups
As discussed in 5.3, second list item, the simultaneous application of Part 2 and Part 5 of ISO 639 will require
implementation-level specification.
10 © ISO 2010 – All rights reserved

There are currently 64 items that are included both in Part 2 and in Part 5 (listed in Annex A of Part 5). Of
these items, 29 items are identical in the two parts (e.g. “alg – Algonquian languages”). The remaining
35 items are intended to cover remainder groups in Part 2 and entire language groups in Part 5 (e.g. “afa –
Afro-Asiatic (Other)” in Part 2 and “afa – Afro-Asiatic languages” in Part 5).
According to the principles of Part 2, the identifier “afa” will be assigned only to a document or information in
(or about) an Afro-Asiatic language that does not have an individual-language identifier in Part 2, and that
does not fall into the remainder groups “ber – Berber (Other)”, “cus – Cushitic (Other)”, or “sem – Semitic
(Other)”, all of which are Afro-Asiatic language groups.
According to the principles of Part 5, the identifier “afa” may be assigned to a document or information in (or
about) any Afro-Asiatic language. The use of “afa”, “sem”, or “ara” in a concrete case relating to Arabic,
depends on the purpose of the encoding, as specified in the implementation.
The use of identifiers from Part 5 will depend on the purpose of the application. It is expected that user-
defined subsets of the items in Part 5 will frequently be used in combination with, for example, the totality or
defined subsets of Part 2 or Part 3.
7 Combining language identifiers with other standards and codes
7.1 Combining ISO 639 with ISO 3166
The language identifiers of ISO 639 may be combined with country and country subdivision identifiers of
ISO 3166 (all parts) to denote the area in which a word, term, phrase, or language variant is (or has been)
used.
NOTE 1 In ISO 3166, the term “code element” is used to refer to the concept of “identifier” according to ISO 639
terminology.
NOTE 2 Some applications may not allow the use of the country subdivision code of ISO 3166-2, because of the
variable format of that code.
EXAMPLE
⎯ “eng US” (or “en US”, “eng USA”, “en USA”, “eng 840”, “en 840”) indicates English of the United States of America;
⎯ “eng US-NY” indicates English of the state of New York;
⎯ “fra FR” (or “fre FR”, “fr FR”, “fra FRA”, “fre FRA”, “fr FRA” ”, “fra 250”, “fre 250”, “fr 250”) indicates French of France;
⎯ “fra FR-75” indicates French of Paris.
NOTE 3 Applications may define a default region for each language and use ISO 3166 identifiers to specify usage
outside this region only.
7.2 Combining ISO 639 with ISO 19111 and ISO 19112
The language identifiers of ISO 639 may also be combined with spatial referencing information in accordance
with ISO 19111 and ISO 19112 to denote the area in which a word, term, phrase, language, or language
variant is used.
ISO 19111 and ISO 19112 complement ISO 3166 in that they allow spatial referencing independent of political
and administrative considerations.
7.3 Combining ISO 639 with ISO 15924
The language identifiers of ISO 639 may be combined with script identifiers of ISO 15924 to indicate which
script is used in a document, text segment, language, or language variant.
EXAMPLE
⎯ “deu Latf” (or “ger Latf” or “de Latf”) indicates German in Latin Fraktur script;
⎯ “kur Cyrl” (or “ku Cyrl”) indicates Kurdish in Cyrillic script.
NOTE Applications may define a default script for each language and use ISO 15924 identifiers to specify the use of
scripts other than the default.
7.4 Other code combinations
The language identifiers of ISO 639 may be combined with any other standardized or user-defined code to
establish combined identifiers suitable for given purposes.
The usage of such combined identifiers and combination codes shall be documented in each individual case.
The intension of the individual language identifiers and the ISO 639 language code shall remain unchanged
by such combinations.
7.5 Formats of combined identifiers
This International Standard does not require a specific format of combined identifiers. The format used in 7.1
and 7.2 is intended as an example only.
Each application shall specify the format of combined identifiers. The specification may include one or more of
the following:
⎯ the order of the elements,
⎯ a separation character between elements,
⎯ prefixes or other indicators to some or all of the elements,
⎯ structuring features, such as XML tagging.
Depending on the specification of the application, a combined language identifier for a text in German in Latin
Fraktur script, originating from Austria, could for instance be encoded in one of the following ways:
⎯ de Latf AT
⎯ de_Latf_AT
⎯ de_AT_Latf
⎯ de-C:AT-S:Latf
⎯ language=“de” script=“Latf” area=“AT”
12 © ISO 2010 – All rights reserved

8 Language description format (LDF)
8.1 Compatibilities between the ISO 639 model and ISO 12620
8.1.1 General
The model for ISO 639 has been developed to be compatible with models being developed by other groups
within ISO/TC 37. ISO/TC 37 standards for computational use of terminology, specifically ISO 16642 and its
combination with ISO 12620, emphasize the use of a metamodel in combination with metadata identifiers,
referred to as data categories. These data categories may be referred to also as administered items, in
accordance with ISO/IEC 11179.
ISO 639 uses a specific model for language identification/documentation and a list of metadata identifiers can
be associated with this model. The model for ISO 639 has been developed to be in conformity with the
ISO/IEC 11179 series of standards. As such, language information is
⎯ specified according to ISO/IEC 11179-3,
⎯ defined according to ISO/IEC 11179-4,
⎯ named according to ISO/IEC 11179-5, and
⎯ registered according to ISO/IEC 11179-6.
It is intended to be fully compatible with the metadata registry specified in ISO 12620. It is also intended to be
fully compatible with the Data Category Interchange Format (DCIF) defined in ISO 12620. Some variation
between the metamodel of the metadata registry and the s
...


PROJET DE NORME INTERNATIONALE ISO/DIS 639-4
ISO/TC 37/SC 2 Secrétariat: SCC
Début de vote: Vote clos le:
2006-12-22 2007-05-22
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION • МЕЖДУНАРОДНАЯ ОРГАНИЗАЦИЯ ПО СТАНДАРТИЗАЦИИ • ORGANISATION INTERNATIONALE DE NORMALISATION
Codes pour la représentation des noms de langue —
Partie 4:
Lignes directrices pour la mise en oeuvre et principes généraux
des codes de langue
Codes for the representation of names of languages —
Part 4: Implementation guidelines and general principles for language coding
ICS 01.140.20
Pour accélérer la distribution, le présent document est distribué tel qu'il est parvenu du
secrétariat du comité. Le travail de rédaction et de composition de texte sera effectué au
Secrétariat central de l'ISO au stade de publication.
To expedite distribution, this document is circulated as received from the committee secretariat.
ISO Central Secretariat work of editing and text composition will be undertaken at publication
stage.
CE DOCUMENT EST UN PROJET DIFFUSÉ POUR OBSERVATIONS ET APPROBATION. IL EST DONC SUSCEPTIBLE DE MODIFICATION ET NE PEUT
ÊTRE CITÉ COMME NORME INTERNATIONALE AVANT SA PUBLICATION EN TANT QUE TELLE.
OUTRE LE FAIT D'ÊTRE EXAMINÉS POUR ÉTABLIR S'ILS SONT ACCEPTABLES À DES FINS INDUSTRIELLES, TECHNOLOGIQUES ET
COMMERCIALES, AINSI QUE DU POINT DE VUE DES UTILISATEURS, LES PROJETS DE NORMES INTERNATIONALES DOIVENT PARFOIS ÊTRE
CONSIDÉRÉS DU POINT DE VUE DE LEUR POSSIBILITÉ DE DEVENIR DES NORMES POUVANT SERVIR DE RÉFÉRENCE DANS LA
RÉGLEMENTATION NATIONALE.
© Organisation internationale de normalisation, 2006

ISO/DIS 639-4
PDF — Exonération de responsabilité
Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier
peut être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence
autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées
acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute
responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.
Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info du
fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir l'exploitation
de ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation, veuillez en informer
le Secrétariat central à l'adresse donnée ci-dessous.
Notice de droit d'auteur
Ce document de l'ISO est un projet de Norme internationale qui est protégé par les droits d'auteur de l'ISO.
Sauf autorisé par les lois en matière de droits d'auteur du pays utilisateur, aucune partie de ce projet ISO ne
peut être reproduite, enregistrée dans un système d'extraction ou transmise sous quelque forme que ce soit
et par aucun procédé, électronique ou mécanique, y compris la photocopie, les enregistrements ou autres,
sans autorisation écrite préalable.
Les demandes d'autorisation de reproduction doivent être envoyées à l'ISO à l'adresse ci-après ou au comité
membre de l'ISO dans le pays du demandeur.
ISO copyright office
Case postale 56  CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Toute reproduction est soumise au paiement de droits ou à un contrat de licence.
Les contrevenants pourront être poursuivis.
©
ii ISO 2006 – Tous droits réservés

ISO/DIS 639-4
Sommaire Page
Avant-propos .v
Introduction.vi
1 Domaine d'application .1
2 Références normatives.1
3 Termes et définitions .2
4 Concepts fondamentaux de codage des langues.6
4.1 Indicatifs de langue et langues.6
4.2 Langues individuelles.6
4.3 Macro-langues .6
4.4 Norme linguistique.7
4.5 Dialectes.7
4.6 Codets de langues collectifs et groupes de langues .8
4.7 Langues mortes, anciennes et historiques .8
4.8 Langues abstraites.8
4.9 Systèmes d’écriture et écritures.8
5 Relations entre les parties de l'ISO 639 .9
5.1 Parties de l'ISO 639 .9
5.2 Norme ISO 639 comme espace de codage .9
5.3 Principes .9
5.4 Mise à jour commune et base de données de codage des langues .10
6 Direction générale de l'ISO 639.10
6.1 Agences d'enregistrement et responsabilités concernant les parties de l'ISO 639.10
6.2 Comité consultatif mixte ISO 639/RA-JAC.10
6.2.1 Composition.10
6.2.2 Nomination des membres .10
6.2.3 Secrétariat .10
6.3 Procédures de travail au sein de l’ISO 639/RA-JAC .11
6.4 Ajout et suppression à la liste des entités, modification d’indicatifs.11
6.5 Réservation des indicatifs.11
6.6 Création d’indicatifs de langues.11
6.7 Procédures de vote .11
6.8 Stabilité des tableaux de codes.11
7 Problèmes d'implémentation .12
7.1 Applications .12
7.2 Sous-ensembles du tableau de codes .12
7.3 Groupes de langues.13
8 Combinaison des indicatifs avec d’autres normes ou d’autres codes .13
8.1 Combinaison de l'ISO 639 avec l'ISO 3166 .13
8.2 Combinaison de l'ISO 639 avec l'ISO 19111 et l'ISO 19112.14
8.3 Combinaison de l'ISO 639 avec l'ISO 15924 .14
8.4 Autres combinaisons de codes .14
8.5 Formats des indicatifs combinés .14
ISO/DIS 639-4
9 Format de description de la langue (LDF). 15
9.1 Compatibilités entre le modèle ISO 639 et l'ISO 12620. 15
9.1.1 Identification. 16
9.1.2 Description d’un indicatif de langue ISO 639 . 18
9.2 Extensions de l'ISO 639 à l'ISO 12620 pour LDF . 21
9.2.1 Représentation. 21
9.2.2 Documentation. 23
9.3 Informations sur la langue. 24
9.3.1 Informations calculables sur la langue . 24
9.3.2 Attribution des noms aux langues. 25
9.3.3 Informations sur le pays . 25
9.3.4 Informations sur la langue « dépendant du pays ». 25
9.3.5 Documentation de référence . 26
9.3.6 Informations géographiques . 26
9.3.7 Informations socioculturelles. 26
9.3.8 Caractéristiques linguistiques . 26
Bibliographie . 27

iv © ISO 2006 – Tous droits réservés

ISO/DIS 639-4
Avant-propos
L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes nationaux de
normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est en général confiée
aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du
comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l'ISO participent également aux travaux. L'ISO collabore étroitement avec
la Commission électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI,
Partie 2.
La tâche principale des comités techniques est d'élaborer les Normes internationales. Les projets de Normes
internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur
publication comme Normes internationales requiert l'approbation de 75 % au moins des comités membres
votants.
L'attention est appelée sur le fait que certains des éléments du présent document peuvent faire l'objet de
droits de propriété intellectuelle ou de droits analogues. L'ISO ne saurait être tenue pour responsable de ne
pas avoir identifié de tels droits de propriété et averti de leur existence.
L'ISO 639-4 a été élaborée par le comité technique ISO/TC 37, Terminologie, autres ressources langagières
et contenus, sous-comité SC 2, Méthodes de travail terminographiques et lexicographiques.
L'ISO 639 comprend les parties suivantes, présentées sous le titre général Codes pour la représentation des
noms de langue :
⎯ Partie 1 : Code Alpha-2
⎯ Partie 2 : Code Alpha-3
⎯ Partie 3 : Code Alpha-3 pour un traitement exhaustif des langues
⎯ Partie 4 : Guide d'implémentation et principes généraux des codes de langue. [ce document]
⎯ Partie 5 : Code Alpha-3 pour les familles de langues et les groupes de langues
La Partie 6 est en cours d’élaboration :
⎯ Partie 6 : Représentation Alpha-4 pour un traitement exhaustif de la variation linguistique

1) À publier.
2) À publier.
ISO/DIS 639-4
Introduction
L’ISO 639 fournit des codes pour l’identification et la spécification de différentes langues et variantes
linguistiques ainsi que de différents groupes de langues. Ces identificateurs peuvent s’utiliser dans de
nombreuses applications, y compris pour spécifier la langue d’un texte, la langue des termes ou des mots
d’un dictionnaire ou d’une base de données terminologique, la langue d’une présentation orale, le niveau de
connaissance d’une langue, les possibilités linguistiques d’un logiciel, la localisation, etc. L’implémentation
des diverses parties de l'ISO 639 est prévue pour de nombreux environnements.
Les Parties 1, 2, 3 et 5 de l'ISO 639 contiennent toutes des informations sur les problèmes d’implémentation.
Cependant, il s’avère nécessaire d’étendre ces descriptions et de stipuler les règles d’implémentation dans un
document séparé. Dans les futures révisions des autres parties de la présente norme, il est prévu que ces
normes feront référence à cette partie de l'ISO 639, plutôt que de dupliquer les informations.
vi © ISO 2006 – Tous droits réservés

PROJET DE NORME INTERNATIONALE ISO/DIS 639-4

Codes pour la représentation des noms de langue —
Partie 4:
Lignes directrices pour la mise en oeuvre et principes généraux
des codes de langue
1 Domaine d'application
La présente partie de l'ISO 639 fournit les principaux généraux de codage des langues à l’aide des codes
spécifiés dans les autres parties de l'ISO 639, ainsi que leur combinaison avec d’autres codes. De plus, la
présente partie de l'ISO 639 établit des règles d’utilisation de n’importe quelle combinaison des parties de la
norme. Les données pertinentes pour la description des unités linguistiques sont également fournies et
servent de cadre de travail pour les bases de données qui prennent en charge la série de normes ISO 639.
2 Références normatives
Les documents normatifs suivants contiennent des dispositions qui, par suite de la référence qui y est faite,
constituent des dispositions valables pour la présente partie de l’ISO 639. Pour les références datées, les
amendements ultérieurs ou les révisions de ces publications ne s’appliquent pas. Toutefois, les
parties prenantes aux accords fondés sur la présente partie de l’ISO 639 sont invitées à rechercher la
possibilité d'appliquer les éditions les plus récentes des documents normatifs indiqués ci-après. Pour les
références non datées, la dernière édition du document normatif en référence s’applique. Les membres de
l'ISO et de la CEI possèdent le registre des Normes internationales en vigueur.
ISO 639-1:2002, Codes pour la représentation des noms de langue — Partie 1: Code alpha-2.
ISO 639-2:1998, Codes pour la représentation des noms de langue — Partie 2: Code alpha-3.
ISO 639-3:—, Codes pour la représentation des noms de langue — Partie 3: Code alpha-3 pour un traitement
exhaustif des langues.
ISO 639-5:—, Codes pour la représentation des noms de langue — Partie 5 : Code alpha-3 pour les familles
de langues et groupes de langues. .
ISO 3166-1:1997, Codes pour la représentation des noms de pays et de leurs subdivisions —
Partie 1 : Codes pays.
ISO 3166-2:1998, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 2 : code
pour les subdivisions de pays. .
ISO 3166-3:1999, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 3 : Code
pour les noms de pays antérieurement utilisés.

3) À publier.
4) À publier.
5) En cours de révision ; FDIS 2006-05.
6) En cours de révision ; DIS 2005-09.
ISO/DIS 639-4
ISO 8601:2004, Éléments de données et formats d'échange — Échange d'information — Représentation de
la date et de l'heure.
ISO/CEI 10646:2003, Technologies de l'information — Jeu universel de caractères codés sur plusieurs octets
(JUC).
ISO/CEI 11179-1:2004, Technologies de l'information — Registres de métadonnées (RM) — Partie 1 : Cadre.
ISO/CEI 11179-2:2005, Technologies de l'information — Registres de métadonnées (RM) —
Partie 2 : classification.
ISO/CEI 11179-3:2003, Technologies de l'information — Registres de métadonnées (MDR) —
Partie 3 : métamodèle de registre et attributs de base.
ISO/CEI 11179-4:2004, Technologies de l'information — Registres de métadonnées (RM) —
Partie 4 : Formulation des définitions de données.
ISO/CEI 11179-5:2005, Technologies de l'information — Registres de métadonnées (RM) —
Partie 5 : principes de dénomination et d'identification.
ISO/CEI 11179-6:2005, Technologies de l'information — Registres de métadonnées (RM) —
Partie 6 : Enregistrement.
ISO 12620:1999, Aides informatiques en terminologie — Catégories de données.
ISO 15924:2004, Information et documentation — Codes pour la représentation des noms d'écritures.
ISO 16642:2003, Applications informatiques en terminologie — Plate-forme pour le balisage de terminologies
informatisées.
ISO 19111:2003, Information géographique — Système de référence spatiales par coordonnées.
ISO 19112:2003, Information géographique — Système de références spatiales par identificateurs
géographiques.
3 Termes et définitions
Pour les besoins de la présente partie de l'ISO 639, les termes et définitions suivants s'appliquent.
Dans les futures versions de l'ISO 639, il est prévu que certains termes et définitions, ou tous, soient
remplacés par une référence aux termes et définitions de la présente partie de l'ISO 639.
NOTE Les définitions de la présente partie de l'ISO 639 sont destinées à l’utilisation pratique dans le contexte des
diverses parties de cette norme et de leurs applications. Pour quelques objectifs linguistiques, il existe des besoins de
définitions plus détaillées, et éventuellement dérivées.
3.1
code
données transformées ou représentées sous différentes formes, selon un jeu de règles préétablies
NOTE L’utilisation du terme « code » n’est pas identique dans tous les systèmes de codage normalisés. En fonction
de l’utilisation définie dans la présente partie de l'ISO 639, un « code » doit être compris comme un tableau de codes (3.2)
et l’ensemble des règles relatives à ce tableau. Chaque ligne d’un tableau de codes est un codet de langue (3.4) (par
exemple, « de - German - allemande – Deutsch » dans la Partie 1 de l'ISO 639), alors que l’élément « de » est l’indicatif
de la langue (3.5).
7) En cours de révision.
2 © ISO 2006 – Tous droits réservés

ISO/DIS 639-4
3.2
tableau de codes
tableau des codets faisant partie d’un code
3.3
espace de codage
totalité des valeurs possibles d’un ensemble d’indicatifs au sein d’un code
EXEMPLE Toutes les suites de deux lettres (aa–zz) forment l’espace de codage du code de la langue alpha-2
spécifié dans la Partie 1 de la norme ISO.
NOTE Les codes de langue alpha-3 spécifiés dans les Parties 2, 3 et 5 de l'ISO 639 partagent le même espace de
codage : aucun indicatif de langue affecté dans une des parties ne peut être affecté à un autre élément d’une autre partie.
3.4
codet
entrée individuelle d’un code
NOTE Dans les codes de langues décrits de l'ISO 639, chaque codet se compose d’un indicatif de langue et des
noms de la langue correspondante.
3.5
indicatif de langue
symbole de langue
chaîne de lettres assignée à une unité linguistique dans le but de la représenter de façon unique
NOTE 1 Dans les codes de langues décrits dans les Parties 1, 2, 3 et 5 de l'ISO 639, chaque indicatif de langue se
compose de deux ou trois lettres.
NOTE 2 Voir 4.1.
3.6
langue
utilisation systématique de sons, caractères, symboles ou signes pour exprimer ou communiquer un sens ou
un message
NOTE Voir également 4.1 et 4.2.
3.7
langue individuelle
langue (3.6) distincte de toute autre
NOTE Voir 4.2.
3.8
dialecte
variante linguistique (3.14) propre à une zone géographique ou à un groupe d’utilisateurs d’une langue
NOTE Voir 4.5.
3.9
macro-langue
langue (3.6) qui, dans un but particulier, peut se subdiviser en deux ou plusieurs langues individuelles (3.7)
NOTE Voir 4.3.
3.10
groupe de langues
ensemble de deux ou plusieurs langues individuelles (3.7) qui, dans un but particulier, peut être traité
comme une seule unité
ISO/DIS 639-4
NOTE Voir 4.6.
3.11
famille de langues
ensemble de deux ou plusieurs langues individuelles (3.7) apparentées du fait de leur origine commune
NOTE Dans certains cas exceptionnels, une famille de langues peut ne comprendre qu’une seule langue
individuelle.
3.12
groupe restreint
groupe de langues (3.10) qui exclut explicitement des langues spécifiées
NOTE Voir 4.6.
3.13
variation linguistique
variante continue au sein et entre des langues individuelles (3.7)
NOTE Une variation linguistique peut être considérée comme une variation dans le temps, l’espace, du fait d’une
appartenance culturelle, etc.
3.14
variante linguistique
variante d’une langue individuelle (3.7) qu’il est possible d’identifier et de nommer
3.15
variante standard
variante linguistique (3.14) possédant un haut niveau de normalisation et d’état
NOTE Une variante standard d’une langue peut généralement s’utiliser dans une communication publique ou
officielle et pour la communication entre des utilisateurs de différentes variantes linguistiques
3.16
système d’écriture
système d’écriture d’une langue (3.6), y compris l’écriture (3.17) et le jeu de caractères utilisés
NOTE Voir également 4.9.
3.17
écriture
ensemble de caractères graphiques utilisé pour la forme écrite d’une ou plusieurs langues
[ISO 15924 et ISO/CEI 10646]
NOTE Voir également 4.9.
3.18
orthographe
ensemble de règles d’orthographe applicable aux mots et au texte d’une ou plusieurs langues
3.19
transcription
système de représentation d’un texte dans une écriture différente du texte original
NOTE Le résultat textuel est également appelé « transcription ».
4 © ISO 2006 – Tous droits réservés

ISO/DIS 639-4
3.20
translittération
transcription (3.19) qui permet de reconstruire l’écriture originale sans perdre d’informations
NOTE Le résultat textuel est également appelé « translittération ».
3.21
langue écrite
langue individuelle (3.7) ou variante linguistique (3.14) communément représentée par écrit avec une
orthographe relativement normalisée (3.18)
3.22
langue orale
langue individuelle (3.7) ou variante linguistique (3.14) représentée sous forme orale
NOTE Une langue orale peut se représenter par écrit à l’aide d’un système d’écriture phonétique dans lequel les
caractères représentent directement des sons (phonèmes).
3.23
langue vivante
langue individuelle (3.7) ou variante linguistique (3.14) actuellement utilisée, en particulier sous forme
orale
3.24
langue morte
langue individuelle (3.7) ou variante linguistique (3.14) qui n’est plus utilisée et qui n’a pas de langue
héritée
NOTE Voir 4.7.
3.25
langue ancienne
langue morte (3.24) dotée d’une littérature et d’un état particulier dans la communauté scientifique
NOTE Voir 4.7.
3.26
langue historique
état historique précédemment connu d’une langue vivante (3.23) ou d’une langue morte (3.24)
EXEMPLE L'anglo-saxon anglais et l’anglais médiéval sont des langues historiques de l’anglais.
NOTE Voir 4.7.
3.27
langue naturelle
langue (3.6) utilisée pour la communication humaine et qui n’est pas une langue artificielle (3.28)
3.28
langue artificielle
langue (3.6) utilisée pour la communication humaine et conçue artificiellement
NOTE Voir également 4.8.
ISO/DIS 639-4
4 Concepts fondamentaux de codage des langues
4.1 Indicatifs de langue et langues
Un indicatif de langue représente une langue qui peut également se représenter par un ou plusieurs noms de
langues. Les objets de l'identification sont les langues elles-mêmes ; les noms de langue sont des moyens
par lesquels sont désignées les langues dénommées par les indicatifs de langue.
Les langues ne sont pas des objets statiques dont chaque instanciation est identique à chaque autre. Chaque
langue correspond à une certaine plage de variation de l'expression linguistique. Dans les diverses parties
de l'ISO 639, un indicatif de langue désigne donc une certaine plage de variante linguistique. La plage de
variante indiquée peut avoir trois domaines d'application différents : langue individuelle, macro-langue et
groupe de langues. De plus, les langues représentées peuvent être de divers types : langues vivantes,
langues anciennes, langues construites artificiellement, etc. L'exposé suivant fournit une explication plus
détaillée de l'attribution des indicatifs pour les différents domaines d'application ou pour les différents types de
langues dans l'ISO 639.
4.2 Langues individuelles
Les indicatifs des Parties 1, 2 et 3 de l'ISO 639 sont censés indiquer des langues individuelles différentes, à
moins que le nom de la langue fasse explicitement référence à un groupe de langues.
Il n'existe pas de définition unique d’une « langue » qui soit acceptée par tous et qui convienne à tous les
besoins. Par conséquent, il peut y avoir désaccord, même entre locuteurs ou entre linguistes, sur la question
de savoir si deux variantes représentent des dialectes d'une même langue ou deux langues distinctes.
Pour l'ISO 639, les jugements pour savoir si deux variantes sont considérées représenter la même langue ou
des langues différentes sont basés sur divers facteurs, notamment la similarité linguistique, l'intelligibilité, une
littérature commune, les points de vue des locuteurs sur la relation entre langue et identité, pour n’en citer que
quelques-uns. Les critères fondamentaux suivants s’appliquent :
⎯ deux variantes liées sont normalement considérées comme étant des variantes de la même langue si les
personnes parlant chaque variante ont une compréhension fonctionnelle spontanée de l'autre variante
(c'est-à-dire qu'elles peuvent la comprendre en s'appuyant sur la connaissance de leur propre variante
sans devoir apprendre l'autre variante) ;
⎯ lorsque l'intelligibilité orale entre variantes est marginale, l'existence d'une littérature commune ou d'une
identité ethnolinguistique commune avec une variante centrale comprise par ces deux variantes peut
fortement indiquer qu'il conviendrait néanmoins de les considérer comme des variantes de la même
langue ;
⎯ lorsqu'il existe entre les variantes une intelligibilité suffisante qui permette de communiquer, l'existence
d'identités ethnolinguistiques distinctes bien établies peut fortement indiquer qu'il conviendrait néanmoins
de les considérer comme des langues différentes.
Diverses distinctions établies sur ces bases peuvent ne pas être considérées comme appropriées par un
certain nombre d'usagers ou pour certaines applications. Toutefois, ces critères fondamentaux sont
considérés s'adapter le mieux à la gamme visée d'applications.
4.3 Macro-langues
Les Parties 1 et 2 de l'ISO 639 comprennent des indicatifs qui correspondent, dans une relation un à
plusieurs, à des indicatifs de langue individuelle de la Partie 3 de l'ISO 639. Par exemple, la Partie 3
de l'ISO 639 contient plus de 30 indicatifs appelés identificateurs de langue individuelle pour différentes
variantes de l'arabe, alors que les Parties 1 et 2 contiennent un seul indicatif pour l’arabe (respectivement
« ar » et « ara »), qui sont appelés indicatifs de langue individuelle dans ces parties de l'ISO 639. Il est admis
ici que les indicatifs uniques pour l'arabe dans les Parties 1 et 2 de l'ISO 639 correspondent aux nombreux
indicatifs collectivement désignés pour les variétés de l'arabe dans la Partie 3 de l'ISO 639.
6 © ISO 2006 – Tous droits réservés

ISO/DIS 639-4
Dans cet exemple, il peut sembler qu'il conviendrait d'appeler indicatifs de langue collectifs les indicatifs
uniques des Parties 1 et 2 de l'ISO 639. Ce n'est toutefois pas l'hypothèse admise ici. Dans diverses
parties du monde, il existe des groupes de variantes linguistiques intimement apparentées qui, sur la base
des critères exposés en 4.2, peuvent être considérés comme des langues individuelles, alors que dans
certains contextes d'utilisation, une seule identité de langue sera nécessaire pour l'ensemble de ces langues.
Les situations types où peut apparaître ce besoin sont les suivantes :
⎯ il existe une variante plus développée qui tend à être utilisée pour une communication plus large par les
locuteurs de diverses langues étroitement apparentées ; par conséquent, une identité linguistique
commune est perçue à travers ces langues. Par exemple, il existe plusieurs langues distinctes pour
l'arabe parlé mais l'arabe standard, généralement utilisé dans les affaires et dans les médias par toutes
ces communautés, représente également un aspect important de l'unité ethno-religieuse commune. Par
conséquent, il existe une identité linguistique commune perçue.
⎯ il existe une forme écrite commune qui est utilisée pour plusieurs langues étroitement apparentées. Par
exemple, plusieurs langues chinoises partagent la même forme écrite ;
⎯ il existe une situation sociolinguistique transitoire dans laquelle des sous-communautés d'une même
communauté linguistique divergent, créant la nécessité, pour un certain nombre de besoins, de
reconnaître des langues distinctes alors que, pour d'autres besoins, une identité commune unique reste
valide. Par exemple, dans un certain nombre de contextes d'affaires, il est nécessaire de faire la
distinction entre les langues bosniaque, croate et serbe alors que dans d'autres contextes, ces
distinctions ne sont pas discernables en termes de ressources linguistiques utilisées.
Dans de telles situations, un indicatif pour l'unique identité linguistique commune est considéré comme un
indicatif de macro-langue.
Les macro-langues se distinguent des groupes de langues par le fait que les langues individuelles qui
correspondent à une macro-langue doivent être très étroitement apparentées et qu'il doit exister un domaine
où seule une identité linguistique unique est reconnue.
4.4 Norme linguistique
Certaines formes linguistiques sont « normalisées » ou « standardisées » par des organismes officiels ou
privés tels que des académies ou des comités linguistiques. Cette normalisation peut s’appliquer à divers
éléments : orthographe, morphologie, syntaxe, sémantique, phonétique, etc. Le degré de normalisation varie
considérablement d’une langue à l’autre.
Il est possible de considérer que les langues ou leurs formes linguistiques ont un certain statut officiel dans
certains pays ou régions. Le statut de la langue peut être établi par des actes parlementaires ou d’autres
procédures formelles pour lui donner le statut de « langue nationale », de « langue officielle », de « langue
régionale », etc.
4.5 Dialectes
Les variantes linguistiques désignées par chacun des indicatifs des Parties 1, 2 et 3 de l'ISO 639 sont
supposées être des langues distinctes et non des dialectes d'autres langues même si, pour un certain nombre
de besoins, certains usagers peuvent considérer une variante répertoriée dans la Partie 1 ou 2, ou en
particulier dans la Partie 3 de l'ISO 639 comme un « dialecte » plutôt que comme une « langue » (voir 4.2
et 4.3). Dans la présente Norme internationale, le terme dialecte est utilisé comme dans le champ de la
linguistique dans lequel il identifie n'importe quelle sous-variante linguistique qui pourrait être basée sur divers
critères tels que la région géographique, l'âge, le sexe, la classe sociale, l’époque, etc.
Les dialectes d'une langue sont compris dans la notation représentée par l'indicatif de cette langue. Ainsi,
chaque indicatif de langue représente la gamme complète de toutes les variantes parlées ou écrites de la
langue, y compris toute forme normalisée.
ISO/DIS 639-4
Pour les applications qui nécessitent d'identifier les dialectes, il est permis de développer une norme séparée
qui fournit des indicatifs de dialectes ou qui combine des indicatifs issus de l'ISO 639 avec d'autres
qualificatifs d'identification distinctifs.
4.6 Codets de langues collectifs et groupes de langues
La Partie 2 de l'ISO 639 comporte des indicatifs alpha-3 pour les groupes de langues ; la Partie 5 est
particulièrement consacrée aux groupes et aux familles de langues. Cependant, les Parties 1 et 3 fournissent
des indicatifs uniquement pour les langues individuelles et les macro-langues.
Certains codets de la Partie 2 spécifient des groupes restreints. Ces codets comportent le mot « other » dans
leurs noms anglais (« autres » dans leurs noms français). Les mêmes indicatifs alpha-3 figurent dans la
Partie 5 de l'ISO 639 pour indiquer le groupe ou la famille de langues comme un ensemble. Pour les
applications qui utilisent uniquement la Partie 2, les indicateurs des groupes restreints doivent s’utiliser pour
les langues qui appartiennent au groupe ou à la famille de langues en question, mais qui ne comportent pas
d’indicatif de langue individuelle dans la Partie 2. Les applications qui utilisent les Parties 2 et 5 et celles qui
utilisent les Parties 2 et 3 et 5 doivent utiliser les codets de langue collectifs dans le sens spécifié dans la
Partie 5, qui permet de hiérarchiser les indicatifs de langues.
4.7 Langues mortes, anciennes et historiques
L'ISO 639 comporte des indicatifs qui désignent des langues mortes ainsi que des langues vivantes. Pour se
qualifier en vue d'une inclusion dans l’ISO 639, la langue doit avoir une littérature attestée ou être bien
documentée en tant que langue connue comme ayant été parlée par une communauté particulière à un
certain moment de l'histoire ; il ne peut s'agir d'une langue reconstruite inférée à partir d'une analyse
comparative historique. Le code inclut également des indicatifs qui désignent des langues historiques qui sont
considérées distinctes de toute langue moderne qui peut en descendre ; par exemple, l'anglo-saxon anglais et
le moyen anglais. Ici, également, le critère est que la langue ait une littérature traitée distinctement par la
communauté des chercheurs.
4.8 Langues abstraites
L'ISO 639 comporte des indicatifs qui désignent des langues abstraites (ou construites) qui correspondent
aux critères suivants :
⎯ la langue possède une littérature ;
⎯ la langue est destinée à la communication humaine.
Les langues reconstituées, les langages informatiques de programmation et les langages balisés sont
spécifiquement exclus de l'ISO 639.
4.9 Systèmes d’écriture et écritures
Un seul indicatif de langue est fourni pour une langue, même si celle-ci peut s’écrire dans plusieurs systèmes
d’écriture. Il est possible de combiner les indicatifs de langues de l'ISO 639 avec des indicatifs de systèmes
d’écriture de l'ISO 15924 (voir 8.3).
8 © ISO 2006 – Tous droits réservés

ISO/DIS 639-4
5 Relations entre les parties de l'ISO 639
5.1 Parties de l'ISO 639
Les diverses parties de l'ISO 639 constituent un ensemble coordonné de normes de codage des langues :
⎯ Partie 1 affecte des indicatifs alpha-2 à un nombre limité de langues (actuellement 186), pour des
langues particulières ayant de longue date une littérature scientifique, ainsi qu’une terminologie et une
lexicographie développées ;
⎯ Partie 2 affecte des indicatifs alpha-3 à un nombre de langues quelque peu supérieur (actuellement 474),
en particulier pour des langues particulières ayant une littérature volumineuse dans les bibliothèques
centrales et dans les fonds documentaires ;
⎯ Partie 3 affecte des indicatifs alpha-3 à la plupart des langues individuelles dans le monde (actuellement
environ 7 000) ;
⎯ Partie 5 affecte des indicatifs alpha-3 à des groupes et à des familles de langues ;
⎯ une future Partie 6 prévoit de permettre un codage des éléments plus détaillé qu’au niveau d’une
« langue individuelle ». Lorsque la Partie 6 sera développée, le texte de la présente Partie 4 sera revu
pour inclure les caractéristiques traitées dans cette nouvelle Partie 6.
5.2 Norme ISO 639 comme espace de codage
Tous les indicatifs de langues spécifiés dans les Parties 1, 2, 3 et 5 de la présente Norme internationale
partagent un même espace de codage. Cela implique qu’un indicatif de langue indique toujours un élément
particulier, quelles que soient les parties où il figure.
5.3 Principes
Les principes suivants s’appliquent à chaque partie de l'ISO 639 et à leur interdépendance :
⎯ l’ensemble des langues figurant dans la Partie 1 est un sous-ensemble de celles figurant dans la Partie 2.
L’extension d’un élément de la Partie 1 est exactement identique à celle de l’élément correspondant dans
la Partie 2. Un indicatif alpha-3 dans la Partie 2 et l’indicatif alpha-2 correspondant dans la Partie 1
doivent être considérés comme des synonymes. Lorsque les indicatifs alpha-3 sont différents dans le
« Tableau B » et le « Tableau T » de la Partie 2, ceux-ci doivent être considérés comme des synonymes.
Exemples : (1) Les indicatifs de langue « en » et « eng » désignent exactement la même langue. (2) Les
indicatifs de langue « fra » et « fre » (et « fr ») désignent exactement la même langue. Dans la mesure du
possible, il convient que les implémentations permettent de choisir librement parmi de tels synonymes ;
⎯ certains éléments figurent dans la Partie 2 et dans la Partie 5 avec des désignations légèrement
différentes. Exemple : « gem » désigne « Germaniques (autres) » dans la Partie 2 et « Langues
germaniques » dans la Partie 5. Dans le contexte de la Partie 2, il convient d’utiliser « gem » pour
identifier l’ensemble des langues du groupe « Langues germaniques », et qui ne comporte pas d’indicatif
de langue individuelle dans la Partie 2. Dans d’autres contextes, « gem » peut s’utiliser pour identifier le
groupe de langues « Langues germaniques » en tant qu’unité linguistique ;
⎯ le code alpha-3 des Parties 2, 3 et 5 constitue un seul espace de codage. Aucun indicatif alpha-3 affecté
dans une de ces parties n’a été affecté ou ne sera affecté à un autre élément ;
⎯ les codets de la Partie 3 peuvent également figurer dans la Partie 2 en respectant les procédures du
Comité consultatif mixte (voir 6.2).
ISO/DIS 639-4
5.4 Mise à jour commune et base de données de codage des langues
Alors que les différentes parties de l'ISO 639 ont été développées et publiées comme des parties individuelles
et séparées de la Norme internationale, leur mise à jour est totalement coordonnée.
Il est prévu qu’une future révision de l'ISO 639 soit publiée sous forme de base de données intégrée utilisant
la métastructure spécifiée à l’Article 9 de la présente Norme internationale.
6 Direction générale de l'ISO 639
6.1 Agences d'enregistrement et responsabilités concernant les parties de l'ISO 639
Des Agences d'enregistrement (RA) indépendantes ont été nommées pour les Parties 1, 2 et 3 de l'ISO 639.
Les noms et les coordonnées sont indiqués dans chacune des parties en question.
6.2 Comité consultatif mixte ISO 639/RA-JAC
Un Comité consultatif mixte (ISO 639/RA-JAC) est établi afin de conseiller les Agences d’enregistrement
de l'ISO 639. Il doit conduire la mise en application des règles de codage édictées respectivement
dans l'ISO 639-1, l'ISO 639-2 et l'ISO 639-3.
6.2.1 Composition
Le Comité consultatif mixte ISO 639/RA-JAC se compose de :
⎯ un représentant de l’Agence d’enregistrement ISO 639-1 ;
⎯ un représentant de l’Agence d’enregistrement ISO 639-2 ;
⎯ un représentant de l’Agence d’enregistrement ISO 639-3 ;
⎯ trois représentants du comité technique ISO/TC 37 (nommés par l’ISO/TC 37) ; et
⎯ trois représentants du comité technique ISO/TC 46 (nommés par l’ISO/TC 46).
Ces deux comités techniques peuvent désigner des représentants suppléants.
6.2.2 Nomination des membres
Les représentants ISO 639-1/RA, ISO 639-2/RA et ISO 639-3/RA présideront par alternance pendant 2 ans.
Il sera possible de faire appel à des experts techniques, au nombre maximum de cinq, qui participeront en
tant que membres observateurs non-votants. Les observateurs seront habilités à recevoir les documents
envoyés aux membres de l’ISO 639/RA-JAC et à commenter les documents en retour.
6.2.3 Secrétariat
L’ISO 639/RA-JAC peut décider de désigner un secrétaire chargé de préparer les questions à décider par le
Comité, d’organiser des votes et de documenter les décisions concernant les tableaux de codes de l'ISO 639.
10 © ISO 2006 – Tous droits réservés

ISO/DIS 639-4
6.3 Procédures de travail au sein de l’ISO 639/RA-JAC
L’ISO 639/RA-JAC travaillera essentiellement par correspondance, et exceptionnellement en réunions. Si une
réunion est nécessaire, elle sera tenue de préférence conjointement avec les réunions plénières
de l’ISO/TC 37 et de l’ISO/TC 37/SC 2, ou celles de l’ISO/TC 46 et de l’ISO/TC 46/SC 4.
6.4 Ajout et suppression à la liste des entités, modification d’indicatifs
Les demandes d’ajout, de suppression et de modification d’indicatifs devront être étayées par un
argumentaire. Les Agences d’enregistrement ISO 639-1/RA, ISO 639-2/RA et ISO 639-3/RA doivent
consulter l’ISO 639/RA-JAC à propos d'une proposition d'ajout, de suppression ou de modification d’un
ind
...


NORME ISO
INTERNATIONALE 639-4
Première édition
2010-07-15
Codes pour la représentation des noms
de langue —
Partie 4:
Principes généraux pour le codage de la
représentation des noms de langue et
d'entités connexes, et lignes directrices
pour la mise en œuvre
Codes for the representation of names of languages —
Part 4: General principles of coding of the representation of names of
languages and related entities, and application guidelines

Numéro de référence
©
ISO 2010
PDF – Exonération de responsabilité
Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier
peut être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence
autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées
acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute
responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.
Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info
du fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir
l'exploitation de ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation,
veuillez en informer le Secrétariat central à l'adresse donnée ci-dessous.

DOCUMENT PROTÉGÉ PAR COPYRIGHT

©  ISO 2010
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être reproduite ni utilisée sous
quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l'accord écrit
de l'ISO à l'adresse ci-après ou du comité membre de l'ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Publié en Suisse
ii © ISO 2010 – Tous droits réservés

Sommaire Page
Avant-propos .iv
Introduction.v
1 Domaine d'application .1
2 Références normatives.1
3 Termes et définitions .2
4 Concepts fondamentaux de codage des langues.6
4.1 Indicatifs de langue et langues .6
4.2 Langues individuelles.6
4.3 Macrolangues .6
4.4 Norme linguistique .7
4.5 Dialectes.7
4.6 Codets de langues collectifs et groupes de langues .8
4.7 Langues mortes, anciennes et historiques .8
4.8 Langues artificielles .8
4.9 Systèmes d'écriture et écritures .8
5 Relations entre les parties de l'ISO 639 .8
5.1 Parties de l'ISO 639 .8
5.2 Norme ISO 639 comme espace de codage .9
5.3 Principes.9
5.4 Mise à jour commune et base de données de codage des langues .9
6 Problèmes d'implémentation .10
6.1 Applications .10
6.2 Sous-ensembles du tableau de codes .10
6.3 Groupes de langues .11
7 Combinaison des indicatifs de langue avec d'autres normes ou d'autres codes.11
7.1 Combinaison de l'ISO 639 avec l'ISO 3166 .11
7.2 Combinaison de l'ISO 639 avec l'ISO 19111 et l'ISO 19112.12
7.3 Combinaison de l'ISO 639 avec l'ISO 15924 .12
7.4 Autres combinaisons de codes .12
7.5 Format des indicatifs combinés .12
8 Format de description de la langue (LDF) .13
8.1 Compatibilité entre le modèle ISO 639 et l'ISO 12620.13
8.1.1 Généralités .13
8.1.2 Identification .15
8.1.3 Description d'un indicatif de langue ISO 639 .17
8.2 Extensions de l'ISO 639 au LDF de l'ISO 12620 .20
8.2.1 Représentation .20
8.2.2 Documentation .22
8.3 Informations sur la langue.24
Annexe A (informative) Direction générale de l'ISO 639 .26
Bibliographie.28

Avant-propos
L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes nationaux de
normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est en général confiée
aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du
comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l'ISO participent également aux travaux. L'ISO collabore étroitement avec
la Commission électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI,
Partie 2.
La tâche principale des comités techniques est d'élaborer les Normes internationales. Les projets de Normes
internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur
publication comme Normes internationales requiert l'approbation de 75 % au moins des comités membres
votants.
L'attention est appelée sur le fait que certains des éléments du présent document peuvent faire l'objet de
droits de propriété intellectuelle ou de droits analogues. L'ISO ne saurait être tenue pour responsable de ne
pas avoir identifié de tels droits de propriété et averti de leur existence.
L'ISO 639-4 a été élaborée par le comité technique ISO/TC 37, Terminologie et autres ressources langagières
et ressources de contenu, sous-comité SC 2, Méthodes de travail terminographiques et lexicographiques.
L'ISO 639 comprend les parties suivantes, présentées sous le titre général Codes pour la représentation des
noms de langue:
⎯ Partie 1: Code alpha-2
⎯ Partie 2: Code alpha-3
⎯ Partie 3: Code alpha-3 pour un traitement exhaustif des langues
⎯ Partie 4: Principes généraux pour le codage de la représentation des noms de langue et d'entités
connexes, et lignes directrices pour la mise en oeuvre
⎯ Partie 5: Code alpha-3 pour les familles de langues et groupes de langues
⎯ Partie 6: Code alpha-4 pour un traitement exhaustif des variantes linguistiques

iv © ISO 2010 – Tous droits réservés

Introduction
L'ISO 639 fournit des codes pour l'identification et la spécification des langues individuelles, des variantes
linguistiques et des groupes de langues. Ces identificateurs peuvent s'utiliser dans de nombreuses
applications, y compris pour spécifier la langue d'un texte, la langue des termes ou des mots d'un dictionnaire
ou d'une base de données terminologique, la langue d'une présentation orale, le niveau de connaissance
d'une langue, les possibilités linguistiques d'un logiciel, la localisation, etc. L'implémentation des diverses
parties de l'ISO 639 est prévue pour de nombreux environnements.
Les Parties 1, 2, 3 et 5 de l'ISO 639 contiennent toutes des informations sur les problèmes d'implémentation.
Cependant, il s'avère nécessaire d'étendre ces descriptions et de stipuler les règles d'implémentation dans un
document séparé. Dans les futures révisions des autres parties de l'ISO 639, il est prévu qu'elles feront
référence à la présente partie de l'ISO 639, plutôt que de dupliquer les informations.

NORME INTERNATIONALE ISO 639-4:2010(F)

Codes pour la représentation des noms de langue —
Partie 4:
Principes généraux pour le codage de la représentation des
noms de langue et d'entités connexes, et lignes directrices pour
la mise en œuvre
1 Domaine d'application
La présente partie de l'ISO 639 fournit les principes généraux de codage des langues à l'aide des codes
spécifiés dans les autres parties de l'ISO 639, ainsi que leur combinaison avec d'autres codes. De plus, la
présente partie de l'ISO 639 établit des règles d'utilisation de n'importe quelle combinaison des parties de
l'ISO 639.
La terminologie et les descriptions générales de la présente partie de l'ISO 639 sont destinées à remplacer le
texte correspondant des autres parties de l'ISO 639, selon le cas, dans de futures révisions.
Les métadonnées pertinentes pour la description des entités linguistiques sont également fournies et servent
de cadre de travail pour les bases de données linguistiques qui accompagnent la série de Normes
internationales ISO 639.
2 Références normatives
Les documents de référence suivants sont indispensables pour l'application du présent document. Pour les
références datées, seule l'édition citée s'applique. Pour les références non datées, la dernière édition du
document de référence s'applique (y compris les éventuels amendements).
ISO 639-1:2002, Codes pour la représentation des noms de langue — Partie 1: Code alpha-2
ISO 639-2:1998, Codes pour la représentation des noms de langue — Partie 2: Code alpha-3
ISO 639-3:2007, Codes pour la représentation des noms de langue — Partie 3: Code alpha-3 pour un
traitement exhaustif des langues
ISO 639-5:2008, Codes pour la représentation des noms de langue — Partie 5: Code alpha-3 pour les
familles de langues et groupes de langues
ISO 3166-1:2006, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 1: Codes
de pays
ISO 3166-2:2007, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 2: Code
pour les subdivisions de pays
ISO 3166-3:1999, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 3: Code
pour les noms de pays antérieurement utilisés
ISO 8601:2004, Éléments de données et formats d'échange — Échange d'information — Représentation de
la date et de l'heure
ISO/CEI 11179-1:2004, Technologies de l'information — Registres de métadonnées (RM) — Partie 1: Cadre
ISO/CEI 11179-2:2005, Technologies de l'information — Registres de métadonnées (RM) — Partie 2:
Classification
ISO/CEI 11179-3:2003, Technologies de l'information — Registres de métadonnées (RM) — Partie 3:
Métamodèle de registre et attributs de base
ISO/CEI 11179-4:2004, Technologies de l'information — Registres de métadonnées (RM) — Partie 4:
Formulation des définitions de données
ISO/CEI 11179-5:2005, Technologies de l'information — Registres de métadonnées (RM) — Partie 5:
Principes de dénomination et d'identification
ISO/CEI 11179-6:2005, Technologies de l'information — Registres de métadonnées (RM) — Partie 6:
Enregistrement
ISO 12620:2009, Terminologie et autres ressources langagières et ressources de contenu — Spécification de
catégories de données et gestion d'un registre de catégories de données pour les ressources langagières
ISO 15924:2004, Information et documentation — Codes pour la représentation des noms d'écritures
ISO 19111:2007, Information géographique — Système de référence spatiales par coordonnées
ISO 19112:2003, Information géographique — Système de références spatiales par identificateurs
géographiques
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions suivants s'appliquent.
Dans les futures versions des autres parties de l'ISO 639, il est prévu que tout ou partie des termes et
définitions seront remplacés par une référence aux termes et définitions de la présente partie de l'ISO 639.
NOTE Les définitions de la présente partie de l'ISO 639 sont destinées à l'utilisation pratique dans le contexte des
diverses parties de l'ISO 639 et de leurs applications. Pour certains objectifs linguistiques, il existe des besoins de
définitions plus détaillées ou qui dévient de celles données ici.
3.1
code
données transformées ou représentées sous différentes formes, selon un jeu de règles préétablies
NOTE L'utilisation du terme «code» n'est pas identique dans tous les systèmes de codage normalisés. Selon
l'utilisation définie dans la présente partie de l'ISO 639, un «code» est compris comme un tableau de codes (3.2) et
l'ensemble des règles relatives à ce tableau de codes. Chaque ligne d'un tableau de codes est un codet (3.4)
(par exemple, «de - German - allemand - Deutsch» dans la Partie 1 de l'ISO 639), alors que l'élément «de» est l'indicatif
de langue (3.5).
3.2
tableau de codes
tableau des codets (3.4) faisant partie d'un code (3.1)
3.3
espace de codage
totalité des valeurs possibles d'un ensemble d'indicatifs au sein d'un code (3.1)
2 © ISO 2010 – Tous droits réservés

EXEMPLE Toutes les combinaisons de deux lettres (de a à z) forment l'espace de codage du code de la langue
alpha-2 spécifié dans la Partie 1 de l'ISO 639.
NOTE Les codes de langue alpha-3 spécifiés dans les Parties 2, 3 et 5 de l'ISO 639 partagent le même espace de
codage: aucun indicatif de langue affecté dans une des parties ne peut être affecté à un autre élément d'une autre partie.
3.4
codet
entrée individuelle d'un code (3.1)
NOTE Dans les codes de langues décrits de l'ISO 639, chaque codet se compose d'un indicatif de langue et des
noms de la langue correspondante.
3.5
indicatif de langue
symbole de langue
chaîne de caractères assignée à une entité linguistique afin de la représenter de façon unique
NOTE 1 Dans les codes de langues décrits dans les Parties 1, 2, 3 et 5 de l'ISO 639, chaque indicatif de langue se
compose de deux ou trois lettres.
NOTE 2 Voir 4.1.
3.6
langue
utilisation systématique de sons, caractères, symboles ou signes pour exprimer ou communiquer un sens ou
un message entre humains
NOTE 1 Cette définition est destinée à servir de définition de travail pour les besoins de la série de Normes
internationales ISO 639, et non de définition universelle de ce concept.
NOTE 2 Voir également 4.1 et 4.2.
3.7
langue individuelle
langue (3.6) distincte de toute autre
NOTE Voir 4.2.
3.8
dialecte
variante linguistique (3.14) propre à une zone géographique ou à un groupe d'utilisateurs d'une langue
NOTE Voir 4.5.
3.9
macrolangue
langue (3.6) qui, dans un but particulier, peut se subdiviser en deux ou plusieurs langues individuelles (3.7)
NOTE Voir 4.3.
3.10
groupe de langues
ensemble de deux ou plusieurs langues individuelles (3.7) qui, dans un but particulier, peut être traité
comme une seule unité
NOTE Voir 4.6.
3.11
famille de langues
ensemble de deux ou plusieurs langues individuelles (3.7) apparentées du fait de leur origine commune
NOTE Dans certains cas exceptionnels, une famille de langues peut ne comprendre qu'une seule langue individuelle.
3.12
groupe restreint
groupe de langues (3.10) qui exclut explicitement des langues spécifiées
NOTE Voir 4.6.
3.13
variation linguistique
variante continue au sein et entre des langues individuelles (3.7)
NOTE Une variation linguistique peut être considérée comme une variation dans le temps, l'espace, ou du fait d'une
appartenance culturelle, etc.
3.14
variante linguistique
variante d'une langue individuelle (3.7) qu'il est possible d'identifier et de nommer
3.15
variante standard
variante linguistique (3.14) possédant un haut niveau de normalisation et d'état
NOTE Une variante standard d'une langue peut généralement s'utiliser dans une communication publique ou
officielle et pour la communication entre des utilisateurs de différentes variantes linguistiques
3.16
système d'écriture
système d'écriture d'une langue (3.6), y compris l'écriture (3.17) et le jeu de caractères utilisés
NOTE Voir également 4.9.
3.17
écriture
ensemble de caractères graphiques utilisé pour la forme écrite d'une ou plusieurs langues (3.6)
[ISO 15924:2004 et ISO/CEI 10646:2003]
NOTE Voir également 4.9.
3.18
orthographe
ensemble des règles régissant la manière admise d'écrire les mots et le texte d'une ou plusieurs langues
(3.6)
3.19
transcription
système de représentation d'un texte dans une écriture (3.17) différente du texte original
NOTE Le résultat textuel est également appelé «transcription».
4 © ISO 2010 – Tous droits réservés

3.20
translittération
transcription (3.19) qui permet de reconstruire l'écriture (3.17) originale sans perdre d'informations sur les
caractères graphiques
NOTE Le résultat textuel est également appelé «translittération».
3.21
langue écrite
langue individuelle (3.7) ou variante linguistique (3.14) communément représentée par écrit avec une
orthographe (3.18) relativement normalisée
3.22
langue orale
langue individuelle (3.7) ou variante linguistique (3.14) représentée sous forme orale
NOTE Une langue orale peut se représenter par écrit à l'aide d'un système d'écriture phonétique dans lequel les
caractères représentent directement des sons (phonèmes).
3.23
langue vivante
langue individuelle (3.7) ou variante linguistique (3.14) actuellement utilisée, en particulier sous forme
orale (3.22)
3.24
langue morte
langue individuelle (3.7) ou variante linguistique (3.14) qui n'est plus utilisée et qui n'a pas de langue
héritée encore en usage
NOTE Voir 4.7.
3.25
langue ancienne
langue morte (3.24) dotée d'une littérature et d'un état particulier dans la communauté scientifique
NOTE Voir 4.7.
3.26
langue historique
état historique précédemment connu d'une langue vivante (3.23) ou d'une langue morte (3.24)
EXEMPLE L'anglo-saxon anglais et l'anglais médiéval sont des langues historiques de l'anglais.
NOTE Voir 4.7.
3.27
langue naturelle
langue (3.6) utilisée pour la communication humaine et qui n'est pas une langue artificielle (3.28)
3.28
langue artificielle
langue (3.6) utilisée pour la communication humaine et conçue artificiellement
NOTE Voir également 4.8.
4 Concepts fondamentaux de codage des langues
4.1 Indicatifs de langue et langues
Les indicatifs de langue sont composés des 26 lettres suivantes, en minuscule, de l'alphabet latin: a, b, c, d, e,
f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. Aucun signe diacritique ou caractère modifié n'est utilisé.
Un indicatif de langue représente une langue qui peut également se représenter par un ou plusieurs noms de
langues. Les objets de l'identification sont les langues elles-mêmes; les noms de langue sont des moyens par
lesquels sont désignées les langues dénommées par les indicatifs de langue.
Les langues ne sont pas des objets statiques dont chaque instanciation est identique à chaque autre. Chaque
langue correspond à une certaine plage de variation de l'expression linguistique. Dans l'ISO 639, un indicatif
de langue désigne donc une certaine plage de variante linguistique. La plage de variante indiquée peut avoir
trois domaines d'application différents: langue individuelle, macrolangue et groupe de langues. De plus, les
langues représentées peuvent être de divers types: langues vivantes, langues anciennes, langues construites
artificiellement, etc. L'exposé suivant fournit une explication plus détaillée de l'attribution des indicatifs pour les
différents domaines d'application ou pour les différents types de langues dans l'ISO 639.
4.2 Langues individuelles
Les indicatifs des Parties 1, 2 et 3 de l'ISO 639 sont censés indiquer des langues individuelles différentes, à
moins que le nom de la langue fasse explicitement référence à un groupe de langues.
Il n'existe pas de définition unique d'une «langue» qui soit acceptée par tous et qui convienne à tous les
besoins. Par conséquent, il peut y avoir désaccord, même entre locuteurs de la langue ou entre linguistes, sur
la question de savoir si deux variantes représentent des dialectes d'une même langue ou deux langues
distinctes. Dans le cadre de l'ISO 639, les jugements pour savoir si deux variantes sont considérées
représenter la même langue ou des langues différentes sont basés sur divers facteurs, notamment la
similarité linguistique, l'intelligibilité, une littérature commune, les points de vue des locuteurs sur la relation
entre langue et identité, pour n'en citer que quelques-uns. Les critères fondamentaux suivants s'appliquent.
⎯ Deux variantes liées sont normalement considérées comme étant des variantes de la même langue si les
personnes parlant chaque variante ont une compréhension fonctionnelle spontanée de l'autre variante
(c'est-à-dire qu'elles peuvent la comprendre en s'appuyant sur la connaissance de leur propre variante
sans devoir apprendre l'autre variante).
⎯ Lorsque l'intelligibilité orale entre variantes est marginale, l'existence d'une littérature commune ou d'une
identité ethnolinguistique commune avec une variante centrale comprise par ces deux variantes peut
fortement indiquer qu'il conviendrait néanmoins de les considérer comme des variantes de la même
langue.
⎯ Lorsqu'il existe entre les variantes une intelligibilité suffisante qui permette de communiquer, l'existence
d'identités ethnolinguistiques distinctes bien établies peut fortement indiquer qu'il conviendrait néanmoins
de les considérer comme des langues différentes.
Certaines des distinctions établies sur ces bases peuvent ne pas être considérées comme appropriées par
certains usagers ou pour certaines applications. Toutefois, ces critères fondamentaux sont considérés comme
étant ceux qui s'adaptent le mieux à la gamme visée d'applications.
4.3 Macrolangues
Les Parties 1 et 2 de l'ISO 639 comprennent des indicatifs qui correspondent, dans une relation «un à
plusieurs», à des indicatifs de langue individuelle de la Partie 3 de l'ISO 639. Par exemple, la Partie 3 de
l'ISO 639 contient plus de 30 indicatifs désignés comme identificateurs de langue individuelle pour différentes
variantes de l'arabe, alors que les Parties 1 et 2 contiennent chacune un seul indicatif pour l'arabe,
respectivement «ar» et «ara», qui est appelé indicatif de langue individuelle dans ces parties de l'ISO 639. Il
est supposé ici que les indicatifs uniques pour l'arabe dans les Parties 1 et 2 de l'ISO 639 correspondent aux
nombreux indicatifs collectivement désignés pour les variétés de l'arabe dans la Partie 3 de l'ISO 639.
6 © ISO 2010 – Tous droits réservés

Dans cet exemple, il peut sembler qu'il conviendrait d'appeler indicatifs de langue collectifs les indicatifs
uniques des Parties 1 et 2 de l'ISO 639. Ce n'est toutefois pas l'hypothèse admise ici. Dans diverses parties
du monde, il existe des groupes de variantes linguistiques intimement apparentées qui, sur la base des
critères exposés en 4.2, peuvent être considérés comme des langues individuelles, alors que dans certains
contextes d'utilisation, une seule identité de langue sera nécessaire pour l'ensemble de ces langues. Les
situations type où peut apparaître ce besoin sont les suivantes.
⎯ Il existe une variante plus développée qui tend à être utilisée pour une communication plus large par les
locuteurs de diverses langues étroitement apparentées; par conséquent, une identité linguistique
commune est perçue à travers ces langues. Par exemple, il existe plusieurs langues distinctes pour
l'arabe parlé mais l'arabe standard, généralement utilisé dans les affaires et dans les médias par toutes
ces communautés, représente également un aspect important de l'unité ethno-religieuse commune. Par
conséquent, il existe une identité linguistique commune perçue.
⎯ Il existe une forme écrite commune qui est utilisée pour plusieurs langues étroitement apparentées. Par
exemple, plusieurs langues chinoises partagent la même forme écrite.
⎯ Il existe une situation sociolinguistique transitoire dans laquelle des sous-communautés d'une même
communauté linguistique divergent, créant la nécessité, pour un certain nombre de besoins, de
reconnaître des langues distinctes alors que, pour d'autres besoins, une identité commune unique reste
valide. Par exemple, dans un certain nombre de contextes d'affaires, il est nécessaire de faire la
distinction entre les langues bosniaque, croate et serbe alors que dans d'autres contextes, ces
distinctions ne sont pas discernables en termes de ressources linguistiques utilisées.
Dans de telles situations, un indicatif pour l'unique identité linguistique commune est considéré comme un
indicatif de macrolangue.
Les macrolangues se distinguent des groupes de langues par le fait que les langues individuelles qui
correspondent à une macrolangue doivent être très étroitement apparentées et qu'il doit exister un domaine
où seule une identité linguistique unique est reconnue.
4.4 Norme linguistique
Certaines formes linguistiques sont «normalisées» ou «standardisées» par des organismes officiels ou privés
tels que des académies ou des comités linguistiques. Cette normalisation peut s'appliquer à divers éléments:
orthographe, morphologie, syntaxe, sémantique, phonétique, etc. Le degré de normalisation varie
considérablement d'une langue à l'autre.
Les langues ou leurs formes linguistiques peuvent être considérées comme ayant un certain statut officiel
dans certains pays ou régions. Le statut de la langue peut être établi par des actes parlementaires ou d'autres
procédures formelles pour lui donner le statut de «langue nationale», de «langue officielle», de «langue
régionale», etc.
4.5 Dialectes
Les variantes linguistiques désignées par chacun des indicatifs des Parties 1, 2 et 3 de l'ISO 639 sont
supposées être des langues distinctes et non des dialectes d'autres langues même si, pour un certain nombre
de besoins, certains usagers peuvent considérer une variante répertoriée dans la Partie 1 ou 2, ou en
particulier dans la Partie 3 de l'ISO 639, comme un «dialecte» plutôt que comme une «langue» (voir 4.2
et 4.3). Dans la présente partie de l'ISO 639, le terme dialecte est utilisé comme dans le champ de la
linguistique dans lequel il identifie n'importe quelle sous-variante linguistique qui pourrait être basée sur divers
critères tels que la région géographique, l'âge, le sexe, la classe sociale, l'époque, etc.
Les dialectes d'une langue sont compris dans la notation représentée par l'indicatif de cette langue. Ainsi,
chaque indicatif de langue représente la gamme complète de toutes les variantes parlées ou écrites de la
langue, y compris toute forme normalisée.
Pour les applications qui nécessitent d'identifier les dialectes, il est permis de développer une norme séparée
qui fournit des indicatifs de dialectes ou qui combine des indicatifs issus de l'ISO 639 avec d'autres
qualificatifs d'identification distinctifs.
4.6 Codets de langues collectifs et groupes de langues
La Partie 2 de l'ISO 639 comporte des indicatifs alpha-3 pour les groupes de langues; la Partie 5 est
particulièrement consacrée aux groupes et aux familles de langues. Les Parties 1 et 3 fournissent des
indicatifs uniquement pour les langues individuelles et les macrolangues.
Certains codets de la Partie 2 spécifient des groupes restreints. Ces codets comportent le mot «autres» dans
leurs noms français («other» dans leurs noms anglais). Les mêmes indicatifs alpha-3 figurent dans la Partie 5
de l'ISO 639 pour indiquer le groupe ou la famille de langues comme un ensemble. Pour les applications qui
utilisent uniquement la Partie 2, les indicateurs des groupes restreints doivent s'utiliser pour les langues qui
appartiennent au groupe ou à la famille de langues en question, mais qui ne comportent pas d'indicatif de
langue individuelle dans la Partie 2. Les applications qui utilisent les Parties 2 et 5 et celles qui utilisent les
Parties 2 et 3 et 5 doivent utiliser les codets de langue collectifs dans le sens spécifié dans la Partie 5, qui
permet de hiérarchiser les indicatifs de langues.
4.7 Langues mortes, anciennes et historiques
L'ISO 639 comporte des indicatifs qui désignent des langues mortes ainsi que des langues vivantes. Pour se
qualifier en vue d'une inclusion dans l'ISO 639, la langue doit avoir une littérature attestée ou être bien
documentée en tant que langue connue comme ayant été parlée par une communauté particulière à un
certain moment de l'histoire; il ne peut s'agir d'une langue reconstruite inférée à partir d'une analyse
comparative historique. Le code inclut également des indicatifs qui désignent des langues historiques qui sont
considérées distinctes de toute langue moderne qui a pu en descendre; par exemple, l'anglo-saxon anglais et
le moyen anglais. Ici, également, le critère est que la langue ait une littérature traitée distinctement par la
communauté des chercheurs.
4.8 Langues artificielles
L'ISO 639 comporte des indicatifs qui désignent des langues artificielles (ou construites) qui correspondent
aux critères suivants:
⎯ la langue possède une littérature; et
⎯ la langue est destinée à la communication humaine.
Les langues reconstituées, les langages informatiques de programmation et les langages balisés sont
spécifiquement exclus de l'ISO 639.
4.9 Systèmes d'écriture et écritures
Un seul indicatif de langue est fourni pour une langue, même si celle-ci peut s'écrire dans plusieurs systèmes
d'écriture. Il est possible de combiner les indicatifs de langues de l'ISO 639 avec des indicatifs de systèmes
d'écriture de l'ISO 15924 (voir 7.3).
5 Relations entre les parties de l'ISO 639
5.1 Parties de l'ISO 639
Les diverses parties de l'ISO 639 constituent un ensemble coordonné de normes de codage des langues.
⎯ La Partie 1 affecte des indicatifs alpha-2 à un nombre limité de langues (actuellement 186), pour des
langues particulières ayant de longue date une littérature scientifique, ainsi qu'une terminologie et une
lexicographie développées.
⎯ La Partie 2 affecte des indicatifs alpha-3 à un nombre de langues quelque peu supérieur (actuellement
474), en particulier pour des langues particulières ayant une littérature volumineuse dans les
bibliothèques centrales et dans les fonds documentaires.
8 © ISO 2010 – Tous droits réservés

⎯ La Partie 3 affecte des indicatifs alpha-3 à la plupart des langues individuelles dans le monde
(actuellement environ 7 000).
⎯ La Partie 5 affecte des indicatifs alpha-3 à des groupes et à des familles de langues.
⎯ La Partie 6 permet un codage des éléments plus détaillé qu'au niveau d'une «langue individuelle».
5.2 Norme ISO 639 comme espace de codage
Tous les indicatifs de langues spécifiés dans les Parties 2, 3 et 5 de l'ISO 639 partagent un même espace de
codage. Cela implique qu'un indicatif de langue indique toujours un élément spécifique, quelle que soit la
partie dans laquelle il figure.
De plus, tous les indicatifs de langue de la Partie 1 de l'ISO 639 désignent exactement les mêmes éléments
que les indicatifs de langue correspondants ayant le même nom de référence qui sont spécifiés dans les
Parties 2, 3 et 5.
5.3 Principes
Les principes suivants s'appliquent à chaque partie de l'ISO 639 et à leur interdépendance.
⎯ L'ensemble des langues figurant dans la Partie 1 est un sous-ensemble de celles figurant dans la Partie 2.
L'extension d'un élément de la Partie 1 est exactement identique à celle de l'élément correspondant dans
la Partie 2. Un indicatif alpha-3 dans la Partie 2 et l'indicatif alpha-2 correspondant dans la Partie 1
doivent être considérés comme des synonymes. Lorsque les indicatifs alpha-3 sont différents dans le
«Tableau B» et le «Tableau T» de la Partie 2, ceux-ci doivent être considérés comme des synonymes.
EXEMPLE 1 Les indicatifs de langue «en» et «eng» désignent exactement la même langue.
EXEMPLE 2 Les indicatifs de langue «fra» et «fre» (et «fr») désignent exactement la même langue. Dans la
mesure du possible, il convient que les implémentations permettent de choisir librement parmi de tels synonymes.
⎯ Certains éléments figurent dans la Partie 2 et dans la Partie 5 avec des désignations légèrement
différentes. Ainsi, «gem» désigne «Germaniques (autres)» dans la Partie 2 et «Langues germaniques»
dans la Partie 5. Dans le contexte de la Partie 2, il convient d'utiliser «gem» pour identifier l'ensemble des
langues qui appartiennent au groupe «Langues germaniques» et qui ne comporte pas d'indicatif de
langue individuelle dans la Partie 2. Dans d'autres contextes, «gem» peut s'utiliser pour identifier le
groupe de langues «Langues germaniques» en tant qu'entité linguistique.
⎯ Le code alpha-3 des Parties 2, 3 et 5 constitue un seul espace de codage. Aucun indicatif alpha-3 affecté
dans une de ces parties n'a été affecté ou ne sera affecté à un autre élément.
⎯ Les codets de la Partie 3 peuvent également figurer dans la Partie 2 en respectant les procédures du
Comité consultatif mixte (voir 6.2).
5.4 Mise à jour commune et base de données de codage des langues
Alors que les différentes parties de l'ISO 639 ont été développées et publiées comme des parties individuelles
et séparées de la Norme internationale, leur mise à jour est totalement coordonnée.
Il est prévu qu'une future révision de l'ISO 639 soit publiée sous forme de base de données intégrée utilisant
la métastructure spécifiée dans l'Article 8 de la présente partie de l'ISO 639.
6 Problèmes d'implémentation
6.1 Applications
L'ISO 639 et ses différentes parties peuvent être utilisées dans diverses applications. On peut s'attendre à ce
qu'un nombre restreint, ou qu'aucune, de ces applications utiliseront la totalité des codes de langues de
toutes les parties de l'ISO 639. Au cours de l'implémentation, il peut être nécessaire de spécifier l'utilisation en
rapport avec certains problèmes énumérés en 6.2 et 6.3.
Certains types d'applications figurent ci-dessous. Les numéros de cette liste sont repris en 6.2 et en 6.3 sous
la forme «6.1: a)», «6.1: b)», etc. Ces références sont fournies uniquement à titre indicatif.
Les indicatifs de langues des diverses parties de l'ISO 639 peuvent s'utiliser avec, par exemple:
a) des bases de données multilingues terminologiques ou lexicographiques pour identifier la langue d'une
information particulière (par exemple, mot, terme, contexte ou définition);
b) un document textuel ou un ensemble de documents textuels pour identifier la langue de l'ensemble du
texte ou de parties du texte (par exemple, citations);
c) des documents ou des bases de données bibliographiques (en général) pour identifier la(les) langue(s)
des entrées bibliographiques ou la(les) langue(s) des documents référencés;
d) des documents ou des bases de données linguistiques et bibliographiques ou des documents
lexicographiques pour identifier la(les) langue(s) faisant l'objet de la description dans les documents
(par exemple, «langue source», «langue de destination», «langue de description», «langue décrite»,
etc.);
e) des documents traduits pour identifier la langue source de la traduction;
f) des services de traduction et d'interprétation pour identifier les langues couvertes par le service;
g) des notes ou des procès verbaux de réunions pour identifier la(les) langue(s) utilisée(s) au cours de la
réunion;
h) des répertoires d'individus ou d'organisations pour identifier les connaissances ou les préférences d'une
langue;
i) des logiciels pour identifier les possibilités d'une langue (par exemple, gestion des jeux de caractères,
contrôle grammatical intégré et dictionnaires);
j) la localisation en général, y compris les divers types d'applications mentionnées ci-dessus, mais en soi
utilisateur essentiel de l'ISO 639; voir également l'Article 7.
Une implémentation bien définie et très utilisée des tableaux de codes de l'ISO 639 a été conçue par le
groupe d'étude «The Internet Engineering Task Force» (IETF, voir http://www.ietf.org/). Son répertoire
RFC 4646 (qui a remplacé les répertoires RFC 3066 et RFC 1766) définit l'utilisation des indicatifs de langues
ISO 639 alpha-2 et alpha-3 associés à d'autres éléments d'information pour identifier la langue des
documents et de parties textuelles.
6.2 Sous-ensembles du tableau de codes
La spécification d'une implémentation de l'ISO 639 doit comprendre les informations sur le sous-ensemble
particulier qui est utilisé parmi la totalité des tableaux de codes de l'ISO 639. Certaines des options
recommandées sont les suivantes:
⎯ Partie 1 uniquement [6.1: a) à i), si toutes les langues en question figurent dans la Partie 1];
⎯ Partie 1 et Partie 2, utilisant la Partie 2 uniquement pour les éléments qui ne figurent pas dans la Partie 1
(ou un sous-ensemble personnalisé de la Partie 1);
10 © ISO 2010 – Tous droits réservés

⎯ Partie 2 uniquement [6.1: c)];
⎯ Partie 2 et Partie 3;
⎯ Partie 2 et Partie 5, utilisant des éléments figurant dans les deux parties dans le sens spécifié dans la
Partie 5 (voir également 6.3) [6.1: d)];
⎯ Partie 1, Partie 2 et Partie 5, utilisant des éléments figurant dans les Parties 2 et 5 dans le sens spécifié
dans la Partie 5 (voir également 6.3) [6.1: d)];
⎯ Partie 2, Partie 3 et Partie 5, utilisant des éléments figurant dans les Parties 2 et 5 dans le sens spécifié
dans la Partie 5 (voir également 6.3); et
⎯ un sous-ensemble personnalisé de n'importe quelle partie, ou toute combinaison des diverses parties.
L'utilisation de la Partie 5 est prévue uniquement avec d'autres parties de l'ISO 639.
Il est prévu qu'un mécanisme de désignation et d'enregistrement de sous-ensembles définis de la totalité du
codage de langues de l'ISO 639 soit développé ultérieurement.
6.3 Groupes de langues
Comme cela est indiqué au deuxième point en 5.3, l'application simultanée des Parties 2 et 5 de l'ISO 639
exigera une spécification du niveau d'implémentation.
Il existe actuellement 64 éléments qui figurent à la fois dans les Parties 2 et 5 (répertoriés dans l'Annexe A de
la Partie 5). Parmi ces éléments, 29 sont identiques dans les deux parties (par exemple, «alg – langues
algonquines»). Les 35 éléments restants sont destinés à traiter des groupes restreints de la Partie 2 et la
totalité des groupes de langues de la Partie 5 [par exemple, «afa – langues afro-asiatiques (autres)» dans la
Partie 2 et «afa – langues afro-asiatiques» dans la Partie 5].
D'après les principes de la Partie 2, l'indicatif «afa» sera affecté uniquement à un document ou à une
information dans (ou à propos de) une langue afro-asiatique n'ayant pas d'indicatif de langue individuelle dans
la Partie 2 et n'appartenant pas aux groupes restreints «ber – berbère (autre)», «cus – couchitique (autres)»,
ou «sem – sémitique (autres)», qui tous sont des groupes de langues afro-asiatiques.
D'après les principes de la Partie 5, l'indicatif «afa» peut être affecté à un document ou à une information
dans (ou à propos de) une langue afro-asiatique. L'utilisation de «afa», «sem» ou «ara» dans un cas concret
se rapportant à l'arabe, dépend de l'objectif du codage tel qu'il est précisé dans l'implémentation.
L'utilisation des indicatifs de la Partie 5 dépendra de l'objectif de l'application. Il est prévu que les sous-
ensembles d'éléments personnalisés de la Partie 5 soient fréquemment utilisés en combinaison avec, par
exemple, la totalité ou des sous-ensembles définis des Parties 2 ou 3.
7 Combinaison des indicatifs de langue avec d'autres normes ou d'autres codes
7.1 Combinaison de l'ISO 639 avec l'ISO 3166
Il est possible de combiner les indicatifs de langues de l'ISO 639 avec des indicatifs de pays ou de
subdivisions de pays de l'ISO 3166 (toutes les parties) pour indiquer la région où un mot, un terme, une
phrase ou une variante linguistique est utilisé.
NOTE 1 Dans l'ISO 3166, le terme «codet» est utilisé pour faire référence au concept «indicatif» selon la terminologie
de l'ISO 639.
NOTE 2 Il se peut que certaines applications ne permettent pas l'utilisation des codes de subdivision des pays de
l'ISO 3166-2,
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.

Loading comments...