ISO 5964:1985
(Main)Documentation — Guidelines for the establishment and development of multilingual thesauri
Documentation — Guidelines for the establishment and development of multilingual thesauri
Should be used in conjunction with ISO 2788, and regarded as an extension of the scope of the monolingual guidelines. The majority of procedures and recommendations contained in ISO 2788 are equally valid for a multilingual thesaurus. This applies particularly to general procedures, for example, the forms of terms, the basic thesaural relationships, and management operations such a evaluation and maintenance. Distinction is made between preferred terms and non-preferred terms.
Documentation — Principes directeurs pour l'établissement et le développement de thesaurus multilingues
Dokumentacija - Smernice za zasnovo in razvoj večjezičnih tezavrov
General Information
Relations
Buy Standard
Standards Content (Sample)
International Standard
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION.ME~YHAPO~HAR OPI-AHM3A~Mfl I-IO CTAHAAPTM3A~MM.ORGANISATION INTERNATIONALE DE NORMALISATION
Documentation - Guidelines for the establishment and
development of multilingual thesauri
- Principes directeurs pour l% tablissemen t et Ie developpemen t de thesaurus multilingues
Documentation
First edition - 1985-02-15
UDC 025.48 Ref. No. ISO 59644985 (E)
Descriptors : documentation, subject indexing, information retrieval, thesauri, multilingual thesauri, preparation, rules (instructions).
Price based on 61 pages
---------------------- Page: 1 ----------------------
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of
national Standards bodies (ISO member bedies). The work of preparing International
Standards is normally carried out through ISO technical committees. Esch member
body interested in a subject for which a technical committee has been established has
the right to be represented on that committee. International organizations, govern-
mental and non-governmental, in liaison with ISO, also take part in the work.
Draft International Standards adopted by the technical committees are circulated to
the member bodies for approval before their acceptance as International Standards by
the ISO Council. They are approved in accordance with ISO procedures requiring at
least 75 % approval by the member bodies voting.
International Standard ISO 5964 was prepared by Technical Committee ISO/TC 46,
Documen ta tion.
0 International Organkation for Standardkation, 1985
Printed in Switzerland
ii
---------------------- Page: 2 ----------------------
Contents
Page
0 Introduction
........................................................ 1
1 Scope and field of application
......................................... 1
2 References .
2
Definitions .
3 2
4 General . 3
5 Abbreviations and Symbols 4
...........................................
6 Vocabulary control
.................................................. 5
7 The establishment of a multilingual thesaurus: general Problems
........... 5
8 The establishment of a multilingual thesaurus: management decisions . 6
9 The establishment of a multilingual thesaurus: language Problems. . 7
10 Establishing equivalent terms in different languages 11
......................
11 Other language Problems. 20
............................................
12 Relationships between terms in a multilingual thesaurus.
.................. 25
Display of terms and relationships
13 . 27
14 Form and contents of a multilingual thesaurus . 31
15 Organization of work 32
................................................
Annexes
A Symbolization of thesaural relationships 35
................................
B Examplesofdisplays. . 36
. . .
Ill
---------------------- Page: 3 ----------------------
This page intentionally left blank
---------------------- Page: 4 ----------------------
INTERNATIONAL STANDARD
ISO 5964-1985 (E)
Documentation - Guidelines for the establishment and
development of multilingual thesauri
0 Introduction
A trend towards the international exchange of information,
fully supported by the UNISIST* Programme of UNESCO, and
exemplified by Systems like the International information System for the agricultural sciences and technology (AGRIS) and the Inter-
national Nuclear Information System (INIS), clearly calls for a higher commitment to multilingual cooperation. Information Systems
are expanding across language boundaries, leading to a notable increase in the Provision sf indexing and retrieval tools which are
either language-independent (the Broad System of Ordering), or multilingual. Aids of this kind are essential if retrieval of documents
indexed in more than one language is not to depend on the acquisition and use of a Single, dominant language. Indexers or searchers
should, where possible, be able to work in their mother tongues, or at least in a language with which they are already familiar. Within
this context it is considered that multilingual thesauri have a significant part to play in improving the bibliographic control 0% literature
on a global scale.
The standardization of procedures for the construction of a multilingual thesaurus is seen as a primary step in achieving compatibility
between thesauri produced by indexing agencies using terms selected from different natura1 languages. The recording of these pro-
cedures will also enable indexers engaged in this task to benefit from the experience sf others, and to work in a logical and consistent
fashion, using recommended practices which have been established in the course of discussions at an international level.
1 Scope and field of application
1 .l The guidelines given in this International Standard should be used in conjunction with ISO 2788, and regarded as an extension
of the scope of the monolingual guidelines. lt is considered that the majority of procedures and recommendations contained in
ISO 2788 are equally valid for a multilingual thesaurus. This applies particularly to general procedures concerning, for example, the
forms of terms, the basic thesaural relationships, and management operations such as evaluation and maintenance. Except when it
appears to be necessary, the procedures described in ISO 2788 are not repeated here, and it is therefore essential to refer to both of
these International Standards when constructing a multilingual thesaurus.
1.2 These guidelines are restricted in scope to the Problems of multilingualism which tan arise during the construction of a “con-
ventional” thesaurus, i.e. a thesaurus displaying terms selected from more than one natura1 language, these terms then constituting
the vocabulary of a controlled indexing language. Throughout this International Standard, a distinction is made between preferred
terms and non-preferred terms (sec definitions in clause 3). These guidelines are not applicable to indexing languages in which con-
cepts are expressed entirely as Symbols (for example mathematical equations or Chemical formulae), nor to Systems which are based
on the automatic analysis and searching of free text. lt is considered, however, that a weil-constructed multilingual thesaurus tan play
a significant part in improving retrieval from a free-text System which covers documents in more than one language.
in the field of documentation, and it is inevitable, therefore, that the
1.3 M ultilingual thesauri are relatively recent devel opments
present guidelines should display certain limitations.
a) The examples used to illustrate Problems encountered in the establishment of term equivalences have been drawn largely from
the fields of science (including the social sciences) and technology. As far as possible, however, examples were Chosen which
illustrate general Problems and procedures, i.e. those which should apply in any field of knowledge.
b) lt is realized that the procedures described in these guidelines may not be entirely appropriate for all languages. The examples
have been selected, for entirely pragmatic reasons, from three of the major languages, i.e. English, French and German, but this
does not imply that these languages are regarded as dominant in the field of documentation. As far as possible the procedures
considered here, together with their accompanying examples, relate to Problems which may be encountered in any language.
*
Intergovernmental Programme for Co-Operation in the field of scientific and technological information.
---------------------- Page: 5 ----------------------
ISO 5964-1985 (E)
2 References
ISO/R 639, Symbols for languages, countrles and authorities.
ISO 1086, Documentation - Title-leaves of a book.
ISO 2788, Documentation - Guidelines for the establishmen t and developmen t of monolingual thesauri
3 Definitions
For the purposes of this International Standard, the following definitions apply:
3.1 coined term: A neologism especially created in a target language to express a concept which is denoted by an existing and
recognized term in a Source language, but which has no t previously been expressed n the target language.
compound term : An indexing term (sec 3.8) which tan be factored morphologicall y into separa te componen ts, each sf which
32
could be expressed, or re-expressed, as a noun that is capabl e of serving independently as an indexi ng term.
NOTE -- The Parts of the great majority of compound terms tan be distinguished as follows:
the focus or head, i.e. the noun component which identifies the general class of concepts to which the term as a whole refers;
b) the diffe rence or modifier, i.e. one or more further components which serve to narrow the extension of the focus by specifying one of its
su bclasses.
ly consist of separate words, whereas the same concept would frequently be
In French, English and simila r languages, compound terms usual
expressed by a Single word in German and some other languages.
Examples:
English German
a)
=
SYSTElVlS ANALYSIS ’ SYSTEMANALYSE
Frenc h German
=
PONT EN BETON BETONBR ÜCKE
In example (a) the English word “analysis” and the German component “analyse” both represent foci, and the modifying differentes are represented
by “Systems” (English) and “System” (German). Despite these surface structural differentes, however, the terms “Systems analysis” and
“Systemanalyse” are both regarded as compound terms for the purposes of this International Standard.
3.3 dominant language: An exchange language (sec 3.5) which is also used for indexing and retrieval in Systems which, for policy
reasons, do not give equal Status to all the languages in the System. Every concept recognized in the System must necessarily be
represented by a preferred term in the dominant language. In some cases, however, an equivalent expression may be lacking in one
more sf the other languages. These other languages are then known as secondary languages.
34 equal Status: Languages in a multilingual thesaurus have equal Status when every preferred term in one language is matched
in
by an equivalent preferred term all other lang uages.
3.5 exchange language: The language used as a medium for data exchange in those multilingual Systems which, as a matter of
policy, decide to use terms selected from only one language for this purpose. The exchange language may also be used for indexing
and/or retrieval, and the multilingual thesaurus then functions principally as a means Bor translating the local languages sf indexers
and enquirers into, or out sf, the exchange language. The different languages in such a System would still be recognized as having
equal Status (sec 3.4) if equivalents are established reciprocally between the preferred terms in the exchange language and the pre-
ferred terms in all other languages.
feedback: The act sf changing the form or stru cture sf a term in a Source ianguage in Order to achieve an easier or a more
36
useful solution to a Problem encountered in a target Ia nguage.
Example: Let us assume that a German thesaurus is used as a Source language and contains the term “Lehrerbildungsgesetz”. Direct
“Law of education sf teachers”, or “‘Loi sur Ia
translation of this term into English or French would call for a complicated Paraphrase,
formation des enseignants”. Neither sf these phrases would be regarded as a satisfactory indexing term. A shorter expression, which
is closer to the German construction, tan be achieved in English, i.e. “Teacher education law”, but this cannot be done in French.
2
---------------------- Page: 6 ----------------------
ISO 5964-1985 (E)
Feedback would operate if, in response to these Problems, the original German compound term is factored into its separate com-
ponents, each expressed as a noun, i.e. “Bildung”,
“Gesetz” and “Lehrer”, and if these are henceforth accepted as indexing terms in
German and assigned to documents dealing with this subject. Translation into English and French could then be carried out on this
new and simpler basis, i.e.
= =
Gesetz Law Loi
= =
Lehrer Teachers Enseignant
= =
Bildung Education Formation
The German compound term “Lehrerbildungsgesertz” may still be retained in the German thesaurus if it is likely to be sought by
users, but its Status would be changed to that of a non-preferred term, and the user would be redirected to the combination of
separate nouns which represents this complex concept, for example:
Lehrerbildungsgesetz BS LEHRER + BILDUNG + GESETZ
37 . indexing languag e: A controlled set of terms selected from natura1 language to represent, in summary form, the.
subjects of documents.
NOTE - In a post-coordinate System these terms are used as “keywords” for retrieval purposes, usually without attempting to indicate their syntac-
tical relationships. Syntactical relationships tan be indicated in various ways in a pre-coordinated index, for example by printing terms in entries in an
Order which suggests their relative roles, and so allows the user to perceive the subject as a whole. Despite these differentes, however, both kinds of
System tan be based on controlled vocabularies of terms displayed and organized in a thesaurus.
3.8 indexing term: The representation of a concept, preferabiy in the form of a noun or noun Phrase.
than one word, and is then kn lown as a compound term (sec 3.2). In a controlled indexing vocabulary,
NOTE - An indexing term tan consist of more
a term is designated either as a preferred term or as a non-preferred term.
39 . preferred term: A term used consistently when indexing to represent a given concept; sometimes known as “descriptor”.
3.10 non-preferred term: The synonym or quasi-synonym of a preferred term. A non-preferred term is not assigned to docu-
ments, but is provided as an entry Point in a thesaurus or alphabetical index, the user being directed by an instruction (for example
USE or SEE) to the appropriate preferred term; sometimes known as “non-descriptor”.
term: A term in one language (the Source language) which has been adopted without Change in a second br target)
3.11 loan
language.
Example:
English (target language)
German (Source language)
=
KINDERGARTEN KINDERGARTENS
3.12 multilingual thesaurus: A thesaurus (see 3.16) containing terms selected from more than one natura1 language. lt displays
not only the interrelationships between terms, but also equivalent terms in each of the languages covered.
3.13 secondary language: See definition of dominant language (3.3).
Point preferred term is translated into its nearest
3.14 Source language (SL): That language which serves as a starting when a
equivalent term or terms in a second (or target) language.
3.15 target language (TL) : The language into which a term first encountered in another language (the Source language, see 3.14)
is translated.
3.16 thesaurus: The vocabulary of a controlled indexing language (see 3.7), formally organized so that the a prhMationships
and “narrower”) are made explicit.
between concepts (for example as “broader”
4 General
No significance should be attached to the Order in which terms in the various languages are set down in the examples, nor does the
use of terms such as Source language and target language imply that one or the other of these languages is dominant. The Order of
“Source” and another as “target”, varies from example to
languages used in the examples, and the designation of one language as
example, and depends upon the Problem being illustrated. Where an appropriate Order is not determined on technical grounds,
alphabetical Order (English, French, German) has been used. See definitions of Source and target languages in 3.14 and 3.15.
3
---------------------- Page: 7 ----------------------
ISO 5964-1985 (E)
5 Abbreviations and symbols
5.1 The abbreviations in table 3 have been used in later clauses to indicate relationships between terms.
Table ‘l - Abbrewiatisns
Terme g&Grique
Narrower term Terme specifique
Related term Verwandter Begriff
Benutzt für
Similar abbreviations either exist already, or tan be dlevised, in other languages, CU a multilingual thesaurus tan employ the neutral or
language-independent System of symbols developed by &SO Isee annex AI.
.iB The follovving symbols and conventions are also used throughout the following clauses of this International Standard:
preferred terms are printed in upper case throughout:
a)
Examplel ‘:
English Frenc German
--
- ZITZ
DOGS
CHIEN HUND
63) non-preferred terms are printed in lobver- case, with an upper case initial, except when the non-preferred terrn is an abbrevi-
ation or acronym which should be printed throughout in upper case:
English
ANllVlALS
CliF Fauna
Fauna
USE ANIMALS
French
R&ONANCE MAGNiTlQUE NUCLEA2RE
EP RlViN
RMN
EM RESONANCE lVlAGNET!QUE NUCLEAIRE
c) = indicates an equivalence between terms in two ianguages:
Exampie d
Engllish German
= =
POLITIQUE POLlTiK
POLITIGS
7 indicates that an equivalent does not exist in the language under which the question mark is printed:
d) .
English French
ZZ
?
LATCHKEY’ CHILDREN
1) See 11.1.3 for an explanation of the use of the plural form in English, and ahe singdar forms in French and German, in lhis and Iater examples.
4
---------------------- Page: 8 ----------------------
ISO 59644985 (E)
6 Vocabulary control
. Two principal means for achieving vocabulary control are employed in thesauri:
61
a) terms are deliberately restricted in scope to selected meanings. Unlike the terms in a dictionary, which may be accompanied by
a number of different definitions reflecting common usage, each term in a thesaurus is generally restricted to whichever Single
meaning best serves the needs of an indexing System. The structure of a thesaurus, notably its display of hierarchical relationships,
frequently indicates the intended meaning of a term. If this technique is not sufficiently explicit, a definition or scope note should
be appended to the term. This should state the Chosen meaning, and may also indicate other meanings which are recognized in
natura1 language but which have been deliberately excluded for indexing purposes;
b) when the same concept tan be expressed by two or more Synonyms, one of these terms is usually selected as the preferred
term (see 3.9) which is then used consistently in indexing. Reference to the preferred term should be made from any synonym
which might also function as a user’s access Point. To assist the user of a printed thesaurus, it is recommended that preferred
terms should be distinguished typographically from non-preferred terms.
6.2 Vocabulary control is also achieved through the application of rules or policies which determine, for example, the form of a
term, for example its expression as a Singular or Plural, or the extent to which a compound term (see 3.2) should be either retained in
its present form or factored into separate components, each sf which is then expressed as a noun and used independently as an in-
dexing term. These and other aspects of vocabulary control apply to all kinds of thesauri, whether monolingual or multilingual, and
they are considered in greater detail in ISO 2788.
7 The establishment of a multilingua I thesaurus: general Problems
7.1 T,he establishment of any thesaurus, whether nonolingual or multilingual, involves two different classes of Problem which call
for decisions :
a) management Problems concerning, for example, the establishment of an updating policy, or the choice between alternative
forms of display, etc.;
b) language Problems which call for decisions on matters such as the forms of indexing terms (for example representation
llurals or Singulars), or the Status of terms (i.e. preferred or non-preferred).
as P
Problems tan usu ally be resolved by studying and choosing between the different recommended procedures described
These general
in a set of sta ndard guidelines. Since these matters are covered already in ISO 2788, they will not be reconsidered here i n detail.
7.2 The makers of a multilingual thesaurus face two additional kinds of Problem which do not occur in monolingual work:
a) management Problems, which call for decisions on, for example, the relative Status of languages (i.e. the designation of a
given language as the exchange language, the dominant language, or a secondary language), or the choice of a starting Point for
the work (for example translation of an existing thesaurus as opposed to ab initio construction);
b) language Problems which call for the choice of an appropriate procedure when a term in one language expresses a concept
term in one or more of the other lang uages.
which cannot be represented by an exactly equivalent
7.3 These special Problems associated with multilingual thesauri tan be seen as extensions of the general Problems considered
in 7.1. The matter of Status, for example, arises first as a general Problem (i.e. the Status of a term as “preferred” or “non-preferred”),
and then re-occurs as a multilingual Problem (i.e. the relative Status of each language). The establishment of a multilingual thesaurus
is, however, more complicated than this simple division of Problems into two classes appears to indicate, due to the fact that some
management decisions will directly affect the choice of procedures available to the indexer who is concerned with language Problems.
The possible extent of this interaction between two different classes of Problem tan be demonstrated by assuming, for example, that
the editors of a new multilingual thesaurus have decided, as a matter of policy, to impose the following conditions:
a) the new multilingual thesaurus should be a translated Version of an existing monolingual thesaurus;
b) the language of this Source thesaurus should have the Status of the exchange language;
feedback to this Source thesaurus (see 3.6) is not allowed : that is to say, none of its or I structure tan be modif ied
Cl
in the other languages.
in response to linguistic or conceptual Problems encountered
5
---------------------- Page: 9 ----------------------
ISO 5964-1985 (E)
Faced by this range of management decisions, t h e task of the specialists responsible for adding the second or subsequent Ia
nguages
will certainly become very difficult,
and in some cases it may be impossible to achieve satisfactory solutions.
7.4 lt could be argued that Standard guidelines should, for the sake of completeness, take account sf all these factors. That is to
say, if a term in one language cannot be matched by an exactly equivalent term in another language, an “ideal” Standard should
review the various ways in which this Problem could be approached, it should set these down in an Order of preference with adequate
explanations and examples, and it should then go on to consider how each of these alternative approaches might be affected by the
presence of certain management decisions (for example “feedback” versus “no feedback”). This approach was, in fact, considered
during the early stages in the drafting of this International Standard, and the interaction between management decisions and
language Problems was represented in various ways, for example in the form of decision-making tables. lt was decided, however, that
the resulting International Standard would be too complicated for practical use. lt was further realized that if certain combinations of
circumstances were described as permitted options in the International Standard, their adoption would lead, in some circumstances,
to a thesaurus which is over-biassed towards a Single dominant language, without taking sufficient account of the special needs of
other language users. Such a thesaurus would fail to satisfy the general criteria considered in clause 0, where it is stated that l’. in-
dexers or searchers should, where possible, be able to work in their mother tongues, or at least in a language with which they are
already familiar”. Consequently, certain decisions, mostiy related to management Problems, arc indicated as “not recommended”
in the following clauses.
8 The establishment of a multilingual thesaurus: management decisions
8.1 Status of languages
8.1 .I The Status of each of the languages in a multilingual thesaurus should be decided before any attempt is made to deal with the
language problems considered in the following @lause. Terms such as “‘dominant language”, ‘“equal Status”, etc. were defined above
Isee clause 3).
8.W lt is sometimes necessary, on practical grourrds, to designate one of the languages as the exchange language, i.e. the
language which is used as a medium for exchanging indexing data Ifor example in a multilingual network). Even in these cases,
however, it should be possible for indexers and users to use their local languages for indexing and retrieval. All the languages should
be regarded as having equal Status from the viewpoint sf thesaurus construction. The imposition of a dominant language upon other
language users is NOT RECOMMENDED.
8.2 Sources od a multilingual tkesaurus
8.23 Three main approaches to the construction of a multilingual tkesaurus tan be postulated. These arc considered below in order
of preference :
a) ab initio construction, i.e. establishment of a new thesaurus without direct reference to the terms or structure of any existing
thesaurus. This method needs to be adopted when a new multilingual information System is being established and an existing
thesaurus (whether monolingual or multilingual) does not already ex&. Ab iraitio construction is also recommended in some other
circumstances considered below;
b) translation sf an existing thesaurus, for example a monolingual thesaur us covering the subject field of the proposed multi-
Two situations tan be distinguish ed:
ling ual thesaurus, and serving as the Source language.
‘l B feedback to the Source language is permitted, i.e. the terms and structure sf the original thesaurus may be modified to take
account of Problems encountered in any of the target languages;
2) feedback is not permitted, i.e. changes cannot be made to the terms or structure 0% the Source language thesaurus. This
procedure is not recommended. lf the only thesaurus available for translation is one which does not allow feedback, the
ab initio construction should be preferred, the existing thesaurus being regarded only as a possible Source sf terms andior
relationships;
c) reconciliation and merging 0% existing thesauri in two or more sf the working languages. This situation may occur if a
new international System is being formed on the basis sf two or more pre-existing national or monolingual Systems. In practice, it
is unlikely that two or more thesauri already established in different languages will correspond exactly in terms of either their logical
structures or their subject coverage. This procedure should therefore be adopted only if feedback between all the pre-established
thesauri is allowed, i*e. the structure and/or contents of any of the existing thesauri tan be modified to take account of Problems
encountered during the merging process. If feedback is not permitted, the ab hitio method should be preferred. The existing
thesauri tan then be regarded primarily as sources sf terms and/or relationships.
---------------------- Page: 10 ----------------------
ISO 59644985 (E)
9 The establishment sf a multilingual thesaurus: language Problems
9.1 Introduction
9.1.1 The following assumptions are made in this and other clauses:
thesaurus have equal (sec 3.41, whether or not one of these languages also functions as
a) all languages in a multilingual
an exchange langua
ge;
b) either the ab initio method is adopted, or feedback is allowed if the work involves the translation and/or merging of one or
more existing thesauri.
9.1.2 When languages have equal Status, every preferred term in one of the languages should be matched by an equivalent preferred
term in each of the other languages. lt is not necessary to establish one-to-one equivalences between non-preferred terms, nor is this
usually possible, since languages vary in the number of Synonyms which express a given concept.
Examples:
English
al German French
= ZE
TELEFON TELEPHONE TELEPHONES
BF Fernsprecher
Fernsprecher
BS TELEFON
English
b) German French
= =
FAHRSTUHL ASCENSEUR LIFTS
IJ F Elevators
BF Aufzug
Aufzug Elevators
BS FAHRSTUHL USE LIFTS
In case nd in English is matched by two terms in German, i. e. a preferred term and a non-preferred term. In
(a) a Single term in French a
case (b ) a Single term in French is matched by two terms in German and two terms in English.
9.1.3 In the following clauses, the Problems associated with the establishment of term equivalences are demonstrated, for the sake
of simpler explanations, in only two languages. These examples have been Chosen, however, to illustrate general procedures and
practices which tan be extended, by analogy, to situations involving more than two languages.
9.1.4 In the following examples the language possessing the term which gives rise to a particular translation Problem is designated
the Source language (see 3.14). These Problems usually occur when a term in a Source language expresses a concept which has not
been recognized by the users of the target language, so that the target language needs to be modified or extended to accommodate
this “new” concept. The existent
...
SLOVENSKI STANDARD
SIST ISO 5964:1996
01-april-1996
'RNXPHQWDFLMD6PHUQLFH]D]DVQRYRLQUD]YRMYHþMH]LþQLKWH]DYURY
Documentation -- Guidelines for the establishment and development of multilingual
thesauri
Documentation -- Principes directeurs pour l'établissement et le développement de
thesaurus multilingues
Ta slovenski standard je istoveten z: ISO 5964:1985
ICS:
01.140.20 Informacijske vede Information sciences
SIST ISO 5964:1996 en
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.
---------------------- Page: 1 ----------------------
SIST ISO 5964:1996
---------------------- Page: 2 ----------------------
SIST ISO 5964:1996
International Standard
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION.ME~YHAPO~HAR OPI-AHM3A~Mfl I-IO CTAHAAPTM3A~MM.ORGANISATION INTERNATIONALE DE NORMALISATION
Documentation - Guidelines for the establishment and
development of multilingual thesauri
- Principes directeurs pour l% tablissemen t et Ie developpemen t de thesaurus multilingues
Documentation
First edition - 1985-02-15
UDC 025.48 Ref. No. ISO 59644985 (E)
Descriptors : documentation, subject indexing, information retrieval, thesauri, multilingual thesauri, preparation, rules (instructions).
Price based on 61 pages
---------------------- Page: 3 ----------------------
SIST ISO 5964:1996
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of
national Standards bodies (ISO member bedies). The work of preparing International
Standards is normally carried out through ISO technical committees. Esch member
body interested in a subject for which a technical committee has been established has
the right to be represented on that committee. International organizations, govern-
mental and non-governmental, in liaison with ISO, also take part in the work.
Draft International Standards adopted by the technical committees are circulated to
the member bodies for approval before their acceptance as International Standards by
the ISO Council. They are approved in accordance with ISO procedures requiring at
least 75 % approval by the member bodies voting.
International Standard ISO 5964 was prepared by Technical Committee ISO/TC 46,
Documen ta tion.
0 International Organkation for Standardkation, 1985
Printed in Switzerland
ii
---------------------- Page: 4 ----------------------
SIST ISO 5964:1996
Contents
Page
0 Introduction
........................................................ 1
1 Scope and field of application
......................................... 1
2 References .
2
Definitions .
3 2
4 General . 3
5 Abbreviations and Symbols 4
...........................................
6 Vocabulary control
.................................................. 5
7 The establishment of a multilingual thesaurus: general Problems
........... 5
8 The establishment of a multilingual thesaurus: management decisions . 6
9 The establishment of a multilingual thesaurus: language Problems. . 7
10 Establishing equivalent terms in different languages 11
......................
11 Other language Problems. 20
............................................
12 Relationships between terms in a multilingual thesaurus.
.................. 25
Display of terms and relationships
13 . 27
14 Form and contents of a multilingual thesaurus . 31
15 Organization of work 32
................................................
Annexes
A Symbolization of thesaural relationships 35
................................
B Examplesofdisplays. . 36
. . .
Ill
---------------------- Page: 5 ----------------------
SIST ISO 5964:1996
This page intentionally left blank
---------------------- Page: 6 ----------------------
SIST ISO 5964:1996
INTERNATIONAL STANDARD
ISO 5964-1985 (E)
Documentation - Guidelines for the establishment and
development of multilingual thesauri
0 Introduction
A trend towards the international exchange of information,
fully supported by the UNISIST* Programme of UNESCO, and
exemplified by Systems like the International information System for the agricultural sciences and technology (AGRIS) and the Inter-
national Nuclear Information System (INIS), clearly calls for a higher commitment to multilingual cooperation. Information Systems
are expanding across language boundaries, leading to a notable increase in the Provision sf indexing and retrieval tools which are
either language-independent (the Broad System of Ordering), or multilingual. Aids of this kind are essential if retrieval of documents
indexed in more than one language is not to depend on the acquisition and use of a Single, dominant language. Indexers or searchers
should, where possible, be able to work in their mother tongues, or at least in a language with which they are already familiar. Within
this context it is considered that multilingual thesauri have a significant part to play in improving the bibliographic control 0% literature
on a global scale.
The standardization of procedures for the construction of a multilingual thesaurus is seen as a primary step in achieving compatibility
between thesauri produced by indexing agencies using terms selected from different natura1 languages. The recording of these pro-
cedures will also enable indexers engaged in this task to benefit from the experience sf others, and to work in a logical and consistent
fashion, using recommended practices which have been established in the course of discussions at an international level.
1 Scope and field of application
1 .l The guidelines given in this International Standard should be used in conjunction with ISO 2788, and regarded as an extension
of the scope of the monolingual guidelines. lt is considered that the majority of procedures and recommendations contained in
ISO 2788 are equally valid for a multilingual thesaurus. This applies particularly to general procedures concerning, for example, the
forms of terms, the basic thesaural relationships, and management operations such as evaluation and maintenance. Except when it
appears to be necessary, the procedures described in ISO 2788 are not repeated here, and it is therefore essential to refer to both of
these International Standards when constructing a multilingual thesaurus.
1.2 These guidelines are restricted in scope to the Problems of multilingualism which tan arise during the construction of a “con-
ventional” thesaurus, i.e. a thesaurus displaying terms selected from more than one natura1 language, these terms then constituting
the vocabulary of a controlled indexing language. Throughout this International Standard, a distinction is made between preferred
terms and non-preferred terms (sec definitions in clause 3). These guidelines are not applicable to indexing languages in which con-
cepts are expressed entirely as Symbols (for example mathematical equations or Chemical formulae), nor to Systems which are based
on the automatic analysis and searching of free text. lt is considered, however, that a weil-constructed multilingual thesaurus tan play
a significant part in improving retrieval from a free-text System which covers documents in more than one language.
in the field of documentation, and it is inevitable, therefore, that the
1.3 M ultilingual thesauri are relatively recent devel opments
present guidelines should display certain limitations.
a) The examples used to illustrate Problems encountered in the establishment of term equivalences have been drawn largely from
the fields of science (including the social sciences) and technology. As far as possible, however, examples were Chosen which
illustrate general Problems and procedures, i.e. those which should apply in any field of knowledge.
b) lt is realized that the procedures described in these guidelines may not be entirely appropriate for all languages. The examples
have been selected, for entirely pragmatic reasons, from three of the major languages, i.e. English, French and German, but this
does not imply that these languages are regarded as dominant in the field of documentation. As far as possible the procedures
considered here, together with their accompanying examples, relate to Problems which may be encountered in any language.
*
Intergovernmental Programme for Co-Operation in the field of scientific and technological information.
---------------------- Page: 7 ----------------------
SIST ISO 5964:1996
ISO 5964-1985 (E)
2 References
ISO/R 639, Symbols for languages, countrles and authorities.
ISO 1086, Documentation - Title-leaves of a book.
ISO 2788, Documentation - Guidelines for the establishmen t and developmen t of monolingual thesauri
3 Definitions
For the purposes of this International Standard, the following definitions apply:
3.1 coined term: A neologism especially created in a target language to express a concept which is denoted by an existing and
recognized term in a Source language, but which has no t previously been expressed n the target language.
compound term : An indexing term (sec 3.8) which tan be factored morphologicall y into separa te componen ts, each sf which
32
could be expressed, or re-expressed, as a noun that is capabl e of serving independently as an indexi ng term.
NOTE -- The Parts of the great majority of compound terms tan be distinguished as follows:
the focus or head, i.e. the noun component which identifies the general class of concepts to which the term as a whole refers;
b) the diffe rence or modifier, i.e. one or more further components which serve to narrow the extension of the focus by specifying one of its
su bclasses.
ly consist of separate words, whereas the same concept would frequently be
In French, English and simila r languages, compound terms usual
expressed by a Single word in German and some other languages.
Examples:
English German
a)
=
SYSTElVlS ANALYSIS ’ SYSTEMANALYSE
Frenc h German
=
PONT EN BETON BETONBR ÜCKE
In example (a) the English word “analysis” and the German component “analyse” both represent foci, and the modifying differentes are represented
by “Systems” (English) and “System” (German). Despite these surface structural differentes, however, the terms “Systems analysis” and
“Systemanalyse” are both regarded as compound terms for the purposes of this International Standard.
3.3 dominant language: An exchange language (sec 3.5) which is also used for indexing and retrieval in Systems which, for policy
reasons, do not give equal Status to all the languages in the System. Every concept recognized in the System must necessarily be
represented by a preferred term in the dominant language. In some cases, however, an equivalent expression may be lacking in one
more sf the other languages. These other languages are then known as secondary languages.
34 equal Status: Languages in a multilingual thesaurus have equal Status when every preferred term in one language is matched
in
by an equivalent preferred term all other lang uages.
3.5 exchange language: The language used as a medium for data exchange in those multilingual Systems which, as a matter of
policy, decide to use terms selected from only one language for this purpose. The exchange language may also be used for indexing
and/or retrieval, and the multilingual thesaurus then functions principally as a means Bor translating the local languages sf indexers
and enquirers into, or out sf, the exchange language. The different languages in such a System would still be recognized as having
equal Status (sec 3.4) if equivalents are established reciprocally between the preferred terms in the exchange language and the pre-
ferred terms in all other languages.
feedback: The act sf changing the form or stru cture sf a term in a Source ianguage in Order to achieve an easier or a more
36
useful solution to a Problem encountered in a target Ia nguage.
Example: Let us assume that a German thesaurus is used as a Source language and contains the term “Lehrerbildungsgesetz”. Direct
“Law of education sf teachers”, or “‘Loi sur Ia
translation of this term into English or French would call for a complicated Paraphrase,
formation des enseignants”. Neither sf these phrases would be regarded as a satisfactory indexing term. A shorter expression, which
is closer to the German construction, tan be achieved in English, i.e. “Teacher education law”, but this cannot be done in French.
2
---------------------- Page: 8 ----------------------
SIST ISO 5964:1996
ISO 5964-1985 (E)
Feedback would operate if, in response to these Problems, the original German compound term is factored into its separate com-
ponents, each expressed as a noun, i.e. “Bildung”,
“Gesetz” and “Lehrer”, and if these are henceforth accepted as indexing terms in
German and assigned to documents dealing with this subject. Translation into English and French could then be carried out on this
new and simpler basis, i.e.
= =
Gesetz Law Loi
= =
Lehrer Teachers Enseignant
= =
Bildung Education Formation
The German compound term “Lehrerbildungsgesertz” may still be retained in the German thesaurus if it is likely to be sought by
users, but its Status would be changed to that of a non-preferred term, and the user would be redirected to the combination of
separate nouns which represents this complex concept, for example:
Lehrerbildungsgesetz BS LEHRER + BILDUNG + GESETZ
37 . indexing languag e: A controlled set of terms selected from natura1 language to represent, in summary form, the.
subjects of documents.
NOTE - In a post-coordinate System these terms are used as “keywords” for retrieval purposes, usually without attempting to indicate their syntac-
tical relationships. Syntactical relationships tan be indicated in various ways in a pre-coordinated index, for example by printing terms in entries in an
Order which suggests their relative roles, and so allows the user to perceive the subject as a whole. Despite these differentes, however, both kinds of
System tan be based on controlled vocabularies of terms displayed and organized in a thesaurus.
3.8 indexing term: The representation of a concept, preferabiy in the form of a noun or noun Phrase.
than one word, and is then kn lown as a compound term (sec 3.2). In a controlled indexing vocabulary,
NOTE - An indexing term tan consist of more
a term is designated either as a preferred term or as a non-preferred term.
39 . preferred term: A term used consistently when indexing to represent a given concept; sometimes known as “descriptor”.
3.10 non-preferred term: The synonym or quasi-synonym of a preferred term. A non-preferred term is not assigned to docu-
ments, but is provided as an entry Point in a thesaurus or alphabetical index, the user being directed by an instruction (for example
USE or SEE) to the appropriate preferred term; sometimes known as “non-descriptor”.
term: A term in one language (the Source language) which has been adopted without Change in a second br target)
3.11 loan
language.
Example:
English (target language)
German (Source language)
=
KINDERGARTEN KINDERGARTENS
3.12 multilingual thesaurus: A thesaurus (see 3.16) containing terms selected from more than one natura1 language. lt displays
not only the interrelationships between terms, but also equivalent terms in each of the languages covered.
3.13 secondary language: See definition of dominant language (3.3).
Point preferred term is translated into its nearest
3.14 Source language (SL): That language which serves as a starting when a
equivalent term or terms in a second (or target) language.
3.15 target language (TL) : The language into which a term first encountered in another language (the Source language, see 3.14)
is translated.
3.16 thesaurus: The vocabulary of a controlled indexing language (see 3.7), formally organized so that the a prhMationships
and “narrower”) are made explicit.
between concepts (for example as “broader”
4 General
No significance should be attached to the Order in which terms in the various languages are set down in the examples, nor does the
use of terms such as Source language and target language imply that one or the other of these languages is dominant. The Order of
“Source” and another as “target”, varies from example to
languages used in the examples, and the designation of one language as
example, and depends upon the Problem being illustrated. Where an appropriate Order is not determined on technical grounds,
alphabetical Order (English, French, German) has been used. See definitions of Source and target languages in 3.14 and 3.15.
3
---------------------- Page: 9 ----------------------
SIST ISO 5964:1996
ISO 5964-1985 (E)
5 Abbreviations and symbols
5.1 The abbreviations in table 3 have been used in later clauses to indicate relationships between terms.
Table ‘l - Abbrewiatisns
Terme g&Grique
Narrower term Terme specifique
Related term Verwandter Begriff
Benutzt für
Similar abbreviations either exist already, or tan be dlevised, in other languages, CU a multilingual thesaurus tan employ the neutral or
language-independent System of symbols developed by &SO Isee annex AI.
.iB The follovving symbols and conventions are also used throughout the following clauses of this International Standard:
preferred terms are printed in upper case throughout:
a)
Examplel ‘:
English Frenc German
--
- ZITZ
DOGS
CHIEN HUND
63) non-preferred terms are printed in lobver- case, with an upper case initial, except when the non-preferred terrn is an abbrevi-
ation or acronym which should be printed throughout in upper case:
English
ANllVlALS
CliF Fauna
Fauna
USE ANIMALS
French
R&ONANCE MAGNiTlQUE NUCLEA2RE
EP RlViN
RMN
EM RESONANCE lVlAGNET!QUE NUCLEAIRE
c) = indicates an equivalence between terms in two ianguages:
Exampie d
Engllish German
= =
POLITIQUE POLlTiK
POLITIGS
7 indicates that an equivalent does not exist in the language under which the question mark is printed:
d) .
English French
ZZ
?
LATCHKEY’ CHILDREN
1) See 11.1.3 for an explanation of the use of the plural form in English, and ahe singdar forms in French and German, in lhis and Iater examples.
4
---------------------- Page: 10 ----------------------
SIST ISO 5964:1996
ISO 59644985 (E)
6 Vocabulary control
. Two principal means for achieving vocabulary control are employed in thesauri:
61
a) terms are deliberately restricted in scope to selected meanings. Unlike the terms in a dictionary, which may be accompanied by
a number of different definitions reflecting common usage, each term in a thesaurus is generally restricted to whichever Single
meaning best serves the needs of an indexing System. The structure of a thesaurus, notably its display of hierarchical relationships,
frequently indicates the intended meaning of a term. If this technique is not sufficiently explicit, a definition or scope note should
be appended to the term. This should state the Chosen meaning, and may also indicate other meanings which are recognized in
natura1 language but which have been deliberately excluded for indexing purposes;
b) when the same concept tan be expressed by two or more Synonyms, one of these terms is usually selected as the preferred
term (see 3.9) which is then used consistently in indexing. Reference to the preferred term should be made from any synonym
which might also function as a user’s access Point. To assist the user of a printed thesaurus, it is recommended that preferred
terms should be distinguished typographically from non-preferred terms.
6.2 Vocabulary control is also achieved through the application of rules or policies which determine, for example, the form of a
term, for example its expression as a Singular or Plural, or the extent to which a compound term (see 3.2) should be either retained in
its present form or factored into separate components, each sf which is then expressed as a noun and used independently as an in-
dexing term. These and other aspects of vocabulary control apply to all kinds of thesauri, whether monolingual or multilingual, and
they are considered in greater detail in ISO 2788.
7 The establishment of a multilingua I thesaurus: general Problems
7.1 T,he establishment of any thesaurus, whether nonolingual or multilingual, involves two different classes of Problem which call
for decisions :
a) management Problems concerning, for example, the establishment of an updating policy, or the choice between alternative
forms of display, etc.;
b) language Problems which call for decisions on matters such as the forms of indexing terms (for example representation
llurals or Singulars), or the Status of terms (i.e. preferred or non-preferred).
as P
Problems tan usu ally be resolved by studying and choosing between the different recommended procedures described
These general
in a set of sta ndard guidelines. Since these matters are covered already in ISO 2788, they will not be reconsidered here i n detail.
7.2 The makers of a multilingual thesaurus face two additional kinds of Problem which do not occur in monolingual work:
a) management Problems, which call for decisions on, for example, the relative Status of languages (i.e. the designation of a
given language as the exchange language, the dominant language, or a secondary language), or the choice of a starting Point for
the work (for example translation of an existing thesaurus as opposed to ab initio construction);
b) language Problems which call for the choice of an appropriate procedure when a term in one language expresses a concept
term in one or more of the other lang uages.
which cannot be represented by an exactly equivalent
7.3 These special Problems associated with multilingual thesauri tan be seen as extensions of the general Problems considered
in 7.1. The matter of Status, for example, arises first as a general Problem (i.e. the Status of a term as “preferred” or “non-preferred”),
and then re-occurs as a multilingual Problem (i.e. the relative Status of each language). The establishment of a multilingual thesaurus
is, however, more complicated than this simple division of Problems into two classes appears to indicate, due to the fact that some
management decisions will directly affect the choice of procedures available to the indexer who is concerned with language Problems.
The possible extent of this interaction between two different classes of Problem tan be demonstrated by assuming, for example, that
the editors of a new multilingual thesaurus have decided, as a matter of policy, to impose the following conditions:
a) the new multilingual thesaurus should be a translated Version of an existing monolingual thesaurus;
b) the language of this Source thesaurus should have the Status of the exchange language;
feedback to this Source thesaurus (see 3.6) is not allowed : that is to say, none of its or I structure tan be modif ied
Cl
in the other languages.
in response to linguistic or conceptual Problems encountered
5
---------------------- Page: 11 ----------------------
SIST ISO 5964:1996
ISO 5964-1985 (E)
Faced by this range of management decisions, t h e task of the specialists responsible for adding the second or subsequent Ia
nguages
will certainly become very difficult,
and in some cases it may be impossible to achieve satisfactory solutions.
7.4 lt could be argued that Standard guidelines should, for the sake of completeness, take account sf all these factors. That is to
say, if a term in one language cannot be matched by an exactly equivalent term in another language, an “ideal” Standard should
review the various ways in which this Problem could be approached, it should set these down in an Order of preference with adequate
explanations and examples, and it should then go on to consider how each of these alternative approaches might be affected by the
presence of certain management decisions (for example “feedback” versus “no feedback”). This approach was, in fact, considered
during the early stages in the drafting of this International Standard, and the interaction between management decisions and
language Problems was represented in various ways, for example in the form of decision-making tables. lt was decided, however, that
the resulting International Standard would be too complicated for practical use. lt was further realized that if certain combinations of
circumstances were described as permitted options in the International Standard, their adoption would lead, in some circumstances,
to a thesaurus which is over-biassed towards a Single dominant language, without taking sufficient account of the special needs of
other language users. Such a thesaurus would fail to satisfy the general criteria considered in clause 0, where it is stated that l’. in-
dexers or searchers should, where possible, be able to work in their mother tongues, or at least in a language with which they are
already familiar”. Consequently, certain decisions, mostiy related to management Problems, arc indicated as “not recommended”
in the following clauses.
8 The establishment of a multilingual thesaurus: management decisions
8.1 Status of languages
8.1 .I The Status of each of the languages in a multilingual thesaurus should be decided before any attempt is made to deal with the
language problems considered in the following @lause. Terms such as “‘dominant language”, ‘“equal Status”, etc. were defined above
Isee clause 3).
8.W lt is sometimes necessary, on practical grourrds, to designate one of the languages as the exchange language, i.e. the
language which is used as a medium for exchanging indexing data Ifor example in a multilingual network). Even in these cases,
however, it should be possible for indexers and users to use their local languages for indexing and retrieval. All the languages should
be regarded as having equal Status from the viewpoint sf thesaurus construction. The imposition of a dominant language upon other
language users is NOT RECOMMENDED.
8.2 Sources od a multilingual tkesaurus
8.23 Three main approaches to the construction of a multilingual tkesaurus tan be postulated. These arc considered below in order
of preference :
a) ab initio construction, i.e. establishment of a new thesaurus without direct reference to the terms or structure of any existing
thesaurus. This method needs to be adopted when a new multilingual information System is being established and an existing
thesaurus (whether monolingual or multilingual) does not already ex&. Ab iraitio construction is also recommended in some other
circumstances considered below;
b) translation sf an existing thesaurus, for example a monolingual thesaur us covering the subject field of the proposed multi-
Two situations tan be distinguish ed:
ling ual thesaurus, and serving as the Source language.
‘l B feedback to the Source language is permitted, i.e. the terms and structure sf the original thesaurus may be modified to take
account of Problems encountered in any of the target languages;
2) feedback is not permitted, i.e. changes cannot be made to the terms or structure 0% the Source language thesaurus. This
procedure is not recommended. lf the only thesaurus available for translation is one which does not allow feedback, the
ab initio construction should be preferred, the existing thesaurus being regarded only as a possible Source sf terms andior
relationships;
c) reconciliation and merging 0% existing thesauri in two or more sf the working languages. This situation may occur if a
new international System is being formed on the basis sf two or more pre-existing national or monolingual Systems. In practice, it
is unlikely that two or more thesauri already established in different languages will correspond exactly in terms of either their logical
structures or their subject coverage. This procedure should therefore be adopted only if feedback between all the pre-established
thesauri is allowed, i*e. the structure and/or contents of any of the existing thesauri tan be modified to take account of Problems
encountered during the merging process. If feedback is not permitted, the ab hitio method should be preferred. The existing
thesauri tan then be regarded primarily as sources sf terms and/or relationships.
---------------------- Page: 12 ----------------------
SIST ISO 5964:1996
ISO 59644985 (E)
9 The establishment sf a multilingual thesaurus: language Problems
9.1 Introduction
9.1.1 The following assumptions are made in this and other clauses:
thesaurus have equal (sec 3.41, whether or not one of these languages also functions as
a) all languages in a multilingual
an exchange langua
ge;
b) either the ab initio method is adopted, or feedback is allowed if the work involves the translation and/or merging of one or
more existing thesauri.
9.1.2 When languages have equal Status, every preferred term in one of the languages should be matched by an equivalent preferred
term in each of the other languages. lt is not necessary to establish one-to-one equivalences between non-preferred terms, nor is this
usually possible, since languages vary in the number of Synonyms which express a given concept.
Examples:
English
al German French
= ZE
TELEFON TELEPHONE TELEPHONES
BF Fernsprecher
Fernsprecher
BS TELEFON
English
b) German French
= =
FAHRSTUHL ASCENSEUR LIFTS
IJ F Elevators
BF Aufzug
Aufzug Elevators
BS FAHRSTUHL USE LIFTS
In case nd in English is matched by two terms in German, i. e. a preferred term and a non-p
...
Norme internationale
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION.MEIK~YHAPOfiHAR OPI-AHM3AL&lR il0 CTAH~APTM3AL&lM.ORGANlSATlON INTERNATIONALE DE NORMALISATION
Documentation - Principes directeurs pour
l’établissement et le développement de thesaurus
multilingues
Documentation - Guidelines for the establishmen t and developmen t of multilingual thesauri
Première édition - 1985-02-E
CDU 025.48 Réf. no : ISO 5964-1985 (FI
Descripteurs : documentation, indexation, recherche de l’information, thesaurus, thesaurus multilingue, préparation, règlement.
Prix basé sur 61 pages
---------------------- Page: 1 ----------------------
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale
d’organismes nationaux de normalisation (comités membres de I’ISO). L’élaboration
des Normes internationales est confiée aux comités techniques de I’ISO. Chaque
comité membre intéressé par une étude a le droit de faire partie du comité technique
créé à cet effet. Les organisations internationales, gouvernementales et non gouverne-
mentales, en liaison avec I’ISO, participent également aux travaux.
Les projets de Normes internationales adoptés par les comités techniques sont soumis
aux comités membres pour approbation, avant leur acceptation comme Normes inter-
nationales par le Conseil de I’ISO. Les Normes internationales sont approuvées confor-
mément aux procédures de I’ISO qui requièrent l’approbation de 75 % au moins des
comités membres votants.
La Norme internationale ISO 5964 a été élaborée par le comité technique ISO/TC 46,
Documentation.
@ Organisation internationale de normalisation, 1985 l
Imprimé en Suisse
ii
---------------------- Page: 2 ----------------------
Sommaire
Page
................................................... . 1
0 Introduction
................................... . 1
1 Objet et domaine d’application . .
2 Références . . . . 2
3 Définitions . . . . 2
4 Généralités . . 4
....................................... . 4
5 Abréviations et symboles.
.........................................
6 Contrôle du vocabulaire . . . 5
7 Construction d’un thesaurus multilingue: problèmes généraux . . . . 5
8 Construction d’un thesaurus multilingue: principes de gestion . . . . 6
9 Construction d’un thesaurus multilingue: problèmes de langues. . . 7
10 Établissement des termes équivalents dans les différentes langues . . . . 11
.................................... . 21
11 Autres problèmes de langues . .
12 Relations entre les termes dans un thesaurus multilingue . . . . 26
13 Présentation des termes et des relations . . . . 28
14 Forme et contenu d’un thesaurus multilingue. . . . . 32
Organisation du travail . . . . 33
15
Annexes
35
A Symbolisation des relations des thesaurus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B 36
Exemples de présentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . .
III
---------------------- Page: 3 ----------------------
Page blanche
---------------------- Page: 4 ----------------------
NORME INTERNATIONALE ISO 59644985 (FI
Documentation - Principes directeurs pour
l’établissement et le développement de thesaurus
multilingues
0 Introduction
Le développement de l’échange international de l’information, pleinement soutenu par le programme UNISIST* de I’UNESCO illustré
par des systèmes tels que «AGRIS)) (Système international d’information pour les sciences et la technologie agricole) et (( INIS H
(Système international de documentation nucléaire) nécessite à l’évidence un engagement important au niveau de la coopération mul-
tilingue. Les systèmes de documentation s’étendent au-delà des frontières linguistiques conduisant à un accroissement notable du
nombre d’outils pour l’indexation et la recherche documentaire, soit indépendants de la langue, par exemple BS0 «Broad System of
Ordering», soit multilingues. Des outils de ce genre sont essentiels si l’on veut que la recherche de documents indexés dans plusieurs
langues ne dépende pas de la connaissance et de l’utilisation d’une langue unique dominante. Les indexeurs et les utilisateurs doivent,
quand c’est possible, pouvoir travailler dans leur langue maternelie ou au moins dans une langue qui leur est familière. Dans ce con-
texte, on peut considérer que les thesaurus multilingues ont un rôle important à jouer dans l’amélioration de la maîtrise de la littérature
dans son ensemble.
La normalisation des méthodes de construction d’un thesaurus multilingue conduit dans un premier temps à réaliser la compatibilité
entre les thesaurus issus d’organismes d’indexation utilisant des termes choisis dans des langues naturelles différentes. L’enregistre-
ment de ces méthodes doit également permettre aux indexeurs de bénéficier de l’expérience des autres et de travailler de facon logi-
que et cohérente en utilisant les techniques préconisées à un niveau international.
1 Objet et domaine d’application
1 .l Les principes directeurs prescrits par la présente Norme internationale doivent être utilisés conjointement à I’ISO 2788 et consi-
dérés comme une extension des principes directeurs sur les monolingues. La plupart des méthodes et recommandations de I’ISO 2788
sont également valables pour les thesaurus multilingues. Ceci s’applique particulièrement aux règles générales concernant par exem-
ple les formes des termes, les relations sémantiques de base et les opérations de gestion telles que l’évaluation et la mise à jour. Les
méthodes décrites dans I’ISO 2788 ne sont pas répétées ici, sauf nécessité, et il faut donc se référer à ces deux Normes internationales
pour construire un thesaurus multilingue.
1.2 Ces principes directeurs sont restreints aux problèmes de multilinguisme qui peuvent se poser pendant la construction d’un the-
saurus conventionnel, c’est-à-dire un thesaurus comprenant des termes choisis dans plusieurs langues naturelles, ces termes consti-
tuant ensuite le vocabulaire d’un langage contrôlé servant à l’indexation. Une distinction est faite, tout au long de la présente Norme
internationale, entre termes préférentiels et termes non préférentiels (voir les définitions au chapitre 3). Ces principes directeurs ne
s’appliquent pas au langage d’indexation dans lequel les notions sont représentées entièrement par des symboles (par exemple équa-
tions mathématiques ou formules chimiques) ni au systéme basé sur l’analyse automatique des textes et la recherche en langage libre.
Cependant, un thesaurus multilingue bien construit peut jouer un rôle important dans l’amélioration des systémes de recherche en
langage libre concernant les documents en plusieurs langues.
1.3 En raison du développement relativement récent des thesaurus multilingues dans le domaine de la documentation, il est inévita-
ble que ces principes directeurs présentent actuellement certaines limites.
a) Les exemples donnés pour illustrer les problèmes rencontrés dans l’établissement des équivalences des termes ont été large-
ment tirés des domaines des sciences (y compris les sciences sociales) et des techniques. Cependant, aussi souvent que possible,
les exemples choisis illustrent des problèmes et des méthodes généraux, pouvant s’appliquer à n’importe quel domaine de la con-
naissance.
* Programme intergouvernemental de coopération dans le domaine de l’information scientifique et technique.
1
---------------------- Page: 5 ----------------------
ISO 5964-1985 (FI
b) II est clair que les méthodes décrites dans ces principes directeurs ne peuvent s’appliquer complétement à toutes les langues.
Les exemples ont été tirés, pour des raisons tout à fait pragmatiques de trois des langues les plus répandues: l’allemand, l’anglais,
le français: ceci ne veut pas dire que ces langues sont considérées comme dominantes en documentation. Aussi souvent que pos-
sible, les méthodes dont il est question ainsi que les exemples qui les accompagnent ont trait à des problèmes qui peuvent se ren-
contrer dans n’importe quelle langue.
2 Références
ISOIR 639, Indicatifs de langue, de pays et d’autorité.
I SO 1086, Documentation - Feuillets de titre d’un livre.
ISO 2788, Documentation - Principes directeurs pour 1% tablissemen t et le développement de thesaurus monolingues.
3 Définitions
Dans le cadre de la présente Norme internationale, les définitions suivantes sont applicables.
3.1 terme cr&5: Néologisme créé spécialement dans une langue-cible pour exprimer un concept désigné par un terme particulier et
existant dans une langue source mais n’ayant pas été préalablement exprimé dans la langue cible.
3.2 terme composé : Terme d’indexation (voir 3.8) qui peut être décomposé morphologiquement en composants distincts, chacun
de ces composants pouvant être exprimé ou réexprimé par un nom susceptible de servir indépendamment de terme d’indexation.
NOTE - Les parties de la plupart des termes composés peuvent être identifiées ainsi:
a) le cœur ou la tête, c’est-à-dire le composant qui désigne la notion générale à laquelle le terme appartient;
b) le distinctif ou le modificateur, c’est-à-dire un ou plusieurs composants qui servent à restreindre l’étendue du cœur en précisant une de ses
sous-classes.
En francais, en anglais, ou dans d’autres langues similaires, les termes composés sont généralement faits de mots séparés alors que le même concept
sera exprimé fréquemment par un mot unique en allemand ou dans d’autres langues.
Exemples:
a ) Anglais Allemand
=
SYSTEMS ANALYSIS SYSTEMANALYSE
b 1 Français Allemand
=
BETONBRÜCKE
PONT EN BÉTON
Dans l’exemple (a) le mot anglais (( analysiss et le composant allemand (( analyse 1) représentent tous les deux des cœurs, et les modificateurs sont
représentés par (( systems M (anglais) et G system H (allemand). En dépit de ces diffkences de structure apparente les termes (( Systems analysis)) et
(( Systemanalyse H sont cependant considérés, dans la présente Norme internationale, comme des termes composés.
3.3 langue dominante: Langue d’échange (voir 3.5) utilisée également pour l’indexation et la recherche de l’information dans des
systèmes qui, pour des raisons politiques, ne donnent pas un statut identique à chaque langue. Chaque notion utilisée dans le
système doit nécessairement être représentée par un terme préférentiel dans la langue dominante. Dans certains cas cependant I’équi-
valence peut manquer dans une ou plusieurs des autres langues. Ces autres langues sont alors appelées: langues secondaires.
3.4 statut identique: Les versions linguistiques ont un statut identique si à chaque terme préférentiel d’une langue correspond un
terme préférentiel équivalent dans toute autre langue.
3.5 langue d’échange: Langue utilisée comme support pour l’échange des données dans des systémes multilingues qui ont pour
politique d’utiliser des termes choisis dans une seule langue. La langue d’échange peut également être utilisée pour l’indexation et/ou
la recherche de l’information et le thesaurus multilingue est alors essentiellement un outil de traduction des langues propres aux
indexeurs et aux utilisateurs vers la langue d’échange, et vice-versa. On peut considérer que dans un tel systéme les différentes lan-
gues ont un statut identique (voir 3.4) si l’on établit des équivalences réciproques entre les termes préférentiels de la langue d’échange
et des termes préférentiels de toutes les autres langues.
2
---------------------- Page: 6 ----------------------
ISO 59644985 (F)
3.6 rétroaction: Acte de changer la forme ou la structure d’un terme dans la langue source afin de parvenir à une solution plus
.
facile ou plus pratique pour un problème rencontré dans la langue cible.
Exemple: imaginons qu’un thesaurus allemand soit utilisé comme langue source et contienne le terme composé (( Lehrerbildungsge-
setz)). La traduction directe de ce terme en anglais et en francais donne une phrase complexe telle que: (( Law of education of
teachers)) ou (( Loi sur la formation des enseignants)). Aucune de ces phrases ne peut être considérée comme un terme d’indexation
satisfaisant. Une expression plus courte, plus proche de la construction allemande peut être trouvée en anglais, comme par exemple:
«Teacher education law», mais pas en francais. II y a rétroaction quand, pour résoudre ce problème, le terme composé allemand
d’origine est divisé en ses différents composants, chacun exprimé sous une forme nominale, c’est-à-dire: (( Bildung)), (( Gesetz)) et
(( Lehrer» et si ceux-ci sont acceptés comme termes d’indexation en allemand et attribués à des documents ayant trait à ce sujet. La
traduction en anglais et en francais peut alors se faire sur cette nouvelle base plus simple.
=
=
Gesetz Law Loi
= =
Lehrer Teachers Enseignant
= =
Bildung Education Formation
Le terme allemand composé (( Lehrerbildungsgesetz)) peut encore figurer dans le thesaurus allemand et les utilisateurs risquent de le
chercher, mais il est alors transformé en terme non préférentiel et l’utilisateur est réorienté vers la combinaison de noms séparés qui
représente cette notion complexe, par exemple :
Lehrerbildungsgesetz BS LEHRER + BILDUNG + GESETZ
3.7 langage d’indexation: Ensemble contrôlé de termes sélectionnés à partir du langage naturel et utilisé pour représenter, sous
une forme condensée, le contenu des documents.
NOTE - Dans un système post-coordonné, ces termes sont utilisés comme G mots clés» pour les besoins de la recherche documentaire généralement
sans essayer d’indiquer leurs relations syntaxiques. Les relations syntaxiques peuvent être indiquées de différentes maniéres dans un index pré-
coordonné, c’est-à-dire en écrivant les termes d’indexation dans un ordre qui suggère leurs rôles relatifs, et permettre ainsi à l’utilisateur de saisir le
contenu globalement. En dépit de ces différences, les deux types de système peuvent se fonder sur des vocabulaires contrôlés de termes présentés et
organisés en thesaurus.
3.8 terme d’indexation: Représentation d’une notion, de préférence sous forme de nom ou de locution nominale.
NOTE - Un terme d’indexation peut être formé de plusieurs mots et s’appelle alors terme composé (voir 3.2). Dans un vocabulaire d’indexation con-
trôlé, les termes sont considérés comme appartenant à l’une des deux catégories (3.9 et 3.10).
3.9 descripteur: Terme utilisé régulièrement, lors de l’indexation pour représenter une notion donnée; parfois appelé ((terme préfé-
rentiel )).
3.10 non-descripteur: Synonyme ou quasi-synonyme d’un descripteur. Un non-descripteur n’est jamais attribué à des docu-
ments, mais est utilisé comme point d’accès dans un thesaurus ou un index alphabétique, l’utilisateur étant dirigé par une instruction
(par exemple UTILISER ou VOIR) vers le descripteur approprié; parfois appelé ((synonyme» ou ((terme non préférentiel )).
3.11 terme d’emprunt: Terme d’une langue (la langue source) qui est adopté sans changement dans une autre langue (langue
cible).
Exemple:
Allemand (langue source) Anglais (langue cible)
=
KINDERGARTENS
KINDERGARTEN
3.12 thesaurus multilingue: Thesaurus (voir 3.16) contenant des termes sélectionnés à partir de plusieurs langages naturels. II
présente non seulement les relations entre les termes, mais aussi les termes équivalents dans chaque langue considérée.
3.13 langue secondaire: Voir la définition de olangue dominante)) (3.3).
3.14 langue source (LS) : Langue qui sert de point de départ quand on traduit un terme préférentiel par le ou les termes équivalents
les plus proches appartenant à une autre langue (ou langue cible).
3.15 langue cible (LC) : Langue dans laquelle un terme qui a été d’abord pris en compte dans une autre langue (la langue source,
voir 3.14) est traduit.
3.16 thesaurus: Vocabulaire d’un langage d’indexation contrôlé (voir 3.7) organisé formellement de facon à expliciter les relations
a priori entre les notions (par exemple relations générique-spécifique).
3
---------------------- Page: 7 ----------------------
ISO 59644985 (FI
4 Généralités
Aucune signification particulière ne devrait être donnée à l’ordre dans lequel les termes des différentes langues sont écrits dans les
exemples; de même l’utilisation des termes comme langue source et langue cible n’implique pas que l’une ou l’autre langue soit domi-
nante. L’ordre des langues utilisées dans les exemples et la désignation de l’une comme ~wwce~> et de l’autre comme ocible>> varie
d’un exemple à l’autre et dépend du problème illustré. Quand un ordre spécial n’est pas déterminé d’un point de vue technique, c’est
l’ordre alphabétique qui a été utilisé (allemand, anglais, francais). Voir 3.14 et 3.15 pour les définitions de langue source et de langue
,
cible.
5 Abréviations et symboles
5.1 Les abréviations du tableau 1 sont utilisées dans les chapitres suivants pour indiquer les relations entre les termes.
Tableau 1 - Abréviations
1 Pour les termes en allemand
Pour les termes en anglais Pour les termes en francais
I
TG: Terme générique OB: Oberbegriff
BT: Broader term
NT: Narrower term TS: Terme spécifique UB: Unterbegriff
WB:
RT: Related term VA: Voir aussi Verwandter Begriff
EM: Employer BS: Benutze
USE: Use
BF:
UF: Use for EP: Employé pour Benutzt für
NE: D: Définition
SN: Scope note Note explicative
Dans les autres langues, on peut inventer, s’il n’en existe déjà, des abréviations de ce type, ou alors on peut utiliser, pour un thesaurus
multilingue un système de symboles neutres ou indépendants des langues, tel que celui mis au point par I’ISO (voir annexe A).
5.2 Les symboles et les conventions ci-après sont également utilisés dans les chapitres suivants de la présente Norme
internationale :
a) les termes préférentiels sont écrits entièrement en majuscules:
Exemple1 ’ :
Anglais Francais
Allemand
= =
CHIEN
HUND DOGS
b) les termes non préférentiels sont écrits en minuscules avec la première lettre majuscule, sauf dans le cas où le terme non préfé-
rentiel est une abréviation ou un acronyme qui doit être écrit entièrement en majuscules:
Exemples:
Anglais
ANIMALS
UF Fauna
Fauna
USE ANIMALS
Francais
RÉSONNANCE MAGNÉTIQUE NUCLÉAIRE
EP RMN
RMN
EM RÉSONNANCE MAGNÉTIQUE NUCLÉAIRE
1) Voir en II. 1.3 l’explication de l’utilisation du pluriel en anglais et du singulier en francais et en allemand.
4
---------------------- Page: 8 ----------------------
ISO 59644985 (FI
cl = indique une équivalence entre deux termes de deux langues différentes:
.
Anglais Francais
Allemand
= =
POLITICS POLITIQUE POLITIK
d) ? indique qu’il n’y a pas d’équivalent dans la langue sous laquelle il est placé:
Exemple:
Anglais Francais
=
LATCHKEY CHILDREN ? ’
6 Contrôle du vocabulaire
6.1 II y a deux manières principales de réaliser le contrôle du vocabulaire dans un thesaurus:
a) les termes sont restreints délibérément à un sens précis. À la différence des termes d’un dictionnaire qui peuvent être suivis
d’un certain nombre de définitions différentes liées à l’usage, chaque terme d’un thesaurus n’a généralement qu’un seul sens qui
convient le mieux au système d’indexation. La structure d’un thesaurus, notamment la présentation des relations hiérarchiques,
indique souvent le sens choisi pour un terme. Si cette présentation n’est pas suffisamment explicite, une définition ou une note
d’application doit être ajoutée au terme, précisant le sens choisi et pouvant indiquer également les autres sens existant dans le lan-
gage naturel qui sont volontairement exclus pour les besoins de l’indexation;
b) quand la même notion peut être exprimée par deux synonymes ou plus, un de ces termes est généralement selectionné
comme un terme préférentiel (voir 3.9) et ensuite utilisé comme tel dans l’indexation. La référence au terme préférentiel doit être
faite à partir de tout autre synonyme pouvant également servir de point d’accès pour l’utilisateur. Pour aider l’utilisateur d’un the-
saurus, il est recommandé que les termes préférentiels soient distincts typographiquement des termes non préférentiels.
6.2 Le contrôle du vocabulaire se réalise aussi en appliquant des règles ou des principes qui déterminent, par exemple, la forme d’un
terme, son nombre, ou dans quelle mesure un terme composé (voir 3.2) doit être retenu sous sa forme composée ou divisée en com-
posants séparés, chacun d’eux étant alors présenté comme un nom et utilisé indépendamment comme un terme d’indexation. Tous
ces aspects de contrôle du vocabulaire s’appliquent à tous les types de thesaurus, qu’ils soient monolingues ou multilingues, et sont
largement détaillés dans I’ISO 2788.
7 Construction d’un thesaurus multilingue: problèmes généraux
7.1 La construction d’un thesaurus, qu’il soit monolingue ou multilingue entraîne deux types différents de problèmes nécessitant
une décision :
a) problèmes de gestion concernant, par exemple, l’établissement d’une politique de mise à jour ou le choix entre différentes
formes de présentation, etc. ;
b) problèmes de langue nécessitant des choix sur des sujets tels que la forme des termes d’indexation (par exemple leur représen-
tation au pluriel ou au singulier) ou le statut des termes (c’est-à-dire préférentiels ou non préférentiels).
Ces problèmes généraux peuvent habituellement être résolus en choisissant parmi les différentes méthodes décrites dans un ensemble
de principes directeurs normalisés. Puisque ces problèmes sont déjà traités dans I’ISO 2788, ils ne sont pas revus ici en détail.
7.2 Ceux qui élaborent un thesaurus multilingue rencontrent deux types de problèmes supplémentaires par rapport à un thesaurus
monolingue :
a) des problèmes de gestion qui nécessitent des choix, par exemple sur le statut relatif des langues (c’est-à-dire la désignation
d’une langue donnée comme langue d’échange, dominante ou secondaire) ou le choix d’un point de départ pour le travail (par
exemple la ((traduction )) d’un thesaurus existant en opposition à une élaboration ab-initid ;
b) des problèmes de langue nécessitant le choix d’une méthode appropriée quand un terme d’une langue exprime une notion qui
ne peut pas être représentée par un terme exactement équivalent dans une ou plusieurs autres langues
5
---------------------- Page: 9 ----------------------
ISO 59644985 (FI
7.3 Ces problemes particuliers aux thesaurus multilingues découlent des problèmes généraux posés en 7.1. La question du statut,
par exemple, soulève d’abord un problème général (c’est-à-dire le statut d’un terme comme (( préférentiel )) ou (( non préférentiel ») et
réapparaît ensuite comme un problème spécifique au thesaurus multilingue (c’est-à-dire le statut relatif de chaque langue). L’établis-
sement d’un thesaurus multilingue entraîne cependant plus de difficultés que cette simple répartition des problèmes en deux classes
pourrait le laisser croire, étant donné que certaines décisions affectent directement le choix des méthodes disponibles pour résoudre
les problémes de langue. La dimension possible de cette interaction entre deux types de problèmes peut être démontrée si l’on sup-
pose, par exemple, que les auteurs d’un nouveau thesaurus multilingue ont choisi d’imposer les conditions suivantes:
a) le nouveau thesaurus multilingue doit être une version ((traduite» d’un thesaurus monolingue existant;
b) la langue de ce thesaurus source doit avoir la statut d’une langue d’échange;
c) la rétroaction vers le thesaurus source (voir 3.6) est interdite: ce qui veut dire qu’aucun de ses termes ni sa structure logique ne
peuvent être modifiés pour répondre à des problèmes linguistiques ou conceptuels rencontrés dans les autres langues.
Face à cette série de décisions, la tâche des spécialistes chargés d’ajouter la deuxième langue ou les suivantes est certainement très
difficile et, dans certains cas, il est peut être impossible d’arriver à des solutions satisfaisantes.
7.4 On peut objecter que les principes directeurs normalisés doivent, afin d’être complets, tenir compte de tous ces facteurs. Ainsi,
si un terme d’une langue n’a pas d’équivalent exact dans une autre langue, une norme ((idéale» doit passer en revue les différentes
facons d’aborder le probléme, les exposer par ordre de préférence avec des explications adéquates et des exemples et examiner
ensuite comment chacune de ces approches peut être modifiée par la présence de certaines décisions (par exemple (( rétroaction H ou
(( non-rétroaction))). Cette approche a été envisagée, en fait, lors des premières étapes de rédaction de la présente Norme internatio-
nale et l’interaction entre les options prises et les problèmes de langues a été considérée de plusieurs manières, par exemple sous la
forme de tables de décision. II a cependant été décidé que la Norme internationale finale serait trop compliquée pour les besoins prati-
ques. On s’est rendu compte, de plus, que si certaines combinaisons de circonstances étaient présentées comme des options permi-
ses dans la Norme internationale, leur adoption conduirait, dans certains cas, à un thesaurus qui serait très favorable à une seule lan-
gue dominante et qui ne tiendrait pas suffisamment compte des besoins spécifiques des utilisateurs des autres langues. Un tel thesau-
rus ne serait pas satisfaisant par rapport au critère général cité au chapitre 0, où il est dit que (( les indexeurs et les chercheurs devraient
si possible être capables de travailler dans leur langue maternelle ou au moins dans une langue qui leur est familière». En consé-
quence, certaines décisions concernant pour la plupart les problèmes de gestion, sont indiquées comme (( non recommandées))
dans les chapitres suivants.
8 Construction d’un thesaurus multilingue: principes de gestion
8.1 Le statut des langues
8.1 .l On doit choisir le statut de chacune des langues d’un thesaurus multilingue avant d’aborder les problèmes de langues traités au
chapitre suivant. Des termes tels que «langue dominante», «statut identique)), etc. ont été définis plus haut (voir chapitre 3).
8.1.2 II est parfois nécessaire, au niveau pratique, de désigner une des langues comme étant la langue d’échange, c’est-à-dire celle
qui est utilisée comme support pour l’échange de données d’indexation (par exemple dans un réseau multilingue). Même dans ce cas,
cependant, il devrait être possible pour les indexeurs et les utilisateurs d’employer leur propre langue pour l’indexation et la recherche.
On doit considérer que toutes les langues ont un statut identique au point de vue de la construction d’un thesaurus. Imposer une
langue dominante à des utilisateurs d’autres langues n’est PAS RECOMMANDÉ.
8.2 Les sources d’un thesaurus multilingue
8.2.1 La construction d’un thesaurus multilingue peut être abordée de trois facons principales. Elles sont exposées, ici, par ordre de
,
préférence :
a) élaboration ab-initie, c’est-à-dire construction d’un nouveau thesaurus sans référence directe aux termes ou à la structure d’un
thesaurus existant. Cette méthode devrait être choisie lors de la création de tout nouveau système d’information multilingue et
quand il n’existe pas de thesaurus (qu’il soit monolingue ou multilingue). L’élaboration ab-initia est également recommandée dans
quelques autres cas qui seront envisagés plus loin;
b) traduction d’un thesaurus existant, par exemple un thesaurus monolingue couvrant le domaine du thesaurus multilingue
proposé et servant de langue source. On peut distinguer deux situations:
1) la rétroaction vers la langue source est permise, c’est-à-dire que les termes et la structure du thesaurus original peuvent
être modifiés pour prendre en compte les problèmes posés par n’importe laquelle des langues cibles;
6
---------------------- Page: 10 ----------------------
60 59644985 (FI
2) la rétroaction est interdite, c’est-à-dire qu’il n’est pas possible de modifier les termes ou la structure du thesaurus source.
Cette méthode n’est pas recommandée. Si le seul thesaurus valable pour la traduction ne permet pas la rétroaction, il vau-
dra mieux alors utiliser la construction ab-initio, le thesaurus existant servant uniquement dans ce cas de source possible de
termes et/ou de relations;
c) recherche de compatibilité et fusion de thesaurus existant en deux ou plusieurs langues de travail. Cette situation peut
se produire quand un nouveau système international est en train d’être créé à partir de deux ou plusieurs systèmes nationaux ou
monolingues préexistants. Dans la pratique, il est peu probable que deux ou plusieurs thesaurus déjà construits dans des langues
différentes correspondent exactement au niveau de leurs structures logiques, ou du domaine couvert. Cette méthode doit donc
être adoptée uniquement quand la rétroaction entre tous les thesaurus déjà existants est permise, c’est-à-dire si la structure et/ou
le contenu de chaque thesaurus existant peut être modifié pour tenir compte des problèmes rencontrés pendant le processus de
fusion. Si la rétroaction est interdite, la méthode ab-initia est préférable. Les thesaurus existants peuvent alors servir essentielle-
ment de source de termes et/ou de relations.
9 Construction d’un thesaurus multilingue: problèmes de langues
9.1 Introduction
9.1 .l Les postulats ci-après sont énoncés dans ce chapitre et dans les suivants:
a) toutes les langues d’un thesaurus multilingue ont un statut identique (voir 3.4), qu’une de ces langues fasse ou non fonction
de langue d’échange;
b) la méthode ab-initia est adoptée, ou la rétroaction est autorisée si le travail nécessite la traduction et/ou la fusion d’un ou de
plusieurs thesaurus
...
Norme internationale
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION.MEIK~YHAPOfiHAR OPI-AHM3AL&lR il0 CTAH~APTM3AL&lM.ORGANlSATlON INTERNATIONALE DE NORMALISATION
Documentation - Principes directeurs pour
l’établissement et le développement de thesaurus
multilingues
Documentation - Guidelines for the establishmen t and developmen t of multilingual thesauri
Première édition - 1985-02-E
CDU 025.48 Réf. no : ISO 5964-1985 (FI
Descripteurs : documentation, indexation, recherche de l’information, thesaurus, thesaurus multilingue, préparation, règlement.
Prix basé sur 61 pages
---------------------- Page: 1 ----------------------
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale
d’organismes nationaux de normalisation (comités membres de I’ISO). L’élaboration
des Normes internationales est confiée aux comités techniques de I’ISO. Chaque
comité membre intéressé par une étude a le droit de faire partie du comité technique
créé à cet effet. Les organisations internationales, gouvernementales et non gouverne-
mentales, en liaison avec I’ISO, participent également aux travaux.
Les projets de Normes internationales adoptés par les comités techniques sont soumis
aux comités membres pour approbation, avant leur acceptation comme Normes inter-
nationales par le Conseil de I’ISO. Les Normes internationales sont approuvées confor-
mément aux procédures de I’ISO qui requièrent l’approbation de 75 % au moins des
comités membres votants.
La Norme internationale ISO 5964 a été élaborée par le comité technique ISO/TC 46,
Documentation.
@ Organisation internationale de normalisation, 1985 l
Imprimé en Suisse
ii
---------------------- Page: 2 ----------------------
Sommaire
Page
................................................... . 1
0 Introduction
................................... . 1
1 Objet et domaine d’application . .
2 Références . . . . 2
3 Définitions . . . . 2
4 Généralités . . 4
....................................... . 4
5 Abréviations et symboles.
.........................................
6 Contrôle du vocabulaire . . . 5
7 Construction d’un thesaurus multilingue: problèmes généraux . . . . 5
8 Construction d’un thesaurus multilingue: principes de gestion . . . . 6
9 Construction d’un thesaurus multilingue: problèmes de langues. . . 7
10 Établissement des termes équivalents dans les différentes langues . . . . 11
.................................... . 21
11 Autres problèmes de langues . .
12 Relations entre les termes dans un thesaurus multilingue . . . . 26
13 Présentation des termes et des relations . . . . 28
14 Forme et contenu d’un thesaurus multilingue. . . . . 32
Organisation du travail . . . . 33
15
Annexes
35
A Symbolisation des relations des thesaurus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B 36
Exemples de présentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . .
III
---------------------- Page: 3 ----------------------
Page blanche
---------------------- Page: 4 ----------------------
NORME INTERNATIONALE ISO 59644985 (FI
Documentation - Principes directeurs pour
l’établissement et le développement de thesaurus
multilingues
0 Introduction
Le développement de l’échange international de l’information, pleinement soutenu par le programme UNISIST* de I’UNESCO illustré
par des systèmes tels que «AGRIS)) (Système international d’information pour les sciences et la technologie agricole) et (( INIS H
(Système international de documentation nucléaire) nécessite à l’évidence un engagement important au niveau de la coopération mul-
tilingue. Les systèmes de documentation s’étendent au-delà des frontières linguistiques conduisant à un accroissement notable du
nombre d’outils pour l’indexation et la recherche documentaire, soit indépendants de la langue, par exemple BS0 «Broad System of
Ordering», soit multilingues. Des outils de ce genre sont essentiels si l’on veut que la recherche de documents indexés dans plusieurs
langues ne dépende pas de la connaissance et de l’utilisation d’une langue unique dominante. Les indexeurs et les utilisateurs doivent,
quand c’est possible, pouvoir travailler dans leur langue maternelie ou au moins dans une langue qui leur est familière. Dans ce con-
texte, on peut considérer que les thesaurus multilingues ont un rôle important à jouer dans l’amélioration de la maîtrise de la littérature
dans son ensemble.
La normalisation des méthodes de construction d’un thesaurus multilingue conduit dans un premier temps à réaliser la compatibilité
entre les thesaurus issus d’organismes d’indexation utilisant des termes choisis dans des langues naturelles différentes. L’enregistre-
ment de ces méthodes doit également permettre aux indexeurs de bénéficier de l’expérience des autres et de travailler de facon logi-
que et cohérente en utilisant les techniques préconisées à un niveau international.
1 Objet et domaine d’application
1 .l Les principes directeurs prescrits par la présente Norme internationale doivent être utilisés conjointement à I’ISO 2788 et consi-
dérés comme une extension des principes directeurs sur les monolingues. La plupart des méthodes et recommandations de I’ISO 2788
sont également valables pour les thesaurus multilingues. Ceci s’applique particulièrement aux règles générales concernant par exem-
ple les formes des termes, les relations sémantiques de base et les opérations de gestion telles que l’évaluation et la mise à jour. Les
méthodes décrites dans I’ISO 2788 ne sont pas répétées ici, sauf nécessité, et il faut donc se référer à ces deux Normes internationales
pour construire un thesaurus multilingue.
1.2 Ces principes directeurs sont restreints aux problèmes de multilinguisme qui peuvent se poser pendant la construction d’un the-
saurus conventionnel, c’est-à-dire un thesaurus comprenant des termes choisis dans plusieurs langues naturelles, ces termes consti-
tuant ensuite le vocabulaire d’un langage contrôlé servant à l’indexation. Une distinction est faite, tout au long de la présente Norme
internationale, entre termes préférentiels et termes non préférentiels (voir les définitions au chapitre 3). Ces principes directeurs ne
s’appliquent pas au langage d’indexation dans lequel les notions sont représentées entièrement par des symboles (par exemple équa-
tions mathématiques ou formules chimiques) ni au systéme basé sur l’analyse automatique des textes et la recherche en langage libre.
Cependant, un thesaurus multilingue bien construit peut jouer un rôle important dans l’amélioration des systémes de recherche en
langage libre concernant les documents en plusieurs langues.
1.3 En raison du développement relativement récent des thesaurus multilingues dans le domaine de la documentation, il est inévita-
ble que ces principes directeurs présentent actuellement certaines limites.
a) Les exemples donnés pour illustrer les problèmes rencontrés dans l’établissement des équivalences des termes ont été large-
ment tirés des domaines des sciences (y compris les sciences sociales) et des techniques. Cependant, aussi souvent que possible,
les exemples choisis illustrent des problèmes et des méthodes généraux, pouvant s’appliquer à n’importe quel domaine de la con-
naissance.
* Programme intergouvernemental de coopération dans le domaine de l’information scientifique et technique.
1
---------------------- Page: 5 ----------------------
ISO 5964-1985 (FI
b) II est clair que les méthodes décrites dans ces principes directeurs ne peuvent s’appliquer complétement à toutes les langues.
Les exemples ont été tirés, pour des raisons tout à fait pragmatiques de trois des langues les plus répandues: l’allemand, l’anglais,
le français: ceci ne veut pas dire que ces langues sont considérées comme dominantes en documentation. Aussi souvent que pos-
sible, les méthodes dont il est question ainsi que les exemples qui les accompagnent ont trait à des problèmes qui peuvent se ren-
contrer dans n’importe quelle langue.
2 Références
ISOIR 639, Indicatifs de langue, de pays et d’autorité.
I SO 1086, Documentation - Feuillets de titre d’un livre.
ISO 2788, Documentation - Principes directeurs pour 1% tablissemen t et le développement de thesaurus monolingues.
3 Définitions
Dans le cadre de la présente Norme internationale, les définitions suivantes sont applicables.
3.1 terme cr&5: Néologisme créé spécialement dans une langue-cible pour exprimer un concept désigné par un terme particulier et
existant dans une langue source mais n’ayant pas été préalablement exprimé dans la langue cible.
3.2 terme composé : Terme d’indexation (voir 3.8) qui peut être décomposé morphologiquement en composants distincts, chacun
de ces composants pouvant être exprimé ou réexprimé par un nom susceptible de servir indépendamment de terme d’indexation.
NOTE - Les parties de la plupart des termes composés peuvent être identifiées ainsi:
a) le cœur ou la tête, c’est-à-dire le composant qui désigne la notion générale à laquelle le terme appartient;
b) le distinctif ou le modificateur, c’est-à-dire un ou plusieurs composants qui servent à restreindre l’étendue du cœur en précisant une de ses
sous-classes.
En francais, en anglais, ou dans d’autres langues similaires, les termes composés sont généralement faits de mots séparés alors que le même concept
sera exprimé fréquemment par un mot unique en allemand ou dans d’autres langues.
Exemples:
a ) Anglais Allemand
=
SYSTEMS ANALYSIS SYSTEMANALYSE
b 1 Français Allemand
=
BETONBRÜCKE
PONT EN BÉTON
Dans l’exemple (a) le mot anglais (( analysiss et le composant allemand (( analyse 1) représentent tous les deux des cœurs, et les modificateurs sont
représentés par (( systems M (anglais) et G system H (allemand). En dépit de ces diffkences de structure apparente les termes (( Systems analysis)) et
(( Systemanalyse H sont cependant considérés, dans la présente Norme internationale, comme des termes composés.
3.3 langue dominante: Langue d’échange (voir 3.5) utilisée également pour l’indexation et la recherche de l’information dans des
systèmes qui, pour des raisons politiques, ne donnent pas un statut identique à chaque langue. Chaque notion utilisée dans le
système doit nécessairement être représentée par un terme préférentiel dans la langue dominante. Dans certains cas cependant I’équi-
valence peut manquer dans une ou plusieurs des autres langues. Ces autres langues sont alors appelées: langues secondaires.
3.4 statut identique: Les versions linguistiques ont un statut identique si à chaque terme préférentiel d’une langue correspond un
terme préférentiel équivalent dans toute autre langue.
3.5 langue d’échange: Langue utilisée comme support pour l’échange des données dans des systémes multilingues qui ont pour
politique d’utiliser des termes choisis dans une seule langue. La langue d’échange peut également être utilisée pour l’indexation et/ou
la recherche de l’information et le thesaurus multilingue est alors essentiellement un outil de traduction des langues propres aux
indexeurs et aux utilisateurs vers la langue d’échange, et vice-versa. On peut considérer que dans un tel systéme les différentes lan-
gues ont un statut identique (voir 3.4) si l’on établit des équivalences réciproques entre les termes préférentiels de la langue d’échange
et des termes préférentiels de toutes les autres langues.
2
---------------------- Page: 6 ----------------------
ISO 59644985 (F)
3.6 rétroaction: Acte de changer la forme ou la structure d’un terme dans la langue source afin de parvenir à une solution plus
.
facile ou plus pratique pour un problème rencontré dans la langue cible.
Exemple: imaginons qu’un thesaurus allemand soit utilisé comme langue source et contienne le terme composé (( Lehrerbildungsge-
setz)). La traduction directe de ce terme en anglais et en francais donne une phrase complexe telle que: (( Law of education of
teachers)) ou (( Loi sur la formation des enseignants)). Aucune de ces phrases ne peut être considérée comme un terme d’indexation
satisfaisant. Une expression plus courte, plus proche de la construction allemande peut être trouvée en anglais, comme par exemple:
«Teacher education law», mais pas en francais. II y a rétroaction quand, pour résoudre ce problème, le terme composé allemand
d’origine est divisé en ses différents composants, chacun exprimé sous une forme nominale, c’est-à-dire: (( Bildung)), (( Gesetz)) et
(( Lehrer» et si ceux-ci sont acceptés comme termes d’indexation en allemand et attribués à des documents ayant trait à ce sujet. La
traduction en anglais et en francais peut alors se faire sur cette nouvelle base plus simple.
=
=
Gesetz Law Loi
= =
Lehrer Teachers Enseignant
= =
Bildung Education Formation
Le terme allemand composé (( Lehrerbildungsgesetz)) peut encore figurer dans le thesaurus allemand et les utilisateurs risquent de le
chercher, mais il est alors transformé en terme non préférentiel et l’utilisateur est réorienté vers la combinaison de noms séparés qui
représente cette notion complexe, par exemple :
Lehrerbildungsgesetz BS LEHRER + BILDUNG + GESETZ
3.7 langage d’indexation: Ensemble contrôlé de termes sélectionnés à partir du langage naturel et utilisé pour représenter, sous
une forme condensée, le contenu des documents.
NOTE - Dans un système post-coordonné, ces termes sont utilisés comme G mots clés» pour les besoins de la recherche documentaire généralement
sans essayer d’indiquer leurs relations syntaxiques. Les relations syntaxiques peuvent être indiquées de différentes maniéres dans un index pré-
coordonné, c’est-à-dire en écrivant les termes d’indexation dans un ordre qui suggère leurs rôles relatifs, et permettre ainsi à l’utilisateur de saisir le
contenu globalement. En dépit de ces différences, les deux types de système peuvent se fonder sur des vocabulaires contrôlés de termes présentés et
organisés en thesaurus.
3.8 terme d’indexation: Représentation d’une notion, de préférence sous forme de nom ou de locution nominale.
NOTE - Un terme d’indexation peut être formé de plusieurs mots et s’appelle alors terme composé (voir 3.2). Dans un vocabulaire d’indexation con-
trôlé, les termes sont considérés comme appartenant à l’une des deux catégories (3.9 et 3.10).
3.9 descripteur: Terme utilisé régulièrement, lors de l’indexation pour représenter une notion donnée; parfois appelé ((terme préfé-
rentiel )).
3.10 non-descripteur: Synonyme ou quasi-synonyme d’un descripteur. Un non-descripteur n’est jamais attribué à des docu-
ments, mais est utilisé comme point d’accès dans un thesaurus ou un index alphabétique, l’utilisateur étant dirigé par une instruction
(par exemple UTILISER ou VOIR) vers le descripteur approprié; parfois appelé ((synonyme» ou ((terme non préférentiel )).
3.11 terme d’emprunt: Terme d’une langue (la langue source) qui est adopté sans changement dans une autre langue (langue
cible).
Exemple:
Allemand (langue source) Anglais (langue cible)
=
KINDERGARTENS
KINDERGARTEN
3.12 thesaurus multilingue: Thesaurus (voir 3.16) contenant des termes sélectionnés à partir de plusieurs langages naturels. II
présente non seulement les relations entre les termes, mais aussi les termes équivalents dans chaque langue considérée.
3.13 langue secondaire: Voir la définition de olangue dominante)) (3.3).
3.14 langue source (LS) : Langue qui sert de point de départ quand on traduit un terme préférentiel par le ou les termes équivalents
les plus proches appartenant à une autre langue (ou langue cible).
3.15 langue cible (LC) : Langue dans laquelle un terme qui a été d’abord pris en compte dans une autre langue (la langue source,
voir 3.14) est traduit.
3.16 thesaurus: Vocabulaire d’un langage d’indexation contrôlé (voir 3.7) organisé formellement de facon à expliciter les relations
a priori entre les notions (par exemple relations générique-spécifique).
3
---------------------- Page: 7 ----------------------
ISO 59644985 (FI
4 Généralités
Aucune signification particulière ne devrait être donnée à l’ordre dans lequel les termes des différentes langues sont écrits dans les
exemples; de même l’utilisation des termes comme langue source et langue cible n’implique pas que l’une ou l’autre langue soit domi-
nante. L’ordre des langues utilisées dans les exemples et la désignation de l’une comme ~wwce~> et de l’autre comme ocible>> varie
d’un exemple à l’autre et dépend du problème illustré. Quand un ordre spécial n’est pas déterminé d’un point de vue technique, c’est
l’ordre alphabétique qui a été utilisé (allemand, anglais, francais). Voir 3.14 et 3.15 pour les définitions de langue source et de langue
,
cible.
5 Abréviations et symboles
5.1 Les abréviations du tableau 1 sont utilisées dans les chapitres suivants pour indiquer les relations entre les termes.
Tableau 1 - Abréviations
1 Pour les termes en allemand
Pour les termes en anglais Pour les termes en francais
I
TG: Terme générique OB: Oberbegriff
BT: Broader term
NT: Narrower term TS: Terme spécifique UB: Unterbegriff
WB:
RT: Related term VA: Voir aussi Verwandter Begriff
EM: Employer BS: Benutze
USE: Use
BF:
UF: Use for EP: Employé pour Benutzt für
NE: D: Définition
SN: Scope note Note explicative
Dans les autres langues, on peut inventer, s’il n’en existe déjà, des abréviations de ce type, ou alors on peut utiliser, pour un thesaurus
multilingue un système de symboles neutres ou indépendants des langues, tel que celui mis au point par I’ISO (voir annexe A).
5.2 Les symboles et les conventions ci-après sont également utilisés dans les chapitres suivants de la présente Norme
internationale :
a) les termes préférentiels sont écrits entièrement en majuscules:
Exemple1 ’ :
Anglais Francais
Allemand
= =
CHIEN
HUND DOGS
b) les termes non préférentiels sont écrits en minuscules avec la première lettre majuscule, sauf dans le cas où le terme non préfé-
rentiel est une abréviation ou un acronyme qui doit être écrit entièrement en majuscules:
Exemples:
Anglais
ANIMALS
UF Fauna
Fauna
USE ANIMALS
Francais
RÉSONNANCE MAGNÉTIQUE NUCLÉAIRE
EP RMN
RMN
EM RÉSONNANCE MAGNÉTIQUE NUCLÉAIRE
1) Voir en II. 1.3 l’explication de l’utilisation du pluriel en anglais et du singulier en francais et en allemand.
4
---------------------- Page: 8 ----------------------
ISO 59644985 (FI
cl = indique une équivalence entre deux termes de deux langues différentes:
.
Anglais Francais
Allemand
= =
POLITICS POLITIQUE POLITIK
d) ? indique qu’il n’y a pas d’équivalent dans la langue sous laquelle il est placé:
Exemple:
Anglais Francais
=
LATCHKEY CHILDREN ? ’
6 Contrôle du vocabulaire
6.1 II y a deux manières principales de réaliser le contrôle du vocabulaire dans un thesaurus:
a) les termes sont restreints délibérément à un sens précis. À la différence des termes d’un dictionnaire qui peuvent être suivis
d’un certain nombre de définitions différentes liées à l’usage, chaque terme d’un thesaurus n’a généralement qu’un seul sens qui
convient le mieux au système d’indexation. La structure d’un thesaurus, notamment la présentation des relations hiérarchiques,
indique souvent le sens choisi pour un terme. Si cette présentation n’est pas suffisamment explicite, une définition ou une note
d’application doit être ajoutée au terme, précisant le sens choisi et pouvant indiquer également les autres sens existant dans le lan-
gage naturel qui sont volontairement exclus pour les besoins de l’indexation;
b) quand la même notion peut être exprimée par deux synonymes ou plus, un de ces termes est généralement selectionné
comme un terme préférentiel (voir 3.9) et ensuite utilisé comme tel dans l’indexation. La référence au terme préférentiel doit être
faite à partir de tout autre synonyme pouvant également servir de point d’accès pour l’utilisateur. Pour aider l’utilisateur d’un the-
saurus, il est recommandé que les termes préférentiels soient distincts typographiquement des termes non préférentiels.
6.2 Le contrôle du vocabulaire se réalise aussi en appliquant des règles ou des principes qui déterminent, par exemple, la forme d’un
terme, son nombre, ou dans quelle mesure un terme composé (voir 3.2) doit être retenu sous sa forme composée ou divisée en com-
posants séparés, chacun d’eux étant alors présenté comme un nom et utilisé indépendamment comme un terme d’indexation. Tous
ces aspects de contrôle du vocabulaire s’appliquent à tous les types de thesaurus, qu’ils soient monolingues ou multilingues, et sont
largement détaillés dans I’ISO 2788.
7 Construction d’un thesaurus multilingue: problèmes généraux
7.1 La construction d’un thesaurus, qu’il soit monolingue ou multilingue entraîne deux types différents de problèmes nécessitant
une décision :
a) problèmes de gestion concernant, par exemple, l’établissement d’une politique de mise à jour ou le choix entre différentes
formes de présentation, etc. ;
b) problèmes de langue nécessitant des choix sur des sujets tels que la forme des termes d’indexation (par exemple leur représen-
tation au pluriel ou au singulier) ou le statut des termes (c’est-à-dire préférentiels ou non préférentiels).
Ces problèmes généraux peuvent habituellement être résolus en choisissant parmi les différentes méthodes décrites dans un ensemble
de principes directeurs normalisés. Puisque ces problèmes sont déjà traités dans I’ISO 2788, ils ne sont pas revus ici en détail.
7.2 Ceux qui élaborent un thesaurus multilingue rencontrent deux types de problèmes supplémentaires par rapport à un thesaurus
monolingue :
a) des problèmes de gestion qui nécessitent des choix, par exemple sur le statut relatif des langues (c’est-à-dire la désignation
d’une langue donnée comme langue d’échange, dominante ou secondaire) ou le choix d’un point de départ pour le travail (par
exemple la ((traduction )) d’un thesaurus existant en opposition à une élaboration ab-initid ;
b) des problèmes de langue nécessitant le choix d’une méthode appropriée quand un terme d’une langue exprime une notion qui
ne peut pas être représentée par un terme exactement équivalent dans une ou plusieurs autres langues
5
---------------------- Page: 9 ----------------------
ISO 59644985 (FI
7.3 Ces problemes particuliers aux thesaurus multilingues découlent des problèmes généraux posés en 7.1. La question du statut,
par exemple, soulève d’abord un problème général (c’est-à-dire le statut d’un terme comme (( préférentiel )) ou (( non préférentiel ») et
réapparaît ensuite comme un problème spécifique au thesaurus multilingue (c’est-à-dire le statut relatif de chaque langue). L’établis-
sement d’un thesaurus multilingue entraîne cependant plus de difficultés que cette simple répartition des problèmes en deux classes
pourrait le laisser croire, étant donné que certaines décisions affectent directement le choix des méthodes disponibles pour résoudre
les problémes de langue. La dimension possible de cette interaction entre deux types de problèmes peut être démontrée si l’on sup-
pose, par exemple, que les auteurs d’un nouveau thesaurus multilingue ont choisi d’imposer les conditions suivantes:
a) le nouveau thesaurus multilingue doit être une version ((traduite» d’un thesaurus monolingue existant;
b) la langue de ce thesaurus source doit avoir la statut d’une langue d’échange;
c) la rétroaction vers le thesaurus source (voir 3.6) est interdite: ce qui veut dire qu’aucun de ses termes ni sa structure logique ne
peuvent être modifiés pour répondre à des problèmes linguistiques ou conceptuels rencontrés dans les autres langues.
Face à cette série de décisions, la tâche des spécialistes chargés d’ajouter la deuxième langue ou les suivantes est certainement très
difficile et, dans certains cas, il est peut être impossible d’arriver à des solutions satisfaisantes.
7.4 On peut objecter que les principes directeurs normalisés doivent, afin d’être complets, tenir compte de tous ces facteurs. Ainsi,
si un terme d’une langue n’a pas d’équivalent exact dans une autre langue, une norme ((idéale» doit passer en revue les différentes
facons d’aborder le probléme, les exposer par ordre de préférence avec des explications adéquates et des exemples et examiner
ensuite comment chacune de ces approches peut être modifiée par la présence de certaines décisions (par exemple (( rétroaction H ou
(( non-rétroaction))). Cette approche a été envisagée, en fait, lors des premières étapes de rédaction de la présente Norme internatio-
nale et l’interaction entre les options prises et les problèmes de langues a été considérée de plusieurs manières, par exemple sous la
forme de tables de décision. II a cependant été décidé que la Norme internationale finale serait trop compliquée pour les besoins prati-
ques. On s’est rendu compte, de plus, que si certaines combinaisons de circonstances étaient présentées comme des options permi-
ses dans la Norme internationale, leur adoption conduirait, dans certains cas, à un thesaurus qui serait très favorable à une seule lan-
gue dominante et qui ne tiendrait pas suffisamment compte des besoins spécifiques des utilisateurs des autres langues. Un tel thesau-
rus ne serait pas satisfaisant par rapport au critère général cité au chapitre 0, où il est dit que (( les indexeurs et les chercheurs devraient
si possible être capables de travailler dans leur langue maternelle ou au moins dans une langue qui leur est familière». En consé-
quence, certaines décisions concernant pour la plupart les problèmes de gestion, sont indiquées comme (( non recommandées))
dans les chapitres suivants.
8 Construction d’un thesaurus multilingue: principes de gestion
8.1 Le statut des langues
8.1 .l On doit choisir le statut de chacune des langues d’un thesaurus multilingue avant d’aborder les problèmes de langues traités au
chapitre suivant. Des termes tels que «langue dominante», «statut identique)), etc. ont été définis plus haut (voir chapitre 3).
8.1.2 II est parfois nécessaire, au niveau pratique, de désigner une des langues comme étant la langue d’échange, c’est-à-dire celle
qui est utilisée comme support pour l’échange de données d’indexation (par exemple dans un réseau multilingue). Même dans ce cas,
cependant, il devrait être possible pour les indexeurs et les utilisateurs d’employer leur propre langue pour l’indexation et la recherche.
On doit considérer que toutes les langues ont un statut identique au point de vue de la construction d’un thesaurus. Imposer une
langue dominante à des utilisateurs d’autres langues n’est PAS RECOMMANDÉ.
8.2 Les sources d’un thesaurus multilingue
8.2.1 La construction d’un thesaurus multilingue peut être abordée de trois facons principales. Elles sont exposées, ici, par ordre de
,
préférence :
a) élaboration ab-initie, c’est-à-dire construction d’un nouveau thesaurus sans référence directe aux termes ou à la structure d’un
thesaurus existant. Cette méthode devrait être choisie lors de la création de tout nouveau système d’information multilingue et
quand il n’existe pas de thesaurus (qu’il soit monolingue ou multilingue). L’élaboration ab-initia est également recommandée dans
quelques autres cas qui seront envisagés plus loin;
b) traduction d’un thesaurus existant, par exemple un thesaurus monolingue couvrant le domaine du thesaurus multilingue
proposé et servant de langue source. On peut distinguer deux situations:
1) la rétroaction vers la langue source est permise, c’est-à-dire que les termes et la structure du thesaurus original peuvent
être modifiés pour prendre en compte les problèmes posés par n’importe laquelle des langues cibles;
6
---------------------- Page: 10 ----------------------
60 59644985 (FI
2) la rétroaction est interdite, c’est-à-dire qu’il n’est pas possible de modifier les termes ou la structure du thesaurus source.
Cette méthode n’est pas recommandée. Si le seul thesaurus valable pour la traduction ne permet pas la rétroaction, il vau-
dra mieux alors utiliser la construction ab-initio, le thesaurus existant servant uniquement dans ce cas de source possible de
termes et/ou de relations;
c) recherche de compatibilité et fusion de thesaurus existant en deux ou plusieurs langues de travail. Cette situation peut
se produire quand un nouveau système international est en train d’être créé à partir de deux ou plusieurs systèmes nationaux ou
monolingues préexistants. Dans la pratique, il est peu probable que deux ou plusieurs thesaurus déjà construits dans des langues
différentes correspondent exactement au niveau de leurs structures logiques, ou du domaine couvert. Cette méthode doit donc
être adoptée uniquement quand la rétroaction entre tous les thesaurus déjà existants est permise, c’est-à-dire si la structure et/ou
le contenu de chaque thesaurus existant peut être modifié pour tenir compte des problèmes rencontrés pendant le processus de
fusion. Si la rétroaction est interdite, la méthode ab-initia est préférable. Les thesaurus existants peuvent alors servir essentielle-
ment de source de termes et/ou de relations.
9 Construction d’un thesaurus multilingue: problèmes de langues
9.1 Introduction
9.1 .l Les postulats ci-après sont énoncés dans ce chapitre et dans les suivants:
a) toutes les langues d’un thesaurus multilingue ont un statut identique (voir 3.4), qu’une de ces langues fasse ou non fonction
de langue d’échange;
b) la méthode ab-initia est adoptée, ou la rétroaction est autorisée si le travail nécessite la traduction et/ou la fusion d’un ou de
plusieurs thesaurus
...
Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.