ISO 24613-4:2021
(Main)Language resource management — Lexical markup framework (LMF) — Part 4: TEI serialization
Language resource management — Lexical markup framework (LMF) — Part 4: TEI serialization
This document describes the serialization of the lexical markup framework (LMF) model defined as an XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).
Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 4: Sérialisation TEI
Le présent document décrit la sérialisation du cadre de balisage lexical (LMF) défini en tant que modèle XML conforme aux lignes directrices de la TEI (Text Encoding Initiative). Cette sérialisation couvre les classes de l'ISO 24613‑1 (modèle de base du LMF) ainsi que les classes fournies par l'ISO 24613‑2 (modèle de dictionnaire lisible par ordinateur, MRD) et l'ISO24613‑3 (extension étymologique).
Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 4. del: Serializacija TEI
General Information
Relations
Standards Content (Sample)
SLOVENSKI STANDARD
01-junij-2021
Nadomešča:
SIST ISO 24613:2013
Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 4. del:
Serializacija TEI
Language resource management - Lexical markup framework (LMF) - Part 4: TEI
serialization
Gestion des ressources linguistiques -- Cadre de balisage lexical (LMF) - Partie 4:
Sérialisation TEI
Ta slovenski standard je istoveten z: ISO 24613-4:2021
ICS:
01.020 Terminologija (načela in Terminology (principles and
koordinacija) coordination)
01.140.20 Informacijske vede Information sciences
35.240.30 Uporabniške rešitve IT v IT applications in information,
informatiki, dokumentiranju in documentation and
založništvu publishing
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.
INTERNATIONAL ISO
STANDARD 24613-4
First edition
2021-01
Language resource management —
Lexical markup framework (LMF) —
Part 4:
TEI serialization
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 4: Sérialisation TEI
Reference number
©
ISO 2021
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved
Contents Page
Foreword .v
1 Scope . 1
2 Normative references . 1
3	 Terms	and	definitions . 1
4 General principles . 1
5 Serialization of the LMF core model (ISO 24613-1) . 2
5.1 Implementing the LexicalResource class . 2
5.2 Implementing the GlobalInformation class. 2
5.3 Implementing the Lexicon class . 3
5.4 Implementing the LexiconInformation class . 4
5.5 Implementing the LexicalEntry class . 4
5.6 Implementing the Form and Lemma classes . 5
5.6.1 Form class . 5
5.6.2 Lemma class . 5
5.7 Implementing the GrammaticalInformation class . 5
5.8 Implementing the Sense class . 7
5.9 Implementing the Definition class . 7
5.10 Implementing the OrthographicRepresentation class . 8
5.11 Implementing the CrossREF class . 8
5.12 Data category selection. 9
6 Serialization of the MRD model (ISO 24613-2) . 9
6.1 Implementing the form representations for the Form class . 9
6.2 Implementing classes derived from the Form class.11
6.2.1 General principles .11
6.2.2 Implementing the WordForm class .11
6.2.3 Implementing the Stem class .11
6.2.4 Implementing the WordPart class .11
6.2.5 Implementing the RelatedForm class .12
6.3 Implementing the Bibliography class .12
6.4 Implementing the CrossREF mechanism to refer to external media files .12
6.5 Implementing the Example class .12
6.6 Implementing the Translation class .13
6.7 Implementing the TextRepresentation class .13
6.8 Implementing the SubjectField class .14
6.9 Implementing the CrossREF mechanism to represent related entries .14
7 Implementing the classes from the etymological extension (ISO 24613-3) .15
7.1 Implementing the Etymology class .15
7.2 Implementing the Etymon class.15
7.2.1 Referencing forms in an etymon .16
7.2.2 Representing the meaning of an etymon .16
7.2.3 Representing the language of an etymon .16
7.2.4 Associating grammatical information to an etymon.16
7.2.5 Dating an etymon .16
7.2.6 Providing sources associated with an etymon .17
7.2.7 Further prose component in an etymological description .17
7.3 Implementing the EtyLink class .17
7.4 Implementing the CognateSet class .17
7.5 Implementing the Cognate class .17
7.6 Implementing the Gloss class .18
8 Additional mechanisms .18
8.1 Overview .18
8.2 Representing punctuation marks with  .18
8.3 Representing various labels with  .18
8.4 Encoding simple separating characters with  .19
8.5 Providing rendition information with the @rend attribute.19
8.6 Usage example of the additional features introduced in Clause 8 .19
Bibliography .20
iv © ISO 2021 – All rights reserved
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to
the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see
www .iso .org/ iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
1)
This first edition of ISO 24613-4, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-3:—
2)
and ISO 24613-5:— , cancels and replaces ISO 24613:2008, which has been technically revised.
The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
1) Under preparation. Stage at the time of publication: ISO/FDIS 24613-3:2020.
2) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
----------------------
 ...
INTERNATIONAL ISO
STANDARD 24613-4
First edition
2021-01
Language resource management —
Lexical markup framework (LMF) —
Part 4:
TEI serialization
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 4: Sérialisation TEI
Reference number
©
ISO 2021
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved
Contents Page
Foreword .v
1 Scope . 1
2 Normative references . 1
3	 Terms	and	definitions . 1
4 General principles . 1
5 Serialization of the LMF core model (ISO 24613-1) . 2
5.1 Implementing the LexicalResource class . 2
5.2 Implementing the GlobalInformation class. 2
5.3 Implementing the Lexicon class . 3
5.4 Implementing the LexiconInformation class . 4
5.5 Implementing the LexicalEntry class . 4
5.6 Implementing the Form and Lemma classes . 5
5.6.1 Form class . 5
5.6.2 Lemma class . 5
5.7 Implementing the GrammaticalInformation class . 5
5.8 Implementing the Sense class . 7
5.9 Implementing the Definition class . 7
5.10 Implementing the OrthographicRepresentation class . 8
5.11 Implementing the CrossREF class . 8
5.12 Data category selection. 9
6 Serialization of the MRD model (ISO 24613-2) . 9
6.1 Implementing the form representations for the Form class . 9
6.2 Implementing classes derived from the Form class.11
6.2.1 General principles .11
6.2.2 Implementing the WordForm class .11
6.2.3 Implementing the Stem class .11
6.2.4 Implementing the WordPart class .11
6.2.5 Implementing the RelatedForm class .12
6.3 Implementing the Bibliography class .12
6.4 Implementing the CrossREF mechanism to refer to external media files .12
6.5 Implementing the Example class .12
6.6 Implementing the Translation class .13
6.7 Implementing the TextRepresentation class .13
6.8 Implementing the SubjectField class .14
6.9 Implementing the CrossREF mechanism to represent related entries .14
7 Implementing the classes from the etymological extension (ISO 24613-3) .15
7.1 Implementing the Etymology class .15
7.2 Implementing the Etymon class.15
7.2.1 Referencing forms in an etymon .16
7.2.2 Representing the meaning of an etymon .16
7.2.3 Representing the language of an etymon .16
7.2.4 Associating grammatical information to an etymon.16
7.2.5 Dating an etymon .16
7.2.6 Providing sources associated with an etymon .17
7.2.7 Further prose component in an etymological description .17
7.3 Implementing the EtyLink class .17
7.4 Implementing the CognateSet class .17
7.5 Implementing the Cognate class .17
7.6 Implementing the Gloss class .18
8 Additional mechanisms .18
8.1 Overview .18
8.2 Representing punctuation marks with  .18
8.3 Representing various labels with  .18
8.4 Encoding simple separating characters with  .19
8.5 Providing rendition information with the @rend attribute.19
8.6 Usage example of the additional features introduced in Clause 8 .19
Bibliography .20
iv © ISO 2021 – All rights reserved
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to
the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see
www .iso .org/ iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
1)
This first edition of ISO 24613-4, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-3:—
2)
and ISO 24613-5:— , cancels and replaces ISO 24613:2008, which has been technically revised.
The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
1) Under preparation. Stage at the time of publication: ISO/FDIS 24613-3:2020.
2) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
INTERNATIONAL STANDARD ISO 24613-4:2021(E)
Language resource management — Lexical markup
framework (LMF) —
Part 4:
TEI serialization
1 Scope
This document describes the serialization of the lexical markup framework (LMF) model defined as an
XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the
classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine
readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content
constitutes requirements of this document. For dated references, only the edition cited applies. For
undated references, the latest edition of the referenced document (including any amendments) applies.
ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model
ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-
readable dictionary (MRD) model
ISO 24613-3, Language resource management — Lexical markup framework (LMF)
 ...
NORME ISO
INTERNATIONALE 24613-4
Première édition
2021-01
Gestion des ressources
linguistiques — Cadre de balisage
lexical (LMF) —
Partie 4:
Sérialisation TEI
Language resource management — Lexical markup framework
(LMF) —
Part 4: TEI serialization
Numéro de référence
©
ISO 2021
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2021
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii © ISO 2021 – Tous droits réservés
Sommaire Page
Avant-propos .v
1 Domaine d’application . 1
2 Références normatives . 1
3	 Termes	et	définitions . 1
4 Principes généraux . 2
5 Sérialisation du modèle de base LMF (ISO 24613-1) . 2
5.1 Implémentation de la classe LexicalResource . 2
5.2 Implémentation de la classe GlobalInformation . 2
5.3 Implémentation de la classe Lexicon . 3
5.4 Implémentation de la classe LexiconInformation . 4
5.5 Implémentation de la classe LexicalEntry. 4
5.6 Implémentation des classes Form et Lemma . 5
5.6.1 Classe Form . 5
5.6.2 Classe Lemma . 5
5.7 Implémentation de la classe GrammaticalInformation . 5
5.8 Implémentation de la classe Sense . 7
5.9 Implémentation de la classe Definition . 7
5.10 Implémentation de la classe OrthographicRepresentation . 8
5.11 Implémentation de la classe CrossREF . 8
5.12 Sélection des catégories de données . 9
6 Sérialisation du modèle MRD (ISO 24613-2) . 9
6.1 Implémentation des représentations de forme pour la classe Form . 9
6.2 Implémentation des classes dérivées de la classe Form .10
6.2.1 Principes généraux .10
6.2.2 Implémentation de la classe WordForm .10
6.2.3 Implémentation de la classe Stem .11
6.2.4 Implémentation de la classe WordPart .11
6.2.5 Implémentation de la classe RelatedForm .11
6.3 Implémentation de la classe Bibliography .12
6.4 Implémentation du mécanisme CrossREF de renvoi à des fichiers multimédia externes .12
6.5 Implémentation de la classe Example .12
6.6 Implémentation de la classe Translation .13
6.7 Implémentation de la classe TextRepresentation .13
6.8 Implémentation de la classe SubjectField .14
6.9 Implémentation du mécanisme CrossRef pour représenter les entrées associées .14
7 Implémentation des classes à partir de l’extension étymologique (ISO 24613-3) .15
7.1 Implémentation de la classe Etymology .15
7.2 Implémentation de la classe Etymon .15
7.2.1 Référencement des formes dans un étymon .15
7.2.2 Représentation de la signification d’un étymon .16
7.2.3 Représentation de la langue d’un étymon .16
7.2.4 Association d’informations grammaticales à un étymon .16
7.2.5 Datation d’un étymon .16
7.2.6 Citation de sources associées à un étymon .17
7.2.7 Élément de prose supplémentaire dans une description étymologique .17
7.3 Implémentation de la classe EtyLink .17
7.4 Implémentation de la classe CognateSet .17
7.5 Implémentation de la classe Cognate .17
7.6 Implémentation de la classe Gloss .18
8 Mécanismes supplémentaires .18
8.1 Vue d’ensemble .18
8.2 Représentation de signes de ponctuation avec  .18
8.3 Représentation de diverses étiquettes avec  .18
8.4 Codage de caractères de séparation simples avec  .19
8.5 Transmission d’informations de rendu avec l’attribut @rend .19
8.6 Exemple d’usage des traits supplémentaires présentés à l’Article 8 .19
Bibliographie .20
iv © ISO 2021 – Tous droits réservés
Avant-propos
L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes
nationaux de normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est
en général confiée aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l'ISO participent également aux travaux.
L'ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www
.iso .org/ directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant
les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de
l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de
brevets reçues par l’ISO (voir www .iso .org/ brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir le lien suivant: www .iso .org/ iso/ fr/ avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie,
sous-comité SC 4, Gestion des ressources linguistiques.
Cette première édition de l’ISO 24613-4, ainsi que l’ISO 24613-1:2019, l’ISO 24613-2:2020,
1) 2)
l’ISO 24613-3:— et l’ISO 24613-5:— , annule et remplace l’ISO 24613:2008, qui a été révisée
techniquement.
Les principales modifications par rapport à l’édition précédente sont les suivantes:
— révision complète du contenu et de sa sous-division en plusieurs parties.
Une liste de toutes les parties de la série ISO 24613 se trouve sur le site Web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes
se trouve à l’adresse www .iso .org/ fr/ members .html.
1) En préparation. Étape au moment de la publication: ISO/FDIS 24613-3:2020.
2) En préparation. Étape au moment de la publication: ISO/DIS 24613-5:2020.
NORME INTERNATIONALE ISO 24613-4:2021(F)
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 4:
Sérialisation TEI
1 Domaine d’application
Le présent document décrit la sérialisation du cadre de balisage lexical (LMF) défini en tant que modèle
XML conforme aux lignes directrices de la TEI (Text Encoding Initiative). Cette sérialisation couvre
les classes de l’ISO 24613-1 (modèle de base du LMF) ainsi que les classes fournies par l’ISO 24613-2
(modèle de dictionnaire lisible par ordinateur, MRD) et l’ISO24613-3 (extension étymologique).
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.
Pour les références non datées, la dernière édition du document de référence s’applique (y compris les
éventuels amendements).
ISO 24613-1, Gestion des ressources linguistiques — Cadre de
 ...












Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.