ISO 24613-6:2024
(Main)Language resource management — Lexical markup framework (LMF) — Part 6: Syntax and semantics
Language resource management — Lexical markup framework (LMF) — Part 6: Syntax and semantics
This document specifies the syntax and semantics (SynSem) module of the lexical markup framework (LMF), a metamodel for representing data in monolingual and multilingual lexical databases used with computer applications. The SynSem module allows for the description of specific syntactic and semantic properties of lexemes, as well as the complex interactions between them. More specifically, the syntax part of the module describes the properties of a lexeme when combined with other lexemes in a sentence. When recorded in a lexicon, these properties make up the syntactic description of a lexical entry instance. The semantics part of the module, on the other hand, describes the sense of a lexeme and its relationship with other senses belonging to the same language. The SynSem interface describes the predicates and the mapping between syntactic and semantic arguments. This serialization covers the classes of ISO 24613-1 (Core model), ISO 24613-2 (Machine-readable dictionary (MRD) model) and ISO 24613-4 (TEI serialization).
Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 6: Syntaxe et sémantique
Le présent document spécifie le module syntaxe et sémantique (SynSem) du cadre de balisage lexical (LMF), un métamodèle permettant de représenter les données dans des bases de données lexicales monolingues et multilingues utilisées avec des applications informatiques. Le module SynSem permet de décrire les propriétés syntaxiques et sémantiques spécifiques des lexèmes, ainsi que les interactions complexes entre ces derniers. Plus précisément, la partie syntaxique du module décrit les propriétés d’un lexème lorsqu’il est combiné avec d’autres lexèmes dans une phrase. Lorsqu’elles sont enregistrées dans un lexique, ces propriétés constituent la description syntaxique d’une entrée lexicale. La partie sémantique du module, quant à elle, décrit le sens d’un lexème et sa relation avec les autres sens appartenant à la même langue. L’interface SynSem décrit les prédicats et la correspondance entre les arguments syntaxiques et sémantiques. Cette sérialisation couvre les classes de l’ISO 24613-1 (modèle de base), de l’ISO 24613-2 (modèle de dictionnaire lisible par ordinateur (MRD)) et de l’ISO 24613-4 (sérialisation TEI).
Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 6. del: Sintaksa in semantika
Ta dokument določa modul sintakse in semantike (SynSem) ogrodja za označevanje leksikonov (LMF), tj. metamodel za predstavljanje podatkov v enojezičnih in večjezičnih leksikalnih zbirkah podatkov, ki se uporabljajo z računalniškimi aplikacijami. Modul SynSem omogoča opis določenih skladenjskih in pomenskih lastnosti leksemov ter kompleksnih interakcij med njimi. Dejansko sintaktični del modula opisuje lastnosti leksema v kombinaciji z drugimi leksemi v stavku. Ko so te lastnosti zapisane v leksikon, sestavljajo skladenjski opis primerka leksikalnega vnosa. Po drugi strani pa semantični del modula opisuje pomen leksema in njegovo razmerje z drugimi pomeni v istem jeziku. Vmesnik SynSem opisuje predikate ter preslikavo med sintaktičnimi in semantičnimi argumenti.
Ta serializacija zajema razrede standardov ISO 24613-1 (jedrni model), ISO 24613-2 (model strojno berljivega slovarja (MRD)) in ISO 24613-4 (serializacija TEI).
General Information
- Status
- Published
- Publication Date
- 23-Apr-2024
- Technical Committee
- ISO/TC 37/SC 4 - Language resource management
- Drafting Committee
- ISO/TC 37/SC 4 - Language resource management
- Current Stage
- 6060 - International Standard published
- Start Date
- 24-Apr-2024
- Due Date
- 17-Sep-2024
- Completion Date
- 24-Apr-2024
Overview
ISO 24613-6:2024 - Language resource management - Lexical markup framework (LMF) - Part 6: Syntax and semantics specifies the SynSem (syntax and semantics) module of the Lexical Markup Framework (LMF). This ISO standard defines a UML-based metamodel for representing syntactic behaviours, subcategorization frames, senses and semantic predicates in monolingual and multilingual lexical databases. The serialization in this part covers classes from ISO 24613-1 (Core model), ISO 24613-2 (MRD model) and ISO 24613-4 (TEI serialization).
Key topics and technical requirements
- Scope and purpose: formalize how lexemes’ syntactic properties and semantic senses are modelled and linked in a lexicon intended for computational use (NLP, lexicography, language resources).
- Core modelling elements: standardized classes and relationships including:
- SyntacticBehaviour, SubcategorizationFrame, SyntacticArgument, SubcategorizationFrameSet
- SynArgMap for mapping arguments across related frames
- SenseRelation, SemanticPredicate, PredicativeRepresentation, SemanticArgument
- SynSemArgMap, SynSemCorrespondence, PredicateRelation, ArgumentRelation
- Syntax module: describes how a lexeme combines with other lexemes in sentences (valency, argument structure, ordered syntactic arguments, recursive argument structures).
- Semantics module: represents word senses, inter-sense relations and abstract semantic predicates that link senses (predicate-argument structures).
- Syntax–semantics interface: defines the mapping between syntactic arguments and semantic arguments (the SynSemArgMap), enabling predicate-argument alignment.
- Interoperability: intended to be compatible with LMF core and MRD models and with TEI serialization; allows lexicons to be extended while preserving a common core.
- Normative references: relies on ISO 24613-1 (Core model) and follows ISO editorial procedures.
Applications and users
- Natural language processing (NLP): machine translation, semantic role labeling, parsing, information extraction and question answering benefit from standardized lexicon formats.
- Lexicographers and language-resource developers: create interoperable machine-readable dictionaries and lexical databases with explicit syntactic/semantic annotations.
- Corpus linguists and computational linguists: encode valency patterns, alternations (e.g., anti-causatives), argument mappings and sense relations for cross-linguistic study.
- Software engineers and ontology/knowledge-base integrators: map lexical predicates to ontologies and link syntax to semantic representations for language-aware applications.
- Tooling and exchange: supports lexicon interchange, merging and reuse across projects and platforms that implement LMF/TEI serializations.
Related standards and notes
- Part of the ISO 24613 LMF family: see ISO 24613-1 (Core model), ISO 24613-2 (MRD model) and ISO 24613-4 (TEI serialization) for complementary models and serializations.
- Informative examples (e.g., French verb “aider”, English “boil” alternations) illustrate SynSem modelling in Annex A.
- ISO 24613-6:2024 is the first edition (published April 2024) and is extensible for project-specific needs while preserving interoperability.
ISO 24613-6:2024 - Language resource management — Lexical markup framework (LMF) — Part 6: Syntax and semantics Released:24. 04. 2024
ISO 24613-6:2024 - Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 6: Syntaxe et sémantique Released:5/8/2024
REDLINE ISO 24613-6:2024 - Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 6: Syntaxe et sémantique Released:5/8/2024
Frequently Asked Questions
ISO 24613-6:2024 is a standard published by the International Organization for Standardization (ISO). Its full title is "Language resource management — Lexical markup framework (LMF) — Part 6: Syntax and semantics". This standard covers: This document specifies the syntax and semantics (SynSem) module of the lexical markup framework (LMF), a metamodel for representing data in monolingual and multilingual lexical databases used with computer applications. The SynSem module allows for the description of specific syntactic and semantic properties of lexemes, as well as the complex interactions between them. More specifically, the syntax part of the module describes the properties of a lexeme when combined with other lexemes in a sentence. When recorded in a lexicon, these properties make up the syntactic description of a lexical entry instance. The semantics part of the module, on the other hand, describes the sense of a lexeme and its relationship with other senses belonging to the same language. The SynSem interface describes the predicates and the mapping between syntactic and semantic arguments. This serialization covers the classes of ISO 24613-1 (Core model), ISO 24613-2 (Machine-readable dictionary (MRD) model) and ISO 24613-4 (TEI serialization).
This document specifies the syntax and semantics (SynSem) module of the lexical markup framework (LMF), a metamodel for representing data in monolingual and multilingual lexical databases used with computer applications. The SynSem module allows for the description of specific syntactic and semantic properties of lexemes, as well as the complex interactions between them. More specifically, the syntax part of the module describes the properties of a lexeme when combined with other lexemes in a sentence. When recorded in a lexicon, these properties make up the syntactic description of a lexical entry instance. The semantics part of the module, on the other hand, describes the sense of a lexeme and its relationship with other senses belonging to the same language. The SynSem interface describes the predicates and the mapping between syntactic and semantic arguments. This serialization covers the classes of ISO 24613-1 (Core model), ISO 24613-2 (Machine-readable dictionary (MRD) model) and ISO 24613-4 (TEI serialization).
ISO 24613-6:2024 is classified under the following ICS (International Classification for Standards) categories: 01.020 - Terminology (principles and coordination). The ICS classification helps identify the subject area and facilitates finding related standards.
ISO 24613-6:2024 is available in PDF format for immediate download after purchase. The document can be added to your cart and obtained through the secure checkout process. Digital delivery ensures instant access to the complete standard document.
Standards Content (Sample)
SLOVENSKI STANDARD
01-november-2024
Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 6. del:
Sintaksa in semantika
Language resource management — Lexical markup framework (LMF) — Part 6: Syntax
and semantics
Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 6:
Syntaxe et sémantique
Ta slovenski standard je istoveten z: ISO 24613-6:2024
ICS:
01.020 Terminologija (načela in Terminology (principles and
koordinacija) coordination)
01.140.20 Informacijske vede Information sciences
35.240.30 Uporabniške rešitve IT v IT applications in information,
informatiki, dokumentiranju in documentation and
založništvu publishing
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.
International
Standard
ISO 24613-6
First edition
Language resource management —
2024-04
Lexical markup framework (LMF) —
Part 6:
Syntax and semantics
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 6: Syntaxe et sémantique
Reference number
© ISO 2024
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii
Contents Page
Foreword .iv
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Description of the syntax and semantics module (SynSem) model . 2
4.1 General principles of the SynSem model .2
4.2 Class description .4
4.2.1 SyntacticBehaviour class .4
4.2.2 SubcategorizationFrame class .4
4.2.3 SyntacticArgument class.4
4.2.4 SubcategorizationFrameSet class .5
4.2.5 SynArgMap class.5
4.2.6 SenseRelation class .5
4.2.7 SemanticPredicate class .5
4.2.8 PredicativeRepresentation class.5
4.2.9 SemanticArgument class .6
4.2.10 ArgumentRelation class .6
4.2.11 SynSemArgMap class .6
4.2.12 SynSemCorrespondence class .6
4.2.13 PredicateRelation class .6
Annex A (informative) Syntax-semantics examples . 7
Bibliography .11
iii
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out through
ISO technical committees. Each member body interested in a subject for which a technical committee
has been established has the right to be represented on that committee. International organizations,
governmental and non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely
with the International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types
of ISO document should be noted. This document was drafted in accordance with the editorial rules of the
ISO/IEC Directives, Part 2 (see www.iso.org/directives).
ISO draws attention to the possibility that the implementation of this document may involve the use of (a)
patent(s). ISO takes no position concerning the evidence, validity or applicability of any claimed patent
rights in respect thereof. As of the date of publication of this document, ISO had not received notice of (a)
patent(s) which may be required to implement this document. However, implementers are cautioned that
this may not represent the latest information, which may be obtained from the patent database available at
www.iso.org/patents. ISO shall not be held responsible for identifying any or all such patent rights.
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions
related to conformity assessment, as well as information about ISO’s adherence to the World Trade
Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www.iso.org/iso/foreword.html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology, Subcommittee
SC 4, Language resource management.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www.iso.org/members.html.
iv
International Standard ISO 24613-6:2024(en)
Language resource management — Lexical markup
framework (LMF) —
Part 6:
Syntax and semantics
1 Scope
This document specifies the syntax and semantics (SynSem) module of the lexical markup framework (LMF),
a metamodel for representing data in monolingual and multilingual lexical databases used with computer
applications. The SynSem module allows for the description of specific syntactic and semantic properties of
lexemes, as well as the complex interactions between them. More specifically, the syntax part of the module
describes the properties of a lexeme when combined with other lexemes in a sentence. When recorded in a
lexicon, these properties make up the syntactic description of a lexical entry instance. The semantics part
of the module, on the other hand, describes the sense of a lexeme and its relationship with other senses
belonging to the same language. The SynSem interface describes the predicates and the mapping between
syntactic and semantic arguments.
This serialization covers the classes of ISO 24613-1 (Core model), ISO 24613-2 (Machine-readable dictionary
(MRD) model) and ISO 24613-4 (TEI serialization).
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes
requirements of this document. For dated references, only the edition cited applies. For undated references,
the latest edition of the referenced document (including any amendments) applies.
ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 24613-1 and the following apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at https:// www .electropedia .org/
3.1
syntactic behaviour
one of the possible alternations that a lexeme can show, at the syntactic level
EXAMPLE A verb can have different types of syntactic behaviours for subcategorization frame (3.2) alternations,
such as the active voice, the passive voice, reflexive, etc.
[9][12]
Note 1 to entry: A syntactic behaviour is described in terms of subcategorization frames.
3.2
subcategorization frame
valence
valency
set of restrictions on a lexeme indicating the properties of the syntactic arguments (3.4) that can or must
occur with this given lexeme
3.3
semantic predicate
formal semantic unit that represents a semantic relation between one or more semantic arguments (3.5) in
a predicate-argument structure
[SOURCE: ISO 24617-4:2014, 2.1.2, modified — term “predicate” replaced by “semantic predicate”.
“argument” replaced by “semantic argument” within definition. Note 1 to entry deleted.]
3.4
syntactic argument
one of the essential and functional constituents in a clause that identifies the participants in the process
referred to by a lexeme
EXAMPLE Alfred (syntactic argument) reads a book (syntactic argument) today (adjunct).
3.5
semantic argument
formal semantic unit that is an essential constituent of a predicate-argument structure and can have variable
instantiations depending on the utterance
[SOURCE: ISO 24617-4:2014, 2.1.1, modified — term “argument” replaced by “semantic argument”. Notes to
entry deleted.]
4 Description of the syntax and semantics module (SynSem) model
4.1 General principles of the SynSem model
The modelling of the syntactic and semantic properties of lexicons can differ considerably from lexicon to
lexicon, due to different linguistic theories.
[2]
The present modelling of syntax and semantics builds on the previous one, given in ISO 24613:2008 ,
which contained two sub-modules for syntax and semantics. In ISO 24613:2008, experts identified a
nucleus of elements that are sufficiently generic to constitute a common ground. The ISO 24613:2008
syntactic and semantics models were the basis for other modelling of the syntax/semantics interface
...
International
Standard
ISO 24613-6
First edition
Language resource management —
2024-04
Lexical markup framework (LMF) —
Part 6:
Syntax and semantics
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 6: Syntaxe et sémantique
Reference number
© ISO 2024
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii
Contents Page
Foreword .iv
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Description of the syntax and semantics module (SynSem) model . 2
4.1 General principles of the SynSem model .2
4.2 Class description .4
4.2.1 SyntacticBehaviour class .4
4.2.2 SubcategorizationFrame class .4
4.2.3 SyntacticArgument class.4
4.2.4 SubcategorizationFrameSet class .5
4.2.5 SynArgMap class.5
4.2.6 SenseRelation class .5
4.2.7 SemanticPredicate class .5
4.2.8 PredicativeRepresentation class.5
4.2.9 SemanticArgument class .6
4.2.10 ArgumentRelation class .6
4.2.11 SynSemArgMap class .6
4.2.12 SynSemCorrespondence class .6
4.2.13 PredicateRelation class .6
Annex A (informative) Syntax-semantics examples . 7
Bibliography .11
iii
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out through
ISO technical committees. Each member body interested in a subject for which a technical committee
has been established has the right to be represented on that committee. International organizations,
governmental and non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely
with the International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types
of ISO document should be noted. This document was drafted in accordance with the editorial rules of the
ISO/IEC Directives, Part 2 (see www.iso.org/directives).
ISO draws attention to the possibility that the implementation of this document may involve the use of (a)
patent(s). ISO takes no position concerning the evidence, validity or applicability of any claimed patent
rights in respect thereof. As of the date of publication of this document, ISO had not received notice of (a)
patent(s) which may be required to implement this document. However, implementers are cautioned that
this may not represent the latest information, which may be obtained from the patent database available at
www.iso.org/patents. ISO shall not be held responsible for identifying any or all such patent rights.
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions
related to conformity assessment, as well as information about ISO’s adherence to the World Trade
Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www.iso.org/iso/foreword.html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology, Subcommittee
SC 4, Language resource management.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www.iso.org/members.html.
iv
International Standard ISO 24613-6:2024(en)
Language resource management — Lexical markup
framework (LMF) —
Part 6:
Syntax and semantics
1 Scope
This document specifies the syntax and semantics (SynSem) module of the lexical markup framework (LMF),
a metamodel for representing data in monolingual and multilingual lexical databases used with computer
applications. The SynSem module allows for the description of specific syntactic and semantic properties of
lexemes, as well as the complex interactions between them. More specifically, the syntax part of the module
describes the properties of a lexeme when combined with other lexemes in a sentence. When recorded in a
lexicon, these properties make up the syntactic description of a lexical entry instance. The semantics part
of the module, on the other hand, describes the sense of a lexeme and its relationship with other senses
belonging to the same language. The SynSem interface describes the predicates and the mapping between
syntactic and semantic arguments.
This serialization covers the classes of ISO 24613-1 (Core model), ISO 24613-2 (Machine-readable dictionary
(MRD) model) and ISO 24613-4 (TEI serialization).
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes
requirements of this document. For dated references, only the edition cited applies. For undated references,
the latest edition of the referenced document (including any amendments) applies.
ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 24613-1 and the following apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at https:// www .electropedia .org/
3.1
syntactic behaviour
one of the possible alternations that a lexeme can show, at the syntactic level
EXAMPLE A verb can have different types of syntactic behaviours for subcategorization frame (3.2) alternations,
such as the active voice, the passive voice, reflexive, etc.
[9][12]
Note 1 to entry: A syntactic behaviour is described in terms of subcategorization frames.
3.2
subcategorization frame
valence
valency
set of restrictions on a lexeme indicating the properties of the syntactic arguments (3.4) that can or must
occur with this given lexeme
3.3
semantic predicate
formal semantic unit that represents a semantic relation between one or more semantic arguments (3.5) in
a predicate-argument structure
[SOURCE: ISO 24617-4:2014, 2.1.2, modified — term “predicate” replaced by “semantic predicate”.
“argument” replaced by “semantic argument” within definition. Note 1 to entry deleted.]
3.4
syntactic argument
one of the essential and functional constituents in a clause that identifies the participants in the process
referred to by a lexeme
EXAMPLE Alfred (syntactic argument) reads a book (syntactic argument) today (adjunct).
3.5
semantic argument
formal semantic unit that is an essential constituent of a predicate-argument structure and can have variable
instantiations depending on the utterance
[SOURCE: ISO 24617-4:2014, 2.1.1, modified — term “argument” replaced by “semantic argument”. Notes to
entry deleted.]
4 Description of the syntax and semantics module (SynSem) model
4.1 General principles of the SynSem model
The modelling of the syntactic and semantic properties of lexicons can differ considerably from lexicon to
lexicon, due to different linguistic theories.
[2]
The present modelling of syntax and semantics builds on the previous one, given in ISO 24613:2008 ,
which contained two sub-modules for syntax and semantics. In ISO 24613:2008, experts identified a
nucleus of elements that are sufficiently generic to constitute a common ground. The ISO 24613:2008
syntactic and semantics models were the basis for other modelling of the syntax/semantics interface, such
[13]
as the W3C Ontolex “Syntax and Semantics Module”. For these reasons, the overall structure of the
[11] [8]
previous model, which was used in various projects such as the PAROLE and SIMPLE projects, was
not changed in this document, but some simplifications/modifications were introduced. In particular, the
previous semantic module contained elements that were entirely dedicated to the modelling of WordNet-
like lexicons, introducing a Synset class. This is judged to be unnecessary in this document sinc
...
Norme
internationale
ISO 24613-6
Première édition
Gestion des ressources
2024-04
linguistiques — Cadre de balisage
lexical (LMF) —
Partie 6:
Syntaxe et sémantique
Language resource management — Lexical markup
framework (LMF) —
Part 6: Syntax and semantics
Numéro de référence
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2024
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii
Sommaire Page
Avant-propos .iv
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Description du module syntaxe et sémantique – modèle (SynSem) . 2
4.1 Principes généraux du modèle SynSem .2
4.2 Description des classes .4
4.2.1 Classe SyntacticBehaviour .4
4.2.2 Classe SubcategorizationFrame .4
4.2.3 Classe SyntacticArgument .4
4.2.4 Classe SubcategorizationFrameSet .5
4.2.5 Classe SynArgMap .5
4.2.6 Classe SenseRelation .5
4.2.7 Classe SemanticPredicate .5
4.2.8 Classe PredicativeRepresentation .5
4.2.9 Classe SemanticArgument .6
4.2.10 Classe ArgumentRelation .6
4.2.11 Classe SynSemArgMap .6
4.2.12 Classe SynSemCorrespondence . .6
4.2.13 Classe PredicateRelation .6
Annexe A (informative) Exemples de syntaxe-sémantique . 7
Bibliographie .11
iii
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes nationaux
de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est en général
confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude a le droit de faire
partie du comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l’ISO participent également aux travaux. L’ISO collabore étroitement avec
la Commission électrotechnique internationale (IEC) en ce qui concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a
été rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir
www.iso.org/directives).
L’ISO attire l’attention sur le fait que la mise en application du présent document peut entraîner l’utilisation
d’un ou de plusieurs brevets. L’ISO ne prend pas position quant à la preuve, à la validité et à l’applicabilité de
tout droit de brevet revendiqué à cet égard. À la date de publication du présent document, l’ISO n’avait pas
reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires à sa mise en application. Toutefois,
il y a lieu d’avertir les responsables de la mise en application du présent document que des informations
plus récentes sont susceptibles de figurer dans la base de données de brevets, disponible à l’adresse
www.iso.org/brevets. L’ISO ne saurait être tenue pour responsable de ne pas avoir identifié tout ou partie de
tels droits de propriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de
l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au
commerce (OTC), voir www.iso.org/avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie, sous-comité
SC 4, Gestion des ressources linguistiques.
Une liste de toutes les parties de la série ISO 24613 se trouve sur le site web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve à l’adresse www.iso.org/fr/members.html.
iv
Norme internationale ISO 24613-6:2024(fr)
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 6:
Syntaxe et sémantique
1 Domaine d’application
Le présent document spécifie le module syntaxe et sémantique (SynSem) du cadre de balisage lexical (LMF),
un métamodèle permettant de représenter les données dans des bases de données lexicales monolingues
et multilingues utilisées avec des applications informatiques. Le module SynSem permet de décrire les
propriétés syntaxiques et sémantiques spécifiques des lexèmes, ainsi que les interactions complexes entre
ces derniers. Plus précisément, la partie syntaxique du module décrit les propriétés d’un lexème lorsqu’il
est combiné avec d’autres lexèmes dans une phrase. Lorsqu’elles sont enregistrées dans un lexique, ces
propriétés constituent la description syntaxique d’une entrée lexicale. La partie sémantique du module,
quant à elle, décrit le sens d’un lexème et sa relation avec les autres sens appartenant à la même langue.
L’interface SynSem décrit les prédicats et la correspondance entre les arguments syntaxiques et sémantiques.
Cette sérialisation couvre les classes de l’ISO 24613-1 (modèle de base), de l’ISO 24613-2 (modèle de
dictionnaire lisible par ordinateur (MRD)) et de l’ISO 24613-4 (sérialisation TEI).
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour
les références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO 24613-1, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 1: Modèle de base
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO 24613-1 ainsi que les suivants
s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp
— IEC Electropedia: disponible à l’adresse https:// www .electropedia .org/
3.1
comportement syntaxique
une des alternances possibles qu’un lexème peut présenter, au niveau syntaxique
EXEMPLE Un verbe peut avoir différents types de comportements syntaxiques selon les alternances du cadre de
sous-catégorisation (3.2), comme la voix active, la voix passive, le réfléchi, etc.
[9][12]
Note 1 à l'article: Un comportement syntaxique est décrit en termes de cadres de sous-catégorisation .
3.2
cadre de sous-catégorisation
valence
ensemble de restrictions sur un lexème indiquant les propriétés des arguments syntaxiques (3.4) qui peuvent
ou doivent apparaître avec ce lexème
3.3
prédicat sémantique
unité sémantique formelle qui représente une relation sémantique entre un ou plusieurs arguments
sémantiques (3.5) dans une structure prédicat-argument
[SOURCE: ISO 24617-4:2014, 2.1.2, modifié – Le terme «prédicat» a été remplacé par «prédicat sémantique»;
«argument» a été remplacé par «argument sémantique» dans la définition. La Note 1 à l’article a été
supprimée.]
3.4
argument syntaxique
un des constituants essentiels et fonctionnels d’une clause qui identifie les participants au processus auquel
se réfère un lexème
EXEMPLE Alfred (argument syntaxique) lit un livre (argument syntaxique) aujourd’hui (circonstant).
3.5
argument sémantique
unité sémantique formelle qui est un constituant essentiel d’une structure prédicat-argument et qui peut
avoir des instanciations variables selon l’énoncé
[SOURCE: ISO 24617-4:2014, 2.1.1, modifié – Le terme «argument» a été remplacé par «argument
sémantique». Les Notes à l’article ont été supprimées.]
4 Description du module syntaxe et sémantique – modèle (SynSem)
4.1 Principes généraux du modèle SynSem
La modélisation des propriétés syntaxiques et sémantiques des lexiques peut varier considérablement d’un
lexique à l’autre, en raison de théories linguistiques différentes.
La présente modélisation de la syntaxe et de la sémantique s’appuie sur la précédente, donnée
[2]
dans l’ISO 24613:2008 , qui contenait deux sous-modules pour la syntaxe et la sémantique. Dans
l’ISO 24613:2008, les experts ont identifié un noyau d’éléments suffisamment génériques pour constituer un
terrain commun. Les modèles syntaxiques et sémantiques de l’ISO 24613:2008 ont servi de base à d’autres
modélisations de l’interface syntaxe/sémantique, telles que le module «Syntaxe et Sémantique Ontolex
[13]
du W3C» . Pour ces raisons, la structure globale du modèle précédent, qui a été utilisée dans différents
[11] [8]
projets tels que les projets PAROLE et SIMPLE , n’a pas été modifiée dans le présent document, mais
certaines simplifications/modifications ont été apportées. En particulier, le module sémantique précédent
contenait des éléments entièrement dédiés à la modélisation des lexiques de type WordNet, en introduisant
une classe Synset. Cette classe est jugée inutile dans le présent document puisque les classes Sense et
SenseRelation peuvent être utilisées à la place. Une autre différence par rapport à l’ISO 24613:2008 est
...
ISO /TC 37/SC 4
Date : 2024-03-01
ISO/TC 37/SC 4
Secrétariat : KATS
Première édition
2024-04
Date: 2024-04-22
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 6 : :
Syntaxe et sémantique
Language resource management — Lexical markup framework (LMF) —
Part 6: Syntax and semantics
ICS : 01.020
Type du document: Norme internationale
Sous-type du document:
Stade du document: (60) Publication
Langue du document: F
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© © ISO 2024
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvreoeuvre, aucune partie
de cette publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique
ou mécanique, y compris la photocopie, ou la diffusion sur l'internetl’internet ou sur un intranet, sans autorisation écrite
préalable. Une autorisation peut être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du
demandeur.
ISO Copyright Officecopyright office
Case PostaleCP 401 • • Ch. de Blandonnet 8
CH-1214 Vernier, GenèveGeneva
Tél. : Phone: + 41 22 749 01 11
E-mail : : copyright@iso.org
Web : Website: www.iso.org
Publié en Suisse
ii
Sommaire Page
Avant-propos . iv
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Description du module syntaxe et sémantique – modèle (SynSem) . 2
4.1 Principes généraux du modèle SynSem . 2
4.2 Description des classes . 4
4.2.1 Classe SyntacticBehaviour . 4
4.2.2 Classe SubcategorizationFrame . 4
4.2.3 Classe SyntacticArgument . 5
4.2.4 Classe SubcategorizationFrameSet . 5
4.2.5 Classe SynArgMap . 5
4.2.6 Classe SenseRelation . 5
4.2.7 Classe SemanticPredicate . 5
4.2.8 Classe PredicativeRepresentation . 5
4.2.9 Classe SemanticArgument . 6
4.2.10 Classe ArgumentRelation . 6
4.2.11 Classe SynSemArgMap . 6
4.2.12 Classe SynSemCorrespondence . 6
4.2.13 Classe PredicateRelation . 6
Annex A (informative) Exemples de syntaxe-sémantique . 7
A.1 Illustration du modèle complet . 7
A.2 Exemple partiel. 9
A.3 Utilisation de SubcategorizationFrameSet . 11
A.4 Exemples de modélisation et sérialisation TEI-XML du modèle . 12
Bibliographie . 13
iii
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes nationaux de
normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est en général confiée
aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du
comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l’ISO participent également aux travaux. L’ISO collabore étroitement avec
la Commission électrotechnique internationale (IEC) en ce qui concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont décrites
dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents critères
d’approbation requis pour les différents types de documents ISO. Le présent document a été rédigé
conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir
www.iso.org/directives).
L’ISO attire l’attention sur le fait que la mise en application du présent document peut entraîner l’utilisation
d’un ou de plusieurs brevets. L’ISO ne prend pas position quant à la preuve, à la validité et à l’applicabilité de
tout droit de propriétébrevet revendiqué à cet égard. À la date de publication du présent document, l’ISO
n’avait pas reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires à sa mise en application.
Toutefois, il y a lieu d’avertir les responsables de la mise en application du présent document que des
informations plus récentes sont susceptibles de figurer dans la base de données de brevets, disponible à
l’adresse www.iso.org/brevets. L’ISO ne saurait être tenue pour responsable de ne pas avoir identifié tout ou
partie de tels droits de brevetpropriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions spécifiques
de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de l’ISO aux
principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au commerce
(OTC), voir www.iso.org/avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie, sous-comité
SC 4, Gestion des ressources linguistiques.
Une liste de toutes les parties de la série ISO 24613 se trouve sur le site web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve à l’adresse www.iso.org/fr/members.html.
iv
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 6:
Syntaxe et sémantique
1 Domaine d’application
Le présent document spécifie le module syntaxe et sémantique (SynSem) du cadre de balisage lexical (LMF),
un métamodèle permettant de représenter les données dans des bases de données lexicales monolingues et
multilingues utilisées avec des applications informatiques. Le module SynSem permet de décrire les
propriétés syntaxiques et sémantiques spécifiques des lexèmes, ainsi que les interactions complexes entre ces
derniers. Plus précisément, la partie syntaxique du module décrit les propriétés d’un lexème lorsqu’il est
combiné avec d’autres lexèmes dans une phrase. Lorsqu’elles sont enregistrées dans un lexique, ces propriétés
constituent la description syntaxique d’une entrée lexicale. La partie sémantique du module, quant à elle,
décrit le sens d’un lexème et sa relation avec les autres sens appartenant à la même langue. L’interface SynSem
décrit les prédicats et la correspondance entre les arguments syntaxiques et sémantiques.
Cette sérialisation couvre les classes de l’ISO 24613-1 (modèle de base), de l’ISO 24613-2 (modèle de
dictionnaire lisible par ordinateur (MRD)) et de l’ISO 24613-4 (sérialisation TEI).
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur contenu,
des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour les
références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO 24613-1, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 1 : : Modèle de
base.
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions donnés dansde l’ISO 24613-1 ainsi que les
suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https://www.iso.org/obp
— IEC Electropedia: disponible à l’adresse https://www.electropedia.org/
3.1
comportement syntaxique
une des alternances possibles qu’un lexème peut présenter, au niveau syntaxique
EXEMPLE Un verbe peut avoir différents types de comportements syntaxiques selon les alternances du cadre de
sous-catégorisation (3.2), comme la voix active, la voix passive, le réfléchi, etc.
[9][12]
Note 1 à l'article: Un comportement syntaxique est décrit en termes de cadres de sous-catégorisation .
Type du document: Norme internationale
Sous-type du document:
Stade du document: (60) Publication
Langue du document: F
3.2
cadre de sous-catégorisation
valence
ensemble de restrictions sur un lexème indiquant les propriétés des arguments syntaxiques (3.4) qui peuvent
ou doivent apparaître avec ce lexème
3.3
prédicat sémantique
unité sémantique formelle qui représente une relation sémantique entre un ou plusieurs arguments
sémantiques (3.5) dans une structure prédicat-argument
[SOURCE: ISO 24617-4:2014, 2.1.2, modifié – Le terme «prédicat» a été remplacé par «prédicat sémantique»;
«argument» a été remplacé par «argument sémantique» dans la définition. La Note 1 à l’article a été
supprimée.]
3.4
argument syntaxique
un des constituants essentiels et fonctionnels d’une clause qui identifie les participants au processus auquel
se réfère un lexème
EXEMPLE Alfred (argument syntaxique) lit un livre (argument syntaxique) aujourd’hui (circonstant).
3.5
argument sémantique
unité sémantique formelle qui est un constituant essentiel d’une structure prédicat-argument et qui peut avoir
des instanciations variables selon l’énoncé
[SOURCE: ISO 24617-4:2014, 2.1.1, modifié – Le terme «argument» a été remplacé par «argument
sémantique». Les Notes à l’article ont été supprimées.]
4 Description du module syntaxe et sémantique – modèle (SynSem)
4.1 Principes généraux du modèle SynSem
La modélisation des propriétés syntaxiques et sémantiques des lexiques peut varier considérablement d’un
lexique à l’autre, en raison de théories linguistiques différentes.
La présente modélisation de la syntaxe et de la sémantique s’appuie sur la précédente, donnée
[2]
dans l’ISO 24613:2008 , qui contenait deux sous-modules pour la syntaxe et la sémantique. Dans
l’ISO 24613:2008, les experts ont identifié un noyau d’éléments suffisamment génériques pour constituer un
terrain commun. Les modèles syntaxiques et sémantiques de l’ISO 24613:2008 ont servi de base à d’autres
modélisations de l’interface syntaxe/sémantique, telles que le module «Syntaxe et Sémantique Ontolex du
[13]
W3C» . Pour ces raisons, la structure globale du modèle précédent, qui a été utilisée dans différents projets
[11] [8]
tels que les projets PAROLE et SIMPLE , n’a pas été modifiée dans le présent document, mais certaines
simplifications/modifications ont été apportées. En particulier, le module sémantique précédent contenait des
éléments entièrement dédiés à la modélisation des lexiques de type WordNet, en introduisant une classe
Synset. Cette classe est jugée inutile dans le présent document puisque les classes Sense et SenseRelation
peuvent être utilisées à la place. Une autre différence par rapport à l’ISO 24613:2008 est l’absence d’une classe
fea
...
















Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.
Loading comments...