Language resource management — Semantic annotation framework (SemAF) — Part 12: Quantification

This document specifies a markup language called QuantML for annotating and representing semantic phenomena relating to quantification in natural language. QuantML comprises an extensible markup language (XML)-based representation format, an abstract syntax and a semantics.

Gestion des ressources linguistiques — Cadre d’annotation sémantique (SemAF) — Partie 12: Quantification

Le présent document spécifie un langage de balisage appelé QuantML pour l’annotation et la représentation de phénomènes sémantiques associés à une quantification en langage naturel. QuantML comprend un format de représentation basé sur le langage de balisage extensible (XML), une syntaxe abstraite et une sémantique.

Upravljanje jezikovnih virov - Ogrodje za semantično označevanje (SemAF) - 12. del: Kvantifikacija

General Information

Status
Published
Publication Date
07-Jan-2025
Current Stage
6060 - International Standard published
Start Date
08-Jan-2025
Due Date
08-Jan-2025
Completion Date
08-Jan-2025

Buy Standard

Standard
ISO 24617-12:2025 - Language resource management — Semantic annotation framework (SemAF) — Part 12: Quantification Released:8. 01. 2025
English language
43 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 24617-12:2025 - Gestion des ressources linguistiques — Cadre d’annotation sémantique (SemAF) — Partie 12: Quantification Released:8. 01. 2025
French language
46 pages
sale 15% off
Preview
sale 15% off
Preview

Standards Content (Sample)


International
Standard
ISO 24617-12
First edition
Language resource management —
2025-01
Semantic annotation framework
(SemAF) —
Part 12:
Quantification
Gestion des ressources linguistiques — Cadre d’annotation
sémantique (SemAF) —
Partie 12: Quantification
Reference number
© ISO 2025
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii
Contents Page
Foreword .iv
Introduction .v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Background . 3
5 Basic concepts . 5
5.1 Aspects of quantification in natural language and their annotation . .5
5.2 Quantification domains .6
5.3 Determinacy .7
5.4 Distributivity .7
5.5 Involvement, size and exhaustiveness.8
5.6 Individuation .9
5.7 Argument roles .9
5.8 Polarity and modality . .9
5.9 Participant scope .9
5.10 Event scope .10
5.11 Repetitiveness .10
5.12 Modifiers — Restrictiveness and linking .10
5.13 Genericity .11
6 QuantML specification .12
6.1 Abstract syntax . 12
6.1.1 General . 12
6.1.2 Conceptual inventory . 12
6.1.3 Entity structures . 13
6.1.4 Link structures . 13
6.2 Concrete syntax — A reference representation format .14
6.2.1 Representation formats .14
6.2.2 Entity structure representations .14
6.2.3 Link structure representations . 15
6.3 Semantics . 15
Annex A (informative) Annotation guidelines . 17
Annex B (informative) QuantML semantics .24
Annex C (informative) Example annotations with semantic interpretations .34
Bibliography .42

iii
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out through
ISO technical committees. Each member body interested in a subject for which a technical committee
has been established has the right to be represented on that committee. International organizations,
governmental and non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely
with the International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types
of ISO document should be noted. This document was drafted in accordance with the editorial rules of the
ISO/IEC Directives, Part 2 (see www.iso.org/directives).
ISO draws attention to the possibility that the implementation of this document may involve the use of (a)
patent(s). ISO takes no position concerning the evidence, validity or applicability of any claimed patent
rights in respect thereof. As of the date of publication of this document, ISO had not received notice of (a)
patent(s) which may be required to implement this document. However, implementers are cautioned that
this may not represent the latest information, which may be obtained from the patent database available at
www.iso.org/patents. ISO shall not be held responsible for identifying any or all such patent rights.
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions
related to conformity assessment, as well as information about ISO's adherence to the World Trade
Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www.iso.org/iso/foreword.html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology, Subcommittee
SC 4, Language resource management.
A list of all parts in the ISO 24617 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www.iso.org/members.html.

iv
Introduction
This document is an addition to the ISO 24617 series of standards for annotating various types of semantic
phenomena in natural language. Quantification phenomena are particularly important since quantifications
occur in every sentence in every language, except in trivial sentences such as “It is raining” in English, “det
regner” in Danish or “Llueve” in Spanish. Quantification phenomena are an essential component for the
understanding of spoken and textual language and multimodal messages. Annotating such phenomena in
an interoperable way improves the re-usability of language resources as a basis for understanding-based
applications of language technology, such as factually and contextually reliable information extraction and
question answering in human-computer dialogue.
The content of this document builds on earlier studies of aspects and annotation of quantification
phenomena, in particular References [3] and [5]. Based on these and other previous studies, this document
specifies an annotation scheme with a markup language, called QuantML, which allows a synthesized way of
treating a range of quantification phenomena.
This document provides support for the annotation of quantification phenomena in accordance with the
principles of semantic annotation laid down in ISO 24617-6, and in a way that is consistent with existing
and developing standards for the annotation of semantic information within the ISO semantic annotation
framework (SemAF, the ISO 24617 series).
NOTE The explanatory repository of annotated quantification phenomena in the Quantification Bank (see
Reference [37]), maintained at Tilburg University, provides background information about the basic concepts in
quantification annotation, plus a collection of annotated examples.

v
International Standard ISO 24617-12:2025(en)
Language resource management — Semantic annotation
framework (SemAF) —
Part 12:
Quantification
1 Scope
This document specifies a markup language called QuantML for annotating and representing semantic
phenomena relating to quantification in natural language. QuantML comprises an extensible markup
language (XML)-based representation format, an abstract syntax and a semantics.
2 Normative references
There are no normative references in this document.
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at https:// www .electropedia .org/
3.1
definiteness
language-dependent morphosyntactic feature of a noun phrase (NP) (3.12), marked in English and other
European languages by a definite or indefinite article or a nominal suffix, by a demonstrative, or by a
possessive expression
Note 1 to entry: The definiteness feature has two possible values: “definite” and “indefinite”. Being definite is often
regarded as an indication of determinacy, indefinite as an indication of indeterminacy.
Note 2 to entry: In some languages it is only possible to express that a NP is definite (NPs are by default indefinite) or
to express that an NP is indefinite (NPs are by default definite).
EXAMPLE al (definite article in Arabic languages), -e (suffix as definite article in Farsi), el/la (definite article
in Spanish), a/az (definite article in Hungarian, there is no indefinite article), yī (occasionally indefinite article in
Chinese; there is no definite article and the definiteness is definite unless an indefinite article or the context indicates
otherwise).
Note 3 to entry: For overviews of definite expressions, see Refer
...


Norme
internationale
ISO 24617-12
Première édition
Gestion des ressources
2025-01
linguistiques — Cadre d’annotation
sémantique (SemAF) —
Partie 12:
Quantification
Language resource management — Semantic annotation
framework (SemAF) —
Part 12: Quantification
Numéro de référence
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2025
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii
Sommaire Page
Avant-propos .iv
Introduction .v
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Contexte . . 3
5 Concepts de base . 5
5.1 Aspects de la quantification en langage naturel et leur annotation .5
5.2 Domaines de quantification .6
5.3 Détermination .7
5.4 Distributivité . .7
5.5 Implication, taille et exhaustivité .8
5.6 Individuation .9
5.7 Rôles d’argument .9
5.8 Polarité et modalité .10
5.9 Périmètre de participant .10
5.10 Périmètre d’événement .10
5.11 Répétitivité .11
5.12 Modificateurs — Caractère restrictif et lien .11
5.13 Généricité . 12
6 Spécification QuantML .12
6.1 QuantML . 12
6.1.1 Généralités . 12
6.1.2 Inventaire conceptuel . 13
6.1.3 Structures d’entité .14
6.1.4 Structures de lien .14
6.2 Syntaxe concrète — Un format de représentation de référence . 15
6.2.1 Formats de représentation . 15
6.2.2 Représentations des structures d’entité . 15
6.2.3 Représentations des structures de lien .16
6.3 Sémantique .16
Annexe A (informative) Lignes directrices pour l’annotation .18
Annexe B (informative) Sémantique QuantML .25
Annexe C (informative) Exemples d’annotations avec interprétations sémantiques .37
Bibliographie .45

iii
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes nationaux
de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est en général
confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude a le droit de faire
partie du comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l’ISO participent également aux travaux. L’ISO collabore étroitement avec
la Commission électrotechnique internationale (IEC) en ce qui concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a
été rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir
www.iso.org/directives).
L’ISO attire l’attention sur le fait que la mise en application du présent document peut entraîner l’utilisation
d’un ou de plusieurs brevets. L’ISO ne prend pas position quant à la preuve, à la validité et à l’applicabilité de
tout droit de brevet revendiqué à cet égard. À la date de publication du présent document, l’ISO n’avait pas
reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires à sa mise en application. Toutefois,
il y a lieu d’avertir les responsables de la mise en application du présent document que des informations
plus récentes sont susceptibles de figurer dans la base de données de brevets, disponible à l’adresse
www.iso.org/brevets. L’ISO ne saurait être tenue pour responsable de ne pas avoir identifié tout ou partie de
tels droits de propriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de
l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au
commerce (OTC), voir www.iso.org/avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie, sous-
comité SC 4, Gestion des ressources linguistiques.
Une liste de toutes les parties de la série ISO 24617 se trouve sur le site web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve à l’adresse www.iso.org/fr/members.html.

iv
Introduction
Le présent document est un ajout à la série de normes ISO 24617 pour l’annotation de divers types de
phénomènes sémantiques en langage naturel. Les phénomènes de quantification sont particulièrement
importants car les quantifications interviennent dans toutes les phrases dans toutes les langues, sauf dans
les phrases banales telles que «It is raining» en anglais, «det regner» en danois ou «Llueve» en espagnol.
Les phénomènes de quantification sont une composante essentielle à la compréhension du langage écrit ou
oral et des messages multimodaux. L’annotation de ces phénomènes d’une manière interopérable améliore
la réutilisabilité des ressources linguistiques servant de base aux applications de technologie linguistique
fondées sur la compréhension, telles que l’extraction d’informations factuellement et contextuellement
fiables et les réponses à des questions dans un dialogue homme‑machine.
Le contenu du présent document s’appuie sur des études antérieures concernant les aspects et l’annotation
des phénomènes de quantification, en particulier sur les Références [3] et [5]. Sur la base de ces études
et d’autres études antérieures, le présent document spécifie un schéma d’annotation avec un langage de
balisage, appelé QuantML, qui permet de fournir une méthode simple pour traiter un éventail de phénomènes
de quantification.
Le présent document fournit un support pour l’annotation des phénomènes de quantification conformément
aux principes d’annotation sémantique définis dans l’ISO 24617‑6, et d’une manière cohérente avec les
normes existantes et en développement pour l’annotation des informations sémantiques dans le cadre
d’annotation sémantique ISO (SemAF, la série ISO 24617).
NOTE Le référentiel explicatif de phénomènes de quantification annotés dans la Quantification Bank
(voir la Référence [37]), conservé à l’Université de Tilburg, fournit des informations contextuelles sur les concepts de
base de l’annotation de quantification ainsi qu’une collection d’exemples annotés.

v
Norme internationale ISO 24617-12:2025(fr)
Gestion des ressources linguistiques — Cadre d’annotation
sémantique (SemAF) —
Partie 12:
Quantification
1 Domaine d’application
Le présent document spécifie un langage de balisage appelé QuantML pour l’annotation et la représentation
de phénomènes sémantiques associés à une quantification en langage naturel. QuantML comprend un format
de représentation basé sur le langage de balisage extensible (XML), une syntaxe abstraite et une sémantique.
2 Références normatives
Le présent document ne contient aucune référence normative.
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp
— IEC Electropedia: disponible à l’adresse https:// www .electropedia .org/
3.1
définitude
caractéristique morphosyntaxique d’un groupe nominal (GN) (3.12) qui dépend de la langue, indiqué en
anglais et dans d’autres langues européennes par un article défini ou indéfini ou un suffixe nominal, ou par
une expression démonstrative ou possessive
Note 1 à l'article: La caractéristique définitude a deux valeurs po
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.