Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 3: Data quality management requirements and guidelines

This document specifies requirements and provides guidance for establishing, implementing, maintaining and continually improving the quality of data used in the areas of analytics and machine learning. This document does not define a detailed process, methods or metrics. Rather it defines the requirements and guidance for a quality management process along with a reference process and methods that can be tailored to meet the requirements in this document. The requirements and recommendations set out in this document are generic and are intended to be applicable to all organizations, regardless of type, size or nature.

Intelligence artificielle — Qualité des données pour les analyses de données et l’apprentissage automatique (AA) — Partie 3: Exigences et lignes directrices pour la gestion de la qualité des données

Le présent document spécifie des exigences et fournit des recommandations pour l’établissement, la mise en œuvre, le maintien et l’amélioration continue de la qualité des données utilisées dans les domaines de l’analyse de données et de l’apprentissage automatique. Le présent document ne définit pas de processus, de méthodes ou de métriques détaillés. Il définit plutôt les exigences et recommandations associées à un processus de gestion de la qualité, ainsi qu’un processus et des méthodes de référence qui peuvent être adaptés pour satisfaire à ses exigences. Les exigences et recommandations énoncées dans le présent document sont génériques et prévues pour s’appliquer à tout organisme, quels que soient son type, sa taille et sa nature.

General Information

Status
Published
Publication Date
01-Jul-2024
Current Stage
6060 - International Standard published
Start Date
02-Jul-2024
Due Date
30-Apr-2024
Completion Date
02-Jul-2024

Overview

ISO/IEC 5259-3:2024 defines requirements and provides guidance for establishing, implementing, maintaining and continually improving the quality of data used for analytics and machine learning (ML). It sets out a generic, organization‑agnostic framework for a data quality management process, including a reference life cycle and methods that organizations can tailor. The standard specifically does not prescribe detailed processes, methods or numeric metrics - instead it requires and guides the design of a quality management approach suitable to each organization’s context.

Key topics and requirements

  • Data quality management objectives: establish a process to ensure data is fit for analytics and ML use and continually improved.
  • Organizational aspects: foster a data quality culture; define roles, responsibilities and competence management.
  • Management system integration: align data quality activities with existing management systems and resources.
  • Documentation & auditing: require documentation, audits, assessments, confirmation reviews and measurable work products.
  • Life‑cycle coverage: specify requirements across data life‑cycle stages including:
    • Data motivation and conceptualization
    • Data specification
    • Data planning
    • Data acquisition
    • Data preprocessing
    • Data augmentation
    • Data provisioning
    • Data decommissioning
  • Horizontal processes: verification & validation, configuration management, change management, and risk management for data quality.
  • Supply chain & tooling: guidance for managing data quality across supplier relationships and for the management of data processing tools and dependencies.
  • Project‑specific management: tailoring, planning, coordination, data quality justification, decommissioning and project work products.

Practical applications

  • Build or improve an organizational data quality management program for ML and analytics projects.
  • Design data governance controls that ensure data fitness for model training, evaluation and deployment.
  • Integrate data quality requirements into project plans, supplier contracts and tooling procurement.
  • Structure audits, verification/validation activities and documentation to support reproducibility, compliance and risk mitigation.
  • Tailor the reference life cycle to specific projects (e.g., model development, data pipelines, labeling efforts) without inventing fixed metrics.

Who should use this standard

  • Data governance leaders, Chief Data Officers (CDOs) and CIOs
  • Data engineers, ML engineers and data scientists
  • Quality assurance, compliance and risk management teams
  • Procurement and supply‑chain managers working with data suppliers
  • Tooling and platform architects responsible for data pipelines and processing tools

Related standards

  • Other parts of the ISO/IEC 5259 series and complementary ISO/IEC AI and data management standards (consult the ISO catalogue for specific titles). These provide complementary guidance on AI systems, ethics and technical controls.

Keywords: ISO/IEC 5259-3, data quality, machine learning, ML data governance, data quality management, analytics, data life cycle, AI data standards.

Standard

ISO/IEC 5259-3:2024 - Artificial intelligence — Data quality for analytics and machine learning (ML) — Part 3: Data quality management requirements and guidelines Released:2. 07. 2024

English language
28 pages
sale 15% off
Preview
sale 15% off
Preview
Standard

ISO/IEC 5259-3:2024 - Intelligence artificielle — Qualité des données pour les analyses de données et l’apprentissage automatique (AA) — Partie 3: Exigences et lignes directrices pour la gestion de la qualité des données Released:11. 07. 2025

French language
29 pages
sale 15% off
Preview
sale 15% off
Preview
Standard

REDLINE ISO/IEC 5259-3:2024 - Intelligence artificielle — Qualité des données pour les analyses de données et l’apprentissage automatique (AA) — Partie 3: Exigences et lignes directrices pour la gestion de la qualité des données Released:11. 07. 2025

French language
29 pages
sale 15% off
Preview
sale 15% off
Preview

Frequently Asked Questions

ISO/IEC 5259-3:2024 is a standard published by the International Organization for Standardization (ISO). Its full title is "Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 3: Data quality management requirements and guidelines". This standard covers: This document specifies requirements and provides guidance for establishing, implementing, maintaining and continually improving the quality of data used in the areas of analytics and machine learning. This document does not define a detailed process, methods or metrics. Rather it defines the requirements and guidance for a quality management process along with a reference process and methods that can be tailored to meet the requirements in this document. The requirements and recommendations set out in this document are generic and are intended to be applicable to all organizations, regardless of type, size or nature.

This document specifies requirements and provides guidance for establishing, implementing, maintaining and continually improving the quality of data used in the areas of analytics and machine learning. This document does not define a detailed process, methods or metrics. Rather it defines the requirements and guidance for a quality management process along with a reference process and methods that can be tailored to meet the requirements in this document. The requirements and recommendations set out in this document are generic and are intended to be applicable to all organizations, regardless of type, size or nature.

ISO/IEC 5259-3:2024 is classified under the following ICS (International Classification for Standards) categories: 35.020 - Information technology (IT) in general. The ICS classification helps identify the subject area and facilitates finding related standards.

ISO/IEC 5259-3:2024 is available in PDF format for immediate download after purchase. The document can be added to your cart and obtained through the secure checkout process. Digital delivery ensures instant access to the complete standard document.

Standards Content (Sample)


International
Standard
ISO/IEC 5259-3
First edition
Artificial intelligence — Data
2024-07
quality for analytics and machine
learning (ML) —
Part 3:
Data quality management
requirements and guidelines
Intelligence artificielle — Qualité des données pour les analyses
de données et l’apprentissage automatique —
Partie 3: Exigences et lignes directrices pour la gestion de la
qualité des données
Reference number
© ISO/IEC 2024
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
© ISO/IEC 2024 – All rights reserved
ii
Contents Page
Foreword .v
Introduction .vi
1 Scope .1
2 Normative references .1
3 Terms and definitions .1
4 Symbols and abbreviated terms. 2
5 Intended usage . 2
6 Overall data quality management . 2
6.1 Objective.2
6.2 General .2
6.3 Requirements and recommendations .3
6.3.1 General .3
6.3.2 Data quality culture . .3
6.3.3 Management of data quality issues . .3
6.3.4 Competence management .3
6.3.5 Resource management .4
6.3.6 Management system integration .4
6.3.7 Documentation.4
6.3.8 Data quality audit and assessment.4
6.3.9 Confirmation review and data quality measures .5
6.3.10 Project-specific data quality management .5
6.4 Work products .5
7 Life cycle-specific data quality management .6
7.1 Objective.6
7.2 General .6
7.2.1 Data quality management life cycle .6
7.2.2 Data quality management life cycle stages .7
7.2.3 Project-independent tailoring of the data quality management life cycle .8
7.2.4 Horizontal aspects of the data quality management life cycle .8
7.3 Requirements and recommendations .9
7.3.1 Data motivation and conceptualization . .9
7.3.2 Data specification .9
7.3.3 Data planning .11
7.3.4 Data acquisition . . .11
7.3.5 Data preprocessing . 13
7.3.6 Data augmentation . 13
7.3.7 Data provisioning .14
7.3.8 Data decommissioning .16
7.4 Work products .17
7.4.1 Work products of data motivation and conceptualization stage .17
7.4.2 Work products of data specification stage .17
7.4.3 Work products of data planning stage .17
7.4.4 Work products of data acquisition stage .17
7.4.5 Work products of data preprocessing stage .17
7.4.6 Work products of data augmentation stage .18
7.4.7 Work products of data provisioning stage .18
7.4.8 Work products of data decommissioning stage .18
8 Horizontal processes .18
8.1 Objective.18
8.2 General .18
8.3 Requirements and recommendations .18
8.3.1 Verification and validation .18

© ISO/IEC 2024 – All rights reserved
iii
8.3.2 Configuration management .19
8.3.3 Change management .19
8.3.4 Risk management . 20
8.4 Work products .21
8.4.1 Work products of verification and validation .21
8.4.2 Work products of configuration management .21
8.4.3 Work products of change management.21
8.4.4 Work products for risk management .21
9 Management of data quality in supply chains .22
9.1 Objective. 22
9.2 Requirements and recommendations . 22
9.3 Work products . 22
10 Management of data processing tools .23
10.1 Objective. 23
10.2 Requirements and recommendations . 23
10.3 Work products . 23
11 Management of data quality dependencies .23
11.1 Objective. 23
11.2 Requirements and recommendations . 23
11.3 Work products . 23
12 Project-specific data quality management .24
12.1 Objective.24
12.2 Requirements and recommendations .24
12.2.1 Context and intended use .24
12.2.2 Objective .24
12.2.3 Requirements and recommendations .24
12.3 Specification and management of data quality requirements .24
12.3.1 Objective .24
12.3.2 Requirements and recommendations . 25
12.4 Roles and responsibilities in data quality management . 25
12.4.1 Objective . 25
12.4.2 Requirements and recommendations . 25
12.4.3 Work products . 25
12.5 Tailoring of the data quality activities . 25
12.6 Planning and coordination of the data quality activities . 26
12.6.1 General . 26
12.6.2 Data quality plan . 26
12.6.3 Planning of processes. 26
12.7 Progression of the data quality life cycle . 26
12.8 Data quality justification . 26
12.9 Decommissioning .27
12.10 Work products .27
Bibliography .28

© ISO/IEC 2024 – All rights reserved
iv
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical
Commission) form the specialized system for worldwide standardization. National bodies that are
members of ISO or IEC participate in the development of International Standards through technical
committees established by the respective organization to deal with particular fields of technical activity.
ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations,
governmental and non-governmental, in liaison with ISO and IEC, also take part in the work.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types
of document should be noted. This document was drafted in accordance with the editorial rules of the ISO/
IEC Directives, Part 2 (see www.iso.org/directives or www.iec.ch/members_experts/refdocs).
ISO and IEC draw attention to the possibility that the implementation of this document may involve the
use of (a) patent(s). ISO and IEC take no position concerning the evidence, validity or applicability of any
claimed patent rights in respect thereof. As of the date of publication of this document, ISO and IEC had not
received notice of (a) patent(s) which may be required to implement this document. However, implementers
are cautioned that this may not represent the latest information, which may be obtained from the patent
database available at www.iso.org/patents and https://patents.iec.ch. ISO and IEC shall not be held
responsible for identifying any or all such patent rights.
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions
related to conformity assessment, as well as information about ISO's adherence to the World Trade
Organization (WTO) principles in the Technical Barriers to Trade (TBT) see www.iso.org/iso/foreword.html.
In the IEC, see www.iec.ch/understanding-standards.
This document was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology,
Subcommittee SC 42, Artificial intelligence.
A list of all parts in the ISO/IEC 5259 series can be found on the ISO and IEC websites.
Any feedback or questions on this document should be directed to the user’s national standards
body. A complete listing of these bodies can be found at www.iso.org/members.html and
www.iec.ch/national-committees.

© ISO/IEC 2024 – All rights reserved
v
Introduction
The quality of analytics and machine learning (ML) based products and services depends on the quality of
data used to train ML models. Hence, data quality management is essential as it often helps to ensure the
success of analytics and ML technology.
The adoption of a data quality management system facilitates managing the quality of products and services
that employ analytics and ML technologies. This document defines vocabulary, requirements and guidelines
for communication, alignment and agreement for managing data quality. The data quality management
system provides transparency and auditability, either through self-assessment or third party assessment.
It facilitates achieving relevant stakeholder satisfaction and managing quality, performance and self-
declaration requirements. Specifically, this document defines requirements for a data quality management
system with references to data quality measures that are relevant for the most commonly used analytics
and ML technologies.
As data quality requirements vary with context and application domain, this document provides a generic set
of requirements and recommendations relating to common data life cycle stages. A data life cycle is typically
tightly integrated with the accompanying AI system life cycle and therefore has several dependencies. This
document does not prescribe what AI system life cycle to use. Instead, it provides generic interfaces that
allow users of this document the flexibility to interface with several life cycle models as long as the life cycle
processes can be mapped.
ISO/IEC 5259-1 describes the data quality terminology and concepts used in this document.
1)
ISO/IEC 5259-2 describes the data quality model and data quality measures used in this document.
ISO/IEC 5259-4 describes the data quality process framework used in this document.
2)
ISO/IEC 5259-5 provides a data quality governance framework as guidance for governing bodies.
3)
ISO/IEC TR 5259-6 describes a visualization framework for data quality in analytics and ML.
1) Under preparation. Stage at the time of publication: ISO/IEC FDIS 5259-2:2024.
2) Under preparation. Stage at the time of publication: ISO/IEC DIS 5259-5:2023.
3) Under preparation. Stage at the time of publication: ISO/IEC CD TR 5259-6:2023.

© ISO/IEC 2024 – All rights reserved
vi
International Standard ISO/IEC 5259-3:2024(en)
Artificial intelligence — Data quality for analytics and
machine learning (ML) —
Part 3:
Data quality management requirements and guidelines
1 Scope
This document specifies requirements and provides guidance for establishing, implementing, maintaining
and continually improving the quality of data used in the areas of analytics and machine learning.
This document does not define a detailed process, methods or metrics. Rather it defines the requirements
and guidance for a quality management process along with a reference process and methods that can be
tailored to meet the requirements in this document.
The requirements and recommendations set out in this document are generic and are intended to be
applicable to all organizations, regardless of type, size or nature.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes
requirements of this document. For dated references, only the edition cited applies. For undated references,
the latest edition of the referenced document (including any amendments) applies.
ISO/IEC 5259-1:2024, Artificial intelligence — Data quality for analytics and machine learning (ML) — Part 1:
Overview, terminology, and examples
4)
ISO/IEC 5259-2 , Artificial Intelligence — Data quality for analytics and machine learning (ML) — Part 2: Data
quality measures
ISO/IEC 22989, Information technology — Artificial intelligence — Artificial intelligence concepts and
terminology
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO/IEC 22989, ISO/IEC 5259-1 and the
following apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at https:// www .electropedia .org/
3.1
data quality claim
statement to what degree data satisfy a data quality requirement
4) Under preparation. Stage at the time of publication: ISO/IEC FDIS 5259-2:2024.

© ISO/IEC 2024 – All rights reserved
3.2
data quality plan
specification of practices, processes and allocation of resources to achieve data quality objectives as the
outcome of data quality planning
3.3
data quality planning
part of data quality management focused on setting data quality objectives and specifying necessary
operational processes and related resources to achieve the quality objectives
[SOURCE: ISO 8000-2:2022, modified — example removed]
3.4
development interface agreement
DIA
agreement between customer and supplier in which the responsibilities for activities to be performed,
evidence to be reviewed, or work products to be exchanged by each party related to the development of
items or elements are specified
Note 1 to entry: While DIA applies to the development phase, supply agreement applies to production.
[SOURCE: ISO 26262-1:2018]
4 Symbols and abbreviated terms
DQMLC data quality management life cycle
5 Intended usage
This document may be used in one or more of the following modes:
— by an organization to establish and tailor a data quality management process for the use of data in
analytics and ML, and continually improve processes;
— by an ML project to define, trace and evaluate data quality requirements;
— by a data user and data holder to establish a common understanding of data quality characteristics, and
to ensure that agreed requirements have been met, facilitating an agreement for transacting data.
NOTE The organization can request assurances of confidentiality and proper use for supporting evidence.
6 Overall data quality management
6.1 Objective
The objective of a data quality management process is to establish appropriate (i.e. repeatable and auditable)
processes to manage the quality of data and reliably meet a given set of requirements set by the organization.
6.2 General
Data quality impacts outcomes of analytics and ML algorithms. Data quality has an inherent constituent and
a system-dependent constituent. Data can be suitable for one application but not suitable for another. This
document helps to establish and maintain data quality for each analytics and ML application.

© ISO/IEC 2024 – All rights reserved
6.3 Requirements and recommendations
6.3.1 General
The following requirements and recommendations apply to the whole organization.
6.3.2 Data quality culture
The organization should sustain a data quality culture.
The organization shall:
a) have rules and processes to achieve quality (according to this document) taking into account the data
quality model as applied to the applicable products and services;
b) define and implement data quality management processes, and perform related data quality activities;
c) integrate the data quality management processes and activities, to the extent appropriate, into other
management processes and activities, such as general quality management and risk management;
d) document the performed activities;
e) provide resources sufficient to perform data quality management;
f) monitor, and to the extent necessary, review and improve the data quality management processes;
g) provide the required authority to involved personnel;
h) communicate data quality policies within the organization.
6.3.3 Management of data quality issues
The organization shall meet data quality requirements by:
a) having processes for communicating, analysing, evaluating, resolving and closing data quality issues;
b) documenting closed issues;
c) escalating or delegating issues that cannot be closed.
NOTE 1 Resolving and closing issues of data quality can include limiting or adjusting the scope of the ML project.
NOTE 2 A data quality issue can be closed by implementing a resolution or determining a resolution based on
defined acceptance criteria.
6.3.4 Competence management
The organization shall manage competence by:
a) documenting required skills and tools to process the data;
b) ensuring that involved personnel have sufficient skills to perform their activities and duties;
c) maintaining records of persons and their proficiency on the required skills and tools;
d) keeping appropriate records of training and experience that substantiate claims of appropriate skills.
The organization can use external sources of competencies.

© ISO/IEC 2024 – All rights reserved
6.3.5 Resource management
The organization shall provide the resources required for data quality management, including:
a) software applications, training and support necessary to perform data quality management;
b) IT infrastructure or services necessary to perform data quality management (e.g. compute, storage,
networking);
c) personnel with the skills required to perform data quality management.
6.3.6 Management system integration
The organization should integrate its data quality management activities into its existing management
system, including its management systems for product or service quality, and for the development and use
of AI systems. Implications from dual roles of stakeholders should be managed by the quality management
system, including mitigation of any conflicts of interest.
NOTE 1 Stakeholder management can consider the potential of multiple roles for an individual. A user of analytics
and ML based products or services can also be an owner or contributor of data.
NOTE 2 Organizations can use ISO/IEC 42001 to define a management system for the development or use of AI
systems.
NOTE 3 Organizations can use ISO 9001 or other sector-specific quality management systems to define their
quality management system.
6.3.7 Documentation
Documentation shall be intelligible to relevant stakeholders of the project in accordance with their role.
Resources in a language that is not understood by a relevant stakeholder should be accompanied by a
summary in a language that the stakeholder can understand.
The documentation shall be accessible to relevant stakeholders as appropriate and authorized. Access
overhead should be minimized.
Documentation should include the context or references necessary to make it intelligible to future relevant
stakeholders who are not part of the current project. This practice can enable these stakeholders to evaluate
a dataset for potential reuse, partially or in total.
6.3.8 Data quality audit and assessment
The implemented processes shall be audited when appropriate, which shall be based on an evaluation of:
a) the data quality plan against organizational rules and processes;
b) arguments and justifications detailing how the requirements of the data quality model have been
applied;
c) arguments detailing how the objectives of data quality plan have been achieved;
d) whether the data quality plan and all work products are complete, consistent and correct according to
this document;
e) recommendations for improvement of data quality.
The data shall be assessed using a data quality assessment, which shall be based on an evaluation of
whether the data achieve the objectives of this document, the current state-of-the-art in technology and the
applicable engineering domain knowledge.

© ISO/IEC 2024 – All rights reserved
The data quality assessment plan shall be included in the specification stage. The data quality assessment
shall be performed before data provisioning (see Figure 1, Stage 7: Data provisioning) or at an appropriate
interval when using continuous learning or when using streaming data.
The data quality assessment may be performed on a subset of the data when it can be demonstrated that the
quality of the subset is representative of the quality of the complete dataset.
6.3.9 Confirmation review and data quality measures
Data quality shall be confirmed by appropriate data quality measures in accordance with ISO/IEC 5259-2. A
data quality review shall at least cover:
a) confirmation reviews of key work products. Every confirmation review:
1) shall be finalized before data provisioning;
2) should be based on whether the objectives of this document are achieved;
b) quality audits of the implemented processes;
c) quality assessment of the data.
All work products shall undergo confirmation reviews.
The personnel performing these reviews shall have access to the involved personnel, relevant information
and required resources.
NOTE Confirmation reviews of key work products can be delegated, but the responsibility stays with the
designated person.
6.3.10 Project-specific data quality management
The organization shall manage project-specific data by:
a) establishing a suitable project-specific data quality management process that meets all requirements of
the specific ML project;
b) maintaining a list of relevant data quality claims. Where applicable, quantitative and qualitative
benchmarks for data quality measures shall be documented;
c) adopting appropriate processes to identify and manage all data quality measures relevant for the
project.
The project-specific data quality management process shall fulfil the requirements of Clause 12.
6.4 Work products
Work products of the data quality management process shall include:
a) organization-specific rules and processes for data quality (e.g. according to ISO/IEC 5259-4);
b) evidence of competence management;
c) evidence of a data quality management system;
d) identification of the used data quality measures;
e) documentation of applicable data quality measure benchmarks;
f) identified quality anomaly reports.

© ISO/IEC 2024 – All rights reserved
7 Life cycle-specific data quality management
7.1 Objective
The objective of a data quality management life cycle (DQMLC) is to establish and maintain data quality
throughout the data life cycle. An example of a data life cycle model is described in ISO/IEC 5259-1:2024,
Figure 3.
7.2 General
7.2.1 Data quality management life cycle
Data quality shall be managed in all stages of the data life cycle. The data quality management life cycle
(DQMLC) model shown in Figure 1 provides guidance towards meeting the quality requirements of data for
use in an analytics and ML context. It derives discrete stages that are relevant for the management of data
quality and facilitates grouping and organizing of requirements and guidelines to consider for managing
data quality. The DQMLC model is not prescriptive of the temporal ordering of stages. The various stages of
the DQMLC are described in 7.2.2.

Key
Primary development pathway
Feedback pathway
Instantiation of DLC model for 5259 series (see ISO/IEC 5259-1:2024, Figure 3)
Data quality management life cycle stage
Horizontal processes of the data quality management life cycle
Indicating iteration within the life cycle
Grouping of data quality management life cycle stages to clarify mapping to DCL model
Figure 1 — Data quality management life cycle

© ISO/IEC 2024 – All rights reserved
Issues in data quality can originate at any stage throughout the data life cycle. Data quality management
shall establish and maintain data quality processes at the beginning of the data life cycle. If the organization
delegates the responsibility for a process, that delegation shall be documented and be traceable.
NOTE It is generally more difficult to detect and correct data quality issues after the fact than to manage data
quality risks when they first occur. For example, errors introduced while collecting data are more easily avoided by
appropriate quality management rather than attempting to detect and correct errors later in the data life cycle.
7.2.2 Data quality management life cycle stages
7.2.2.1 Data motivation and conceptualization
Data quality management begins with the motivation and conceptualization stage. Potential issues with
data quality should be identified and managed when the first need for data for an analytics and ML context
becomes apparent. Among others, the motivation and intended use for the data are validated and verified to
manage quality characteristics such as conformity and relevance.
7.2.2.2 Data specification
In the data specification stage, data quality management imposes requirements on the creation of the
data specification, including data formats, statistical properties and divisibility. Data quality management
guidelines facilitate identification of erroneous, incomplete, or conflicting requirements and plans.
For example, given an analytics and ML context, quality management confirms that the data match the
requirements of that context.
7.2.2.3 Data planning
In the data planning stage, a plan is formulated to meet the data specification. This includes planning of
specific tasks and resources to acquire and process data throughout the data life cycle, as well as evaluation
methods and acceptance criteria.
7.2.2.4 Data acquisition
In terms of data quality management, data acquisition can refer to collecting data, generating data, or
acquiring and combining existing datasets. The choice of method of data collection has implications on data
quality management. Regardless of the method of obtaining data, the result of this stage is considered the
raw input for subsequent stages of the data life cycle, even if an already managed dataset is imported.
7.2.2.5 Data preprocessing
The data preprocessing stage organizes all data quality management requirements and guidelines that are
related to processing the raw input data obtained during the data acquisition stage. Activities in this stage
tend to remove data items, for example by filtering and cleaning raw data.
7.2.2.6 Data augmentation
Data augmentation takes the input from the data preprocessing stage and organizes it according to all
quality management requirements and guidelines related to adding to the dataset. This includes associating
metadata, adding data labels or other transformations.
7.2.2.7 Data provisioning
The goal of data provisioning is to provide the dataset where it is needed. Data quality management
requirements in this stage include, among others, maintaining integrity of datasets during delivery, access
control, documentation and verification that context of use matches the dataset’s intended use.

© ISO/IEC 2024 – All rights reserved
7.2.2.8 Data decommissioning
Data quality management closes with data deletion or data transfer in the data decommissioning stage. In
each of these mutually exclusive cases, the responsibility for the data is released. The appropriate handling
of data released is a major factor of trust in the organization and can contribute to data misuse prevention.
7.2.3 Project-independent tailoring of the data quality management life cycle
The organization should tailor the life cycle if it:
a) joins or splits the stages;
b) performs required processes in different or added stages (see ISO/IEC 5259-4);
c) iterates stages;
d) performs activities concurrently if they do not depend on each other;
e) omits stages that do not apply, given a rationale;
f) includes data quality management provisions for validation and verification, change management and
configuration management as shown in Figure 1.
7.2.4 Horizontal aspects of the data quality management life cycle
7.2.4.1 General
Figure 1 shows four processes that cover all stages of the data quality management life cycle including:
a) validation and verification;
b) change management;
c) configuration management;
d) risk management.
These processes shall also be carried out in the case of project-independent tailoring.
7.2.4.2 Validation and verification
Validation and verification of the data quality should be done at all relevant stages throughout the data
quality management life cycle.
7.2.4.3 Change management
Change management ensures that any alteration to the data or processes does not adversely affect data
quality.
7.2.4.4 Configuration management
Configuration management helps to ensure that data and processes are uniquely referenceable, and that
data quality is not adversely affected by any configuration management changes.
7.2.4.5 Risk management
Risk management should be done at all relevant steps throughout the data quality management life cycle.

© ISO/IEC 2024 – All rights reserved
7.3 Requirements and recommendations
7.3.1 Data motivation and conceptualization
7.3.1.1 General
The organization shall:
a) document motivation and origin of the data need;
b) specify scope, purpose and intended use of data;
c) document data quality requirements.
NOTE For more information on societal and ethical concerns see ISO/IEC TR 24368.
7.3.1.2 Stakeholder analysis
The organization shall:
a) perform a stakeholder analysis to identify all relevant stakeholders of the data and implications for data
quality management;
b) identify potentially conflicting data quality requirements.
NOTE A description of potential AI stakeholder roles and sub-roles is provided by ISO/IEC 22989:2022, 5.19.
7.3.1.3 Feasibility analysis
The organization should maintain a feasibility analysis based on its available skills and resources that
assesses the organization's ability to meet its data quality goals. A feasibility analysis should be updated
throughout the data life cycle.
NOTE Prior ML projects and openly available datasets that have achieved target quality goals are examples of
evidence supporting feasibility.
7.3.2 Data specification
7.3.2.1 General
The organization shall specify data requirements in a data specification and validate that
...


Norme
internationale
ISO/IEC 5259-3
Première édition
Intelligence artificielle — Qualité
2024-07
des données pour les analyses
de données et l’apprentissage
automatique (AA) —
Partie 3:
Exigences et lignes directrices pour
la gestion de la qualité des données
Artificial intelligence — Data quality for analytics and machine
learning (ML) —
Part 3: Data quality management requirements and guidelines
Numéro de référence
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO/IEC 2024
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
© ISO/IEC 2024 – Tous droits réservés
ii
Sommaire Page
Avant-propos .v
Introduction .vi
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Symboles et abréviations . 2
5 Utilisation prévue . 2
6 Gestion globale de la qualité des données . 2
6.1 Objectif.2
6.2 Généralités .3
6.3 Exigences et recommandations .3
6.3.1 Généralités .3
6.3.2 Culture de qualité des données .3
6.3.3 Gestion des problèmes de qualité des données.3
6.3.4 Gestion des compétences .4
6.3.5 Gestion des ressources .4
6.3.6 Intégration du système de gestion .4
6.3.7 Documentation.4
6.3.8 Audit et évaluation de la qualité des données .5
6.3.9 Examen de confirmation et mesures de la qualité des données .5
6.3.10 Gestion de la qualité des données spécifique au projet .5
6.4 Livrables .6
7 Gestion de la qualité des données spécifique au cycle de vie. 6
7.1 Objectif.6
7.2 Généralités .6
7.2.1 Cycle de vie de gestion de la qualité des données .6
7.2.2 Étapes du cycle de vie de gestion de la qualité des données .7
7.2.3 Adaptation du cycle de vie de gestion de la qualité des données indépendamment
du projet .8
7.2.4 Aspects horizontaux du cycle de vie de gestion de la qualité des données .9
7.3 Exigences et recommandations .9
7.3.1 Motivation et conceptualisation des données .9
7.3.2 Spécification des données .10
7.3.3 Planification des données . 12
7.3.4 Acquisition des données . 12
7.3.5 Prétraitement des données .14
7.3.6 Augmentation des données .14
7.3.7 Mise à disposition des données . 15
7.3.8 Mise hors service des données.17
7.4 Livrables .18
7.4.1 Livrables de l’étape de motivation et conceptualisation des données .18
7.4.2 Livrables de l’étape de spécification des données .18
7.4.3 Livrables de l’étape de planification des données .18
7.4.4 Livrables de l’étape d’acquisition des données .18
7.4.5 Livrables de l’étape de prétraitement des données .19
7.4.6 Livrables de l’étape d’augmentation des données .19
7.4.7 Livrables de l’étape de mise à disposition des données .19
7.4.8 Livrables de l’étape de mise hors service des données .19
8 Processus horizontaux . 19
8.1 Objectif.19
8.2 Généralités .19
8.3 Exigences et recommandations . 20

© ISO/IEC 2024 – Tous droits réservés
iii
8.3.1 Vérification et validation . . 20
8.3.2 Gestion de la configuration . 20
8.3.3 Gestion des modifications . 20
8.3.4 Gestion des risques . 22
8.4 Livrables . 22
8.4.1 Livrables de vérification et validation . 22
8.4.2 Livrables de gestion de la configuration . 22
8.4.3 Livrables de gestion des modifications . 22
8.4.4 Livrables pour la gestion des risques . 23
9 Gestion de la qualité des données dans les chaînes d’approvisionnement .23
9.1 Objectif. 23
9.2 Exigences et recommandations . 23
9.3 Livrables .24
10 Gestion des outils de traitement des données .24
10.1 Objectif.24
10.2 Exigences et recommandations .24
10.3 Livrables .24
11 Gestion des dépendances en matière de qualité des données .24
11.1 Objectif.24
11.2 Exigences et recommandations . 25
11.3 Livrables . 25
12 Gestion de la qualité des données spécifique au projet .25
12.1 Objectif. 25
12.2 Exigences et recommandations . 25
12.2.1 Contexte et utilisation prévue . 25
12.2.2 Objectif . 25
12.2.3 Exigences et recommandations . 25
12.3 Spécification et gestion des exigences de qualité des données . 26
12.3.1 Objectif . 26
12.3.2 Exigences et recommandations . 26
12.4 Rôles et responsabilités dans le cadre de la gestion de la qualité des données . 26
12.4.1 Objectif . 26
12.4.2 Exigences et recommandations .27
12.4.3 Livrables .27
12.5 Adaptation des activités liées à la qualité des données .27
12.6 Planification et coordination des activités liées à la qualité des données .27
12.6.1 Généralités .27
12.6.2 Plan de qualité des données .27
12.6.3 Planification des processus . 28
12.7 Progression du cycle de vie de la qualité des données . 28
12.8 Justification de la qualité des données . 28
12.9 Mise hors service . 28
12.10 Livrables . 28
Bibliographie .29

© ISO/IEC 2024 – Tous droits réservés
iv
Avant-propos
L’ISO (Organisation internationale de normalisation) et l’IEC (Commission électrotechnique internationale)
forment le système spécialisé de la normalisation mondiale. Les organismes nationaux membres de l’ISO ou
de l’IEC participent au développement de Normes internationales par l’intermédiaire des comités techniques
créés par l’organisation concernée afin de s’occuper des domaines particuliers de l’activité technique.
Les comités techniques de l’ISO et de l’IEC collaborent dans des domaines d’intérêt commun. D’autres
organisations internationales, gouvernementales et non gouvernementales, en liaison avec l’ISO et l’IEC,
participent également aux travaux.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont décrites
dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents critères
d’approbation requis pour les différents types de documents. Le présent document a été rédigé conformément
aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www.iso.org/directives ou
www.iec.ch/members_experts/refdocs).
L’ISO et l’IEC attirent l’attention sur le fait que la mise en application du présent document peut entraîner
l’utilisation d’un ou de plusieurs brevets. L’ISO et l’IEC ne prennent pas position quant à la preuve, à la validité
et à l’applicabilité de tout droit de propriété revendiqué à cet égard. À la date de publication du présent
document, l’ISO et l’IEC n’avaient pas reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires
à sa mise en application. Toutefois, il y a lieu d’avertir les responsables de la mise en application du présent
document que des informations plus récentes sont susceptibles de figurer dans la base de données de
brevets, disponible à l’adresse www.iso.org/brevets et https://patents.iec.ch. L’ISO et l’IEC ne sauraient être
tenues pour responsables de ne pas avoir identifié tout ou partie de tels droits de propriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions spécifiques
de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de l’ISO aux
principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au commerce
(OTC), voir www.iso.org/iso/avant-propos. Pour l’IEC, voir www.iec.ch/understanding-standards.
Le présent document a été élaboré par le comité technique mixte ISO/IEC JTC 1, Technologies de l’information,
sous-comité SC 42, Intelligence artificielle.
Une liste de toutes les parties de la série ISO/IEC 5259 se trouve sur les sites Web de l’ISO et de l’IEC.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve aux adresses www.iso.org/members.html et www.iec.ch/national-committees.

© ISO/IEC 2024 – Tous droits réservés
v
Introduction
La qualité des produits et services basés sur l’analyse de données et l’apprentissage automatique (AA)
dépend de la qualité des données utilisées pour entraîner les modèles d’AA. Par conséquent, la gestion de la
qualité des données est essentielle, car elle contribue souvent à assurer le succès des technologies d’analyse
de données et d’AA.
L’adoption d’un système de gestion de la qualité des données facilite la gestion de la qualité des produits
et services qui utilisent des technologies d’analyse de données et d’AA. Le présent document définit le
vocabulaire, les exigences et les lignes directrices de communication, d’alignement et d’accord pour la
gestion de la qualité des données. Le système de gestion de la qualité des données assure la transparence et
la vérifiabilité, que ce soit par auto-évaluation ou évaluation par une tierce partie. Il améliore la satisfaction
des parties prenantes concernées et facilite la gestion des exigences en matière de qualité, de performance
et d’autodéclaration. Plus précisément, le présent document définit les exigences relatives à un système de
gestion de la qualité des données avec des références aux mesures de la qualité des données pertinentes
pour les technologies d’analyse de données et d’AA les plus couramment utilisées.
Comme les exigences de qualité des données varient en fonction du contexte et du domaine d’application,
le présent document fournit un ensemble générique d’exigences et de recommandations liées aux étapes
communes du cycle de vie des données. Un cycle de vie des données est généralement étroitement intégré
au cycle de vie du système d’IA associé et a donc plusieurs dépendances. Le présent document ne prescrit
pas le cycle de vie du système d’IA à utiliser. Il fournit plutôt des interfaces génériques qui permettent aux
utilisateurs du présent document de travailler avec plusieurs modèles de cycle de vie pour autant que les
processus du cycle de vie puissent être mis en correspondance.
L’ISO/IEC 5259-1 décrit la terminologie et les concepts de qualité des données utilisés dans le présent
document.
1)
L’ISO/IEC 5259-2 décrit le modèle de qualité des données et les mesures de la qualité des données utilisés
dans le présent document.
L’ISO/IEC 5259-4 décrit le cadre pour le processus de qualité des données utilisé dans le présent document.
2)
L’ISO/IEC 5259-5 fournit un cadre de gouvernance de la qualité des données afin de guider les organes de
gouvernance.
3)
L’ISO/IEC TR 5259-6 décrit un cadre de visualisation pour la qualité des données dans le cadre de l’analyse
de données et de l’AA.
1) En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
2) En cours d’élaboration. Stade au moment de la publication : ISO/IEC DIS 5259-5:2023.
3) En cours d’élaboration. Stade au moment de la publication : ISO/IEC CD TR 5259-6:2023.

© ISO/IEC 2024 – Tous droits réservés
vi
Norme internationale ISO/IEC 5259-3:2024(fr)
Intelligence artificielle — Qualité des données pour les
analyses de données et l’apprentissage automatique (AA) —
Partie 3:
Exigences et lignes directrices pour la gestion de la qualité
des données
1 Domaine d’application
Le présent document spécifie des exigences et fournit des recommandations pour l’établissement, la mise
en œuvre, le maintien et l’amélioration continue de la qualité des données utilisées dans les domaines de
l’analyse de données et de l’apprentissage automatique.
Le présent document ne définit pas de processus, de méthodes ou de métriques détaillés. Il définit plutôt les
exigences et recommandations associées à un processus de gestion de la qualité, ainsi qu’un processus et
des méthodes de référence qui peuvent être adaptés pour satisfaire à ses exigences.
Les exigences et recommandations énoncées dans le présent document sont génériques et prévues pour
s’appliquer à tout organisme, quels que soient son type, sa taille et sa nature.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour
les références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO/IEC 5259-1:2024, Intelligence artificielle — Qualité des données pour les analyses de données et
l’apprentissage automatique (AA) — Partie 1: Vue d'ensemble, terminologie et exemples
4)
ISO/IEC 5259-2 , Intelligence artificielle — Qualité des données pour les analyses de données et l’apprentissage
automatique (AA) — Partie 2: Mesures de la qualité des données
ISO/IEC 22989, Technologies de l'information — Intelligence artificielle — Concepts et terminologie relatifs à
l'intelligence artificielle
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO/IEC 5259-1, l’ISO/IEC 22989 ainsi
que les suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp
— IEC Electropedia: disponible à l’adresse https:// www .electropedia .org/
4) En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.

© ISO/IEC 2024 – Tous droits réservés
3.1
énoncé de qualité des données
déclaration indiquant dans quelle mesure les données satisfont à une exigence de qualité des données
3.2
plan de qualité des données
spécification des pratiques, des processus et de l’affectation des ressources pour atteindre les objectifs de
qualité des données en tant que résultat de la planification de la qualité des données
3.3
planification de la qualité des données
partie de la gestion de la qualité des données axée sur la définition d’objectifs de qualité des données et
la spécification des processus opérationnels et des ressources associées, nécessaire pour atteindre les
objectifs qualité
[SOURCE: ISO 8000-2:2022, modifié — L’exemple a été supprimé.]
3.4
accord d’interface de développement
AID
accord entre le client et le fournisseur dans lequel sont spécifiées les responsabilités relatives aux
activités à réaliser, aux preuves à examiner ou aux livrables à échanger par chaque partie dans le cadre du
développement d’articles ou d’éléments
Note 1 à l'article: Alors que l’AID s’applique à la phase de développement, le contrat de fourniture s’applique à la
production.
[SOURCE: ISO 26262-1:2018]
4 Symboles et abréviations
CVGQD cycle de vie de gestion de la qualité des données
5 Utilisation prévue
Le présent document peut être utilisé dans un ou plusieurs des modes suivants:
— par un organisme pour établir et adapter un processus de gestion de la qualité des données pour
l’utilisation des données dans le cadre de l’analyse de données et de l’AA, et pour améliorer en continu les
processus;
— par un projet d’AA pour définir, tracer et évaluer les exigences de qualité des données;
— par un utilisateur de données et un détenteur de données afin d’établir une compréhension commune des
caractéristiques de qualité des données et de s’assurer que les exigences convenues ont été satisfaites,
facilitant ainsi un accord pour la transaction des données.
NOTE L’organisme peut demander des garanties de confidentialité et de bonne utilisation des preuves à l’appui.
6 Gestion globale de la qualité des données
6.1 Objectif
L’objectif d’un processus de gestion de la qualité des données est d’établir des processus appropriés (c’est-
à-dire reproductibles et auditables) pour gérer la qualité des données et satisfaire de manière fiable à un
ensemble donné d’exigences définies par l’organisme.

© ISO/IEC 2024 – Tous droits réservés
6.2 Généralités
La qualité des données a un impact sur les résultats des algorithmes d’analyse de données et d’AA. La qualité
des données a une composante inhérente et une composante qui dépend du système. Les données peuvent
convenir à une application, mais pas à une autre. Le présent document aide à établir et maintenir la qualité
des données pour chaque application d’analyse de données et d’AA.
6.3 Exigences et recommandations
6.3.1 Généralités
Les exigences et recommandations suivantes s’appliquent à l’ensemble de l’organisme.
6.3.2 Culture de qualité des données
Il convient que l’organisme maintienne une culture de qualité des données.
L’organisme doit:
a) disposer de règles et de processus pour atteindre la qualité (conformément au présent document)
en tenant compte du modèle de qualité des données tel qu’il est appliqué aux produits et services
applicables;
b) définir et mettre en œuvre des processus de gestion de la qualité des données et réaliser les activités
connexes liées à la qualité des données;
c) intégrer les processus et activités de gestion de la qualité des données, dans la mesure du possible,
à d’autres processus et activités de gestion, tels que la gestion de la qualité générale et la gestion des
risques;
d) documenter les activités réalisées;
e) fournir les ressources suffisantes pour assurer la gestion de la qualité des données;
f) surveiller et, dans la mesure nécessaire, revoir et améliorer les processus de gestion de la qualité des
données;
g) fournir l’autorité requise au personnel impliqué;
h) communiquer les politiques de qualité des données au sein de l’organisme.
6.3.3 Gestion des problèmes de qualité des données
L’organisme doit satisfaire aux exigences de qualité des données en:
a) mettant en place des processus de communication, d’analyse, d’évaluation, de résolution et de clôture
des problèmes de qualité des données;
b) documentant les problèmes clôturés;
c) faisant remonter ou délégant les problèmes qui ne peuvent pas être clôturés.
NOTE 1 La résolution et la clôture des problèmes de qualité des données peuvent inclure la limitation ou l’ajustement
du domaine d’application du projet d’AA.
NOTE 2 Un problème de qualité des données peut être clôturé en mettant en œuvre une résolution ou en
déterminant une résolution sur la base de critères d’acceptation définis.

© ISO/IEC 2024 – Tous droits réservés
6.3.4 Gestion des compétences
L’organisme doit gérer les compétences en:
a) documentant les qualifications et les outils requis pour traiter les données;
b) s’assurant que le personnel impliqué possède les qualifications suffisantes pour exercer les activités et
fonctions qui lui incombent;
c) tenant à jour des registres du personnel et de leur maîtrise des qualifications et outils requis;
d) tenant des registres de formations et d’expérience appropriés qui justifient les qualifications
revendiquées.
L’organisme peut faire appel à des sources de compétences externes.
6.3.5 Gestion des ressources
L’organisme doit fournir les ressources nécessaires à la gestion de la qualité des données, y compris:
a) les applications logicielles, les formations et le support nécessaires à la gestion de la qualité des données;
b) l’infrastructure ou les services informatiques nécessaires à la gestion de la qualité des données
(par exemple, calcul, stockage, mise en réseau);
c) le personnel ayant les qualifications requises pour assurer la gestion de la qualité des données.
6.3.6 Intégration du système de gestion
Il convient que l’organisme intègre ses activités de gestion de la qualité des données dans son système de
gestion existant, y compris ses systèmes de gestion axés sur la qualité des produits ou services, ainsi que
ceux axés sur le développement et l’utilisation de systèmes d’IA. Il convient que les implications du double
rôle des parties prenantes soient gérées par le système de gestion de la qualité, y compris l’atténuation de
tout conflit d’intérêts.
NOTE 1 La gestion des parties prenantes peut prendre en compte le potentiel d’une personne à assumer plusieurs
rôles. Un utilisateur de produits ou services basés sur l’analyse de données et l’AA peut également être propriétaire ou
contributeur de données.
NOTE 2 Les organismes peuvent utiliser l’ISO/IEC 42001 afin de définir un système de gestion pour le
développement ou l’utilisation de systèmes d’IA.
NOTE 3 Les organismes peuvent utiliser l’ISO 9001 ou d’autres systèmes de gestion de la qualité spécifiques à leur
secteur pour définir leur système de gestion de la qualité.
6.3.7 Documentation
La documentation doit être intelligible pour les parties prenantes concernées du projet conformément à
leur rôle. Il convient que les ressources dans une langue qui n’est pas comprise par une partie prenante
concernée soient accompagnées d’un résumé dans une langue que la partie prenante peut comprendre.
La documentation doit être accessible aux parties prenantes concernées, suivant le cas et selon les
autorisations. Il convient de réduire le plus possible les frais généraux d’accès.
Il convient que la documentation inclue le contexte ou les références nécessaires pour la rendre intelligible
aux futures parties prenantes concernées qui ne font pas partie du projet en cours. Cette pratique peut
permettre à ces parties prenantes d’évaluer un ensemble de données en vue d’une réutilisation potentielle,
partielle ou totale.
© ISO/IEC 2024 – Tous droits réservés
6.3.8 Audit et évaluation de la qualité des données
Les processus mis en œuvre doivent être audités, le cas échéant, sur la base d’une évaluation:
a) du plan de qualité des données par rapport aux règles et processus organisationnels;
b) des arguments et justifications détaillant la manière dont les exigences du modèle de qualité des
données ont été appliquées;
c) des arguments détaillant la manière dont les objectifs du plan de qualité des données ont été atteints;
d) permettant de déterminer si le plan de qualité des données et tous les livrables sont complets, cohérents
et corrects conformément au présent document;
e) des recommandations d’amélioration de la qualité des données.
Les données doivent être évaluées à l’aide d’une évaluation de la qualité des données, qui doit reposer sur
une évaluation visant à déterminer si les données atteignent les objectifs du présent document, l’état de l’art
actuel de la technologie et les connaissances techniques applicables dans le domaine.
Le plan d’évaluation de la qualité des données doit être inclus dans l’étape de spécification. L’évaluation de
la qualité des données doit être réalisée avant la mise à disposition des données (voir l’Étape 7 à la Figure 1:
mise à disposition des données) ou à un intervalle approprié lors de l’utilisation de l’apprentissage continu
ou de données en continu.
L’évaluation de la qualité des données peut être réalisée sur un sous-ensemble de données lorsqu’il peut être
démontré que la qualité du sous-ensemble est représentative de la qualité de l’ensemble de données complet.
6.3.9 Examen de confirmation et mesures de la qualité des données
La qualité des données doit être confirmée par des mesures appropriées de la qualité des données
conformément à l’ISO/IEC 5259-2. Un examen de la qualité des données doit au moins couvrir:
a) les examens de confirmation des principaux livrables:
1) chaque examen de confirmation doit être finalisé avant la mise à disposition des données;
2) il convient que chaque examen de confirmation repose sur le fait que les objectifs du présent
document sont atteints ou non;
b) les audits qualité des processus mis en œuvre;
c) une évaluation de la qualité des données.
Tous les livrables doivent faire l’objet d’examens de confirmation.
Le personnel réalisant ces examens doit avoir accès au personnel impliqué, aux informations pertinentes et
aux ressources requises.
NOTE Les examens de confirmation des principaux livrables peuvent être délégués, mais la responsabilité
incombe à la personne désignée.
6.3.10 Gestion de la qualité des données spécifique au projet
L’organisme doit gérer les données spécifiques au projet en:
a) établissant un processus approprié de gestion de la qualité des données spécifique au projet qui satisfait
à toutes les exigences du projet d’AA spécifique;
b) tenant à jour une liste des énoncés de qualité des données pertinents. Le cas échéant, des références
quantitatives et qualitatives pour les mesures de la qualité des données doivent être documentées;

© ISO/IEC 2024 – Tous droits réservés
c) adoptant des processus appropriés pour identifier et gérer toutes les mesures de la qualité des données
pertinentes pour le projet.
Le processus de gestion de la qualité des données spécifique au projet doit satisfaire aux exigences de
l’Article 12.
6.4 Livrables
Les livrables du processus de gestion de la qualité des données doivent inclure:
a) les règles et processus spécifiques à l’organisme pour la qualité des données (par exemple, conformément
à l’ISO/IEC 5259-4);
b) les preuves de gestion des compétences;
c) les preuves d’un système de gestion de la qualité des données;
d) l’identification des mesures de la qualité des données utilisées;
e) la documentation des références de mesure de la qualité des données applicables;
f) les rapports sur les anomalies de qualité identifiées.
7 Gestion de la qualité des données spécifique au cycle de vie
7.1 Objectif
L’objectif d’un cycle de vie de gestion de la qualité des données (CVGQD) est d’établir et de maintenir la qualité
des données tout au long du cycle de vie des données. Un exemple de modèle de cycle de vie des données est
décrit dans l’ISO/IEC 5259-1:2024, Figure 3.
7.2 Généralités
7.2.1 Cycle de vie de gestion de la qualité des données
La qualité des données doit être gérée à toutes les étapes du cycle de vie des données. Le modèle de cycle de
vie de gestion de la qualité des données (CVGQD) représenté à la Figure 1 fournit des recommandations pour
satisfaire aux exigences de qualité des données à utiliser dans un contexte d’analyse de données et d’AA.
Il déduit des étapes spécifiques qui sont pertinentes pour la gestion de la qualité des données et facilite le
regroupement et l’organisation des exigences et des lignes directrices à prendre en compte pour la gestion
de la qualité des données. Le modèle de CVGQD n’est pas prescriptif de l’ordre temporel des étapes. Les
différentes étapes du CVGQD sont décrites en 7.2.2.

© ISO/IEC 2024 – Tous droits réservés
Légende
Voie de développement principale
Voie de retour d’informations
Instanciation du modèle CVD pour la série 5259 (voir l’ISO/IEC 5259-1:2024, Figure 3)
Étape du cycle de vie de gestion de la qualité des données
Processus horizontaux du cycle de vie de gestion de la qualité des données
Indication de l’itération dans le cycle de vie
Regroupement des étapes du cycle de vie de gestion de la qualité des données pour clarifier la mise en
correspondance avec le modèle CVD
Figure 1 — Cycle de vie de gestion de la qualité des données
Les problèmes de qualité des données peuvent survenir à n’importe quelle étape du cycle de vie des données.
La gestion de la qualité des données doit établir et maintenir des processus de qualité des données au début
du cycle de vie des données. Si l’organisme délègue la responsabilité d’un processus, cette délégation doit
être documentée et traçable.
NOTE Il est généralement plus difficile d’identifier et de corriger les problèmes de qualité des données après coup
que de gérer les risques de qualité des données lorsqu’ils surviennent pour la première fois. Par exemple, les erreurs
introduites lors de la collecte de données sont plus facilement évitées par une gestion de la qualité appropriée plutôt
qu’en tentant d’identifier et de corriger les erreurs plus tard dans le cycle de vie des données.
7.2.2 Étapes du cycle de vie de gestion de la qualité des données
7.2.2.1 Motivation et conceptualisation des données
La gestion de la qualité des données commence par l’étape de motivation et de conceptualisation. Il convient
d’identifier et de gérer les problèmes potentiels liés à la qualité des données lorsque le premier besoin de
données pour un contexte d’analyse de données et d’AA devient apparent. Entre autres, la motivation et
l’utilisation prévue des données sont validées et vérifiées afin de gérer les caractéristiques de qualité telles
que la conformité et la pertinence.
7.2.2.2 Spécification des données
À l’étape de spécification des données, la gestion de la qualité des données impose des exigences pour la
création de la spécification des données, y compris les formats de données, les propriétés statistiques et la

© ISO/IEC 2024 – Tous droits réservés
divisibilité. Les lignes directrices de gestion de la qualité des données facilitent l’identification d’exigences
et de plans erronés, incomplets ou contradictoires. Par exemple, dans un contexte d’analyse de données et
d’AA, la gestion de la qualité confirme que les données correspondent aux exigences du contexte.
7.2.2.3 Planification des données
Au cours de l’étape de planification des données, un plan est formulé pour satisfaire à la spécification des
données. Cela comprend la planification des tâches et des ressources spécifiques pour acquérir et traiter
les données tout au long du cycle de vie des données, ainsi que des méthodes d’évaluation et des critères
d’acceptation.
7.2.2.4 Acquisition des données
En matière de gestion de la qualité des données, l’acquisition de données peut désigner la collecte de données,
la génération de données ou l’acquisition et la combinaison d’ensembles de données existants. Le choix de la
méthode de collecte des données
...


Date: 2025-06-06
ISO/IEC 5259--3:2024(fr)
ISO/IEC JTC 1/SC 42
Première édition
2024-07
Intelligence artificielle — Qualité des données pour les analyses
de données et l’apprentissage automatique (AA) — —
Partie 3:
Exigences et lignes directrices pour la gestion de la qualité des
données
Artificial intelligence — Data quality for analytics and machine learning (ML) — —
Part 3: Data quality management requirements and guidelines
ICS: 35.020
DOCUMENT PROTÉGÉ PAR COPYRIGHT

© ISO/IEC 2024
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre oeuvre, aucune partie
de cette publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique
ou mécanique, y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable.
Une autorisation peut être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays
du demandeur.
ISO copyright office
Case postaleCP 401 • • Ch. de Blandonnet 8
CH-1214 Vernier, GenèveGeneva
Tél.: +Phone: + 41 22 749 01 11
E-mail: copyright@iso.org
WebWebsite: www.iso.org
Publié en Suisse
© ISO/IEC 2024 – Tous droits réservés
iii
Sommaire Page
Avant-propos . vi
Introduction . vii
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Symboles et abréviations . 2
5 Utilisation prévue . 2
6 Gestion globale de la qualité des données . 3
6.1 Objectif . 3
6.2 Généralités . 3
6.3 Exigences et recommandations . 3
6.4 Livrables . 6
7 Gestion de la qualité des données spécifique au cycle de vie . 6
7.1 Objectif . 6
7.2 Généralités . 7
7.3 Exigences et recommandations . 10
7.4 Livrables . 19
8 Processus horizontaux . 21
8.1 Objectif . 21
8.2 Généralités . 21
8.3 Exigences et recommandations . 21
8.4 Livrables . 24
9 Gestion de la qualité des données dans les chaînes d’approvisionnement . 25
9.1 Objectif . 25
9.2 Exigences et recommandations . 25
9.3 Livrables . 26
10 Gestion des outils de traitement des données . 26
10.1 Objectif . 26
10.2 Exigences et recommandations . 26
10.3 Livrables . 26
11 Gestion des dépendances en matière de qualité des données . 27
11.1 Objectif . 27
11.2 Exigences et recommandations . 27
11.3 Livrables . 27
12 Gestion de la qualité des données spécifique au projet . 27
12.1 Objectif . 27
12.2 Exigences et recommandations . 27
12.3 Spécification et gestion des exigences de qualité des données . 28
12.4 Rôles et responsabilités dans le cadre de la gestion de la qualité des données . 29
12.5 Adaptation des activités liées à la qualité des données . 29
12.6 Planification et coordination des activités liées à la qualité des données . 29
12.7 Progression du cycle de vie de la qualité des données . 30
12.8 Justification de la qualité des données. 30
12.9 Mise hors service. 31
12.10 Livrables . 31
© ISO/IEC 2024 – Tous droits réservés
iv
Bibliographie . 32

© ISO/IEC 2024 – Tous droits réservés
v
Avant-propos
L’ISO (Organisation internationale de normalisation) et l’IEC (Commission électrotechnique internationale)
forment le système spécialisé de la normalisation mondiale. Les organismes nationaux membres de l’ISO ou
de l’IEC participent au développement de Normes internationales par l’intermédiaire des comités techniques
créés par l’organisation concernée afin de s’occuper des domaines particuliers de l’activité technique. Les
comités techniques de l’ISO et de l’IEC collaborent dans des domaines d’intérêt commun. D’autres
organisations internationales, gouvernementales et non gouvernementales, en liaison avec l’ISO et l’IEC,
participent également aux travaux.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont décrites
dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents critères
d’approbation requis pour les différents types de documents. Le présent document a été rédigé conformément
aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www.iso.org/directives ou
www.iec.ch/members_experts/refdocs).
L’ISO et l’IEC attirent l’attention sur le fait que la mise en application du présent document peut entraîner
l’utilisation d’un ou de plusieurs brevets. L’ISO et l’IEC ne prennent pas position quant à la preuve, à la validité
et à l’applicabilité de tout droit de propriété revendiqué à cet égard. À la date de publication du présent
document, l’ISO et l’IEC n’avaient pas reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires
à sa mise en application. Toutefois, il y a lieu d’avertir les responsables de la mise en application du présent
document que des informations plus récentes sont susceptibles de figurer dans la base de données de brevets,
disponible à l’adresse www.iso.org/brevets et https://patents.iec.ch. L’ISO et l’IEC ne sauraient être tenues
pour responsables de ne pas avoir identifié tout ou partie de tels droits de propriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions spécifiques
de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de l’ISO aux
principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au commerce
(OTC), voir www.iso.org/iso/avant-propos. Pour l’IEC, voir www.iec.ch/understanding-standards.
Le présent document a été élaboré par le comité technique mixte ISO/IEC JTC 1, Technologies de l’information,
sous-comité SC 42, Intelligence artificielle.
Une liste de toutes les parties de la série ISO/IEC 5259 se trouve sur les sites Web de l’ISO et de l’IEC.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve aux adresses www.iso.org/members.html et www.iec.ch/national-committees.
© ISO/IEC 2024 – Tous droits réservés
vi
Introduction
La qualité des produits et services basés sur l’analyse de données et l’apprentissage automatique (AA) dépend
de la qualité des données utilisées pour entraîner les modèles d’AA. Par conséquent, la gestion de la qualité
des données est essentielle, car elle contribue souvent à assurer le succès des technologies d’analyse de
données et d’AA.
L’adoption d’un système de gestion de la qualité des données facilite la gestion de la qualité des produits et
services qui utilisent des technologies d’analyse de données et d’AA. Le présent document définit le
vocabulaire, les exigences et les lignes directrices de communication, d’alignement et d’accord pour la gestion
de la qualité des données. Le système de gestion de la qualité des données assure la transparence et la
vérifiabilité, que ce soit par auto-évaluation ou évaluation par une tierce partie. Il améliore la satisfaction des
parties prenantes concernées et facilite la gestion des exigences en matière de qualité, de performance et
d’autodéclaration. Plus précisément, le présent document définit les exigences relatives à un système de
gestion de la qualité des données avec des références aux mesures de la qualité des données pertinentes pour
les technologies d’analyse de données et d’AA les plus couramment utilisées.
Comme les exigences de qualité des données varient en fonction du contexte et du domaine d’application, le
présent document fournit un ensemble générique d’exigences et de recommandations liées aux étapes
communes du cycle de vie des données. Un cycle de vie des données est généralement étroitement intégré au
cycle de vie du système d’IA associé et a donc plusieurs dépendances. Le présent document ne prescrit pas le
cycle de vie du système d’IA à utiliser. Il fournit plutôt des interfaces génériques qui permettent aux
utilisateurs du présent document de travailler avec plusieurs modèles de cycle de vie pour autant que les
processus du cycle de vie puissent être mis en correspondance.
L’ISO/IEC 5259--1 décrit la terminologie et les concepts de qualité des données utilisés dans le présent
document.
11)
L’ISO/IEC 5259--2 décrit le modèle de qualité des données et les mesures de la qualité des données utilisés
dans le présent document.
L’ISO/IEC 5259--4 décrit le cadre pour le processus de qualité des données utilisé dans le présent document.
22)
L’ISO/IEC 5259--5 fournit un cadre de gouvernance de la qualité des données afin de guider les organes de
gouvernance.
33)
L’ISO/IEC TR 5259--6 décrit un cadre de visualisation pour la qualité des données dans le cadre de l’analyse
de données et de l’AA.
En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
1)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
En cours d’élaboration. Stade au moment de la publication : ISO/IEC DIS 5259-5:2023.
2)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC DIS 5259-5:2023.
En cours d’élaboration. Stade au moment de la publication : ISO/IEC CD TR 5259-6:2023.
3)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC CD TR 5259-6:2023.
© ISO/IEC 2024 – Tous droits réservés
vii
Norme internationale ISO/IEC 5259-3:2024(fr)

Intelligence artificielle — Qualité des données pour les analyses de
données et l’apprentissage automatique (AA) — —
Partie 3:
Exigences et lignes directrices pour la gestion de la qualité des
données
1 Domaine d’application
Le présent document spécifie des exigences et fournit des recommandations pour l’établissement, la mise en
œuvre, le maintien et l’amélioration continue de la qualité des données utilisées dans les domaines de l’analyse
de données et de l’apprentissage automatique.
Le présent document ne définit pas de processus, de méthodes ou de métriques détaillés. Il définit plutôt les
exigences et recommandations associées à un processus de gestion de la qualité, ainsi qu’un processus et des
méthodes de référence qui peuvent être adaptés pour satisfaire à ses exigences.
Les exigences et recommandations énoncées dans le présent document sont génériques et prévues pour
s’appliquer à tout organisme, quels que soient son type, sa taille et sa nature.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur contenu,
des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour les
références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO/IEC 5259--1:2024, Intelligence artificielle — Qualité des données pour les analyses de données et
l’apprentissage automatique (AA) — Partie 1: Vue d'ensemble, terminologie et exemples
44)
ISO/IEC 5259--2, , Intelligence artificielle — Qualité des données pour les analyses de données et
l’apprentissage automatique (AA) — Partie 2: Mesures de la qualité des données
ISO/IEC 22989, Technologies de l'information — Intelligence artificielle — Concepts et terminologie relatifs à
l'intelligence artificielle
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO/IEC 5259--1, l’ISO/IEC 22989 ainsi
que les suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:

En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
4)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
© ISO/IEC 2024– Tous droits réservés

— — ISO Online browsing platform: disponible à l’adresse https://www.iso.org/obp
— — IEC Electropedia: disponible à l’adresse https://www.electropedia.org/
3.1 3.1
énoncé de qualité des données
déclaration indiquant dans quelle mesure les données satisfont à une exigence de qualité des données
3.2 3.2
plan de qualité des données
spécification des pratiques, des processus et de l’affectation des ressources pour atteindre les objectifs de
qualité des données en tant que résultat de la planification de la qualité des données
3.3 3.3
planification de la qualité des données
partie de la gestion de la qualité des données axée sur la définition d’objectifs de qualité des données et la
spécification des processus opérationnels et des ressources associées, nécessaire pour atteindre les objectifs
qualité
[SOURCE: ISO 8000-‑2:2022, modifié — L’exemple a été supprimé.]
3.4 3.4
accord d’interface de développement
AID
accord entre le client et le fournisseur dans lequel sont spécifiées les responsabilités relatives aux activités à
réaliser, aux preuves à examiner ou aux livrables à échanger par chaque partie dans le cadre du
développement d’articles ou d’éléments
Note 1 à l’article l'article: Alors que l’AID s’applique à la phase de développement, le contrat de fourniture s’applique à
la production.
[SOURCE: ISO 26262-‑1:2018]
4 Symboles et abréviations
CVGQD cycle de vie de gestion de la qualité des données
5 Utilisation prévue
Le présent document peut être utilisé dans un ou plusieurs des modes suivants:
— — par un organisme pour établir et adapter un processus de gestion de la qualité des données pour
l’utilisation des données dans le cadre de l’analyse de données et de l’AA, et pour améliorer en continu les
processus;
— — par un projet d’AA pour définir, tracer et évaluer les exigences de qualité des données;
— — par un utilisateur de données et un détenteur de données afin d’établir une compréhension commune
des caractéristiques de qualité des données et de s’assurer que les exigences convenues ont été satisfaites,
facilitant ainsi un accord pour la transaction des données.
NOTE L’organisme peut demander des garanties de confidentialité et de bonne utilisation des preuves à l’appui.
© ISO/IEC 2024 – Tous droits réservés
6 Gestion globale de la qualité des données
6.1 Objectif
L’objectif d’un processus de gestion de la qualité des données est d’établir des processus appropriés (c’est-à-
dire reproductibles et auditables) pour gérer la qualité des données et satisfaire de manière fiable à un
ensemble donné d’exigences définies par l’organisme.
6.2 Généralités
La qualité des données a un impact sur les résultats des algorithmes d’analyse de données et d’AA. La qualité
des données a une composante inhérente et une composante qui dépend du système. Les données peuvent
convenir à une application, mais pas à une autre. Le présent document aide à établir et maintenir la qualité
des données pour chaque application d’analyse de données et d’AA.
6.3 Exigences et recommandations
6.3.1 Généralités
Les exigences et recommandations suivantes s’appliquent à l’ensemble de l’organisme.
6.3.2 Culture de qualité des données
Il convient que l’organisme maintienne une culture de qualité des données.
L’organisme doit:
a) a) disposer de règles et de processus pour atteindre la qualité (conformément au présent
document) en tenant compte du modèle de qualité des données tel qu’il est appliqué aux produits et
services applicables;
b) b) définir et mettre en œuvre des processus de gestion de la qualité des données et réaliser les
activités connexes liées à la qualité des données;
c) c) intégrer les processus et activités de gestion de la qualité des données, dans la mesure du
possible, à d’autres processus et activités de gestion, tels que la gestion de la qualité générale et la gestion
des risques;
d) d) documenter les activités réalisées;
e) e) fournir les ressources suffisantes pour assurer la gestion de la qualité des données;
f) f) surveiller et, dans la mesure nécessaire, revoir et améliorer les processus de gestion de la
qualité des données;
g) g) fournir l’autorité requise au personnel impliqué;
h) h) communiquer les politiques de qualité des données au sein de l’organisme.
6.3.3 Gestion des problèmes de qualité des données
L’organisme doit satisfaire aux exigences de qualité des données en:
a) a) mettant en place des processus de communication, d’analyse, d’évaluation, de résolution et de
clôture des problèmes de qualité des données;
© ISO/IEC 2024 – Tous droits réservés
b) b) documentant les problèmes clôturés;
c) c) faisant remonter ou délégant les problèmes qui ne peuvent pas être clôturés.
NOTE 1 La résolution et la clôture des problèmes de qualité des données peuvent inclure la limitation ou l’ajustement
du domaine d’application du projet d’AA.
NOTE 2 Un problème de qualité des données peut être clôturé en mettant en œuvre une résolution ou en déterminant
une résolution sur la base de critères d’acceptation définis.
6.3.4 Gestion des compétences
L’organisme doit gérer les compétences en:
a) a) documentant les qualifications et les outils requis pour traiter les données;
b) b) s’assurant que le personnel impliqué possède les qualifications suffisantes pour exercer les
activités et fonctions qui lui incombent;
c) c) tenant à jour des registres du personnel et de leur maîtrise des qualifications et outils requis;
d) d) tenant des registres de formations et d’expérience appropriés qui justifient les qualifications
revendiquées.
L’organisme peut faire appel à des sources de compétences externes.
6.3.5 Gestion des ressources
L’organisme doit fournir les ressources nécessaires à la gestion de la qualité des données, y compris:
a) a) les applications logicielles, les formations et le support nécessaires à la gestion de la qualité
des données;
b) b) l’infrastructure ou les services informatiques nécessaires à la gestion de la qualité des données
(par exemple, calcul, stockage, mise en réseau);
c) c) le personnel ayant les qualifications requises pour assurer la gestion de la qualité des données.
6.3.6 Intégration du système de gestion
Il convient que l’organisme intègre ses activités de gestion de la qualité des données dans son système de
gestion existant, y compris ses systèmes de gestion axés sur la qualité des produits ou services, ainsi que ceux
axés sur le développement et l’utilisation de systèmes d’IA. Il convient que les implications du double rôle des
parties prenantes soient gérées par le système de gestion de la qualité, y compris l’atténuation de tout conflit
d’intérêts.
NOTE 1 La gestion des parties prenantes peut prendre en compte le potentiel d’une personne à assumer plusieurs
rôles. Un utilisateur de produits ou services basés sur l’analyse de données et l’AA peut également être propriétaire ou
contributeur de données.
NOTE 2 Les organismes peuvent utiliser l’ISO/IEC 42001 afin de définir un système de gestion pour le développement
ou l’utilisation de systèmes d’IA.
NOTE 3 Les organismes peuvent utiliser l’ISO 9001 ou d’autres systèmes de gestion de la qualité spécifiques à leur
secteur pour définir leur système de gestion de la qualité.
© ISO/IEC 2024 – Tous droits réservés
6.3.7 Documentation
La documentation doit être intelligible pour les parties prenantes concernées du projet conformément à leur
rôle. Il convient que les ressources dans une langue qui n’est pas comprise par une partie prenante concernée
soient accompagnées d’un résumé dans une langue que la partie prenante peut comprendre.
La documentation doit être accessible aux parties prenantes concernées, suivant le cas et selon les
autorisations. Il convient de réduire le plus possible les frais généraux d’accès.
Il convient que la documentation inclue le contexte ou les références nécessaires pour la rendre intelligible
aux futures parties prenantes concernées qui ne font pas partie du projet en cours. Cette pratique peut
permettre à ces parties prenantes d’évaluer un ensemble de données en vue d’une réutilisation potentielle,
partielle ou totale.
6.3.8 Audit et évaluation de la qualité des données
Les processus mis en œuvre doivent être audités, le cas échéant, sur la base d’une évaluation:
a) a) du plan de qualité des données par rapport aux règles et processus organisationnels;
b) b) des arguments et justifications détaillant la manière dont les exigences du modèle de qualité
des données ont été appliquées;
c) c) des arguments détaillant la manière dont les objectifs du plan de qualité des données ont été
atteints;
d) d) permettant de déterminer si le plan de qualité des données et tous les livrables sont complets,
cohérents et corrects conformément au présent document;
e) e) des recommandations d’amélioration de la qualité des données.
Les données doivent être évaluées à l’aide d’une évaluation de la qualité des données, qui doit reposer sur une
évaluation visant à déterminer si les données atteignent les objectifs du présent document, l’état de l’art actuel
de la technologie et les connaissances techniques applicables dans le domaine.
Le plan d’évaluation de la qualité des données doit être inclus dans l’étape de spécification. L’évaluation de la
qualité des données doit être réalisée avant la mise à disposition des données (voir l’Étape 7 à la
Figure 1Figure 1:: mise à disposition des données) ou à un intervalle approprié lors de l’utilisation de
l’apprentissage continu ou de données en continu.
L’évaluation de la qualité des données peut être réalisée sur un sous-ensemble de données lorsqu’il peut être
démontré que la qualité du sous-ensemble est représentative de la qualité de l’ensemble de données complet.
6.3.9 Examen de confirmation et mesures de la qualité des données
La qualité des données doit être confirmée par des mesures appropriées de la qualité des données
conformément à l’ISO/IEC 5259--2. Un examen de la qualité des données doit au moins couvrir:
a) a) les examens de confirmation des principaux livrables:
1) 1) chaque examen de confirmation doit être finalisé avant la mise à disposition des données;
2) 2) il convient que chaque examen de confirmation repose sur le fait que les objectifs du présent
document sont atteints ou non;
b) b) les audits qualité des processus mis en œuvre;
© ISO/IEC 2024 – Tous droits réservés
c) c) une évaluation de la qualité des données.
Tous les livrables doivent faire l’objet d’examens de confirmation.
Le personnel réalisant ces examens doit avoir accès au personnel impliqué, aux informations pertinentes et
aux ressources requises.
NOTE Les examens de confirmation des principaux livrables peuvent être délégués, mais la responsabilité incombe
à la personne désignée.
6.3.10 Gestion de la qualité des données spécifique au projet
L’organisme doit gérer les données spécifiques au projet en:
a) a) établissant un processus approprié de gestion de la qualité des données spécifique au projet
qui satisfait à toutes les exigences du projet d’AA spécifique;
b) b) tenant à jour une liste des énoncés de qualité des données pertinents. Le cas échéant,
des références quantitatives et qualitatives pour les mesures de la qualité des données doivent être
documentées;
c) c) adoptant des processus appropriés pour identifier et gérer toutes les mesures de la qualité des
données pertinentes pour le projet.
Le processus de gestion de la qualité des données spécifique au projet doit satisfaire aux exigences de
12l’Article 12.
6.4 Livrables
Les livrables du processus de gestion de la qualité des données doivent inclure:
a) a) les règles et processus spécifiques à l’organisme pour la qualité des données (par exemple,
conformément à l’ISO/IEC 5259--4);
b) b) les preuves de gestion des compétences;
c) c) les preuves d’un système de gestion de la qualité des données;
d) d) l’identification des mesures de la qualité des données utilisées;
e) e) la documentation des références de mesure de la qualité des données applicables;
f) f) les rapports sur les anomalies de qualité identifiées.
7 Gestion de la qualité des données spécifique au cycle de vie
7.1 Objectif
L’objectif d’un cycle de vie de gestion de la qualité des données (CVGQD) est d’établir et de maintenir la qualité
des données tout au long du cycle de vie des données. Un exemple de modèle de cycle de vie des données est
décrit dans l’ISO/IEC 5259--1:2024, Figure 3.
© ISO/IEC 2024 – Tous droits réservés
7.2 Généralités
7.2.1 Cycle de vie de gestion de la qualité des données
La qualité des données doit être gérée à toutes les étapes du cycle de vie des données. Le modèle de cycle de
vie de gestion de la qualité des données (CVGQD) représenté à la Figure 1Figure 1 fournit des
recommandations pour satisfaire aux exigences de qualité des données à utiliser dans un contexte d’analyse
de données et d’AA. Il déduit des étapes spécifiques qui sont pertinentes pour la gestion de la qualité des
données et facilite le regroupement et l’organisation des exigences et des lignes directrices à prendre en
compte pour la gestion de la qualité des données. Le modèle de CVGQD n’est pas prescriptif de l’ordre temporel
des étapes. Les différentes étapes du CVGQD sont décrites en 7.2.27.2.2.
5259-3_ed1fig1_f.EPS
Légende
5259-3_ed1fig1_key1.EPS Voie de développement principale
5259-3_ed1fig1_key2.EPS
Voie de retour d’informations
5259-3_ed1fig1_key3.EPS
Instanciation du modèle CVD pour la série 5259 (voir l’ISO/IEC 5259--1:2024, Figure 3)
5259-3_ed1fig1_key4.EPS
Étape du cycle de vie de gestion de la qualité des données
5259-3_ed1fig1_key5.EPS
Processus horizontaux du cycle de vie de gestion de la qualité des données
5259-3_ed1fig1_key6.EPS
Indication de l’itération dans le cycle de vie
5259-3_ed1fig1_key7.EPS
Regroupement des étapes du cycle de vie de gestion de la qualité des données pour clarifier la mise en correspondance avec le
modèle CVD
© ISO/IEC 2024 – Tous droits réservés
Figure 1 — Cycle de vie de gestion de la qualité des données
Les problèmes de qualité des données peuvent survenir à n’importe quelle étape du cycle de vie des données.
La gestion de la qualité des données doit établir et maintenir des processus de qualité des données au début
du cycle de vie des données. Si l’organisme délègue la responsabilité d’un processus, cette délégation doit être
documentée et traçable.
NOTE Il est généralement plus difficile d’identifier et de corriger les problèmes de qualité des données après coup
que de gérer les risques de qualité des données lorsqu’ils surviennent pour la première fois. Par exemple, les erreurs
introduites lors de la collecte de données sont plus facilement évitées par une gestion de la qualité appropriée plutôt
qu’en tentant d’identifier et de corriger les erreurs plus tard dans le cycle de vie des données.
7.2.2 Étapes du cycle de vie de gestion de la qualité des données
7.2.2.1 Motivation et conceptualisation des données
La gestion de la qualité des données commence par l’étape de motivation et de conceptualisation. Il convient
d’identifier et de gérer les problèmes potentiels liés à la qualité des données lorsque le premier besoin de
données pour un contexte d’analyse de données et d’AA devient apparent. Entre autres, la motivation et
l’utilisation prévue des données sont validées et vérifiées afin de gérer les caractéristiques de qualité telles
que la conformité et la pertinence.
7.2.2.2 Spécification des données
À l’étape de spécification des données, la gestion de la qualité des données impose des exigences pour la
création de la spécification des données, y compris les formats de données, les propriétés statistiques et la
divisibilité. Les lignes directrices de gestion de la qualité des données facilitent l’identification d’exigences et
de plans erronés, incomplets ou contradictoires. Par exemple, dans un contexte d’analyse de données et d’AA,
la gestion de la qualité confirme que les données correspondent aux exigences du contexte.
7.2.2.3 Planification des données
Au cours de l’étape de planification des données, un plan est formulé pour satisfaire à la spécification des
données. Cela comprend la planification des tâches et des ressources spécifiques pour acquérir et traiter les
données tout au long du cycle de vie des données, ainsi que des méthodes d’évaluation et des critères
d’acceptation.
7.2.2.4 Acquisition des données
En matière de gestion de la qualité des données, l’acquisition de données peut désigner la collecte de données,
la génération de données ou l’acquisition et la combinaison d’ensembles de données existants. Le choix de la
méthode de collecte des données a des implications sur la gestion de la qualité des données. Quelle que soit la
méthode d’obtention des données, le résultat de cette étape est considéré comme l’entrée brute pour les
étapes ultérieures du cycle de vie des données, même si un ensemble de données déjà géré est importé.
7.2.2.5 Prétraitement des données
L’étape de prétraitement des données organise toutes les exigences et lignes directrices de gestion de la
qualité des données qui sont liées au traitement des données d’entrée brute obtenues pendant
l’étape d’acquisition des données. Les activités de cette étape ont tendance à supprimer des éléments de
données, par exemple en filtrant et en nettoyant les données brutes.
© ISO/IEC 2024 – Tous droits réservés
7.2.2.6 Augmentation des données
L’augmentation des données utilise l’intrant de l’étape de prétraitement des données qu’elle organise
conformément à toutes les exigences et lignes directrices de gestion de la qualité liées à l’ajout de données à
l’ensemble de données. Cela inclut l’association de métadonnées, l’ajout d’étiquettes de données ou d’autres
transformations.
7.2.2.7 Mise à disposition des données
L’objectif de la mise à disposition des données est de mettre l’ensemble de données à disposition là où il est
nécessaire. Les exigences de gestion de la qualité des données à cette étape comprennent, entre autres, le
maintien de l’intégrité des ensembles de données pendant la livraison, le contrôle d’accès, la documentation
et la vérification que le contexte d’utilisation correspond à l’utilisation prévue de l’ensemble de données.
7.2.2.8 Mise hors service des données
La gestion de la qualité des données se termine par la suppression ou le transfert des données lors de l’étape de
mise hors service des données. Dans chacun de ces cas, qui sont mutuellement exclusifs, la responsabilité des
données est levée. Une manipulation appropriée des données libérées constitue un facteur majeur de
confiance envers l’organisme et peut contribuer à prévenir l’utilisation abusive des données.
7.2.3 Adaptation du cycle de vie de gestion de la qualité des données indépendamment du projet
Il convient que l’organisme adapte le cycle de vie s’il:
a) a) fusionne ou scinde des étapes;
b) b) exécute les processus requis à différentes étapes ou dans le cadre d’étapes supplémentaires
(voir l’ISO/IEC 5259--4);
c) c) itère les étapes;
d) d) exécute simultanément des activités qui ne dépendent pas les unes des autres;
e) e) omet les étapes qui ne s’appliquent pas, en donnant une justification;
f) f) inclut les dispositions de gestion de la qualité des données pour la validation et la vérification,
la gestion des modifications et la gestion de la configuration comme représenté à la Figure 1Figure 1.
7.2.4 Aspects horizontaux du cycle de vie de gestion de la qualité des données
7.2.4.1 Généralités
La Figure 1Figure 1 montre quatre processus qui couvrent toutes les étapes du cycle de vie de gestion de la
qualité des données, notamment:
a) a) validation et vérification;
b) b) gestion des modifications;
c) c) gestion de la configuration;
d) d) gestion des risques.
Ces processus doivent également être réalisés dans le cas d’une adaptation indépendante du projet.
© ISO/IEC 2024 – Tous droits réservés
7.2.4.2 Validation et vérification
Il convient que la validation et la vérification de la qualité des données soient effectuées à toutes les étapes
pertinentes tout au long du cycle de vie de gestion de la qualité des données.
7.2.4.3 Gestion des modifications
La gestion des modifications permet de s’assurer que les éventuelles modifications de données ou de
processus ne compromettent pas la qualité des données.
7.2.4.4 Gestion de la configuration
La gestion de la configuration permet de s’assurer que les données et processus sont référençables de manière
unique et que la qualité des données n’est pas compromise par des modifications dans la gestion de la
configuration.
7.2.4.5 Gestion des risques
Il convient que la gestion des risques soit effectuée à toutes les étapes pertinentes tout au long du cycle de vie
de gestion de la qualité des données.
7.3 Exigences et recommandations
7.3.1 Motivation et conceptualisation des données
7.3.1.1 Généralités
L’organisme doit:
a) a) documenter la motivation et l’origine du besoin de données;
b) b) spécifier le domaine d’application, la finalité et l’utilisation prévue des données;
c) c) documenter les exigences de qualité des données.
NOTE Pour en savoir plus sur les préoccupations sociétales et éthiques, voir l’ISO/IEC TR 24368.
7.3.1.2 Analyse des parties prenantes
L’organisme doit:
a) a) effectuer une analyse des parties prenantes afin d’identifier toutes les parties prenantes
concernées par les données et leurs implications pour la gestion de la qualité des données;
b) b) identifier les exigences de qualité des données potentiellement contradictoires.
NOTE Une description des rôles et sous-rôles potentiels des parties prenantes de l’IA est fournie par
l’ISO/IEC 22989:2022, 5.19.
7.3.1.3 Analyse de faisabilité
Il convient que l’organisme tienne à jour une analyse de faisabilité basée sur ses qualifications et ressources
disponibles et qui évalue sa capacité à atteindre ses objectifs de qualité des données. Il convient de mettre à
jour l’analyse de faisabilité tout au long du cycle de vie des données.
NOTE Les projets d’AA antérieurs et les ensembles de données accessibles publiquement qui ont atteint les objectifs
de qualité cibles sont des exemples de preuves de faisabilité.
© ISO/IEC 2024 – Tous droits réservés
7.3.2 Spécification des données
7.3.2.1 Généralités
L’organisme doit spécifier les exigences en matière de données dans une spécification de données et valider
que ces exigences sont cohérentes et complètes pour l’utilisation prévue.
La spécification des données doit inclure les aspects minimums requis et ceux qui sont facultatifs en fonction
de l’utilisation prévue par le système d’IA.
Il convient que la spécification couvre les points suivants:
a) a) une description de la nature des données;
b) b) l’objectif prévu du projet d’analyse de données et d’AA utilisant les données;
c) c) les exigences légales;
d) d) les considérations de sécurité et de sûreté;
e) e) la possibilité de biais indésirable;
f) f) les considérations relatives à la protection des données;
g) g) les exigences en matière de données spécifiques au domaine et au projet;
h) h) le modèle de qualité des données et le niveau de qualité requis pour atteindre l’utilisation
prévue des données.
NOTE 1 La spécification des données peut être basée sur la description du traitement des biais indésirables tout au
long du cycle de vie d’un système d’IA, fournie dans l’ISO/IEC TR 24027.
NOTE 2 La spécification des données inclut les différentes interfaces avec un projet d’AA (par exemple, données pour
l’entraînement, données pour les tests ou gestion continue des données).
NOTE 3 Certains algorithmes d’AA requièrent des propriétés statistiques spécifiques aux données d’entraînement.
NOTE 4 Les considérations de protection des données peuvent inclure le principe de minimisation des données
(également appelé «évitement des données »). La minimisation des données signifie que seules les données minimales
nécessaires au fonctionnement du système sont recueillies ou utilisées.
7.3.2.2 Format des données
L’organisme doit déterminer quelles informations doivent être incluses dans les informations de format de
données. Ces informations peuvent inclure, entre autres:
a) a) l’encodage;
b) b) la fréquence (temps);
c) c) la résolution (espace);
d) d) la syntaxe;
e) e) la sémantique;
f) f) la structure des métadonnées associées;
© ISO/IEC 2024 – Tous droits réservés
g) g) les plages de valeurs attendues;
h) h) les éléments facultatifs et obligatoires;
i) i) les formats de propriété éventuellement admissibles et les alternatives valides (par exemple,
tailles des images);
j) j) les liens et renvois.
NOTE La sémantique fait référence à l’interprétation et à l’utilisation des données, ce qui inclut les opérations
admissibles sur les données.
7.3.2.3 Propriétés statistiques et divisibilité
La spécification des données doit inclure la spécification des divisions valides en sous-ensembles
(par exemple, données d’entraînement, de validation et de test). Il convient que les sous-ensembles ne se
croisent pas, sauf lorsqu’ils sont utilisés conjointement avec des méthodes scientifiquement appropriées telles
que le bagging, l’autoamorçage et la validation à k blocs.
Pour chacun de ces sous-ensembles, l’organisme doit déterminer et maintenir:
a) a) des propriétés statistiques pertinentes;
b) b) une représentativité;
c) c) une taille appropriée.
7.3.2.4 Ressources et outils de support
Il convient que la spécification des données inclue toutes les exigences pertinentes relatives à la manipulation
des données et couvre au moins:
a) a) les spécifications des outils de support;
b) b) la spécification matérielle minimale pour traiter les données et utiliser les outils;
c) c) les résolutions nécessaires à la visualisation;
d) d) les exigences relatives au
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.

Loading comments...