Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 3: Data quality management requirements and guidelines

This document specifies requirements and provides guidance for establishing, implementing, maintaining and continually improving the quality of data used in the areas of analytics and machine learning. This document does not define a detailed process, methods or metrics. Rather it defines the requirements and guidance for a quality management process along with a reference process and methods that can be tailored to meet the requirements in this document. The requirements and recommendations set out in this document are generic and are intended to be applicable to all organizations, regardless of type, size or nature.

Intelligence artificielle — Qualité des données pour les analyses de données et l’apprentissage automatique (AA) — Partie 3: Exigences et lignes directrices pour la gestion de la qualité des données

Le présent document spécifie des exigences et fournit des recommandations pour l’établissement, la mise en œuvre, le maintien et l’amélioration continue de la qualité des données utilisées dans les domaines de l’analyse de données et de l’apprentissage automatique. Le présent document ne définit pas de processus, de méthodes ou de métriques détaillés. Il définit plutôt les exigences et recommandations associées à un processus de gestion de la qualité, ainsi qu’un processus et des méthodes de référence qui peuvent être adaptés pour satisfaire à ses exigences. Les exigences et recommandations énoncées dans le présent document sont génériques et prévues pour s’appliquer à tout organisme, quels que soient son type, sa taille et sa nature.

General Information

Status
Published
Publication Date
01-Jul-2024
Current Stage
6060 - International Standard published
Start Date
02-Jul-2024
Due Date
30-Apr-2024
Completion Date
02-Jul-2024

Overview

ISO/IEC 5259-3:2024 defines requirements and provides guidance for establishing, implementing, maintaining and continually improving the quality of data used for analytics and machine learning (ML). It sets out a generic, organization‑agnostic framework for a data quality management process, including a reference life cycle and methods that organizations can tailor. The standard specifically does not prescribe detailed processes, methods or numeric metrics - instead it requires and guides the design of a quality management approach suitable to each organization’s context.

Key topics and requirements

  • Data quality management objectives: establish a process to ensure data is fit for analytics and ML use and continually improved.
  • Organizational aspects: foster a data quality culture; define roles, responsibilities and competence management.
  • Management system integration: align data quality activities with existing management systems and resources.
  • Documentation & auditing: require documentation, audits, assessments, confirmation reviews and measurable work products.
  • Life‑cycle coverage: specify requirements across data life‑cycle stages including:
    • Data motivation and conceptualization
    • Data specification
    • Data planning
    • Data acquisition
    • Data preprocessing
    • Data augmentation
    • Data provisioning
    • Data decommissioning
  • Horizontal processes: verification & validation, configuration management, change management, and risk management for data quality.
  • Supply chain & tooling: guidance for managing data quality across supplier relationships and for the management of data processing tools and dependencies.
  • Project‑specific management: tailoring, planning, coordination, data quality justification, decommissioning and project work products.

Practical applications

  • Build or improve an organizational data quality management program for ML and analytics projects.
  • Design data governance controls that ensure data fitness for model training, evaluation and deployment.
  • Integrate data quality requirements into project plans, supplier contracts and tooling procurement.
  • Structure audits, verification/validation activities and documentation to support reproducibility, compliance and risk mitigation.
  • Tailor the reference life cycle to specific projects (e.g., model development, data pipelines, labeling efforts) without inventing fixed metrics.

Who should use this standard

  • Data governance leaders, Chief Data Officers (CDOs) and CIOs
  • Data engineers, ML engineers and data scientists
  • Quality assurance, compliance and risk management teams
  • Procurement and supply‑chain managers working with data suppliers
  • Tooling and platform architects responsible for data pipelines and processing tools

Related standards

  • Other parts of the ISO/IEC 5259 series and complementary ISO/IEC AI and data management standards (consult the ISO catalogue for specific titles). These provide complementary guidance on AI systems, ethics and technical controls.

Keywords: ISO/IEC 5259-3, data quality, machine learning, ML data governance, data quality management, analytics, data life cycle, AI data standards.

Standard

ISO/IEC 5259-3:2024 - Artificial intelligence — Data quality for analytics and machine learning (ML) — Part 3: Data quality management requirements and guidelines Released:2. 07. 2024

English language
28 pages
sale 15% off
Preview
sale 15% off
Preview
Standard

ISO/IEC 5259-3:2024 - Intelligence artificielle — Qualité des données pour les analyses de données et l’apprentissage automatique (AA) — Partie 3: Exigences et lignes directrices pour la gestion de la qualité des données Released:11. 07. 2025

French language
29 pages
sale 15% off
Preview
sale 15% off
Preview
Standard

REDLINE ISO/IEC 5259-3:2024 - Intelligence artificielle — Qualité des données pour les analyses de données et l’apprentissage automatique (AA) — Partie 3: Exigences et lignes directrices pour la gestion de la qualité des données Released:11. 07. 2025

French language
29 pages
sale 15% off
Preview
sale 15% off
Preview

Frequently Asked Questions

ISO/IEC 5259-3:2024 is a standard published by the International Organization for Standardization (ISO). Its full title is "Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 3: Data quality management requirements and guidelines". This standard covers: This document specifies requirements and provides guidance for establishing, implementing, maintaining and continually improving the quality of data used in the areas of analytics and machine learning. This document does not define a detailed process, methods or metrics. Rather it defines the requirements and guidance for a quality management process along with a reference process and methods that can be tailored to meet the requirements in this document. The requirements and recommendations set out in this document are generic and are intended to be applicable to all organizations, regardless of type, size or nature.

This document specifies requirements and provides guidance for establishing, implementing, maintaining and continually improving the quality of data used in the areas of analytics and machine learning. This document does not define a detailed process, methods or metrics. Rather it defines the requirements and guidance for a quality management process along with a reference process and methods that can be tailored to meet the requirements in this document. The requirements and recommendations set out in this document are generic and are intended to be applicable to all organizations, regardless of type, size or nature.

ISO/IEC 5259-3:2024 is classified under the following ICS (International Classification for Standards) categories: 35.020 - Information technology (IT) in general. The ICS classification helps identify the subject area and facilitates finding related standards.

You can purchase ISO/IEC 5259-3:2024 directly from iTeh Standards. The document is available in PDF format and is delivered instantly after payment. Add the standard to your cart and complete the secure checkout process. iTeh Standards is an authorized distributor of ISO standards.

Standards Content (Sample)


International
Standard
ISO/IEC 5259-3
First edition
Artificial intelligence — Data
2024-07
quality for analytics and machine
learning (ML) —
Part 3:
Data quality management
requirements and guidelines
Intelligence artificielle — Qualité des données pour les analyses
de données et l’apprentissage automatique —
Partie 3: Exigences et lignes directrices pour la gestion de la
qualité des données
Reference number
© ISO/IEC 2024
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
© ISO/IEC 2024 – All rights reserved
ii
Contents Page
Foreword .v
Introduction .vi
1 Scope .1
2 Normative references .1
3 Terms and definitions .1
4 Symbols and abbreviated terms. 2
5 Intended usage . 2
6 Overall data quality management . 2
6.1 Objective.2
6.2 General .2
6.3 Requirements and recommendations .3
6.3.1 General .3
6.3.2 Data quality culture . .3
6.3.3 Management of data quality issues . .3
6.3.4 Competence management .3
6.3.5 Resource management .4
6.3.6 Management system integration .4
6.3.7 Documentation.4
6.3.8 Data quality audit and assessment.4
6.3.9 Confirmation review and data quality measures .5
6.3.10 Project-specific data quality management .5
6.4 Work products .5
7 Life cycle-specific data quality management .6
7.1 Objective.6
7.2 General .6
7.2.1 Data quality management life cycle .6
7.2.2 Data quality management life cycle stages .7
7.2.3 Project-independent tailoring of the data quality management life cycle .8
7.2.4 Horizontal aspects of the data quality management life cycle .8
7.3 Requirements and recommendations .9
7.3.1 Data motivation and conceptualization . .9
7.3.2 Data specification .9
7.3.3 Data planning .11
7.3.4 Data acquisition . . .11
7.3.5 Data preprocessing . 13
7.3.6 Data augmentation . 13
7.3.7 Data provisioning .14
7.3.8 Data decommissioning .16
7.4 Work products .17
7.4.1 Work products of data motivation and conceptualization stage .17
7.4.2 Work products of data specification stage .17
7.4.3 Work products of data planning stage .17
7.4.4 Work products of data acquisition stage .17
7.4.5 Work products of data preprocessing stage .17
7.4.6 Work products of data augmentation stage .18
7.4.7 Work products of data provisioning stage .18
7.4.8 Work products of data decommissioning stage .18
8 Horizontal processes .18
8.1 Objective.18
8.2 General .18
8.3 Requirements and recommendations .18
8.3.1 Verification and validation .18

© ISO/IEC 2024 – All rights reserved
iii
8.3.2 Configuration management .19
8.3.3 Change management .19
8.3.4 Risk management . 20
8.4 Work products .21
8.4.1 Work products of verification and validation .21
8.4.2 Work products of configuration management .21
8.4.3 Work products of change management.21
8.4.4 Work products for risk management .21
9 Management of data quality in supply chains .22
9.1 Objective. 22
9.2 Requirements and recommendations . 22
9.3 Work products . 22
10 Management of data processing tools .23
10.1 Objective. 23
10.2 Requirements and recommendations . 23
10.3 Work products . 23
11 Management of data quality dependencies .23
11.1 Objective. 23
11.2 Requirements and recommendations . 23
11.3 Work products . 23
12 Project-specific data quality management .24
12.1 Objective.24
12.2 Requirements and recommendations .24
12.2.1 Context and intended use .24
12.2.2 Objective .24
12.2.3 Requirements and recommendations .24
12.3 Specification and management of data quality requirements .24
12.3.1 Objective .24
12.3.2 Requirements and recommendations . 25
12.4 Roles and responsibilities in data quality management . 25
12.4.1 Objective . 25
12.4.2 Requirements and recommendations . 25
12.4.3 Work products . 25
12.5 Tailoring of the data quality activities . 25
12.6 Planning and coordination of the data quality activities . 26
12.6.1 General . 26
12.6.2 Data quality plan . 26
12.6.3 Planning of processes. 26
12.7 Progression of the data quality life cycle . 26
12.8 Data quality justification . 26
12.9 Decommissioning .27
12.10 Work products .27
Bibliography .28

© ISO/IEC 2024 – All rights reserved
iv
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical
Commission) form the specialized system for worldwide standardization. National bodies that are
members of ISO or IEC participate in the development of International Standards through technical
committees established by the respective organization to deal with particular fields of technical activity.
ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations,
governmental and non-governmental, in liaison with ISO and IEC, also take part in the work.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types
of document should be noted. This document was drafted in accordance with the editorial rules of the ISO/
IEC Directives, Part 2 (see www.iso.org/directives or www.iec.ch/members_experts/refdocs).
ISO and IEC draw attention to the possibility that the implementation of this document may involve the
use of (a) patent(s). ISO and IEC take no position concerning the evidence, validity or applicability of any
claimed patent rights in respect thereof. As of the date of publication of this document, ISO and IEC had not
received notice of (a) patent(s) which may be required to implement this document. However, implementers
are cautioned that this may not represent the latest information, which may be obtained from the patent
database available at www.iso.org/patents and https://patents.iec.ch. ISO and IEC shall not be held
responsible for identifying any or all such patent rights.
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions
related to conformity assessment, as well as information about ISO's adherence to the World Trade
Organization (WTO) principles in the Technical Barriers to Trade (TBT) see www.iso.org/iso/foreword.html.
In the IEC, see www.iec.ch/understanding-standards.
This document was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology,
Subcommittee SC 42, Artificial intelligence.
A list of all parts in the ISO/IEC 5259 series can be found on the ISO and IEC websites.
Any feedback or questions on this document should be directed to the user’s national standards
body. A complete listing of these bodies can be found at www.iso.org/members.html and
www.iec.ch/national-committees.

© ISO/IEC 2024 – All rights reserved
v
Introduction
The quality of analytics and machine learning (ML) based products and services depends on the quality of
data used to train ML models. Hence, data quality management is essential as it often helps to ensure the
success of analytics and ML technology.
The adoption of a data quality management system facilitates managing the quality of products and services
that employ analytics and ML technologies. This document defines vocabulary, requirements and guidelines
for communication, alignment and agreement for managing data quality. The data quality management
system provides transparency and auditability, either through self-assessment or third party assessment.
It facilitates achieving relevant stakeholder satisfaction and managing quality, performance and self-
declaration requirements. Specifically, this document defines requirements for a data quality management
system with references to data quality measures that are relevant for the most commonly used analytics
and ML technologies.
As data quality requirements vary with context and application domain, this document provides a generic set
of requirements and recommendations relating to common data life cycle stages. A data life cycle is typically
tightly integrated with the accompanying AI system life cycle and therefore has several dependencies. This
document does not prescribe what AI system life cycle to use. Instead, it provides generic interfaces that
allow users of this document the flexibility to interface with several life cycle models as long as the life cycle
processes can be mapped.
ISO/IEC 5259-1 describes the data quality terminology and concepts used in this document.
1)
ISO/IEC 5259-2 describes the data quality model and data quality measures used in this document.
ISO/IEC 5259-4 describes the data quality process framework used in this document.
2)
ISO/IEC 5259-5 provides a data quality governance framework as guidance for governing bodies.
3)
ISO/IEC TR 5259-6 describes a visualization framework for data quality in analytics and ML.
1) Under preparation. Stage at the time of publication: ISO/IEC FDIS 5259-2:2024.
2) Under preparation. Stage at the time of publication: ISO/IEC DIS 5259-5:2023.
3) Under preparation. Stage at the time of publication: ISO/IEC CD TR 5259-6:2023.

© ISO/IEC 2024 – All rights reserved
vi
International Standard ISO/IEC 5259-3:2024(en)
Artificial intelligence — Data quality for analytics and
machine learning (ML) —
Part 3:
Data quality management requirements and guidelines
1 Scope
This document specifies requirements and provides guidance for establishing, implementing, maintaining
and continually improving the quality of data used in the areas of analytics and machine learning.
This document does not define a detailed process, methods or metrics. Rather it defines the requirements
and guidance for a quality management process along with a reference process and methods that can be
tailored to meet the requirements in this document.
The requirements and recommendations set out in this document are generic and are intended to be
applicable to all organizations, regardless of type, size or nature.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes
requirements of this document. For dated references, only the edition cited applies. For undated references,
the latest edition of the referenced document (including any amendments) applies.
ISO/IEC 5259-1:2024, Artificial intelligence — Data quality for analytics and machine learning (ML) — Part 1:
Overview, terminology, and examples
4)
ISO/IEC 5259-2 , Artificial Intelligence — Data quality for analytics and machine learning (ML) — Part 2: Data
quality measures
ISO/IEC 22989, Information technology — Artificial intelligence — Artificial intelligence concepts and
terminology
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO/IEC 22989, ISO/IEC 5259-1 and the
following apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at https:// www .electropedia .org/
3.1
data quality claim
statement to what degree data satisfy a data quality requirement
4) Under preparation. Stage at the time of publication: ISO/IEC FDIS 5259-2:2024.

© ISO/IEC 2024 – All rights reserved
3.2
data quality plan
specification of practices, processes and allocation of resources to achieve data quality objectives as the
outcome of data quality planning
3.3
data quality planning
part of data quality management focused on setting data quality objectives and specifying necessary
operational processes and related resources to achieve the quality objectives
[SOURCE: ISO 8000-2:2022, modified — example removed]
3.4
development interface agreement
DIA
agreement between customer and supplier in which the responsibilities for activities to be performed,
evidence to be reviewed, or work products to be exchanged by each party related to the development of
items or elements are specified
Note 1 to entry: While DIA applies to the development phase, supply agreement applies to production.
[SOURCE: ISO 26262-1:2018]
4 Symbols and abbreviated terms
DQMLC data quality management life cycle
5 Intended usage
This document may be used in one or more of the following modes:
— by an organization to establish and tailor a data quality management process for the use of data in
analytics and ML, and continually improve processes;
— by an ML project to define, trace and evaluate data quality requirements;
— by a data user and data holder to establish a common understanding of data quality characteristics, and
to ensure that agreed requirements have been met, facilitating an agreement for transacting data.
NOTE The organization can request assurances of confidentiality and proper use for supporting evidence.
6 Overall data quality management
6.1 Objective
The objective of a data quality management process is to establish appropriate (i.e. repeatable and auditable)
processes to manage the quality of data and reliably meet a given set of requirements set by the organization.
6.2 General
Data quality impacts outcomes of analytics and ML algorithms. Data quality has an inherent constituent and
a system-dependent constituent. Data can be suitable for one application but not suitable for another. This
document helps to establish and maintain data quality for each analytics and ML application.

© ISO/IEC 2024 – All rights reserved
6.3 Requirements and recommendations
6.3.1 General
The following requirements and recommendations apply to the whole organization.
6.3.2 Data quality culture
The organization should sustain a data quality culture.
The organization shall:
a) have rules and processes to achieve quality (according to this document) taking into account the data
quality model as applied to the applicable products and services;
b) define and implement data quality management processes, and perform related data quality activities;
c) integrate the data quality management processes and activities, to the extent appropriate, into other
management processes and activities, such as general quality management and risk management;
d) document the performed activities;
e) provide resources sufficient to perform data quality management;
f) monitor, and to the extent necessary, review and improve the data quality management processes;
g) provide the required authority to involved personnel;
h) communicate data quality policies within the organization.
6.3.3 Management of data quality issues
The organization shall meet data quality requirements by:
a) having processes for communicating, analysing, evaluating, resolving and closing data quality issues;
b) documenting closed issues;
c) escalating or delegating issues that cannot be closed.
NOTE 1 Resolving and closing issues of data quality can include limiting or adjusting the scope of the ML project.
NOTE 2 A data quality issue can be closed by implementing a resolution or determining a resolution based on
defined acceptance criteria.
6.3.4 Competence management
The organization shall manage competence by:
a) documenting required skills and tools to process the data;
b) ensuring that involved personnel have sufficient skills to perform their activities and duties;
c) maintaining records of persons and their proficiency on the required skills and tools;
d) keeping appropriate records of training and experience that substantiate claims of appropriate skills.
The organization can use external sources of competencies.

© ISO/IEC 2024 – All rights reserved
6.3.5 Resource management
The organization shall provide the resources required for data quality management, including:
a) software applications, training and support necessary to perform data quality management;
b) IT infrastructure or services necessary to perform data quality management (e.g. compute, storage,
networking);
c) personnel with the skills required to perform data quality management.
6.3.6 Management system integration
The organization should integrate its data quality management activities into its existing management
system, including its management systems for product or service quality, and for the development and use
of AI systems. Implications from dual roles of stakeholders should be managed by the quality management
system, including mitigation of any conflicts of interest.
NOTE 1 Stakeholder management can consider the potential of multiple roles for an individual. A user of analytics
and ML based products or services can also be an owner or contributor of data.
NOTE 2 Organizations can use ISO/IEC 42001 to define a management system for the development or use of AI
systems.
NOTE 3 Organizations can use ISO 9001 or other sector-specific quality management systems to define their
quality management system.
6.3.7 Documentation
Documentation shall be intelligible to relevant stakeholders of the project in accordance with their role.
Resources in a language that is not understood by a relevant stakeholder should be accompanied by a
summary in a language that the stakeholder can understand.
The documentation shall be accessible to relevant stakeholders as appropriate and authorized. Access
overhead should be minimized.
Documentation should include the context or references necessary to make it intelligible to future relevant
stakeholders who are not part of the current project. This practice can enable these stakeholders to evaluate
a dataset for potential reuse, partially or in total.
6.3.8 Data quality audit and assessment
The implemented processes shall be audited when appropriate, which shall be based on an evaluation of:
a) the data quality plan against organizational rules and processes;
b) arguments and justifications detailing how the requirements of the data quality model have been
applied;
c) arguments detailing how the objectives of data quality plan have been achieved;
d) whether the data quality plan and all work products are complete, consistent and correct according to
this document;
e) recommendations for improvement of data quality.
The data shall be assessed using a data quality assessment, which shall be based on an evaluation of
whether the data achieve the objectives of this document, the current state-of-the-art in technology and the
applicable engineering domain knowledge.

© ISO/IEC 2024 – All rights reserved
The data quality assessment plan shall be included in the specification stage. The data quality assessment
shall be performed before data provisioning (see Figure 1, Stage 7: Data provisioning) or at an appropriate
interval when using continuous learning or when using streaming data.
The data quality assessment may be performed on a subset of the data when it can be demonstrated that the
quality of the subset is representative of the quality of the complete dataset.
6.3.9 Confirmation review and data quality measures
Data quality shall be confirmed by appropriate data quality measures in accordance with ISO/IEC 5259-2. A
data quality review shall at least cover:
a) confirmation reviews of key work products. Every confirmation review:
1) shall be finalized before data provisioning;
2) should be based on whether the objectives of this document are achieved;
b) quality audits of the implemented processes;
c) quality assessment of the data.
All work products shall undergo confirmation reviews.
The personnel performing these reviews shall have access to the involved personnel, relevant information
and required resources.
NOTE Confirmation reviews of key work products can be delegated, but the responsibility stays with the
designated person.
6.3.10 Project-specific data quality management
The organization shall manage project-specific data by:
a) establishing a suitable project-specific data quality management process that meets all requirements of
the specific ML project;
b) maintaining a list of relevant data quality claims. Where applicable, quantitative and qualitative
benchmarks for data quality measures shall be documented;
c) adopting appropriate processes to identify and manage all data quality measures relevant for the
project.
The project-specific data quality management process shall fulfil the requirements of Clause 12.
6.4 Work products
Work products of the data quality management process shall include:
a) organization-specific rules and processes for data quality (e.g. according to ISO/IEC 5259-4);
b) evidence of competence management;
c) evidence of a data quality management system;
d) identification of the used data quality measures;
e) documentation of applicable data quality measure benchmarks;
f) identified quality anomaly reports.

© ISO/IEC 2024 – All rights reserved
7 Life cycle-specific data quality management
7.1 Objective
The objective of a data quality management life cycle (DQMLC) is to establish and maintain data quality
throughout the data life cycle. An example of a data life cycle model is described in ISO/IEC 5259-1:2024,
Figure 3.
7.2 General
7.2.1 Data quality management life cycle
Data quality shall be managed in all stages of the data life cycle. The data quality management life cycle
(DQMLC) model shown in Figure 1 provides guidance towards meeting the quality requirements of data for
use in an analytics and ML context. It derives discrete stages that are relevant for the management of data
quality and facilitates grouping and organizing of requirements and guidelines to consider for managing
data quality. The DQMLC model is not prescriptive of the temporal ordering of stages. The various stages of
the DQMLC are described in 7.2.2.

Key
Primary development pathway
Feedback pathway
Instantiation of DLC model for 5259 series (see ISO/IEC 5259-1:2024, Figure 3)
Data quality management life cycle stage
Horizontal processes of the data quality management life cycle
Indicating iteration within the life cycle
Grouping of data quality management life cycle stages to clarify mapping to DCL model
Figure 1 — Data quality management life cycle

© ISO/IEC 2024 – All rights reserved
Issues in data quality can originate at any stage throughout the data life cycle. Data quality management
shall establish and maintain data quality processes at the beginning of the data life cycle. If the organization
delegates the responsibility for a process, that delegation shall be documented and be traceable.
NOTE It is generally more difficult to detect and correct data quality issues after the fact than to manage data
quality risks when they first occur. For example, errors introduced while collecting data are more easily avoided by
appropriate quality management rather than attempting to detect and correct errors later in the data life cycle.
7.2.2 Data quality management life cycle stages
7.2.2.1 Data motivation and conceptualization
Data quality management begins with the motivation and conceptualization stage. Potential issues with
data quality should be identified and managed when the first need for data for an analytics and ML context
becomes apparent. Among others, the motivation and intended use for the data are validated and verified to
manage quality characteristics such as conformity and relevance.
7.2.2.2 Data specification
In the data specification stage, data quality management imposes requirements on the creation of the
data specification, including data formats, statistical properties and divisibility. Data quality management
guidelines facilitate identification of erroneous, incomplete, or conflicting requirements and plans.
For example, given an analytics and ML context, quality management confirms that the data match the
requirements of that context.
7.2.2.3 Data planning
In the data planning stage, a plan is formulated to meet the data specification. This includes planning of
specific tasks and resources to acquire and process data throughout the data life cycle, as well as evaluation
methods and acceptance criteria.
7.2.2.4 Data acquisition
In terms of data quality management, data acquisition can refer to collecting data, generating data, or
acquiring and combining existing datasets. The choice of method of data collection has implications on data
quality management. Regardless of the method of obtaining data, the result of this stage is considered the
raw input for subsequent stages of the data life cycle, even if an already managed dataset is imported.
7.2.2.5 Data preprocessing
The data preprocessing stage organizes all data quality management requirements and guidelines that are
related to processing the raw input data obtained during the data acquisition stage. Activities in this stage
tend to remove data items, for example by filtering and cleaning raw data.
7.2.2.6 Data augmentation
Data augmentation takes the input from the data preprocessing stage and organizes it according to all
quality management requirements and guidelines related to adding to the dataset. This includes associating
metadata, adding data labels or other transformations.
7.2.2.7 Data provisioning
The goal of data provisioning is to provide the dataset where it is needed. Data quality management
requirements in this stage include, among others, maintaining integrity of datasets during delivery, access
control, documentation and verification that context of use matches the dataset’s intended use.

© ISO/IEC 2024 – All rights reserved
7.2.2.8 Data decommissioning
Data quality management closes with data deletion or data transfer in the data decommissioning stage. In
each of these mutually exclusive cases, the responsibility for the data is released. The appropriate handling
of data released is a major factor of trust in the organization and can contribute to data misuse prevention.
7.2.3 Project-independent tailoring of the data quality management life cycle
The organization should tailor the life cycle if it:
a) joins or splits the stages;
b) performs required processes in different or added stages (see ISO/IEC 5259-4);
c) iterates stages;
d) performs activities concurrently if they do not depend on each other;
e) omits stages that do not apply, given a rationale;
f) includes data quality management provisions for validation and verification, change management and
configuration management as shown in Figure 1.
7.2.4 Horizontal aspects of the data quality management life cycle
7.2.4.1 General
Figure 1 shows four processes that cover all stages of the data quality management life cycle including:
a) validation and verification;
b) change management;
c) configuration management;
d) risk management.
These processes shall also be carried out in the case of project-independent tailoring.
7.2.4.2 Validation and verification
Validation and verification of the data quality should be done at all relevant stages throughout the data
quality management life cycle.
7.2.4.3 Change management
Change management ensures that any alteration to the data or processes does not adversely affect data
quality.
7.2.4.4 Configuration management
Configuration management helps to ensure that data and processes are uniquely referenceable, and that
data quality is not adversely affected by any configuration management changes.
7.2.4.5 Risk management
Risk management should be done at all relevant steps throughout the data quality management life cycle.

© ISO/IEC 2024 – All rights reserved
7.3 Requirements and recommendations
7.3.1 Data motivation and conceptualization
7.3.1.1 General
The organization shall:
a) document motivation and origin of the data need;
b) specify scope, purpose and intended use of data;
c) document data quality requirements.
NOTE For more information on societal and ethical concerns see ISO/IEC TR 24368.
7.3.1.2 Stakeholder analysis
The organization shall:
a) perform a stakeholder analysis to identify all relevant stakeholders of the data and implications for data
quality management;
b) identify potentially conflicting data quality requirements.
NOTE A description of potential AI stakeholder roles and sub-roles is provided by ISO/IEC 22989:2022, 5.19.
7.3.1.3 Feasibility analysis
The organization should maintain a feasibility analysis based on its available skills and resources that
assesses the organization's ability to meet its data quality goals. A feasibility analysis should be updated
throughout the data life cycle.
NOTE Prior ML projects and openly available datasets that have achieved target quality goals are examples of
evidence supporting feasibility.
7.3.2 Data specification
7.3.2.1 General
The organization shall specify data requirements in a data specification and validate that
...


Norme
internationale
ISO/IEC 5259-3
Première édition
Intelligence artificielle — Qualité
2024-07
des données pour les analyses
de données et l’apprentissage
automatique (AA) —
Partie 3:
Exigences et lignes directrices pour
la gestion de la qualité des données
Artificial intelligence — Data quality for analytics and machine
learning (ML) —
Part 3: Data quality management requirements and guidelines
Numéro de référence
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO/IEC 2024
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
© ISO/IEC 2024 – Tous droits réservés
ii
Sommaire Page
Avant-propos .v
Introduction .vi
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Symboles et abréviations . 2
5 Utilisation prévue . 2
6 Gestion globale de la qualité des données . 2
6.1 Objectif.2
6.2 Généralités .3
6.3 Exigences et recommandations .3
6.3.1 Généralités .3
6.3.2 Culture de qualité des données .3
6.3.3 Gestion des problèmes de qualité des données.3
6.3.4 Gestion des compétences .4
6.3.5 Gestion des ressources .4
6.3.6 Intégration du système de gestion .4
6.3.7 Documentation.4
6.3.8 Audit et évaluation de la qualité des données .5
6.3.9 Examen de confirmation et mesures de la qualité des données .5
6.3.10 Gestion de la qualité des données spécifique au projet .5
6.4 Livrables .6
7 Gestion de la qualité des données spécifique au cycle de vie. 6
7.1 Objectif.6
7.2 Généralités .6
7.2.1 Cycle de vie de gestion de la qualité des données .6
7.2.2 Étapes du cycle de vie de gestion de la qualité des données .7
7.2.3 Adaptation du cycle de vie de gestion de la qualité des données indépendamment
du projet .8
7.2.4 Aspects horizontaux du cycle de vie de gestion de la qualité des données .9
7.3 Exigences et recommandations .9
7.3.1 Motivation et conceptualisation des données .9
7.3.2 Spécification des données .10
7.3.3 Planification des données . 12
7.3.4 Acquisition des données . 12
7.3.5 Prétraitement des données .14
7.3.6 Augmentation des données .14
7.3.7 Mise à disposition des données . 15
7.3.8 Mise hors service des données.17
7.4 Livrables .18
7.4.1 Livrables de l’étape de motivation et conceptualisation des données .18
7.4.2 Livrables de l’étape de spécification des données .18
7.4.3 Livrables de l’étape de planification des données .18
7.4.4 Livrables de l’étape d’acquisition des données .18
7.4.5 Livrables de l’étape de prétraitement des données .19
7.4.6 Livrables de l’étape d’augmentation des données .19
7.4.7 Livrables de l’étape de mise à disposition des données .19
7.4.8 Livrables de l’étape de mise hors service des données .19
8 Processus horizontaux . 19
8.1 Objectif.19
8.2 Généralités .19
8.3 Exigences et recommandations . 20

© ISO/IEC 2024 – Tous droits réservés
iii
8.3.1 Vérification et validation . . 20
8.3.2 Gestion de la configuration . 20
8.3.3 Gestion des modifications . 20
8.3.4 Gestion des risques . 22
8.4 Livrables . 22
8.4.1 Livrables de vérification et validation . 22
8.4.2 Livrables de gestion de la configuration . 22
8.4.3 Livrables de gestion des modifications . 22
8.4.4 Livrables pour la gestion des risques . 23
9 Gestion de la qualité des données dans les chaînes d’approvisionnement .23
9.1 Objectif. 23
9.2 Exigences et recommandations . 23
9.3 Livrables .24
10 Gestion des outils de traitement des données .24
10.1 Objectif.24
10.2 Exigences et recommandations .24
10.3 Livrables .24
11 Gestion des dépendances en matière de qualité des données .24
11.1 Objectif.24
11.2 Exigences et recommandations . 25
11.3 Livrables . 25
12 Gestion de la qualité des données spécifique au projet .25
12.1 Objectif. 25
12.2 Exigences et recommandations . 25
12.2.1 Contexte et utilisation prévue . 25
12.2.2 Objectif . 25
12.2.3 Exigences et recommandations . 25
12.3 Spécification et gestion des exigences de qualité des données . 26
12.3.1 Objectif . 26
12.3.2 Exigences et recommandations . 26
12.4 Rôles et responsabilités dans le cadre de la gestion de la qualité des données . 26
12.4.1 Objectif . 26
12.4.2 Exigences et recommandations .27
12.4.3 Livrables .27
12.5 Adaptation des activités liées à la qualité des données .27
12.6 Planification et coordination des activités liées à la qualité des données .27
12.6.1 Généralités .27
12.6.2 Plan de qualité des données .27
12.6.3 Planification des processus . 28
12.7 Progression du cycle de vie de la qualité des données . 28
12.8 Justification de la qualité des données . 28
12.9 Mise hors service . 28
12.10 Livrables . 28
Bibliographie .29

© ISO/IEC 2024 – Tous droits réservés
iv
Avant-propos
L’ISO (Organisation internationale de normalisation) et l’IEC (Commission électrotechnique internationale)
forment le système spécialisé de la normalisation mondiale. Les organismes nationaux membres de l’ISO ou
de l’IEC participent au développement de Normes internationales par l’intermédiaire des comités techniques
créés par l’organisation concernée afin de s’occuper des domaines particuliers de l’activité technique.
Les comités techniques de l’ISO et de l’IEC collaborent dans des domaines d’intérêt commun. D’autres
organisations internationales, gouvernementales et non gouvernementales, en liaison avec l’ISO et l’IEC,
participent également aux travaux.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont décrites
dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents critères
d’approbation requis pour les différents types de documents. Le présent document a été rédigé conformément
aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www.iso.org/directives ou
www.iec.ch/members_experts/refdocs).
L’ISO et l’IEC attirent l’attention sur le fait que la mise en application du présent document peut entraîner
l’utilisation d’un ou de plusieurs brevets. L’ISO et l’IEC ne prennent pas position quant à la preuve, à la validité
et à l’applicabilité de tout droit de propriété revendiqué à cet égard. À la date de publication du présent
document, l’ISO et l’IEC n’avaient pas reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires
à sa mise en application. Toutefois, il y a lieu d’avertir les responsables de la mise en application du présent
document que des informations plus récentes sont susceptibles de figurer dans la base de données de
brevets, disponible à l’adresse www.iso.org/brevets et https://patents.iec.ch. L’ISO et l’IEC ne sauraient être
tenues pour responsables de ne pas avoir identifié tout ou partie de tels droits de propriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions spécifiques
de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de l’ISO aux
principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au commerce
(OTC), voir www.iso.org/iso/avant-propos. Pour l’IEC, voir www.iec.ch/understanding-standards.
Le présent document a été élaboré par le comité technique mixte ISO/IEC JTC 1, Technologies de l’information,
sous-comité SC 42, Intelligence artificielle.
Une liste de toutes les parties de la série ISO/IEC 5259 se trouve sur les sites Web de l’ISO et de l’IEC.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve aux adresses www.iso.org/members.html et www.iec.ch/national-committees.

© ISO/IEC 2024 – Tous droits réservés
v
Introduction
La qualité des produits et services basés sur l’analyse de données et l’apprentissage automatique (AA)
dépend de la qualité des données utilisées pour entraîner les modèles d’AA. Par conséquent, la gestion de la
qualité des données est essentielle, car elle contribue souvent à assurer le succès des technologies d’analyse
de données et d’AA.
L’adoption d’un système de gestion de la qualité des données facilite la gestion de la qualité des produits
et services qui utilisent des technologies d’analyse de données et d’AA. Le présent document définit le
vocabulaire, les exigences et les lignes directrices de communication, d’alignement et d’accord pour la
gestion de la qualité des données. Le système de gestion de la qualité des données assure la transparence et
la vérifiabilité, que ce soit par auto-évaluation ou évaluation par une tierce partie. Il améliore la satisfaction
des parties prenantes concernées et facilite la gestion des exigences en matière de qualité, de performance
et d’autodéclaration. Plus précisément, le présent document définit les exigences relatives à un système de
gestion de la qualité des données avec des références aux mesures de la qualité des données pertinentes
pour les technologies d’analyse de données et d’AA les plus couramment utilisées.
Comme les exigences de qualité des données varient en fonction du contexte et du domaine d’application,
le présent document fournit un ensemble générique d’exigences et de recommandations liées aux étapes
communes du cycle de vie des données. Un cycle de vie des données est généralement étroitement intégré
au cycle de vie du système d’IA associé et a donc plusieurs dépendances. Le présent document ne prescrit
pas le cycle de vie du système d’IA à utiliser. Il fournit plutôt des interfaces génériques qui permettent aux
utilisateurs du présent document de travailler avec plusieurs modèles de cycle de vie pour autant que les
processus du cycle de vie puissent être mis en correspondance.
L’ISO/IEC 5259-1 décrit la terminologie et les concepts de qualité des données utilisés dans le présent
document.
1)
L’ISO/IEC 5259-2 décrit le modèle de qualité des données et les mesures de la qualité des données utilisés
dans le présent document.
L’ISO/IEC 5259-4 décrit le cadre pour le processus de qualité des données utilisé dans le présent document.
2)
L’ISO/IEC 5259-5 fournit un cadre de gouvernance de la qualité des données afin de guider les organes de
gouvernance.
3)
L’ISO/IEC TR 5259-6 décrit un cadre de visualisation pour la qualité des données dans le cadre de l’analyse
de données et de l’AA.
1) En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
2) En cours d’élaboration. Stade au moment de la publication : ISO/IEC DIS 5259-5:2023.
3) En cours d’élaboration. Stade au moment de la publication : ISO/IEC CD TR 5259-6:2023.

© ISO/IEC 2024 – Tous droits réservés
vi
Norme internationale ISO/IEC 5259-3:2024(fr)
Intelligence artificielle — Qualité des données pour les
analyses de données et l’apprentissage automatique (AA) —
Partie 3:
Exigences et lignes directrices pour la gestion de la qualité
des données
1 Domaine d’application
Le présent document spécifie des exigences et fournit des recommandations pour l’établissement, la mise
en œuvre, le maintien et l’amélioration continue de la qualité des données utilisées dans les domaines de
l’analyse de données et de l’apprentissage automatique.
Le présent document ne définit pas de processus, de méthodes ou de métriques détaillés. Il définit plutôt les
exigences et recommandations associées à un processus de gestion de la qualité, ainsi qu’un processus et
des méthodes de référence qui peuvent être adaptés pour satisfaire à ses exigences.
Les exigences et recommandations énoncées dans le présent document sont génériques et prévues pour
s’appliquer à tout organisme, quels que soient son type, sa taille et sa nature.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour
les références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO/IEC 5259-1:2024, Intelligence artificielle — Qualité des données pour les analyses de données et
l’apprentissage automatique (AA) — Partie 1: Vue d'ensemble, terminologie et exemples
4)
ISO/IEC 5259-2 , Intelligence artificielle — Qualité des données pour les analyses de données et l’apprentissage
automatique (AA) — Partie 2: Mesures de la qualité des données
ISO/IEC 22989, Technologies de l'information — Intelligence artificielle — Concepts et terminologie relatifs à
l'intelligence artificielle
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO/IEC 5259-1, l’ISO/IEC 22989 ainsi
que les suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp
— IEC Electropedia: disponible à l’adresse https:// www .electropedia .org/
4) En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.

© ISO/IEC 2024 – Tous droits réservés
3.1
énoncé de qualité des données
déclaration indiquant dans quelle mesure les données satisfont à une exigence de qualité des données
3.2
plan de qualité des données
spécification des pratiques, des processus et de l’affectation des ressources pour atteindre les objectifs de
qualité des données en tant que résultat de la planification de la qualité des données
3.3
planification de la qualité des données
partie de la gestion de la qualité des données axée sur la définition d’objectifs de qualité des données et
la spécification des processus opérationnels et des ressources associées, nécessaire pour atteindre les
objectifs qualité
[SOURCE: ISO 8000-2:2022, modifié — L’exemple a été supprimé.]
3.4
accord d’interface de développement
AID
accord entre le client et le fournisseur dans lequel sont spécifiées les responsabilités relatives aux
activités à réaliser, aux preuves à examiner ou aux livrables à échanger par chaque partie dans le cadre du
développement d’articles ou d’éléments
Note 1 à l'article: Alors que l’AID s’applique à la phase de développement, le contrat de fourniture s’applique à la
production.
[SOURCE: ISO 26262-1:2018]
4 Symboles et abréviations
CVGQD cycle de vie de gestion de la qualité des données
5 Utilisation prévue
Le présent document peut être utilisé dans un ou plusieurs des modes suivants:
— par un organisme pour établir et adapter un processus de gestion de la qualité des données pour
l’utilisation des données dans le cadre de l’analyse de données et de l’AA, et pour améliorer en continu les
processus;
— par un projet d’AA pour définir, tracer et évaluer les exigences de qualité des données;
— par un utilisateur de données et un détenteur de données afin d’établir une compréhension commune des
caractéristiques de qualité des données et de s’assurer que les exigences convenues ont été satisfaites,
facilitant ainsi un accord pour la transaction des données.
NOTE L’organisme peut demander des garanties de confidentialité et de bonne utilisation des preuves à l’appui.
6 Gestion globale de la qualité des données
6.1 Objectif
L’objectif d’un processus de gestion de la qualité des données est d’établir des processus appropriés (c’est-
à-dire reproductibles et auditables) pour gérer la qualité des données et satisfaire de manière fiable à un
ensemble donné d’exigences définies par l’organisme.

© ISO/IEC 2024 – Tous droits réservés
6.2 Généralités
La qualité des données a un impact sur les résultats des algorithmes d’analyse de données et d’AA. La qualité
des données a une composante inhérente et une composante qui dépend du système. Les données peuvent
convenir à une application, mais pas à une autre. Le présent document aide à établir et maintenir la qualité
des données pour chaque application d’analyse de données et d’AA.
6.3 Exigences et recommandations
6.3.1 Généralités
Les exigences et recommandations suivantes s’appliquent à l’ensemble de l’organisme.
6.3.2 Culture de qualité des données
Il convient que l’organisme maintienne une culture de qualité des données.
L’organisme doit:
a) disposer de règles et de processus pour atteindre la qualité (conformément au présent document)
en tenant compte du modèle de qualité des données tel qu’il est appliqué aux produits et services
applicables;
b) définir et mettre en œuvre des processus de gestion de la qualité des données et réaliser les activités
connexes liées à la qualité des données;
c) intégrer les processus et activités de gestion de la qualité des données, dans la mesure du possible,
à d’autres processus et activités de gestion, tels que la gestion de la qualité générale et la gestion des
risques;
d) documenter les activités réalisées;
e) fournir les ressources suffisantes pour assurer la gestion de la qualité des données;
f) surveiller et, dans la mesure nécessaire, revoir et améliorer les processus de gestion de la qualité des
données;
g) fournir l’autorité requise au personnel impliqué;
h) communiquer les politiques de qualité des données au sein de l’organisme.
6.3.3 Gestion des problèmes de qualité des données
L’organisme doit satisfaire aux exigences de qualité des données en:
a) mettant en place des processus de communication, d’analyse, d’évaluation, de résolution et de clôture
des problèmes de qualité des données;
b) documentant les problèmes clôturés;
c) faisant remonter ou délégant les problèmes qui ne peuvent pas être clôturés.
NOTE 1 La résolution et la clôture des problèmes de qualité des données peuvent inclure la limitation ou l’ajustement
du domaine d’application du projet d’AA.
NOTE 2 Un problème de qualité des données peut être clôturé en mettant en œuvre une résolution ou en
déterminant une résolution sur la base de critères d’acceptation définis.

© ISO/IEC 2024 – Tous droits réservés
6.3.4 Gestion des compétences
L’organisme doit gérer les compétences en:
a) documentant les qualifications et les outils requis pour traiter les données;
b) s’assurant que le personnel impliqué possède les qualifications suffisantes pour exercer les activités et
fonctions qui lui incombent;
c) tenant à jour des registres du personnel et de leur maîtrise des qualifications et outils requis;
d) tenant des registres de formations et d’expérience appropriés qui justifient les qualifications
revendiquées.
L’organisme peut faire appel à des sources de compétences externes.
6.3.5 Gestion des ressources
L’organisme doit fournir les ressources nécessaires à la gestion de la qualité des données, y compris:
a) les applications logicielles, les formations et le support nécessaires à la gestion de la qualité des données;
b) l’infrastructure ou les services informatiques nécessaires à la gestion de la qualité des données
(par exemple, calcul, stockage, mise en réseau);
c) le personnel ayant les qualifications requises pour assurer la gestion de la qualité des données.
6.3.6 Intégration du système de gestion
Il convient que l’organisme intègre ses activités de gestion de la qualité des données dans son système de
gestion existant, y compris ses systèmes de gestion axés sur la qualité des produits ou services, ainsi que
ceux axés sur le développement et l’utilisation de systèmes d’IA. Il convient que les implications du double
rôle des parties prenantes soient gérées par le système de gestion de la qualité, y compris l’atténuation de
tout conflit d’intérêts.
NOTE 1 La gestion des parties prenantes peut prendre en compte le potentiel d’une personne à assumer plusieurs
rôles. Un utilisateur de produits ou services basés sur l’analyse de données et l’AA peut également être propriétaire ou
contributeur de données.
NOTE 2 Les organismes peuvent utiliser l’ISO/IEC 42001 afin de définir un système de gestion pour le
développement ou l’utilisation de systèmes d’IA.
NOTE 3 Les organismes peuvent utiliser l’ISO 9001 ou d’autres systèmes de gestion de la qualité spécifiques à leur
secteur pour définir leur système de gestion de la qualité.
6.3.7 Documentation
La documentation doit être intelligible pour les parties prenantes concernées du projet conformément à
leur rôle. Il convient que les ressources dans une langue qui n’est pas comprise par une partie prenante
concernée soient accompagnées d’un résumé dans une langue que la partie prenante peut comprendre.
La documentation doit être accessible aux parties prenantes concernées, suivant le cas et selon les
autorisations. Il convient de réduire le plus possible les frais généraux d’accès.
Il convient que la documentation inclue le contexte ou les références nécessaires pour la rendre intelligible
aux futures parties prenantes concernées qui ne font pas partie du projet en cours. Cette pratique peut
permettre à ces parties prenantes d’évaluer un ensemble de données en vue d’une réutilisation potentielle,
partielle ou totale.
© ISO/IEC 2024 – Tous droits réservés
6.3.8 Audit et évaluation de la qualité des données
Les processus mis en œuvre doivent être audités, le cas échéant, sur la base d’une évaluation:
a) du plan de qualité des données par rapport aux règles et processus organisationnels;
b) des arguments et justifications détaillant la manière dont les exigences du modèle de qualité des
données ont été appliquées;
c) des arguments détaillant la manière dont les objectifs du plan de qualité des données ont été atteints;
d) permettant de déterminer si le plan de qualité des données et tous les livrables sont complets, cohérents
et corrects conformément au présent document;
e) des recommandations d’amélioration de la qualité des données.
Les données doivent être évaluées à l’aide d’une évaluation de la qualité des données, qui doit reposer sur
une évaluation visant à déterminer si les données atteignent les objectifs du présent document, l’état de l’art
actuel de la technologie et les connaissances techniques applicables dans le domaine.
Le plan d’évaluation de la qualité des données doit être inclus dans l’étape de spécification. L’évaluation de
la qualité des données doit être réalisée avant la mise à disposition des données (voir l’Étape 7 à la Figure 1:
mise à disposition des données) ou à un intervalle approprié lors de l’utilisation de l’apprentissage continu
ou de données en continu.
L’évaluation de la qualité des données peut être réalisée sur un sous-ensemble de données lorsqu’il peut être
démontré que la qualité du sous-ensemble est représentative de la qualité de l’ensemble de données complet.
6.3.9 Examen de confirmation et mesures de la qualité des données
La qualité des données doit être confirmée par des mesures appropriées de la qualité des données
conformément à l’ISO/IEC 5259-2. Un examen de la qualité des données doit au moins couvrir:
a) les examens de confirmation des principaux livrables:
1) chaque examen de confirmation doit être finalisé avant la mise à disposition des données;
2) il convient que chaque examen de confirmation repose sur le fait que les objectifs du présent
document sont atteints ou non;
b) les audits qualité des processus mis en œuvre;
c) une évaluation de la qualité des données.
Tous les livrables doivent faire l’objet d’examens de confirmation.
Le personnel réalisant ces examens doit avoir accès au personnel impliqué, aux informations pertinentes et
aux ressources requises.
NOTE Les examens de confirmation des principaux livrables peuvent être délégués, mais la responsabilité
incombe à la personne désignée.
6.3.10 Gestion de la qualité des données spécifique au projet
L’organisme doit gérer les données spécifiques au projet en:
a) établissant un processus approprié de gestion de la qualité des données spécifique au projet qui satisfait
à toutes les exigences du projet d’AA spécifique;
b) tenant à jour une liste des énoncés de qualité des données pertinents. Le cas échéant, des références
quantitatives et qualitatives pour les mesures de la qualité des données doivent être documentées;

© ISO/IEC 2024 – Tous droits réservés
c) adoptant des processus appropriés pour identifier et gérer toutes les mesures de la qualité des données
pertinentes pour le projet.
Le processus de gestion de la qualité des données spécifique au projet doit satisfaire aux exigences de
l’Article 12.
6.4 Livrables
Les livrables du processus de gestion de la qualité des données doivent inclure:
a) les règles et processus spécifiques à l’organisme pour la qualité des données (par exemple, conformément
à l’ISO/IEC 5259-4);
b) les preuves de gestion des compétences;
c) les preuves d’un système de gestion de la qualité des données;
d) l’identification des mesures de la qualité des données utilisées;
e) la documentation des références de mesure de la qualité des données applicables;
f) les rapports sur les anomalies de qualité identifiées.
7 Gestion de la qualité des données spécifique au cycle de vie
7.1 Objectif
L’objectif d’un cycle de vie de gestion de la qualité des données (CVGQD) est d’établir et de maintenir la qualité
des données tout au long du cycle de vie des données. Un exemple de modèle de cycle de vie des données est
décrit dans l’ISO/IEC 5259-1:2024, Figure 3.
7.2 Généralités
7.2.1 Cycle de vie de gestion de la qualité des données
La qualité des données doit être gérée à toutes les étapes du cycle de vie des données. Le modèle de cycle de
vie de gestion de la qualité des données (CVGQD) représenté à la Figure 1 fournit des recommandations pour
satisfaire aux exigences de qualité des données à utiliser dans un contexte d’analyse de données et d’AA.
Il déduit des étapes spécifiques qui sont pertinentes pour la gestion de la qualité des données et facilite le
regroupement et l’organisation des exigences et des lignes directrices à prendre en compte pour la gestion
de la qualité des données. Le modèle de CVGQD n’est pas prescriptif de l’ordre temporel des étapes. Les
différentes étapes du CVGQD sont décrites en 7.2.2.

© ISO/IEC 2024 – Tous droits réservés
Légende
Voie de développement principale
Voie de retour d’informations
Instanciation du modèle CVD pour la série 5259 (voir l’ISO/IEC 5259-1:2024, Figure 3)
Étape du cycle de vie de gestion de la qualité des données
Processus horizontaux du cycle de vie de gestion de la qualité des données
Indication de l’itération dans le cycle de vie
Regroupement des étapes du cycle de vie de gestion de la qualité des données pour clarifier la mise en
correspondance avec le modèle CVD
Figure 1 — Cycle de vie de gestion de la qualité des données
Les problèmes de qualité des données peuvent survenir à n’importe quelle étape du cycle de vie des données.
La gestion de la qualité des données doit établir et maintenir des processus de qualité des données au début
du cycle de vie des données. Si l’organisme délègue la responsabilité d’un processus, cette délégation doit
être documentée et traçable.
NOTE Il est généralement plus difficile d’identifier et de corriger les problèmes de qualité des données après coup
que de gérer les risques de qualité des données lorsqu’ils surviennent pour la première fois. Par exemple, les erreurs
introduites lors de la collecte de données sont plus facilement évitées par une gestion de la qualité appropriée plutôt
qu’en tentant d’identifier et de corriger les erreurs plus tard dans le cycle de vie des données.
7.2.2 Étapes du cycle de vie de gestion de la qualité des données
7.2.2.1 Motivation et conceptualisation des données
La gestion de la qualité des données commence par l’étape de motivation et de conceptualisation. Il convient
d’identifier et de gérer les problèmes potentiels liés à la qualité des données lorsque le premier besoin de
données pour un contexte d’analyse de données et d’AA devient apparent. Entre autres, la motivation et
l’utilisation prévue des données sont validées et vérifiées afin de gérer les caractéristiques de qualité telles
que la conformité et la pertinence.
7.2.2.2 Spécification des données
À l’étape de spécification des données, la gestion de la qualité des données impose des exigences pour la
création de la spécification des données, y compris les formats de données, les propriétés statistiques et la

© ISO/IEC 2024 – Tous droits réservés
divisibilité. Les lignes directrices de gestion de la qualité des données facilitent l’identification d’exigences
et de plans erronés, incomplets ou contradictoires. Par exemple, dans un contexte d’analyse de données et
d’AA, la gestion de la qualité confirme que les données correspondent aux exigences du contexte.
7.2.2.3 Planification des données
Au cours de l’étape de planification des données, un plan est formulé pour satisfaire à la spécification des
données. Cela comprend la planification des tâches et des ressources spécifiques pour acquérir et traiter
les données tout au long du cycle de vie des données, ainsi que des méthodes d’évaluation et des critères
d’acceptation.
7.2.2.4 Acquisition des données
En matière de gestion de la qualité des données, l’acquisition de données peut désigner la collecte de données,
la génération de données ou l’acquisition et la combinaison d’ensembles de données existants. Le choix de la
méthode de collecte des données
...


Date: 2025-06-06
ISO/IEC 5259--3:2024(fr)
ISO/IEC JTC 1/SC 42
Première édition
2024-07
Intelligence artificielle — Qualité des données pour les analyses
de données et l’apprentissage automatique (AA) — —
Partie 3:
Exigences et lignes directrices pour la gestion de la qualité des
données
Artificial intelligence — Data quality for analytics and machine learning (ML) — —
Part 3: Data quality management requirements and guidelines
ICS: 35.020
DOCUMENT PROTÉGÉ PAR COPYRIGHT

© ISO/IEC 2024
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre oeuvre, aucune partie
de cette publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique
ou mécanique, y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable.
Une autorisation peut être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays
du demandeur.
ISO copyright office
Case postaleCP 401 • • Ch. de Blandonnet 8
CH-1214 Vernier, GenèveGeneva
Tél.: +Phone: + 41 22 749 01 11
E-mail: copyright@iso.org
WebWebsite: www.iso.org
Publié en Suisse
© ISO/IEC 2024 – Tous droits réservés
iii
Sommaire Page
Avant-propos . vi
Introduction . vii
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Symboles et abréviations . 2
5 Utilisation prévue . 2
6 Gestion globale de la qualité des données . 3
6.1 Objectif . 3
6.2 Généralités . 3
6.3 Exigences et recommandations . 3
6.4 Livrables . 6
7 Gestion de la qualité des données spécifique au cycle de vie . 6
7.1 Objectif . 6
7.2 Généralités . 7
7.3 Exigences et recommandations . 10
7.4 Livrables . 19
8 Processus horizontaux . 21
8.1 Objectif . 21
8.2 Généralités . 21
8.3 Exigences et recommandations . 21
8.4 Livrables . 24
9 Gestion de la qualité des données dans les chaînes d’approvisionnement . 25
9.1 Objectif . 25
9.2 Exigences et recommandations . 25
9.3 Livrables . 26
10 Gestion des outils de traitement des données . 26
10.1 Objectif . 26
10.2 Exigences et recommandations . 26
10.3 Livrables . 26
11 Gestion des dépendances en matière de qualité des données . 27
11.1 Objectif . 27
11.2 Exigences et recommandations . 27
11.3 Livrables . 27
12 Gestion de la qualité des données spécifique au projet . 27
12.1 Objectif . 27
12.2 Exigences et recommandations . 27
12.3 Spécification et gestion des exigences de qualité des données . 28
12.4 Rôles et responsabilités dans le cadre de la gestion de la qualité des données . 29
12.5 Adaptation des activités liées à la qualité des données . 29
12.6 Planification et coordination des activités liées à la qualité des données . 29
12.7 Progression du cycle de vie de la qualité des données . 30
12.8 Justification de la qualité des données. 30
12.9 Mise hors service. 31
12.10 Livrables . 31
© ISO/IEC 2024 – Tous droits réservés
iv
Bibliographie . 32

© ISO/IEC 2024 – Tous droits réservés
v
Avant-propos
L’ISO (Organisation internationale de normalisation) et l’IEC (Commission électrotechnique internationale)
forment le système spécialisé de la normalisation mondiale. Les organismes nationaux membres de l’ISO ou
de l’IEC participent au développement de Normes internationales par l’intermédiaire des comités techniques
créés par l’organisation concernée afin de s’occuper des domaines particuliers de l’activité technique. Les
comités techniques de l’ISO et de l’IEC collaborent dans des domaines d’intérêt commun. D’autres
organisations internationales, gouvernementales et non gouvernementales, en liaison avec l’ISO et l’IEC,
participent également aux travaux.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont décrites
dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents critères
d’approbation requis pour les différents types de documents. Le présent document a été rédigé conformément
aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www.iso.org/directives ou
www.iec.ch/members_experts/refdocs).
L’ISO et l’IEC attirent l’attention sur le fait que la mise en application du présent document peut entraîner
l’utilisation d’un ou de plusieurs brevets. L’ISO et l’IEC ne prennent pas position quant à la preuve, à la validité
et à l’applicabilité de tout droit de propriété revendiqué à cet égard. À la date de publication du présent
document, l’ISO et l’IEC n’avaient pas reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires
à sa mise en application. Toutefois, il y a lieu d’avertir les responsables de la mise en application du présent
document que des informations plus récentes sont susceptibles de figurer dans la base de données de brevets,
disponible à l’adresse www.iso.org/brevets et https://patents.iec.ch. L’ISO et l’IEC ne sauraient être tenues
pour responsables de ne pas avoir identifié tout ou partie de tels droits de propriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions spécifiques
de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de l’ISO aux
principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au commerce
(OTC), voir www.iso.org/iso/avant-propos. Pour l’IEC, voir www.iec.ch/understanding-standards.
Le présent document a été élaboré par le comité technique mixte ISO/IEC JTC 1, Technologies de l’information,
sous-comité SC 42, Intelligence artificielle.
Une liste de toutes les parties de la série ISO/IEC 5259 se trouve sur les sites Web de l’ISO et de l’IEC.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve aux adresses www.iso.org/members.html et www.iec.ch/national-committees.
© ISO/IEC 2024 – Tous droits réservés
vi
Introduction
La qualité des produits et services basés sur l’analyse de données et l’apprentissage automatique (AA) dépend
de la qualité des données utilisées pour entraîner les modèles d’AA. Par conséquent, la gestion de la qualité
des données est essentielle, car elle contribue souvent à assurer le succès des technologies d’analyse de
données et d’AA.
L’adoption d’un système de gestion de la qualité des données facilite la gestion de la qualité des produits et
services qui utilisent des technologies d’analyse de données et d’AA. Le présent document définit le
vocabulaire, les exigences et les lignes directrices de communication, d’alignement et d’accord pour la gestion
de la qualité des données. Le système de gestion de la qualité des données assure la transparence et la
vérifiabilité, que ce soit par auto-évaluation ou évaluation par une tierce partie. Il améliore la satisfaction des
parties prenantes concernées et facilite la gestion des exigences en matière de qualité, de performance et
d’autodéclaration. Plus précisément, le présent document définit les exigences relatives à un système de
gestion de la qualité des données avec des références aux mesures de la qualité des données pertinentes pour
les technologies d’analyse de données et d’AA les plus couramment utilisées.
Comme les exigences de qualité des données varient en fonction du contexte et du domaine d’application, le
présent document fournit un ensemble générique d’exigences et de recommandations liées aux étapes
communes du cycle de vie des données. Un cycle de vie des données est généralement étroitement intégré au
cycle de vie du système d’IA associé et a donc plusieurs dépendances. Le présent document ne prescrit pas le
cycle de vie du système d’IA à utiliser. Il fournit plutôt des interfaces génériques qui permettent aux
utilisateurs du présent document de travailler avec plusieurs modèles de cycle de vie pour autant que les
processus du cycle de vie puissent être mis en correspondance.
L’ISO/IEC 5259--1 décrit la terminologie et les concepts de qualité des données utilisés dans le présent
document.
11)
L’ISO/IEC 5259--2 décrit le modèle de qualité des données et les mesures de la qualité des données utilisés
dans le présent document.
L’ISO/IEC 5259--4 décrit le cadre pour le processus de qualité des données utilisé dans le présent document.
22)
L’ISO/IEC 5259--5 fournit un cadre de gouvernance de la qualité des données afin de guider les organes de
gouvernance.
33)
L’ISO/IEC TR 5259--6 décrit un cadre de visualisation pour la qualité des données dans le cadre de l’analyse
de données et de l’AA.
En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
1)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
En cours d’élaboration. Stade au moment de la publication : ISO/IEC DIS 5259-5:2023.
2)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC DIS 5259-5:2023.
En cours d’élaboration. Stade au moment de la publication : ISO/IEC CD TR 5259-6:2023.
3)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC CD TR 5259-6:2023.
© ISO/IEC 2024 – Tous droits réservés
vii
Norme internationale ISO/IEC 5259-3:2024(fr)

Intelligence artificielle — Qualité des données pour les analyses de
données et l’apprentissage automatique (AA) — —
Partie 3:
Exigences et lignes directrices pour la gestion de la qualité des
données
1 Domaine d’application
Le présent document spécifie des exigences et fournit des recommandations pour l’établissement, la mise en
œuvre, le maintien et l’amélioration continue de la qualité des données utilisées dans les domaines de l’analyse
de données et de l’apprentissage automatique.
Le présent document ne définit pas de processus, de méthodes ou de métriques détaillés. Il définit plutôt les
exigences et recommandations associées à un processus de gestion de la qualité, ainsi qu’un processus et des
méthodes de référence qui peuvent être adaptés pour satisfaire à ses exigences.
Les exigences et recommandations énoncées dans le présent document sont génériques et prévues pour
s’appliquer à tout organisme, quels que soient son type, sa taille et sa nature.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur contenu,
des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour les
références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO/IEC 5259--1:2024, Intelligence artificielle — Qualité des données pour les analyses de données et
l’apprentissage automatique (AA) — Partie 1: Vue d'ensemble, terminologie et exemples
44)
ISO/IEC 5259--2, , Intelligence artificielle — Qualité des données pour les analyses de données et
l’apprentissage automatique (AA) — Partie 2: Mesures de la qualité des données
ISO/IEC 22989, Technologies de l'information — Intelligence artificielle — Concepts et terminologie relatifs à
l'intelligence artificielle
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO/IEC 5259--1, l’ISO/IEC 22989 ainsi
que les suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:

En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
4)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
© ISO/IEC 2024– Tous droits réservés

— — ISO Online browsing platform: disponible à l’adresse https://www.iso.org/obp
— — IEC Electropedia: disponible à l’adresse https://www.electropedia.org/
3.1 3.1
énoncé de qualité des données
déclaration indiquant dans quelle mesure les données satisfont à une exigence de qualité des données
3.2 3.2
plan de qualité des données
spécification des pratiques, des processus et de l’affectation des ressources pour atteindre les objectifs de
qualité des données en tant que résultat de la planification de la qualité des données
3.3 3.3
planification de la qualité des données
partie de la gestion de la qualité des données axée sur la définition d’objectifs de qualité des données et la
spécification des processus opérationnels et des ressources associées, nécessaire pour atteindre les objectifs
qualité
[SOURCE: ISO 8000-‑2:2022, modifié — L’exemple a été supprimé.]
3.4 3.4
accord d’interface de développement
AID
accord entre le client et le fournisseur dans lequel sont spécifiées les responsabilités relatives aux activités à
réaliser, aux preuves à examiner ou aux livrables à échanger par chaque partie dans le cadre du
développement d’articles ou d’éléments
Note 1 à l’article l'article: Alors que l’AID s’applique à la phase de développement, le contrat de fourniture s’applique à
la production.
[SOURCE: ISO 26262-‑1:2018]
4 Symboles et abréviations
CVGQD cycle de vie de gestion de la qualité des données
5 Utilisation prévue
Le présent document peut être utilisé dans un ou plusieurs des modes suivants:
— — par un organisme pour établir et adapter un processus de gestion de la qualité des données pour
l’utilisation des données dans le cadre de l’analyse de données et de l’AA, et pour améliorer en continu les
processus;
— — par un projet d’AA pour définir, tracer et évaluer les exigences de qualité des données;
— — par un utilisateur de données et un détenteur de données afin d’établir une compréhension commune
des caractéristiques de qualité des données et de s’assurer que les exigences convenues ont été satisfaites,
facilitant ainsi un accord pour la transaction des données.
NOTE L’organisme peut demander des garanties de confidentialité et de bonne utilisation des preuves à l’appui.
© ISO/IEC 2024 – Tous droits réservés
6 Gestion globale de la qualité des données
6.1 Objectif
L’objectif d’un processus de gestion de la qualité des données est d’établir des processus appropriés (c’est-à-
dire reproductibles et auditables) pour gérer la qualité des données et satisfaire de manière fiable à un
ensemble donné d’exigences définies par l’organisme.
6.2 Généralités
La qualité des données a un impact sur les résultats des algorithmes d’analyse de données et d’AA. La qualité
des données a une composante inhérente et une composante qui dépend du système. Les données peuvent
convenir à une application, mais pas à une autre. Le présent document aide à établir et maintenir la qualité
des données pour chaque application d’analyse de données et d’AA.
6.3 Exigences et recommandations
6.3.1 Généralités
Les exigences et recommandations suivantes s’appliquent à l’ensemble de l’organisme.
6.3.2 Culture de qualité des données
Il convient que l’organisme maintienne une culture de qualité des données.
L’organisme doit:
a) a) disposer de règles et de processus pour atteindre la qualité (conformément au présent
document) en tenant compte du modèle de qualité des données tel qu’il est appliqué aux produits et
services applicables;
b) b) définir et mettre en œuvre des processus de gestion de la qualité des données et réaliser les
activités connexes liées à la qualité des données;
c) c) intégrer les processus et activités de gestion de la qualité des données, dans la mesure du
possible, à d’autres processus et activités de gestion, tels que la gestion de la qualité générale et la gestion
des risques;
d) d) documenter les activités réalisées;
e) e) fournir les ressources suffisantes pour assurer la gestion de la qualité des données;
f) f) surveiller et, dans la mesure nécessaire, revoir et améliorer les processus de gestion de la
qualité des données;
g) g) fournir l’autorité requise au personnel impliqué;
h) h) communiquer les politiques de qualité des données au sein de l’organisme.
6.3.3 Gestion des problèmes de qualité des données
L’organisme doit satisfaire aux exigences de qualité des données en:
a) a) mettant en place des processus de communication, d’analyse, d’évaluation, de résolution et de
clôture des problèmes de qualité des données;
© ISO/IEC 2024 – Tous droits réservés
b) b) documentant les problèmes clôturés;
c) c) faisant remonter ou délégant les problèmes qui ne peuvent pas être clôturés.
NOTE 1 La résolution et la clôture des problèmes de qualité des données peuvent inclure la limitation ou l’ajustement
du domaine d’application du projet d’AA.
NOTE 2 Un problème de qualité des données peut être clôturé en mettant en œuvre une résolution ou en déterminant
une résolution sur la base de critères d’acceptation définis.
6.3.4 Gestion des compétences
L’organisme doit gérer les compétences en:
a) a) documentant les qualifications et les outils requis pour traiter les données;
b) b) s’assurant que le personnel impliqué possède les qualifications suffisantes pour exercer les
activités et fonctions qui lui incombent;
c) c) tenant à jour des registres du personnel et de leur maîtrise des qualifications et outils requis;
d) d) tenant des registres de formations et d’expérience appropriés qui justifient les qualifications
revendiquées.
L’organisme peut faire appel à des sources de compétences externes.
6.3.5 Gestion des ressources
L’organisme doit fournir les ressources nécessaires à la gestion de la qualité des données, y compris:
a) a) les applications logicielles, les formations et le support nécessaires à la gestion de la qualité
des données;
b) b) l’infrastructure ou les services informatiques nécessaires à la gestion de la qualité des données
(par exemple, calcul, stockage, mise en réseau);
c) c) le personnel ayant les qualifications requises pour assurer la gestion de la qualité des données.
6.3.6 Intégration du système de gestion
Il convient que l’organisme intègre ses activités de gestion de la qualité des données dans son système de
gestion existant, y compris ses systèmes de gestion axés sur la qualité des produits ou services, ainsi que ceux
axés sur le développement et l’utilisation de systèmes d’IA. Il convient que les implications du double rôle des
parties prenantes soient gérées par le système de gestion de la qualité, y compris l’atténuation de tout conflit
d’intérêts.
NOTE 1 La gestion des parties prenantes peut prendre en compte le potentiel d’une personne à assumer plusieurs
rôles. Un utilisateur de produits ou services basés sur l’analyse de données et l’AA peut également être propriétaire ou
contributeur de données.
NOTE 2 Les organismes peuvent utiliser l’ISO/IEC 42001 afin de définir un système de gestion pour le développement
ou l’utilisation de systèmes d’IA.
NOTE 3 Les organismes peuvent utiliser l’ISO 9001 ou d’autres systèmes de gestion de la qualité spécifiques à leur
secteur pour définir leur système de gestion de la qualité.
© ISO/IEC 2024 – Tous droits réservés
6.3.7 Documentation
La documentation doit être intelligible pour les parties prenantes concernées du projet conformément à leur
rôle. Il convient que les ressources dans une langue qui n’est pas comprise par une partie prenante concernée
soient accompagnées d’un résumé dans une langue que la partie prenante peut comprendre.
La documentation doit être accessible aux parties prenantes concernées, suivant le cas et selon les
autorisations. Il convient de réduire le plus possible les frais généraux d’accès.
Il convient que la documentation inclue le contexte ou les références nécessaires pour la rendre intelligible
aux futures parties prenantes concernées qui ne font pas partie du projet en cours. Cette pratique peut
permettre à ces parties prenantes d’évaluer un ensemble de données en vue d’une réutilisation potentielle,
partielle ou totale.
6.3.8 Audit et évaluation de la qualité des données
Les processus mis en œuvre doivent être audités, le cas échéant, sur la base d’une évaluation:
a) a) du plan de qualité des données par rapport aux règles et processus organisationnels;
b) b) des arguments et justifications détaillant la manière dont les exigences du modèle de qualité
des données ont été appliquées;
c) c) des arguments détaillant la manière dont les objectifs du plan de qualité des données ont été
atteints;
d) d) permettant de déterminer si le plan de qualité des données et tous les livrables sont complets,
cohérents et corrects conformément au présent document;
e) e) des recommandations d’amélioration de la qualité des données.
Les données doivent être évaluées à l’aide d’une évaluation de la qualité des données, qui doit reposer sur une
évaluation visant à déterminer si les données atteignent les objectifs du présent document, l’état de l’art actuel
de la technologie et les connaissances techniques applicables dans le domaine.
Le plan d’évaluation de la qualité des données doit être inclus dans l’étape de spécification. L’évaluation de la
qualité des données doit être réalisée avant la mise à disposition des données (voir l’Étape 7 à la
Figure 1Figure 1:: mise à disposition des données) ou à un intervalle approprié lors de l’utilisation de
l’apprentissage continu ou de données en continu.
L’évaluation de la qualité des données peut être réalisée sur un sous-ensemble de données lorsqu’il peut être
démontré que la qualité du sous-ensemble est représentative de la qualité de l’ensemble de données complet.
6.3.9 Examen de confirmation et mesures de la qualité des données
La qualité des données doit être confirmée par des mesures appropriées de la qualité des données
conformément à l’ISO/IEC 5259--2. Un examen de la qualité des données doit au moins couvrir:
a) a) les examens de confirmation des principaux livrables:
1) 1) chaque examen de confirmation doit être finalisé avant la mise à disposition des données;
2) 2) il convient que chaque examen de confirmation repose sur le fait que les objectifs du présent
document sont atteints ou non;
b) b) les audits qualité des processus mis en œuvre;
© ISO/IEC 2024 – Tous droits réservés
c) c) une évaluation de la qualité des données.
Tous les livrables doivent faire l’objet d’examens de confirmation.
Le personnel réalisant ces examens doit avoir accès au personnel impliqué, aux informations pertinentes et
aux ressources requises.
NOTE Les examens de confirmation des principaux livrables peuvent être délégués, mais la responsabilité incombe
à la personne désignée.
6.3.10 Gestion de la qualité des données spécifique au projet
L’organisme doit gérer les données spécifiques au projet en:
a) a) établissant un processus approprié de gestion de la qualité des données spécifique au projet
qui satisfait à toutes les exigences du projet d’AA spécifique;
b) b) tenant à jour une liste des énoncés de qualité des données pertinents. Le cas échéant,
des références quantitatives et qualitatives pour les mesures de la qualité des données doivent être
documentées;
c) c) adoptant des processus appropriés pour identifier et gérer toutes les mesures de la qualité des
données pertinentes pour le projet.
Le processus de gestion de la qualité des données spécifique au projet doit satisfaire aux exigences de
12l’Article 12.
6.4 Livrables
Les livrables du processus de gestion de la qualité des données doivent inclure:
a) a) les règles et processus spécifiques à l’organisme pour la qualité des données (par exemple,
conformément à l’ISO/IEC 5259--4);
b) b) les preuves de gestion des compétences;
c) c) les preuves d’un système de gestion de la qualité des données;
d) d) l’identification des mesures de la qualité des données utilisées;
e) e) la documentation des références de mesure de la qualité des données applicables;
f) f) les rapports sur les anomalies de qualité identifiées.
7 Gestion de la qualité des données spécifique au cycle de vie
7.1 Objectif
L’objectif d’un cycle de vie de gestion de la qualité des données (CVGQD) est d’établir et de maintenir la qualité
des données tout au long du cycle de vie des données. Un exemple de modèle de cycle de vie des données est
décrit dans l’ISO/IEC 5259--1:2024, Figure 3.
© ISO/IEC 2024 – Tous droits réservés
7.2 Généralités
7.2.1 Cycle de vie de gestion de la qualité des données
La qualité des données doit être gérée à toutes les étapes du cycle de vie des données. Le modèle de cycle de
vie de gestion de la qualité des données (CVGQD) représenté à la Figure 1Figure 1 fournit des
recommandations pour satisfaire aux exigences de qualité des données à utiliser dans un contexte d’analyse
de données et d’AA. Il déduit des étapes spécifiques qui sont pertinentes pour la gestion de la qualité des
données et facilite le regroupement et l’organisation des exigences et des lignes directrices à prendre en
compte pour la gestion de la qualité des données. Le modèle de CVGQD n’est pas prescriptif de l’ordre temporel
des étapes. Les différentes étapes du CVGQD sont décrites en 7.2.27.2.2.
5259-3_ed1fig1_f.EPS
Légende
5259-3_ed1fig1_key1.EPS Voie de développement principale
5259-3_ed1fig1_key2.EPS
Voie de retour d’informations
5259-3_ed1fig1_key3.EPS
Instanciation du modèle CVD pour la série 5259 (voir l’ISO/IEC 5259--1:2024, Figure 3)
5259-3_ed1fig1_key4.EPS
Étape du cycle de vie de gestion de la qualité des données
5259-3_ed1fig1_key5.EPS
Processus horizontaux du cycle de vie de gestion de la qualité des données
5259-3_ed1fig1_key6.EPS
Indication de l’itération dans le cycle de vie
5259-3_ed1fig1_key7.EPS
Regroupement des étapes du cycle de vie de gestion de la qualité des données pour clarifier la mise en correspondance avec le
modèle CVD
© ISO/IEC 2024 – Tous droits réservés
Figure 1 — Cycle de vie de gestion de la qualité des données
Les problèmes de qualité des données peuvent survenir à n’importe quelle étape du cycle de vie des données.
La gestion de la qualité des données doit établir et maintenir des processus de qualité des données au début
du cycle de vie des données. Si l’organisme délègue la responsabilité d’un processus, cette délégation doit être
documentée et traçable.
NOTE Il est généralement plus difficile d’identifier et de corriger les problèmes de qualité des données après coup
que de gérer les risques de qualité des données lorsqu’ils surviennent pour la première fois. Par exemple, les erreurs
introduites lors de la collecte de données sont plus facilement évitées par une gestion de la qualité appropriée plutôt
qu’en tentant d’identifier et de corriger les erreurs plus tard dans le cycle de vie des données.
7.2.2 Étapes du cycle de vie de gestion de la qualité des données
7.2.2.1 Motivation et conceptualisation des données
La gestion de la qualité des données commence par l’étape de motivation et de conceptualisation. Il convient
d’identifier et de gérer les problèmes potentiels liés à la qualité des données lorsque le premier besoin de
données pour un contexte d’analyse de données et d’AA devient apparent. Entre autres, la motivation et
l’utilisation prévue des données sont validées et vérifiées afin de gérer les caractéristiques de qualité telles
que la conformité et la pertinence.
7.2.2.2 Spécification des données
À l’étape de spécification des données, la gestion de la qualité des données impose des exigences pour la
création de la spécification des données, y compris les formats de données, les propriétés statistiques et la
divisibilité. Les lignes directrices de gestion de la qualité des données facilitent l’identification d’exigences et
de plans erronés, incomplets ou contradictoires. Par exemple, dans un contexte d’analyse de données et d’AA,
la gestion de la qualité confirme que les données correspondent aux exigences du contexte.
7.2.2.3 Planification des données
Au cours de l’étape de planification des données, un plan est formulé pour satisfaire à la spécification des
données. Cela comprend la planification des tâches et des ressources spécifiques pour acquérir et traiter les
données tout au long du cycle de vie des données, ainsi que des méthodes d’évaluation et des critères
d’acceptation.
7.2.2.4 Acquisition des données
En matière de gestion de la qualité des données, l’acquisition de données peut désigner la collecte de données,
la génération de données ou l’acquisition et la combinaison d’ensembles de données existants. Le choix de la
méthode de collecte des données a des implications sur la gestion de la qualité des données. Quelle que soit la
méthode d’obtention des données, le résultat de cette étape est considéré comme l’entrée brute pour les
étapes ultérieures du cycle de vie des données, même si un ensemble de données déjà géré est importé.
7.2.2.5 Prétraitement des données
L’étape de prétraitement des données organise toutes les exigences et lignes directrices de gestion de la
qualité des données qui sont liées au traitement des données d’entrée brute obtenues pendant
l’étape d’acquisition des données. Les activités de cette étape ont tendance à supprimer des éléments de
données, par exemple en filtrant et en nettoyant les données brutes.
© ISO/IEC 2024 – Tous droits réservés
7.2.2.6 Augmentation des données
L’augmentation des données utilise l’intrant de l’étape de prétraitement des données qu’elle organise
conformément à toutes les exigences et lignes directrices de gestion de la qualité liées à l’ajout de données à
l’ensemble de données. Cela inclut l’association de métadonnées, l’ajout d’étiquettes de données ou d’autres
transformations.
7.2.2.7 Mise à disposition des données
L’objectif de la mise à disposition des données est de mettre l’ensemble de données à disposition là où il est
nécessaire. Les exigences de gestion de la qualité des données à cette étape comprennent, entre autres, le
maintien de l’intégrité des ensembles de données pendant la livraison, le contrôle d’accès, la documentation
et la vérification que le contexte d’utilisation correspond à l’utilisation prévue de l’ensemble de données.
7.2.2.8 Mise hors service des données
La gestion de la qualité des données se termine par la suppression ou le transfert des données lors de l’étape de
mise hors service des données. Dans chacun de ces cas, qui sont mutuellement exclusifs, la responsabilité des
données est levée. Une manipulation appropriée des données libérées constitue un facteur majeur de
confiance envers l’organisme et peut contribuer à prévenir l’utilisation abusive des données.
7.2.3 Adaptation du cycle de vie de gestion de la qualité des données indépendamment du projet
Il convient que l’organisme adapte le cycle de vie s’il:
a) a) fusionne ou scinde des étapes;
b) b) exécute les processus requis à différentes étapes ou dans le cadre d’étapes supplémentaires
(voir l’ISO/IEC 5259--4);
c) c) itère les étapes;
d) d) exécute simultanément des activités qui ne dépendent pas les unes des autres;
e) e) omet les étapes qui ne s’appliquent pas, en donnant une justification;
f) f) inclut les dispositions de gestion de la qualité des données pour la validation et la vérification,
la gestion des modifications et la gestion de la configuration comme représenté à la Figure 1Figure 1.
7.2.4 Aspects horizontaux du cycle de vie de gestion de la qualité des données
7.2.4.1 Généralités
La Figure 1Figure 1 montre quatre processus qui couvrent toutes les étapes du cycle de vie de gestion de la
qualité des données, notamment:
a) a) validation et vérification;
b) b) gestion des modifications;
c) c) gestion de la configuration;
d) d) gestion des risques.
Ces processus doivent également être réalisés dans le cas d’une adaptation indépendante du projet.
© ISO/IEC 2024 – Tous droits réservés
7.2.4.2 Validation et vérification
Il convient que la validation et la vérification de la qualité des données soient effectuées à toutes les étapes
pertinentes tout au long du cycle de vie de gestion de la qualité des données.
7.2.4.3 Gestion des modifications
La gestion des modifications permet de s’assurer que les éventuelles modifications de données ou de
processus ne compromettent pas la qualité des données.
7.2.4.4 Gestion de la configuration
La gestion de la configuration permet de s’assurer que les données et processus sont référençables de manière
unique et que la qualité des données n’est pas compromise par des modifications dans la gestion de la
configuration.
7.2.4.5 Gestion des risques
Il convient que la gestion des risques soit effectuée à toutes les étapes pertinentes tout au long du cycle de vie
de gestion de la qualité des données.
7.3 Exigences et recommandations
7.3.1 Motivation et conceptualisation des données
7.3.1.1 Généralités
L’organisme doit:
a) a) documenter la motivation et l’origine du besoin de données;
b) b) spécifier le domaine d’application, la finalité et l’utilisation prévue des données;
c) c) documenter les exigences de qualité des données.
NOTE Pour en savoir plus sur les préoccupations sociétales et éthiques, voir l’ISO/IEC TR 24368.
7.3.1.2 Analyse des parties prenantes
L’organisme doit:
a) a) effectuer une analyse des parties prenantes afin d’identifier toutes les parties prenantes
concernées par les données et leurs implications pour la gestion de la qualité des données;
b) b) identifier les exigences de qualité des données potentiellement contradictoires.
NOTE Une description des rôles et sous-rôles potentiels des parties prenantes de l’IA est fournie par
l’ISO/IEC 22989:2022, 5.19.
7.3.1.3 Analyse de faisabilité
Il convient que l’organisme tienne à jour une analyse de faisabilité basée sur ses qualifications et ressources
disponibles et qui évalue sa capacité à atteindre ses objectifs de qualité des données. Il convient de mettre à
jour l’analyse de faisabilité tout au long du cycle de vie des données.
NOTE Les projets d’AA antérieurs et les ensembles de données accessibles publiquement qui ont atteint les objectifs
de qualité cibles sont des exemples de preuves de faisabilité.
© ISO/IEC 2024 – Tous droits réservés
7.3.2 Spécification des données
7.3.2.1 Généralités
L’organisme doit spécifier les exigences en matière de données dans une spécification de données et valider
que ces exigences sont cohérentes et complètes pour l’utilisation prévue.
La spécification des données doit inclure les aspects minimums requis et ceux qui sont facultatifs en fonction
de l’utilisation prévue par le système d’IA.
Il convient que la spécification couvre les points suivants:
a) a) une description de la nature des données;
b) b) l’objectif prévu du projet d’analyse de données et d’AA utilisant les données;
c) c) les exigences légales;
d) d) les considérations de sécurité et de sûreté;
e) e) la possibilité de biais indésirable;
f) f) les considérations relatives à la protection des données;
g) g) les exigences en matière de données spécifiques au domaine et au projet;
h) h) le modèle de qualité des données et le niveau de qualité requis pour atteindre l’utilisation
prévue des données.
NOTE 1 La spécification des données peut être basée sur la description du traitement des biais indésirables tout au
long du cycle de vie d’un système d’IA, fournie dans l’ISO/IEC TR 24027.
NOTE 2 La spécification des données inclut les différentes interfaces avec un projet d’AA (par exemple, données pour
l’entraînement, données pour les tests ou gestion continue des données).
NOTE 3 Certains algorithmes d’AA requièrent des propriétés statistiques spécifiques aux données d’entraînement.
NOTE 4 Les considérations de protection des données peuvent inclure le principe de minimisation des données
(également appelé «évitement des données »). La minimisation des données signifie que seules les données minimales
nécessaires au fonctionnement du système sont recueillies ou utilisées.
7.3.2.2 Format des données
L’organisme doit déterminer quelles informations doivent être incluses dans les informations de format de
données. Ces informations peuvent inclure, entre autres:
a) a) l’encodage;
b) b) la fréquence (temps);
c) c) la résolution (espace);
d) d) la syntaxe;
e) e) la sémantique;
f) f) la structure des métadonnées associées;
© ISO/IEC 2024 – Tous droits réservés
g) g) les plages de valeurs attendues;
h) h) les éléments facultatifs et obligatoires;
i) i) les formats de propriété éventuellement admissibles et les alternatives valides (par exemple,
tailles des images);
j) j) les liens et renvois.
NOTE La sémantique fait référence à l’interprétation et à l’utilisation des données, ce qui inclut les opérations
admissibles sur les données.
7.3.2.3 Propriétés statistiques et divisibilité
La spécification des données doit inclure la spécification des divisions valides en sous-ensembles
(par exemple, données d’entraînement, de validation et de test). Il convient que les sous-ensembles ne se
croisent pas, sauf lorsqu’ils sont utilisés conjointement avec des méthodes scientifiquement appropriées telles
que le bagging, l’autoamorçage et la validation à k blocs.
Pour chacun de ces sous-ensembles, l’organisme doit déterminer et maintenir:
a) a) des propriétés statistiques pertinentes;
b) b) une représentativité;
c) c) une taille appropriée.
7.3.2.4 Ressources et outils de support
Il convient que la spécification des données inclue toutes les exigences pertinentes relatives à la manipulation
des données et couvre au moins:
a) a) les spécifications des outils de support;
b) b) la spécification matérielle minimale pour traiter les données et utiliser les outils;
c) c) les résolutions nécessaires à la visualisation;
d) d) les exigences relatives au
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.

Loading comments...

The ISO/IEC 5259-3:2024 standard provides a comprehensive framework for ensuring the quality of data used in analytics and machine learning (ML). Its primary focus is on data quality management requirements and guidelines, making it an essential resource for any organization looking to enhance its data governance practices. One of the key strengths of this standard is its broad applicability. By specifying requirements that are generic in nature, ISO/IEC 5259-3:2024 is suitable for all types of organizations, irrespective of their size or sector. This inclusivity ensures that organizations can adapt the recommendations to their unique contexts, allowing for tailored solutions that address specific data quality challenges. The standard emphasizes the importance of establishing, implementing, and maintaining data quality management processes. By providing guidelines rather than prescribing rigid processes, it offers organizations the flexibility to incorporate their existing practices while enhancing their focus on data quality for analytics and ML. This flexibility is particularly relevant in a rapidly evolving technological landscape, where organizations must be agile enough to adapt to new data sources and analytical techniques. Another notable aspect of the document is its focus on continual improvement in data quality. The standard encourages organizations to view data quality as an ongoing endeavor rather than a one-time effort. This forward-thinking approach supports the dynamic nature of analytics and machine learning, where data quality can significantly impact the outcomes of data-driven decision-making. Moreover, while the document does not provide specific metrics or detailed processes, it serves as a foundational reference for organizations looking to design or refine their own data quality management processes. The generic requirements and guidance can be effectively aligned with existing organizational strategies, enhancing the overall effectiveness of data governance frameworks. In summary, the ISO/IEC 5259-3:2024 standard is a vital tool for organizations aiming to improve their data quality for analytics and machine learning. Its emphasis on generic requirements, adaptability, and continuous improvement makes it a relevant and practical resource in the field of data quality management, positioning organizations to better leverage data in their analytical endeavors.

La norme ISO/IEC 5259-3:2024 est un document essentiel pour toute organisation souhaitant optimiser la qualité des données utilisées dans le cadre de l'analyse et de l'apprentissage automatique. Son champ d'application est clairement défini : elle spécifie les exigences et fournit des lignes directrices pour établir, mettre en œuvre, maintenir et améliorer continuellement la qualité des données. Cela en fait un outil incontournable pour les entreprises de toutes tailles et de tous secteurs qui souhaitent s'assurer que leurs données sont fiables et exploitables. Un des points forts de cette norme est son approche générique. Plutôt que de proposer un processus ou des méthodes détaillées, elle définit des exigences et des recommandations qui peuvent être adaptées aux besoins spécifiques de chaque organisation. Cela permet une grande flexibilité et une personnalisation des processus de gestion de la qualité des données. Les organisations peuvent ainsi élaborer des stratégies qui correspondent à leur structure et à leurs ressources, ce qui renforce l'applicabilité de cette norme dans différents contextes. De plus, la norme répond à un besoin croissant dans le domaine de l'intelligence artificielle et de l'apprentissage automatique, où la qualité des données est cruciale pour obtenir des analyses précises et des modèles performants. En fournissant des directives sur la gestion de la qualité des données, elle aide les organisations à éviter les pièges liés à des données de mauvaise qualité, ce qui peut engendrer des décisions erronées. La portée de l'ISO/IEC 5259-3:2024 est donc particulièrement pertinente dans un contexte où l'intelligence artificielle et l'analyse de données prennent une place prépondérante dans les stratégies d'entreprise. En établissant un cadre général pour la gestion de la qualité des données, cette norme contribue à garantir que les organisations peuvent tirer le meilleur parti de leurs investissements en analytics et machine learning. En résumé, la norme ISO/IEC 5259-3:2024 est un document fondamental qui définit les exigences et fournit des lignes directrices propices à l'amélioration de la qualité des données. Son approche générique permet une large utilisation dans divers secteurs d'activité, affirmant ainsi sa pertinence et son importance dans le paysage actuel de la technologie et des données.

ISO/IEC 5259-3:2024 outlines critical requirements and guidance for organizations aiming to enhance data quality specifically for analytics and machine learning (ML). This standard is instrumental for creating a robust framework to manage data quality, ensuring that organizations can effectively utilize their data in analytical processes and ML models. The scope of this standard emphasizes its universal applicability, making it relevant to organizations of all types, sizes, and sectors. It does not prescribe rigid processes, methods, or metrics, but instead offers a flexible quality management process that can be adapted to diverse organizational contexts. This flexibility is one of the significant strengths of the standard, as it empowers organizations to tailor their data quality management practices according to unique operational needs while adhering to the fundamental quality requirements. The guidance provided in ISO/IEC 5259-3:2024 is meticulously designed to assist organizations in establishing, implementing, and maintaining an effective data quality management system. By focusing on continual improvement, this standard encourages organizations to regularly assess and refine their data quality measures, which is essential in the rapidly evolving environment of analytics and ML. Moreover, the standard's emphasis on defining generic requirements and recommendations enhances its relevance across various industries, acknowledging that while the nature of data might differ, the principles of effective data quality management remain consistent. This approach not only fosters a better understanding of data's role in analytics and ML but also elevates organizations' capabilities to deliver reliable insights derived from quality data. In summary, ISO/IEC 5259-3:2024 provides a comprehensive framework for data quality management in analytics and machine learning, highlighting its significance in the modern data-driven landscape. The strength lies in its adaptable nature and its focus on continuous improvement, making it a vital resource for organizations committed to enhancing their data quality practices.

ISO/IEC 5259-3:2024は、人工知能におけるデータ品質管理のための重要な標準であり、分析や機械学習(ML)の分野で使用されるデータの品質を確立、実施、維持、そして継続的に改善するための要件とガイドラインを提供します。この文書は、具体的なプロセス、方法、メトリクスを定義するものではなく、あくまでデータ品質管理プロセスのための要件と指針を策定しています。 この標準の強みは、すべての組織に適用可能な一般的な要件と推奨事項を提供している点です。組織のタイプ、サイズ、性質に関わらず、ISO/IEC 5259-3:2024は、データ品質管理の観点から、実施のフレームワークとしての役割を果たします。これにより、異なる業種や業態においても、データ品質の向上に向けた共通の基準を持つことが可能となります。 さらに、この標準は、データ品質プロセスに対するリファレンスプロセスと方法を示しており、組織はこれを元に自らの状況に合わせて調整することができます。この柔軟性により、ISO/IEC 5259-3:2024は、データを扱うあらゆる分野での実践的かつ効果的なデータ品質管理の実現をサポートします。 また、継続的改善のための指導を含むことにより、この標準は、データ品質の持続的向上を目指す組織における競争力を強化する一助となります。このような要求事項を通じて、データの信頼性や有用性を高め、最終的には分析や機械学習における成果を向上させることが期待されます。 全体として、ISO/IEC 5259-3:2024は、データ品質の重要性を理解し、それの管理フレームワークを提供し、さまざまな組織におけるデータ品質の向上を実現するための有力な基盤を構築します。

ISO/IEC 5259-3:2024 표준은 인공지능 분야에서 데이터 품질의 중요성을 강조하며, 분석 및 기계 학습(ML)에 사용되는 데이터의 품질을 확보하기 위한 요구 사항과 지침을 제시합니다. 이 문서는 데이터 품질 관리 프로세스를 설정하고 구현하며 유지하고 지속적으로 개선하기 위한 포괄적인 프레임워크를 제공합니다. 이 표준의 강점은 그 포괄성에 있습니다. 모든 조직, 유형, 규모 또는 성격에 관계없이 적용 가능한 요구 사항과 권장 사항을 генер하기 때문에, 다양한 산업 분야에서 유용하게 활용될 수 있습니다. 또한, 상세한 프로세스나 방법, 메트릭스를 정의하는 대신, 데이터 품질 관리 프로세스를 위한 요구 사항 및 지침을 제공하여 기업들이 자신의 상황에 맞춰 언제든지 조정할 수 있는 유연성을 제공합니다. 표준은 데이터 품질 관리의 중요성을 인식하고 이를 지속적으로 향상시키기 위한 실질적인 접근 방식을 제시합니다. 데이터 품질의 향상은 분석 및 기계 학습의 결과에 직접적인 영향을 미치기 때문에, 이 표준은 기업들이 데이터 기반의 의사결정을 내리는 데 있어 필수적인 도구로 작용할 것입니다. ISO/IEC 5259-3:2024 표준은 궁극적으로 인공지능의 데이터 품질 관리와 관련된 요구 사항과 권장 사항을 통해, 데이터의 신뢰성과 활용도를 높이는 데 크게 기여할 것으로 기대됩니다. 이 표준을 통해 조직은 기계 학습과 분석 작업을 수행할 때 데이터 품질을 관리하고 개선하는 체계적인 접근을 갖출 수 있을 것입니다.

Das Dokument ISO/IEC 5259-3:2024 bietet eine umfassende Spezifikation für die Anforderungen und Richtlinien zur Datenqualität im Bereich der Analytik und des maschinellen Lernens (ML). Der Fokus dieses Dokuments liegt darauf, Organisationen dabei zu unterstützen, die Qualität der verwendeten Daten systematisch zu etablieren, zu implementieren, aufrechtzuerhalten und kontinuierlich zu verbessern. Dies ist besonders relevant in einer Zeit, in der Datenintegrität und -qualität entscheidend für den Erfolg von datengetriebenen Entscheidungen sind. Ein herausragendes Merkmal dieser Norm ist ihre generische Auffassung, die es ermöglicht, die festgelegten Anforderungen unabhängig von der Art, Größe oder dem Tätigkeitsfeld der Organisation umzusetzen. Dadurch wird ISO/IEC 5259-3:2024 zu einem essenziellen Werkzeug für Unternehmen, die sowohl großen als auch kleinen Umfang in ihrer Datenanalyse betreiben. Die Richtlinien geben einen klaren Rahmen vor, der flexibel genug ist, um an spezifische Bedürfnisse angepasst zu werden, ohne dabei in detaillierte Prozesse, Methoden oder Metriken einzutauchen. Die Norm bietet somit nicht nur eine strategische Anleitung zur Verbesserung der Datenqualität, sondern auch eine Referenz, die sich hervorragend für die Entwicklung maßgeschneiderter Qualitätsmanagementprozesse eignet. Diese Flexibilität ist ein wesentlicher Vorteil, da sie die Implementierung in unterschiedlichen Szenarien und Branchen erleichtert. Zusammenfassend ist die ISO/IEC 5259-3:2024 von großer Bedeutung für Organisationen, die sich auf Analytik und ML stützen, da sie essentielle Anforderungen und strategische Richtlinien zur Sicherstellung einer hohen Datenqualität bereitstellt. Die Norm fördert eine proaktive Herangehensweise an Datenmanagement und -qualität, was in der heutigen datengetriebenen Welt unerlässlich ist.

ISO/IEC 5259-3:2024の標準は、分析および機械学習のためのデータ品質に関する要求事項とガイダンスを提供する重要なドキュメントです。この文書は、データの品質を確立、実施、維持、継続的に改善するための要件を明確に定義しており、特に分析と機械学習の分野において重要な役割を果たしています。 この標準の強みは、具体的なプロセスや手法、メトリクスを定義することなく、品質管理プロセスのための要件とガイダンスを提供している点にあります。これにより、さまざまな組織が必要に応じてこの文書の要求に沿ったプロセスと方法を適応させることが可能です。標準が提供する要求事項と推奨事項は、組織の種類や規模、性質に関わらず適用可能であるため、幅広い状況でのデータ品質管理の実施を支援します。 また、ISO/IEC 5259-3:2024は、データ品質を向上させることにより、分析や機械学習における意思決定の正確性と信頼性を高めることを目的としています。これにより、組織はデータに基づいた決定をより効果的に行うことができ、最終的には競争力を向上させることが期待されます。データ品質管理の要件とガイダンスに関するこの標準は、デジタルトランスフォーメーションの推進やデータ駆動型の文化の醸成において不可欠なリソースとなるでしょう。 総じて、ISO/IEC 5259-3:2024は、データ品質に関する戦略的アプローチを提供し、組織がそのデータ資産を最大限に活用できるよう支援するための重要な文書であり、多くの業界での適用が期待されます。

La norme ISO/IEC 5259-3:2024 est un document essentiel qui se concentre sur la qualité des données dans les domaines de l'analyse et de l'apprentissage automatique. Son champ d'application est très pertinent car il définit les exigences et fournit des orientations pour établir, mettre en œuvre, maintenir et améliorer continuellement la qualité des données. Cette norme n'offre pas un processus détaillé ou des méthodes spécifiques, ce qui lui permet d'être flexible et adaptable aux diverses réalités des organisations. L'un des points forts de cette norme est qu'elle établit une base solide pour la gestion de la qualité des données, tout en fournissant des lignes directrices claires. Les recommandations qu'elle propose sont génériques et peuvent être appliquées à toute organisation, quelle que soit sa taille ou son secteur d'activité. Cela en fait un outil universel pour toutes les structures cherchant à optimiser la qualité des données qu'elles utilisent pour l'analyse et le machine learning. De plus, la norme encourage une approche proactive dans la gestion de la qualité des données. En soulignant l'importance de l'amélioration continue, elle incite les organisations à ne pas se contenter d'un statu quo, mais à rechercher régulièrement des moyens d'optimiser leurs processus de gestion des données. En somme, l'ISO/IEC 5259-3:2024 offre une démarche essentielle pour toute organisation souhaitant garantir la fiabilité et l'intégrité des données utilisées en analyse et en machine learning, renforçant ainsi sa pertinence dans le paysage numérique actuel.

La norme ISO/IEC 5259-3:2024 présente un cadre essentiel pour la gestion de la qualité des données utilisées dans l'analytique et l'apprentissage automatique (ML). Son objectif principal est de spécifier les exigences et de fournir une guidance pour établir, mettre en œuvre, maintenir et améliorer continuellement la qualité des données. Cela est particulièrement pertinent à une époque où la quantité de données générées explose et où la précision des analyses devient cruciale pour les décisions stratégiques. L'un des points forts de cette norme est son approche générique, permettant une application efficace dans divers types d'organisations, quelle que soit leur taille ou leur secteur. Cette flexibilité rend la norme pertinente non seulement pour les grandes entreprises technologiques, mais aussi pour les PME et les organisations à but non lucratif, qui peuvent toutes bénéficier d’un cadre standardisé pour la gestion de la qualité des données. Il est également important de noter que la norme ne prescrit pas de processus, de méthodes ou de métriques détaillés, ce qui est un atout. Au lieu de cela, elle offre des exigences et des lignes directrices qui peuvent être ajustées pour répondre aux besoins spécifiques de chaque organisation. Cette adaptabilité permet aux entreprises de développer des processus de gestion de la qualité des données alignés avec leurs objectifs stratégiques, tout en suivant les bonnes pratiques recommandées. En somme, l'ISO/IEC 5259-3:2024 est une ressource précieuse pour toute organisation cherchant à améliorer la qualité des données dans le domaine de l’analytique et du machine learning. Sa structure permet d'assurer que les données utilisées sont non seulement fiables mais aussi conformes aux exigences de qualité nécessaires pour maximiser l'efficacité des analyses et la pertinence des résultats.

ISO/IEC 5259-3:2024 표준은 인공지능 및 머신러닝(ML)에서의 분석을 위한 데이터 품질을 다루는 중요한 문서로, 데이터 품질 관리 요구 사항 및 가이드를 제공합니다. 이 표준은 데이터의 품질을 설립하고, 시행하며, 유지하고, 지속적으로 향상시키기 위한 요구 사항과 지침을 명확하게 제시합니다. 특히 이 문서는 모든 조직에서 적용 가능한 일반적인 요구 사항과 권장 사항을 포함하고 있어, 크기나 종류에 상관없이 다양한 환경에서 유연하게 활용될 수 있습니다. 이 표준의 강점은 구체적인 절차나 방법, 메트릭스를 정의하지 않으면서도 데이터 품질 관리 프로세스를 설정하는 데 필요한 요구 사항과 지침을 제공하는 데 있습니다. 이는 조직이 자신의 필요와 상황에 맞춰 이를 조정하여 적용할 수 있도록 돕습니다. 이러한 유연성은 특히 다양한 산업 및 비즈니스 모델에서 데이터 품질을 효과적으로 관리하는 데 중요한 역할을 합니다. 또한, ISO/IEC 5259-3:2024는 데이터 품질 관리 프로세스의 기초를 제공하여 조직이 데이터를 보다 신뢰할 수 있는 자원으로 활용하도록 합니다. 데이터 분석과 머신러닝의 발전에 따라 이 표준은 데이터 품질의 중요성을 인식하고 이를 관리하기 위한 근본적인 틀을 마련하는 데 적합합니다. 따라서 데이터 품질 확보는 조직의 전반적인 비즈니스 성과에 긍정적인 영향을 미칠 것으로 기대됩니다. 결론적으로, ISO/IEC 5259-3:2024 표준은 데이터 품질 관리의 요구 사항과 지침을 포괄적으로 다루며, 다양한 조직들이 효과적으로 데이터 품질을 관리할 수 있는 방향을 제시함으로써 인공지능과 머신러닝 분야에서의 데이터 활용을 더욱 신뢰성 있게 만들어 줍니다.

Die ISO/IEC 5259-3:2024 ist ein wegweisendes Dokument, das sich mit der Qualität von Daten für Analytik und maschinelles Lernen (ML) beschäftigt. Der Umfang dieser Norm ist klar umrissen, da sie Anforderungen und Leitlinien für die Etablierung, Implementierung, Aufrechterhaltung und kontinuierliche Verbesserung der Datenqualität in diesen dynamischen Bereichen festlegt. Ein zentraler Stärke dieser Norm liegt darin, dass sie eine flexible Grundlage für das Qualitätsmanagement bietet, ohne dabei detaillierte Prozesse, Methoden oder spezifische Metriken festzulegen. Stattdessen definiert die Norm allgemeine Anforderungen und Empfehlungen, die auf alle Organisationen anwendbar sind, unabhängig von deren Größe, Art oder Branche. Dies fördert eine breite Akzeptanz und ermöglicht es Unternehmen, die geforderten Qualitätsmanagementprozesse an ihre spezifischen Bedürfnisse anzupassen. Die Relevanz der ISO/IEC 5259-3:2024 kann nicht hoch genug eingeschätzt werden, insbesondere in einer Zeit, in der Daten als eines der wertvollsten Güter in der Wirtschaft angesehen werden. Angesichts der rapiden Entwicklungen im Bereich der Künstlichen Intelligenz und des maschinellen Lernens ist es unerlässlich, dass Organisationen die Qualität ihrer Daten sichern, um fundierte Entscheidungen zu treffen und wettbewerbsfähig zu bleiben. Diese Norm bietet die nötige Unterstützung, um sicherzustellen, dass Daten sowohl valide als auch zuverlässig sind, was letztlich auch das Vertrauen in Analysen und Maschinenlernmodelle stärkt. Zusammenfassend lässt sich sagen, dass die ISO/IEC 5259-3:2024 ein unverzichtbares Dokument ist, das eine umfassende Basis für das Datenqualitätsmanagement in der Analytik und im maschinellen Lernen schafft. Die Klarheit in den Anforderungen, paired with its applicability across diverse organizational contexts, positions it als ein essentielles Werkzeug für alle, die die Datenqualität in ihren Prozessen verbessern möchten.

ISO/IEC 5259-3:2024 문서는 데이터 품질 관리의 요구사항과 지침을 포괄적으로 다루고 있습니다. 이 표준은 데이터 분석 및 머신러닝(ML)에서 사용되는 데이터의 품질을 수립하고, 구현하며, 유지하고, 지속적으로 개선하기 위한 필수 요구사항을 명확히 제공합니다. 이 표준의 주요 강점은 데이터 품질 관리 프로세스를 정의할 뿐만 아니라, 이를 효과적으로 적용할 수 있는 참조 프로세스와 방법론을 제시한다는 점입니다. 구체적인 프로세스나 메트릭을 정의하지 않고, 조직이 필요에 따라 맞춤화할 수 있는 유연성을 제공하여 모든 유형, 규모 및 성격의 조직이 활용할 수 있도록 설계되었습니다. 이러한 접근은 다양한 산업과 환경에 적합하며, 조직의 필요에 따라 변경 가능하여 데이터 품질 관리의 적용성을 확대합니다. 또한, 이 문서에서 제공하는 지침은 데이터 품질 향상을 위한 시스템적이고 구조화된 방법론을 수립하는 데 기여할 수 있습니다. 이는 머신러닝 및 데이터 분석의 발전을 지원하는 핵심 요소로서, 데이터의 신뢰성과 유용성을 높이는 데 중요한 역할을 합니다. ISO/IEC 5259-3:2024는 데이터 품질의 중요성을 인식하고 이를 체계적으로 관리하려는 모든 조직에 필수적인 자료로, 데이터 분석 및 머신러닝의 효과를 극대화하는 데 중추적인 역할을 할 것으로 기대됩니다.

ISO/IEC 5259-3:2024は、人工知能に関連するデータの品質に関する重要な標準であり、特に分析および機械学習(ML)におけるデータ品質管理の要件とガイドラインを提供します。この文書は、データ品質の確立、実施、維持、そして継続的改善に関する要求事項を明確に示しており、組織がデータ品質を向上させるための効果的なフレームワークを提供しています。 この標準の強みは、具体的なプロセスや手法、メトリクスを定義するのではなく、汎用的な要件とガイダンスを提供している点にあります。このアプローチにより、各組織は自社のニーズや環境に応じて、質の管理プロセスを柔軟にカスタマイズできるため、多様な業種や規模の組織が活用できる魅力的なものとなっています。また、文書に記載されている要件と推奨事項は、あらゆる組織形態に適用可能であり、データ品質の向上が全ての組織にとっての共通の課題であることを認識しています。 ISO/IEC 5259-3:2024は、分析や機械学習におけるデータの品質を確保するための基盤を築くものであり、効果的なデータ品質管理に必要なフレームワークを提供しています。これは、企業がデータ駆動型の意思決定を行う際、信頼性の高いデータを基にすることを可能にし、結果として競争力を高めることに寄与するため、非常に重要な標準と言えるでしょう。この文書を活用することで、各組織はデータの信頼性を向上させ、より戦略的なデータ活用を実現できるでしょう。

Die ISO/IEC 5259-3:2024 beschäftigt sich mit einem zunehmend wichtigen Thema in der heutigen Datenlandschaft: der Datenqualität für Analytik und maschinelles Lernen. Der Standard legt Anforderungen und Richtlinien fest, die für die Etablierung, Umsetzung, Aufrechterhaltung und kontinuierliche Verbesserung der Qualität von Daten in diesen Bereichen erforderlich sind. Besonders hervorzuheben ist, dass das Dokument keinen detaillierten Prozess oder spezifische Methoden definiert. Stattdessen bietet es einen flexiblen Rahmen, der auf die spezifischen Bedürfnisse von Organisationen zugeschnitten werden kann. Ein starkes Merkmal des Standards ist seine allgemeine Anwendbarkeit. Die Anforderungen und Empfehlungen sind so formuliert, dass sie von allen Organisationen, unabhängig von ihrer Art, Größe oder Branche, implementiert werden können. Dies ermöglicht es, die im Standard definierten Prinzipien zur Datenqualitätsmanagement in unterschiedlichsten Kontexten zu integrieren, wodurch die Relevanz und die Bedeutung der ISO/IEC 5259-3:2024 noch weiter gesteigert werden. Ein weiterer positiver Aspekt ist der Fokus auf die kontinuierliche Verbesserung der Datenqualität. Der Standard ermutigt Organisationen, einen dynamischen Ansatz zu verfolgen, der regelmäßige Überprüfungen und Anpassungen ihrer Datenmanagementprozesse umfasst. Diese proaktive Haltung unterstützt die langfristige Datenintegrität und ist von entscheidender Bedeutung, um den Anforderungen an Analytik und maschinelles Lernen gerecht zu werden. Insgesamt bietet die ISO/IEC 5259-3:2024 eine wertvolle Grundlage für Organisationen, die qualitative Daten als Schlüsselressource für ihre Analysen und maschinelles Lernen betrachten. Mit seinen klaren Anforderungen und Richtlinien stellt er sicher, dass die Datenqualität nicht nur ein einmaliges Ziel, sondern ein fortwährender Prozess der Verbesserung und Anpassung ist.

ISO/IEC 5259-3:2024 provides a comprehensive framework for organizations seeking to improve their data quality in the realms of analytics and machine learning (ML). The standard specifies a set of requirements and guidance that are crucial for establishing, implementing, maintaining, and continually improving the quality of data utilized in these fields. Its broad applicability across various organizations-regardless of their type, size, or nature-ensures that it meets a wide spectrum of needs in the rapidly evolving landscape of artificial intelligence. One of the strengths of this standard is its emphasis on a quality management process without dictating a rigid framework. It facilitates flexibility by offering guidance that can be tailored to specific organizational contexts. This adaptability is particularly relevant for businesses that may have unique operational processes or varying levels of maturity in their data management practices. By not defining strict processes, methods, or metrics, ISO/IEC 5259-3:2024 allows organizations to innovate and implement solutions that are best suited to their individual requirements and goals. Additionally, the document addresses the growing importance of data quality management in analytics and ML, which are increasingly becoming central to data-driven decision-making. The detailed approach to quality management outlined in the standard, including the reference processes and methods, helps ensure that data governance frameworks are effectively integrated into an organization's overall strategy. This is vital for businesses looking to harness data insights while maintaining trustworthiness and reliability. Overall, the relevance of ISO/IEC 5259-3:2024 in today’s data-centric environment cannot be overstated. It provides essential guidelines that foster a culture of quality and continuous improvement in data practices, paving the way for enhanced outcomes in analytics and machine learning endeavors. By following the recommendations of this standard, organizations can set a solid foundation for their data quality management initiatives, ultimately leading to better analytics and more effective machine learning applications.