Sensory analysis — Methodology — Duo-trio test

ISO 10399 specifies a procedure for determining whether a perceptible sensory difference or similarity exists between samples of two products. The method is a forced-choice procedure. The method is applicable whether a difference exists in a single sensory attribute or in several attributes. The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform by the assessors. The method is applicable even when the nature of the difference is unknown (i.e. it determines neither the size nor the direction of difference between samples, nor is there any indication of the attribute(s) responsible for the difference). The method is applicable only if the products are fairly homogeneous. The method is effective for a) determining that either a perceptible difference results (duo-trio testing for difference), or a perceptible difference does not result (duo-trio testing for similarity) when, for example, a change is made in ingredients, processing, packaging, handling or storage, and b) for selecting, training and monitoring assessors. Two forms of the method are described: - the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from regular production); - the balanced-reference technique, used when one product is not more familiar than the other.

Analyse sensorielle — Méthodologie — Essai duo-trio

ISO 10399 spécifie un mode opératoire permettant de déterminer s'il existe une différence sensorielle perceptible ou une similitude entre les échantillons de deux produits. La méthode est une procédure à choix forcé. Elle s'applique s'il existe une différence pour une seule propriété sensorielle ou pour plusieurs. La méthode est statistiquement moins efficace que l'essai triangulaire (décrit dans l'ISO 4120), mais elle est plus facile à réaliser par les sujets. La méthode est applicable même lorsque la nature de la différence est inconnue (ce qui signifie qu'elle ne détermine ni la taille ni le sens de la différence entre des échantillons et qu'elle ne donne pas non plus d'indications sur l'attribut/les attributs à l'origine de cette différence). La présente méthode n'est applicable que si les produits sont relativement homogènes. La méthode est efficace dans les cas suivants: a) déterminer qu'il existe une différence perceptible (essai duo-trio de différence), ou qu'il n'existe pas de différence perceptible (essai duo-trio de similitude), quand, par exemple, des modifications sont apportées aux ingrédients, à la transformation, à l'emballage, aux opérations de manutention ou de stockage, et b) pour sélectionner, entraîner et contrôler les sujets. Deux formes de cette méthode sont décrites: - la technique de la référence constante, utilisée lorsque les sujets connaissent bien un produit (un échantillon de fabrication courante par exemple), et - la technique de la référence équilibrée, utilisée quand aucun des produits n'est plus connu que l'autre.

General Information

Status
Not Published
Current Stage
5020 - FDIS ballot initiated: 2 months. Proof sent to secretariat
Start Date
26-Feb-2026
Completion Date
26-Feb-2026

Relations

Effective Date
12-Feb-2026
Effective Date
25-Nov-2023
Effective Date
11-Nov-2023

Overview

ISO/FDIS 10399:2026 – Sensory analysis - Methodology - Duo-trio test, published by ISO, provides a standardized procedure for assessing sensory differences or similarities between two product samples using the duo-trio test method. The duo-trio test is a forced-choice discrimination method designed to determine whether a perceptible sensory difference exists or whether two products can be considered similar, particularly after changes in ingredients, processing, packaging, handling, or storage. This method is recognized for its ease of use among assessors, even though it is statistically less efficient than the triangle test. ISO 10399 is applicable to both single and multiple sensory attributes and is suitable for use when the nature or direction of differences is unknown.

Key Topics

  • Duo-trio test methodology: Outlines two primary forms:
    • Constant-reference technique: Used when one product is familiar to assessors (usually a control or regular production sample).
    • Balanced-reference technique: Suitable when neither sample is more familiar than the other.
  • Test prerequisites:
    • Applicable to fairly homogeneous products.
    • Ensures all sample handling, preparation, and presentation minimize any unintentional differences.
  • Assessors:
    • Qualifications and training tailored to the test objective.
    • The number of assessors determined by the desired test sensitivity and statistical requirements.
  • Procedure:
    • Presentation of three samples (a reference and two coded samples-one matching the reference and one differing).
    • The order of coded samples is randomized and balanced within groups.
    • Assessors identify which coded sample matches (or does not match) the reference in terms of sensory attributes.
    • No option for reporting "no difference"-uncertain responses are treated as guesses.
  • Analysis:
    • Statistical tables and calculations for determining significant differences or establishing similarity.
    • Guidance on reporting results, including test objectives, sampling details, number and performance of assessors, and analytical approach.

Applications

The duo-trio test according to ISO 10399 is widely used in quality control, research, and product development to:

  • Assess product reformulation: Detect whether changes in ingredients, processing, or packaging alter sensory perception.
  • Verify consistency: Ensure products remain perceptibly consistent across batches or after modifications.
  • Evaluate shelf-life and storage effects: Monitor whether handling or aging impacts sensory properties.
  • Support sensory panel operations: Aid in the selection, training, and monitoring of assessors for sensory testing.
  • Test for difference or similarity: Suitable for confirming the presence of a difference (when testing a prototype against a control) or demonstrating similarity (such as when validating a lower-cost formulation).

Industries benefiting from this standard include food and beverage, personal care, household goods, and any sector where sensory attributes are critical to product quality and consumer acceptance.

Related Standards

Organizations using ISO 10399 may also refer to these complementary standards:

  • ISO 5492: Sensory analysis - Vocabulary
  • ISO 8589: Sensory analysis - General guidance for the design of test rooms
  • ISO 4120: Sensory analysis - Methodology - Triangle test (a more statistically efficient alternative for some applications)
  • ISO 8586: Sensory analysis - General guidance for the selection, training, and monitoring of assessors
  • ISO 6658: Sensory analysis - Methodology - General guidance

These standards, when used collectively, strengthen sensory testing protocols, ensure standardized assessor environments and training, and support accurate and reliable sensory analysis in quality assurance and product development.

Adopting ISO 10399 enables organizations to conduct robust duo-trio sensory tests, helping to safeguard product quality and support evidence-based decisions in product development and quality control.

Buy Documents

Draft

ISO/FDIS 10399 - Sensory analysis — Methodology — Duo-trio test/6/2025

Release Date:06-May-2025
English language (22 pages)
sale 15% off
sale 15% off
Draft

ISO/FDIS 10399 - Sensory analysis — Methodology — Duo-trio test/12/2026

Release Date:12-Feb-2026
English language (22 pages)
sale 15% off
sale 15% off
Draft

REDLINE ISO/FDIS 10399 - Sensory analysis — Methodology — Duo-trio test/12/2026

Release Date:12-Feb-2026
English language (22 pages)
sale 15% off
sale 15% off
Draft

ISO/FDIS 10399 - Analyse sensorielle — Méthodologie — Essai duo-trio/25/2025

Release Date:25-Jun-2025
French language (22 pages)
sale 15% off
sale 15% off
Draft

ISO/FDIS 10399 - Analyse sensorielle — Méthodologie — Essai duo-trio

Release Date:13-Mar-2026
French language (22 pages)
sale 15% off
sale 15% off

Get Certified

Connect with accredited certification bodies for this standard

BSI Group

BSI (British Standards Institution) is the business standards company that helps organizations make excellence a habit.

UKAS United Kingdom Verified

Bureau Veritas

Bureau Veritas is a world leader in laboratory testing, inspection and certification services.

COFRAC France Verified

DNV

DNV is an independent assurance and risk management provider.

NA Norway Verified

Sponsored listings

Frequently Asked Questions

ISO/FDIS 10399 is a draft published by the International Organization for Standardization (ISO). Its full title is "Sensory analysis — Methodology — Duo-trio test". This standard covers: ISO 10399 specifies a procedure for determining whether a perceptible sensory difference or similarity exists between samples of two products. The method is a forced-choice procedure. The method is applicable whether a difference exists in a single sensory attribute or in several attributes. The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform by the assessors. The method is applicable even when the nature of the difference is unknown (i.e. it determines neither the size nor the direction of difference between samples, nor is there any indication of the attribute(s) responsible for the difference). The method is applicable only if the products are fairly homogeneous. The method is effective for a) determining that either a perceptible difference results (duo-trio testing for difference), or a perceptible difference does not result (duo-trio testing for similarity) when, for example, a change is made in ingredients, processing, packaging, handling or storage, and b) for selecting, training and monitoring assessors. Two forms of the method are described: - the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from regular production); - the balanced-reference technique, used when one product is not more familiar than the other.

ISO 10399 specifies a procedure for determining whether a perceptible sensory difference or similarity exists between samples of two products. The method is a forced-choice procedure. The method is applicable whether a difference exists in a single sensory attribute or in several attributes. The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform by the assessors. The method is applicable even when the nature of the difference is unknown (i.e. it determines neither the size nor the direction of difference between samples, nor is there any indication of the attribute(s) responsible for the difference). The method is applicable only if the products are fairly homogeneous. The method is effective for a) determining that either a perceptible difference results (duo-trio testing for difference), or a perceptible difference does not result (duo-trio testing for similarity) when, for example, a change is made in ingredients, processing, packaging, handling or storage, and b) for selecting, training and monitoring assessors. Two forms of the method are described: - the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from regular production); - the balanced-reference technique, used when one product is not more familiar than the other.

ISO/FDIS 10399 is classified under the following ICS (International Classification for Standards) categories: 67.240 - Sensory analysis. The ICS classification helps identify the subject area and facilitates finding related standards.

ISO/FDIS 10399 has the following relationships with other standards: It is inter standard links to FprEN ISO 10399, ISO/TS 15926-11:2023, ISO 10399:2017. Understanding these relationships helps ensure you are using the most current and applicable version of the standard.

ISO/FDIS 10399 is available in PDF format for immediate download after purchase. The document can be added to your cart and obtained through the secure checkout process. Digital delivery ensures instant access to the complete standard document.

Standards Content (Sample)


DRAFT
International
Standard
ISO/DIS 10399
ISO/TC 34/SC 12
Sensory analysis — Methodology —
Secretariat: AFNOR
Duo-trio test
Voting begins on:
Analyse sensorielle — Méthodologie — Essai duo-trio
2025-07-01
Voting terminates on:
ICS: 67.240
2025-09-23
THIS DOCUMENT IS A DRAFT CIRCULATED
FOR COMMENTS AND APPROVAL. IT
IS THEREFORE SUBJECT TO CHANGE
AND MAY NOT BE REFERRED TO AS AN
INTERNATIONAL STANDARD UNTIL
PUBLISHED AS SUCH.
This document is circulated as received from the committee secretariat.
IN ADDITION TO THEIR EVALUATION AS
BEING ACCEPTABLE FOR INDUSTRIAL,
TECHNOLOGICAL, COMMERCIAL AND
USER PURPOSES, DRAFT INTERNATIONAL
STANDARDS MAY ON OCCASION HAVE TO
ISO/CEN PARALLEL PROCESSING
BE CONSIDERED IN THE LIGHT OF THEIR
POTENTIAL TO BECOME STANDARDS TO
WHICH REFERENCE MAY BE MADE IN
NATIONAL REGULATIONS.
RECIPIENTS OF THIS DRAFT ARE INVITED
TO SUBMIT, WITH THEIR COMMENTS,
NOTIFICATION OF ANY RELEVANT PATENT
RIGHTS OF WHICH THEY ARE AWARE AND TO
PROVIDE SUPPORTING DOCUMENTATION.
Reference number
ISO/DIS 10399:2025(en)
DRAFT
ISO/DIS 10399:2025(en)
International
Standard
ISO/DIS 10399
ISO/TC 34/SC 12
Sensory analysis — Methodology —
Secretariat: AFNOR
Duo-trio test
Voting begins on:
Analyse sensorielle — Méthodologie — Essai duo-trio
ICS: 67.240 Voting terminates on:
THIS DOCUMENT IS A DRAFT CIRCULATED
FOR COMMENTS AND APPROVAL. IT
IS THEREFORE SUBJECT TO CHANGE
AND MAY NOT BE REFERRED TO AS AN
INTERNATIONAL STANDARD UNTIL
PUBLISHED AS SUCH.
This document is circulated as received from the committee secretariat.
IN ADDITION TO THEIR EVALUATION AS
BEING ACCEPTABLE FOR INDUSTRIAL,
© ISO 2025
TECHNOLOGICAL, COMMERCIAL AND
USER PURPOSES, DRAFT INTERNATIONAL
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
STANDARDS MAY ON OCCASION HAVE TO
ISO/CEN PARALLEL PROCESSING
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
BE CONSIDERED IN THE LIGHT OF THEIR
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
POTENTIAL TO BECOME STANDARDS TO
WHICH REFERENCE MAY BE MADE IN
or ISO’s member body in the country of the requester.
NATIONAL REGULATIONS.
ISO copyright office
RECIPIENTS OF THIS DRAFT ARE INVITED
CP 401 • Ch. de Blandonnet 8
TO SUBMIT, WITH THEIR COMMENTS,
CH-1214 Vernier, Geneva
NOTIFICATION OF ANY RELEVANT PATENT
Phone: +41 22 749 01 11
RIGHTS OF WHICH THEY ARE AWARE AND TO
PROVIDE SUPPORTING DOCUMENTATION.
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland Reference number
ISO/DIS 10399:2025(en)
ii
ISO/DIS 10399:2025(en)
Contents Page
Foreword .iv
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Principle . 3
5 General test conditions and requirements . 3
6 Assessors . 4
6.1 Qualification .4
6.2 Number of assessors . .4
7 Procedure . 4
8 Analysis and interpretation of results . 6
8.1 When testing for a difference .6
8.2 When testing for similarity .6
9 Test report . 6
10 Precision and bias . 6
Annex A (normative) Tables . 8
Annex B (informative) Examples .15
Bibliography .22

iii
ISO/DIS 10399:2025(en)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out through
ISO technical committees. Each member body interested in a subject for which a technical committee
has been established has the right to be represented on that committee. International organizations,
governmental and non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely
with the International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular the different approval criteria needed for the different types
of ISO documents should be noted. This document was drafted in accordance with the editorial rules of the
ISO/IEC Directives, Part 2 (see www.iso.org/directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of any patent
rights identified during the development of the document will be in the Introduction and/or on the ISO list of
patent declarations received (see www.iso.org/patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation on the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to the World
Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT) see the following URL:
www.iso.org/iso/foreword.html.
This document was prepared by Technical Committee ISO/TC 34, Food products, Subcommittee SC 12,
Sensory analysis.
This fourth edition cancels and replaces the third edition (ISO 10399:2011), of which it constitutes a minor
revision. The document has been generalized beyond food and beverage applications. The description of
how to test for similarity were updated to best practices and some definitions and descriptions amended
to also encompass this scenario. Basic information on how to use the Thurstonian model in addition to the
previously emphasized guessing model has been added. The principle has been expanded slightly to enhance
clarity. Furthermore, R code is provided in the tables of Annex A as one alternative option to derive exact
results, which is exemplified in the examples in Annex B. Example B.2 has been modified to reflect state-of-
the-art testing for similarity, whereas example B.3 has been dropped as the confidence interval approach is
now embedded into the earlier examples. The references have been updated.

iv
DRAFT International Standard ISO/DIS 10399:2025(en)
Sensory analysis — Methodology — Duo-trio test
1 Scope
This document specifies a procedure for determining whether a perceptible sensory difference or similarity
exists between samples of two products. The method is a forced-choice procedure. The method is applicable
whether a difference exists in a single sensory attribute or in several attributes.
The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform
by the assessors.
The method is applicable even when the nature of the difference is unknown (i.e. it determines neither
the size nor the direction of difference between samples, nor is there any indication of the attribute(s)
responsible for the difference). The method is applicable only if the products are fairly homogeneous.
The method is effective for
a) determining that
1) either a perceptible difference results (duo-trio testing for difference), or
2) a meaningful perceptible difference does not result (duo-trio testing for similarity) when, for
example, a change is made in ingredients, processing, packaging, handling or storage, and
b) for selecting, training and monitoring assessors.
Two forms of the method are described:
— the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from
regular production);
— the balanced-reference technique, used when one product is not more familiar than the other.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes
requirements of this document. For dated references, only the edition cited applies. For undated references,
the latest edition of the referenced document (including any amendments) applies.
ISO 5492, Sensory analysis — Vocabulary
ISO 8589, Sensory analysis — General guidance for the design of test rooms
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 5492 and the following apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— IEC Electropedia: available at https:// www .electropedia .org/
— ISO Online browsing platform: available at https:// www .iso .org/ obp

ISO/DIS 10399:2025(en)
3.1
alpha-risk
α-risk
probability of rejecting the null hypothesis by a statistical test when, in fact, the null hypothesis is true
Note 1 to entry: This is also known as Type I error rate, significance level or false positive rate.
Note 2 to entry: When testing for product differences, the alpha risk is the probability of erroneously concluding that
a perceptible difference exists when, in fact, it does not. When testing for similarity, the alpha risk is the probability of
erroneously concluding that the products are perceptibly similar when, in fact, they are not.
3.2
beta-risk
β-risk
probability of failing to reject the null hypothesis by a statistical test when, in fact, the null hypothesis is not true
Note 1 to entry: This is also known as Type II error rate or false negative rate. Furthermore, 1 – β is also known as the
power of the test.
Note 2 to entry: When testing for product differences, the beta risk is the probability of failing to conclude that a
perceptible difference exists when, in fact, the products are perceptually different. When testing for similarity, the
beta risk is the probability of failing to conclude that the products are perceptibly similar when, in fact, they are.
3.3
difference
situation in which samples (3.5) can be distinguished based on their sensory properties
3.4
p
d
The proportion of assessments in which a perceptible difference is detected between the two products is
given the symbol p
d
3.5
product
material to be evaluated
3.6
sample
unit of product (3.4) prepared, presented and evaluated in the test
3.7
sensitivity
< statistic> statistical parameters that measure the performance characteristics of the test
Note 1 to entry: In statistical terms, the sensitivity of the test is defined by the values of α, β and p (or δ).
d
3.8
similarity
situation in which any perceptible differences (3.3) between the samples (3.5) are so small that the products
(3.4) can be used interchangeably
3.9
Thurstonian δ
measure of the magnitude of the sensory difference between two products
Note 1 to entry: The true perceptual difference between two products is denoted δ. The estimate of δ from the data is
denoted d’ (“d-prime”).
Note 2 to entry: For a given protocol, any value of δ is equivalent to a value p so they can be used interchangeably, but
d
[5],[7]
the relationship changes with the test protocol.

ISO/DIS 10399:2025(en)
3.10
triad
three samples (3.5) given to an assessor in the duo-trio test
Note 1 to entry: In the duo-trio test, one sample is labelled as the reference, the other two are marked with different
codes. One of the coded samples is the same product as the reference; the other coded sample is the other product in
the test.
4 Principle
The number of assessors is chosen based on the sensitivity desired for the test (see 6.2 and the discussion in A.3).
Assessors receive a set of three samples (i.e. a triad), one sample of which is labelled as a reference and the
other two samples have different codes. The two coded samples are comprised of one sample that is the
same product as the labelled reference sample (i.e., the hidden reference) and one sample that is a different
product than the labelled reference sample (i.e., the test sample). The presentation order of the coded
samples is assigned to assessors based on balanced random schemes (see 7.1). The assessors are informed
that one of the coded samples is the same as the reference and that one is different. Based on their training
and the instructions given prior to the test, the assessors report either which of the coded samples they
believe to be same as the reference, or which of the coded samples they believe to be different from the
reference.
The number of correct responses is counted, and the significance is determined by reference to a statistical
table or an applicable computer program or app.
5 General test conditions and requirements
5.1 Clearly define the test objective in writing.
5.2 Carry out the test under conditions that prevent communication among assessors until all the
evaluations have been completed using facilities and booths that conform with ISO 8589.
5.3 Prepare the samples out of sight of the assessors and in an identical manner (i.e. same apparatus, same
vessels, same quantity of product).
5.4 Assessors shall not be able to identify the samples from the way in which they are presented. For
example, in a taste test, avoid any differences in appearance. Mask any irrelevant colour differences using
light filters and/or subdued illumination.
5.5 Code the test samples in a uniform manner, preferably using three-digit numbers, chosen at random
for each test. Each triad is composed of three samples, one labelled as the reference and two labelled with
different codes. Preferably, different codes should be used for each assessor during a session. However,
the same two codes may be used for all assessors within a test, provided that each code is used only once
per assessor during a test session (e.g. if several duo-trio tests on the same or different products are being
conducted in the same session).
5.6 It is preferable to present the samples under the conditions at which the product is generally used
(e.g., when tasting, present the samples at the temperature at which the product is generally consumed). The
serving conditions of the three samples in each triad shall be identical, just as that of all the other samples in
a series of tests on a given type of product.
5.7 The size, quantity or volume presented shall be identical for the three samples in each triad, just as
that of all the other samples in a series of tests on a given type of product. The size, quantity or volume to be
evaluated may be imposed. If it is not, the assessors should be told to take sizes, quantities or volumes that
are always similar whatever the sample.

ISO/DIS 10399:2025(en)
5.8 Depending on the products and test objectives, re-tasting (of the reference or all samples) may be
accepted. The assessors shall be instructed accordingly.
5.9 When tasting, the assessors shall be told whether or not they are to swallow the samples or whether
they are free to do as they please. In this latter case, they shall be requested to proceed in the same manner
for all samples. Depending on project objectives and test products, suitable neutralizing agents may be used
between or even within individual trials. Assessors shall be instructed accordingly.
5.10 During the test sessions, avoid giving information about product identity, expected treatment effects,
or individual performance until all testing is completed.
6 Assessors
6.1 Qualification
All assessors should possess the same level of qualification and training, this level being chosen on the basis
of the test objective (see ISO 8586 for guidance). Experience and familiarity with the product may improve
the performance of an assessor and, therefore, may increase the likelihood of a correct result, which will
then increase the probability of finding a significant difference but would decrease the likelihood to find
significant similarity. Monitoring the performance of assessors over time may be useful for increased
sensitivity.
All assessors shall be familiar with the mechanics of the duo-trio test (i.e. the format, task and evaluation
procedure).
6.2 Number of assessors
Choose the number of assessors so as to obtain the sensitivity required for the test (see discussion in
A.3). Using large numbers of assessors increases the likelihood of detecting small differences between
the products. However, in practice, the number of assessors often is determined by material conditions
(e.g. duration of the experiment, number of available assessors, quantity of product). When testing for a
difference, the typical number of assessors is between 32 and 36. When testing for no meaningful difference
(i.e. similarity), twice as many assessors (i.e. approximately 72) are typically needed for equivalent
sensitivity.
Avoid replicate evaluations by the same assessor whenever possible. However, if replicate evaluations
are needed to produce a sufficient number of total evaluations, every effort should be made to have each
assessor perform the same number of replicate evaluations. For example, if only 12 assessors are available,
have each assessor evaluate 3 triads to obtain a total of 36 evaluations.
NOTE Treating 3 evaluations performed by 12 assessors as 36 independent evaluations is not valid when testing
for similarity using Table A.2. However, the test for difference using Table A.1 is valid even when replicate evaluations
[8],[9]
are performed . Recent publications on replicated discrimination tests suggest alternative, model-based
[6]
approaches for analysing replicated evaluations in discrimination tests , or for analysing replicated evaluations in
[11]
discrimination tests with the purpose of showing similarity .
7 Procedure
7.1 If the product is familiar to the assessors (e.g. a control sample from the production line), use the
constant reference technique. If neither product is more familiar than the other, use the balanced-reference
technique:
a) Constant-reference technique: Prepare worksheets and scoresheets (see B.2) in advance of the test
so as to utilize an equal number of the two possible sequences of two products, A and B:
A-REF     A     B A-REF     B     A

ISO/DIS 10399:2025(en)
Distribute these at random in groups of two among the assessors (i.e. use each sequence once among the
first two assessors; use each sequence once again among the next two assessors, etc.) This will minimize
the imbalance that results if the total number of assessors is not an even number.
b) Balanced-reference technique: Prepare worksheets and scoresheets (see B.1) in advance of the test
so as to utilize an equal number of the four possible sequences of two products, A and B:
A-REF    A     B A-REF     B     A
B-REF    A     B B-REF     B     A
where the first two triads contain product A as the reference (i.e. A-REF) and the last two triads contain
product B as the reference (i.e. B-REF). Distribute these at random in groups of four among the assessors
(i.e. use each sequence once among the first group of four assessors; use each sequence once again among
the next group of four assessors, etc.). This will minimize the imbalance that results if the total number of
assessors is not a multiple of four.
7.2 Present the three samples of each triad simultaneously if possible, following the same spatial
arrangement for each assessor (e.g. on a line to be sampled always from left to right, in a triangular array).
Within the triad, assessors are generally allowed to make repeated evaluations of each sample as desired (if,
of course, the nature of the product allows for repeated evaluations).
7.3 Instruct the assessors to evaluate the reference sample first, then evaluate the two coded samples in
the order in which they were presented. Inform the assessors that one of the coded samples is the same as
the reference and that one is different from the reference. Instruct the assessors to indicate either which of
the two coded samples is the same as the reference, or which of the two coded samples is different from the
reference.
NOTE When deciding whether to instruct the assessors to select the sample that is the same as the reference or
to select the sample that is different from the reference, consideration is given to whether or not the panel routinely
uses other discrimination test methods. Many discrimination test methods like the triangle test, for example, focus
on identifying the “odd” or “different” sample in the test. Instructing the assessors to identify the “different” sample
in one method and to identify the “same” sample in another method can cause confusion and lead to higher levels of
incorrect responses.
7.4 Each scoresheet should provide for a single triad of samples. If an assessor is to carry out more than
one test in a session, collect the completed scoresheet and unused samples prior to serving the subsequent
triad. The assessor shall not go back to any samples from previous triads or change the verdict on any
previous test.
7.5 Do not ask questions about preference, acceptance or degree of difference after the assessor has
made a selection. The selection the assessor has just made may bias the reply to any additional questions.
Responses to such questions may be obtained through separate tests for preference, acceptance, degree of
difference, etc., see ISO 6658. A comment section asking why the choice was made may be included for the
assessor’s remarks.
7.6 The duo-trio test is a forced-choice procedure; assessors are not allowed the option of reporting “no
difference”. An assessor who detects no difference between the samples should be instructed to randomly
select one of the samples and to indicate that the selection was only a guess in the comments section of the
scoresheet.
ISO/DIS 10399:2025(en)
8 Analysis and interpretation of results
8.1 When testing for a difference
Use Table A.1 to analyse the data obtained from a duo-trio test. If the number of correct responses is greater
than or equal to the number given in Table A.1 (corresponding to the number of assessors and the α-risk
level chosen for the test), conclude that a perceptible difference exists between the samples (see B.1).
If desired, calculate a confidence interval on the proportion of the population that can distinguish the
samples. The method is described in B.1.5.
8.2 When testing for similarity
NOTE In this document, “similar” does not mean “identical”. Rather, “similar” means that the two products are
sufficiently alike to be used interchangeably. It is not possible to prove that two products are identical. However, it
can be demonstrated that any difference that does exist between two products is so small as to have no practical
significance. The maximum difference that is still considered as small enough (e.g., not deemed consumer-meaningful
by the project team) is indicated by p or δ.
d
Use Table A.2 to analyse the data obtained from a duo-trio test. If the number of correct responses is less
than or equal to the number given in Table A.2 (corresponding to the number of assessors, the α-risk level
and the value of p or δ chosen for the test), conclude that no meaningful difference (i.e. no difference of
d
more than p or δ) exists between the samples (see B.2). If results will be compared from one test to another,
d
then the same value of p or δ should be chosen for all tests.
d
If desired, calculate a confidence interval on the proportion of the population that can distinguish the
samples. The method is described in B.2.5.
9 Test report
Report the test objective, the results and the conclusions. The following additional information is
recommended:
— the purpose of the test and the nature of the treatment studied;
— full identification of the samples (i.e. origin, method of preparation, quantity, shape, storage prior to
testing, serving size, temperature); sample information should communicate that all storage, handling
and preparation was done in such a way as to yield samples that differ only due to the variable of interest,
if at all;
— the number of assessors, the number of correct responses
...


FINAL DRAFT
International
Standard
ISO/TC 34/SC 12
Sensory analysis — Methodology —
Secretariat: AFNOR
Duo-trio test
Voting begins on:
Analyse sensorielle — Méthodologie — Essai duo-trio 2026-02-26
Voting terminates on:
2026-04-23
RECIPIENTS OF THIS DRAFT ARE INVITED TO SUBMIT,
WITH THEIR COMMENTS, NOTIFICATION OF ANY
RELEVANT PATENT RIGHTS OF WHICH THEY ARE AWARE
AND TO PROVIDE SUPPOR TING DOCUMENTATION.
IN ADDITION TO THEIR EVALUATION AS
BEING ACCEPTABLE FOR INDUSTRIAL, TECHNO­
ISO/CEN PARALLEL PROCESSING LOGICAL, COMMERCIAL AND USER PURPOSES, DRAFT
INTERNATIONAL STANDARDS MAY ON OCCASION HAVE
TO BE CONSIDERED IN THE LIGHT OF THEIR POTENTIAL
TO BECOME STAN DARDS TO WHICH REFERENCE MAY BE
MADE IN NATIONAL REGULATIONS.
Reference number
FINAL DRAFT
International
Standard
ISO/TC 34/SC 12
Sensory analysis — Methodology —
Secretariat: AFNOR
Duo-trio test
Voting begins on:
Analyse sensorielle — Méthodologie — Essai duo-trio
Voting terminates on:
RECIPIENTS OF THIS DRAFT ARE INVITED TO SUBMIT,
WITH THEIR COMMENTS, NOTIFICATION OF ANY
RELEVANT PATENT RIGHTS OF WHICH THEY ARE AWARE
AND TO PROVIDE SUPPOR TING DOCUMENTATION.
© ISO 2026
IN ADDITION TO THEIR EVALUATION AS
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
BEING ACCEPTABLE FOR INDUSTRIAL, TECHNO­
ISO/CEN PARALLEL PROCESSING
LOGICAL, COMMERCIAL AND USER PURPOSES, DRAFT
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
INTERNATIONAL STANDARDS MAY ON OCCASION HAVE
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
TO BE CONSIDERED IN THE LIGHT OF THEIR POTENTIAL
or ISO’s member body in the country of the requester.
TO BECOME STAN DARDS TO WHICH REFERENCE MAY BE
MADE IN NATIONAL REGULATIONS.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland Reference number
ii
Contents Page
Foreword .iv
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Principle . 3
5 General test conditions and requirements . 3
6 Assessors . 4
6.1 Qualification .4
6.2 Number of assessors . .4
7 Procedure . 5
8 Analysis and interpretation of results . 6
8.1 When testing for a difference .6
8.2 When testing for similarity .6
9 Precision and bias . 6
10 Test report . 6
Annex A (normative) Tables . 8
Annex B (informative) Examples . 16
Bibliography .22

iii
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out through
ISO technical committees. Each member body interested in a subject for which a technical committee
has been established has the right to be represented on that committee. International organizations,
governmental and non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely
with the International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types
of ISO document should be noted. This document was drafted in accordance with the editorial rules of the
ISO/IEC Directives, Part 2 (see www.iso.org/directives).
ISO draws attention to the possibility that the implementation of this document may involve the use of (a)
patent(s). ISO takes no position concerning the evidence, validity or applicability of any claimed patent
rights in respect thereof. As of the date of publication of this document, ISO had not received notice of (a)
patent(s) which may be required to implement this document. However, implementers are cautioned that
this may not represent the latest information, which may be obtained from the patent database available at
www.iso.org/patents. ISO shall not be held responsible for identifying any or all such patent rights.
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions
related to conformity assessment, as well as information about ISO’s adherence to the World Trade
Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www.iso.org/iso/foreword.html.
This document was prepared by Technical Committee ISO/TC 34, Food products, Subcommittee SC 12,
Sensory analysis, in collaboration with the European Committee for Standardization (CEN), in accordance
with the Agreement on technical cooperation between ISO and CEN (Vienna Agreement).
This fourth edition cancels and replaces the third edition (ISO 10399:2017), which has been technically
revised.
The main changes are as follows:
— the document has been generalized beyond food and beverage applications;
— the description of how to test for similarity has been updated to best practices and some definitions and
descriptions have been amended to also encompass this scenario;
— basic information on how to use the Thurstonian model in addition to the previously emphasized
guessing model has been added;
— the principle has been expanded slightly to enhance clarity;
— R code has been provided in the tables of Annex A as one alternative option to derive exact results, which
is exemplified in the examples in Annex B;
— the example in Clause B.2 has been modified to reflect state-of-the-art testing for similarity, whereas the
example in Clause B.3 has been dropped as the confidence interval approach is now embedded into the
earlier examples;
— the references have been updated.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www.iso.org/members.html.

iv
FINAL DRAFT International Standard ISO/FDIS 10399:2026(en)
Sensory analysis — Methodology — Duo-trio test
1 Scope
This document specifies a procedure for determining whether a perceptible sensory difference or similarity
exists between samples of two products. The method is a forced-choice procedure. The method is applicable
whether a difference exists in a single sensory attribute or in several attributes.
The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform
by the assessors.
The method is applicable even when the nature of the difference is unknown (i.e. it determines neither
the size nor the direction of difference between samples, nor is there any indication of the attribute(s)
responsible for the difference). The method is applicable only if the products are fairly homogeneous.
The method is effective for:
a) determining that either:
1) a perceptible difference results (duo-trio testing for difference); or
2) a meaningful perceptible difference does not result (duo-trio testing for similarity) when, for
example, a change is made in ingredients, processing, packaging, handling or storage;
b) selecting, training and monitoring assessors.
Two forms of the method are described:
— the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from
regular production);
— the balanced-reference technique, used when one product is not more familiar than the other.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes
requirements of this document. For dated references, only the edition cited applies. For undated references,
the latest edition of the referenced document (including any amendments) applies.
ISO 5492, Sensory analysis — Vocabulary
ISO 8589, Sensory analysis — General guidance for the design of test rooms
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 5492 and the following apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https://www.iso.org/obp
— IEC Electropedia: available at https://www.electropedia.org/

3.1
alpha-risk
α-risk
Type I error rate
significance level
false positive rate
α
probability of rejecting the null hypothesis by a statistical test when, in fact, the null hypothesis is true
Note 1 to entry: When testing for product (3.5)differences (3.3), the α-risk is the probability of erroneously concluding
that a perceptible difference exists when, in fact, it does not. When testing for similarity (3.8), the α-risk is the
probability of erroneously concluding that the products are perceptibly similar when, in fact, they are not.
3.2
beta-risk
β-risk
Type II error rate
false negative rate
β
probability of failing to reject the null hypothesis by a statistical test when, in fact, the null hypothesis is not
true
Note 1 to entry: 1 – β is also known as the power of the test.
Note 2 to entry: When testing for product (3.5)differences (3.3), the β-risk is the probability of failing to conclude that
a perceptible difference exists when, in fact, the products are perceptually different. When testing for similarity (3.8),
the β-risk is the probability of failing to conclude that the products are perceptibly similar when, in fact, they are.
3.3
difference
situation in which samples (3.6) can be distinguished based on their sensory properties
3.4
p
d
proportion of assessments in which a perceptible difference (3.3) is detected between the two products (3.5)
3.5
product
material to be evaluated
3.6
sample
unit of product (3.5) prepared, presented and evaluated in the test
3.7
sensitivity
< statistic> statistical parameters that measure the performance characteristics of the test
Note 1 to entry: In statistical terms, the sensitivity of the test is defined by the values of α, β and p (3.4) (or δ).
d
3.8
similarity
situation in which any perceptible differences (3.3) between the samples (3.6) are so small that the products
(3.5) can be used interchangeably
3.9
Thurstonian δ
δ
measure of the magnitude of the sensory difference (3.3) between two products (3.5)
Note 1 to entry: The true perceptual difference between two products is denoted δ. The estimate of δ from the data is
denoted d′ (“d-prime”).
Note 2 to entry: For a given protocol, any value of δ is equivalent to a value p (3.4) so they can be used interchangeably,
d
[4][6]
but the relationship changes with the test protocol.
3.10
triad
three samples (3.6) given to an assessor in the duo-trio test
Note 1 to entry: In the duo-trio test, one sample is labelled as the reference, the other two are marked with different
codes. One of the coded samples is the same product (3.5) as the reference; the other coded sample is the other product
in the test.
4 Principle
The number of assessors is chosen based on the sensitivity desired for the test (see 6.2 and the discussion in
Clause A.3).
Assessors receive a set of three samples (i.e. a triad), one sample of which is labelled as a reference and
the other two samples have different codes. The two coded samples comprise one sample that is the same
product as the labelled reference sample (i.e. the hidden reference) and one sample that is a different product
than the labelled reference sample (i.e. the test sample). The presentation order of the coded samples is
assigned to assessors based on balanced random schemes (see 7.1). The assessors are informed that one
of the coded samples is the same as the reference and that one is different. Based on their training and the
instructions given prior to the test, the assessors report either which of the coded samples they believe to be
same as the reference, or which of the coded samples they believe to be different from the reference.
The number of correct responses is counted, and the significance is determined by reference to a statistical
table or an applicable computer program or app.
5 General test conditions and requirements
5.1 Clearly state the test objective in writing.
5.2 Carry out the test under conditions that prevent communication among assessors until all the
evaluations have been completed using facilities and booths that conform with ISO 8589.
5.3 Prepare the samples out of sight of the assessors and in an identical manner (i.e. same apparatus, same
vessels, same quantity of product).
5.4 Assessors shall not be able to identify the samples from the way in which they are presented. For
example, in a taste test, avoid any differences in appearance. Mask any irrelevant colour differences using
light filters and/or subdued illumination.
5.5 Code the test samples in a uniform manner, preferably using three-digit numbers, chosen at random
for each test. Each triad is composed of three samples, one labelled as the reference and two labelled with
different codes. Preferably, different codes should be used for each assessor during a session. However,
the same two codes may be used for all assessors within a test, provided that each code is used only once
per assessor during a test session (e.g. if several duo-trio tests on the same or different products are being
conducted in the same session).
5.6 The samples should be presented under the conditions at which the product is generally used (e.g.
when tasting, present the samples at the temperature at which the product is generally consumed). The
serving conditions of the three samples in each triad shall be identical, just as that of all the other samples in
a series of tests on a given type of product.
5.7 The size, quantity or volume presented shall be identical for the three samples in each triad, just as
that of all the other samples in a series of tests on a given type of product. The size, quantity or volume to be

evaluated may be imposed. If it is not, the assessors should be told to take sizes, quantities or volumes that
are always similar whatever the sample.
5.8 Depending on the products and test objectives, re-tasting (of the reference or all samples) may be
accepted. The assessors shall be instructed accordingly.
5.9 When tasting, the assessors shall be told whether or not they are to swallow the samples or whether
they are free to do as they please. In this latter case, they shall be requested to proceed in the same manner
for all samples. Depending on project objectives and test products, suitable neutralizing agents may be used
between or even within individual trials. Assessors shall be instructed accordingly.
5.10 During the test sessions, avoid giving information about product identity, expected treatment effects,
or individual performance until all testing is completed.
6 Assessors
6.1 Qualification
All assessors should possess the same level of qualification and training; this level should be chosen based
on the test objective (see ISO 8586 for guidance). Experience and familiarity with the product can improve
the performance of an assessor and, therefore, can increase the likelihood of a correct result, which will
then increase the probability of finding a significant difference but would decrease the likelihood to find
significant similarity. Monitoring the performance of assessors over time may be useful for increased
sensitivity.
All assessors shall be familiar with the mechanics of the duo-trio test (i.e. the format, task and evaluation
procedure).
6.2 Number of assessors
Choose the number of assessors so as to obtain the sensitivity required for the test (see the discussion
in Clause A.3). Using large numbers of assessors increases the probability of detecting small differences
between the products. However, in practice, the number of assessors often is determined by material
conditions (e.g. duration of the experiment, number of available assessors, quantity of product).
As examples, first consider testing for product differences, in which the null hypothesis assumes p = 0 %
d
and the desired power is 80 %. If the alternative hypothesis assumes the true p = 30 %, then a test at the
d
10 %-significance level requires 53 assessors. A test at the 5 %-significance level for the smaller effect size
of p = 25 % requires 102 assessors.
d
Next, consider testing for product similarity, in which the alternative hypothesis assumes p = 0 % and the
d
desired power is 80 %. If similarity is evaluated using the equivalence margin of p = 30 %, i.e. the null
d
hypothesis assumes p = 30 %, then a test at the 10 %-significance level requires 49 assessors. A test at the
d
5 %-significance level using the more conservative equivalence margin p = 25 % requires 102 assessors.
d
As these examples show, a test for product differences at a specific α-risk, β-risk, and values for p under
d
the null and alternative hypotheses requires a particular sample size that is nearly the same as, and often
identical to, the sample size needed to test for equivalence given these same parameter values, but where
the p values under the null and alternative hypotheses have been reversed.
d
Avoid replicate evaluations by the same assessor whenever possible. However, if replicate evaluations
are needed to produce a sufficient number of total evaluations, every effort should be made to have each
assessor perform the same number of replicate evaluations. For example, if only 12 assessors are available,
have each assessor evaluate 3 triads to obtain a total of 36 evaluations.

NOTE Treating 3 evaluations performed by 12 assessors as 36 independent evaluations is not statistically valid
when testing for similarity using Table A.2. However, the test for difference using Table A.1 is statistically valid
[7][8]
even when replicate evaluations are performed. Recent publications on replicated discrimination tests suggest
[5]
alternative, model-based approaches for analysing replicated evaluations in discrimination tests, or for analysing
[10]
replicated evaluations in discrimination tests with the purpose of showing similarity.
7 Procedure
7.1 If the product is familiar to the assessors (e.g. a control sample from the production line), use the
constant reference technique (see 7.2). If neither product is more familiar than the other, use the balanced-
reference technique (see 7.3).
7.2 Constant-reference technique: Prepare worksheets and scoresheets (see Clause B.2) in advance of the
test so as to utilize an equal number of the two possible sequences of two products, A and B:
A-REF     A     B  A-REF     B     A
Distribute these at random in groups of two among the assessors (i.e. use each sequence once among the
first two assessors; use each sequence once again among the next two assessors, etc.) This will minimize the
imbalance that results if the total number of assessors is not an even number.
7.3 Balanced-reference technique: Prepare worksheets and scoresheets (see Clause B.1) in advance of the
test so as to utilize an equal number of the four possible sequences of two products, A and B:
A-REF    A     B  A-REF      B     A
B-REF    A     B  B-REF      B     A
where the first two triads contain product A as the reference (i.e. A-REF) and the last two triads contain
product B as the reference (i.e. B-REF). Distribute these at random in groups of four among the assessors
(i.e. use each sequence once among the first group of four assessors; use each sequence once again among
the next group of four assessors, etc.). This will minimize the imbalance that results if the total number of
assessors is not a multiple of four.
7.4 Present the three samples of each triad simultaneously if possible, following the same spatial
arrangement for each assessor (e.g. on a line to be sampled always from left to right, in a triangular array).
Within the triad, assessors are generally allowed to make repeated evaluations of each sample as desired (if,
of course, the nature of the product allows for repeated evaluations).
7.5 Instruct the assessors to evaluate the reference sample first, then evaluate the two coded samples in
the order in which they were presented. Inform the assessors that one of the coded samples is the same as
the reference and that one is different from the reference. Instruct the assessors to indicate either which of
the two coded samples is the same as the reference, or which of the two coded samples is different from the
reference.
NOTE When deciding whether to instruct the assessors to select the sample that is the same as the reference or
to select the sample that is different from the reference, consideration is given to whether or not the panel routinely
uses other discrimination test methods. Many discrimination test methods such as the triangle test, for example, focus
on identifying the “odd” or “different” sample in the test. Instructing the assessors to identify the “different” sample
in one method and to identify the “same” sample in another method can cause confusion and lead to higher levels of
incorrect responses.
7.6 Each scoresheet should provide for a single triad of samples. If an assessor is to carry out more than
one test in a session, collect the completed scoresheet and unused samples prior to serving the subsequent
triad. The assessor shall not go back to any samples from previous triads or change the verdict on any
previous test.
7.7 Do not ask questions about preference, acceptance or degree of difference after the assessor has
made a selection. The selection the assessor has just made can bias the reply to any additional questions.
Responses to such questions may be obtained through separate tests for preference, acceptance, degree of
difference, etc., see ISO 6658. A comment section asking why the choice was made may be included for the
assessor’s remarks.
7.8 The duo-trio test is a for
...


ISO/TC 34/SC 12
Secretariat: AFNOR
Date: 2025-11-202026-02-12
Sensory analysis — Methodology — Duo-trio test
Analyse sensorielle — Méthodologie — Essai duo-trio
FDIS stage
TThhiiss drdraafftt i iss susubbmmiitttteed d ttoo aa ppaarraallellel l vvoottee i inn IISSOO,, CCEEN.N.

All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication
may be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying,
or posting on the internet or an intranet, without prior written permission. Permission can be requested from either ISO
at the address below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: + 41 22 749 01 11
E-mail: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii
Contents
Foreword . iv
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Principle . 3
5 General test conditions and requirements . 3
6 Assessors . 4
6.1 Qualification . 4
6.2 Number of assessors . 4
7 Procedure . 5
8 Analysis and interpretation of results . 6
8.1 When testing for a difference . 6
8.2 When testing for similarity . 6
9 Precision and bias . 6
10 Test report . 7
Annex A (normative) Tables . 8
Annex B (informative) Examples. 22
Bibliography . 28

iii
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out through
ISO technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the
International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types of
ISO document should be noted. This document was drafted in accordance with the editorial rules of the
ISO/IEC Directives, Part 2 (see www.iso.org/directives).
ISO draws attention to the possibility that the implementation of this document may involve the use of (a)
patent(s). ISO takes no position concerning the evidence, validity or applicability of any claimed patent rights
in respect thereof. As of the date of publication of this document, ISO had not received notice of (a) patent(s)
which may be required to implement this document. However, implementers are cautioned that this may not
represent the latest information, which may be obtained from the patent database available at
www.iso.org/patents. ISO shall not be held responsible for identifying any or all such patent rights.
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions
related to conformity assessment, as well as information about ISO’s adherence to the World Trade
Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www.iso.org/iso/foreword.html.
This document was prepared by Technical Committee ISO/TC 34, Food products, Subcommittee SC 12, Sensory
analysis, in collaboration with the European Committee for Standardization (CEN) Technical Committee, in
accordance with the Agreement on technical cooperation between ISO and CEN (Vienna Agreement).
This fourth edition cancels and replaces the third edition (ISO 10399:2017), which has been technically
revised.
The main changes are as follows:
— the document has been generalized beyond food and beverage applications;
— the description of how to test for similarity has been updated to best practices and some definitions and
descriptions have been amended to also encompass this scenario;
— basic information on how to use the Thurstonian model in addition to the previously emphasized guessing
model has been added;
— the principle has been expanded slightly to enhance clarity;
— R code has been provided in the tables of Annex A as one alternative option to derive exact results, which
is exemplified in the examples in Annex B;
— the example in Clause B.2 has been modified to reflect state-of-the-art testing for similarity, whereas the
example in Clause B.3 has been dropped as the confidence interval approach is now embedded into the
earlier examples;
— the references have been updated.
iv
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www.iso.org/members.html.
v
Sensory analysis — Methodology — Duo-trio test
1 Scope
This document specifies a procedure for determining whether a perceptible sensory difference or similarity
exists between samples of two products. The method is a forced-choice procedure. The method is applicable
whether a difference exists in a single sensory attribute or in several attributes.
The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform
by the assessors.
The method is applicable even when the nature of the difference is unknown (i.e. it determines neither the
size nor the direction of difference between samples, nor is there any indication of the attribute(s) responsible
for the difference). The method is applicable only if the products are fairly homogeneous.
The method is effective for:
a) determining that either:
1) a perceptible difference results (duo-trio testing for difference); or
2) a meaningful perceptible difference does not result (duo-trio testing for similarity) when, for
example, a change is made in ingredients, processing, packaging, handling or storage;
b) selecting, training and monitoring assessors.
Two forms of the method are described:
— the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from
regular production);
— the balanced-reference technique, used when one product is not more familiar than the other.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes
requirements of this document. For dated references, only the edition cited applies. For undated references,
the latest edition of the referenced document (including any amendments) applies.
ISO 5492, Sensory analysis — Vocabulary
ISO 8589, Sensory analysis — General guidance for the design of test rooms
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 5492 and the following apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https://www.iso.org/obp
— IEC Electropedia: available at https://www.electropedia.org/

3.1
alpha-risk
α-risk
Type I error rate
significance level
false positive rate
α
probability of rejecting the null hypothesis by a statistical test when, in fact, the null hypothesis is true
Note 1 to entry: When testing for product (3.5)differences (3.3), the α-risk is the probability of erroneously concluding
that a perceptible difference exists when, in fact, it does not. When testing for similarity (3.8), the α-risk is the probability
of erroneously concluding that the products are perceptibly similar when, in fact, they are not.
3.2
beta-risk
β-risk
Type II error rate
false negative rate
β
probability of failing to reject the null hypothesis by a statistical test when, in fact, the null hypothesis is not
true
Note 1 to entry: 1 – β is also known as the power of the test.
Note 2 to entry: When testing for product (3.5)differences (3.3), the β-risk is the probability of failing to conclude that a
perceptible difference exists when, in fact, the products are perceptually different. When testing for similarity (3.8), the
β-risk is the probability of failing to conclude that the products are perceptibly similar when, in fact, they are.
3.3
difference
situation in which samples (3.6) can be distinguished based on their sensory properties
3.4
p
d
proportion of assessments in which a perceptible difference (3.3) is detected between the two products (3.5)
3.5
product
material to be evaluated
3.6
sample
unit of product (3.5) prepared, presented and evaluated in the test
3.7
sensitivity
< statistic> statistical parameters that measure the performance characteristics of the test
Note 1 to entry: In statistical terms, the sensitivity of the test is defined by the values of α, β and p (3.4(3.3)) (or δ).
d
3.8
similarity
situation in which any perceptible differences (3.3) between the samples (3.6) are so small that the products
(3.5) can be used interchangeably
3.9
Thurstonian δ
δ
measure of the magnitude of the sensory difference (3.3) between two products (3.5)
Note 1 to entry: The true perceptual difference between two products is denoted δ. The estimate of δ from the data is
denoted d′ (“d-prime”).
Note 2 to entry: For a given protocol, any value of δ is equivalent to a value pd (3.4) so they can be used interchangeably,
[4][6]
but the relationship changes with the test protocol.
3.10
triad
three samples (3.6) given to an assessor in the duo-trio test
Note 1 to entry: In the duo-trio test, one sample is labelled as the reference, the other two are marked with different
codes. One of the coded samples is the same product (3.5) as the reference; the other coded sample is the other product
in the test.
4 Principle
The number of assessors is chosen based on the sensitivity desired for the test (see 6.2 and the discussion in
Clause A.3).
Assessors receive a set of three samples (i.e. a triad), one sample of which is labelled as a reference and the
other two samples have different codes. The two coded samples comprise one sample that is the same product
as the labelled reference sample (i.e. the hidden reference) and one sample that is a different product than the
labelled reference sample (i.e. the test sample). The presentation order of the coded samples is assigned to
assessors based on balanced random schemes (see 7.1). The assessors are informed that one of the coded
samples is the same as the reference and that one is different. Based on their training and the instructions
given prior to the test, the assessors report either which of the coded samples they believe to be same as the
reference, or which of the coded samples they believe to be different from the reference.
The number of correct responses is counted, and the significance is determined by reference to a statistical
table or an applicable computer program or app.
5 General test conditions and requirements
5.1 Clearly state the test objective in writing.
5.2 Carry out the test under conditions that prevent communication among assessors until all the
evaluations have been completed using facilities and booths that conform with ISO 8589.
5.3 Prepare the samples out of sight of the assessors and in an identical manner (i.e. same apparatus, same
vessels, same quantity of product).
5.4 Assessors shall not be able to identify the samples from the way in which they are presented. For
example, in a taste test, avoid any differences in appearance. Mask any irrelevant colour differences using light
filters and/or subdued illumination.
5.5 Code the test samples in a uniform manner, preferably using three-digit numbers, chosen at random for
each test. Each triad is composed of three samples, one labelled as the reference and two labelled with different
codes. Preferably, different codes should be used for each assessor during a session. However, the same two
codes may be used for all assessors within a test, provided that each code is used only once per assessor during
a test session (e.g. if several duo-trio tests on the same or different products are being conducted in the same
session).
5.6 The samples should be presented under the conditions at which the product is generally used (e.g. when
tasting, present the samples at the temperature at which the product is generally consumed). The serving
conditions of the three samples in each triad shall be identical, just as that of all the other samples in a series
of tests on a given type of product.
5.7 The size, quantity or volume presented shall be identical for the three samples in each triad, just as that
of all the other samples in a series of tests on a given type of product. The size, quantity or volume to be
evaluated may be imposed. If it is not, the assessors should be told to take sizes, quantities or volumes that are
always similar whatever the sample.
5.8 Depending on the products and test objectives, re-tasting (of the reference or all samples) may be
accepted. The assessors shall be instructed accordingly.
5.9 When tasting, the assessors shall be told whether or not they are to swallow the samples or whether
they are free to do as they please. In this latter case, they shall be requested to proceed in the same manner
for all samples. Depending on project objectives and test products, suitable neutralizing agents may be used
between or even within individual trials. Assessors shall be instructed accordingly.
5.10 During the test sessions, avoid giving information about product identity, expected treatment effects, or
individual performance until all testing is completed.
6 Assessors
6.1 Qualification
All assessors should possess the same level of qualification and training; this level should be chosen based on
the test objective (see ISO 8586 for guidance). Experience and familiarity with the product can improve the
performance of an assessor and, therefore, can increase the likelihood of a correct result, which will then
increase the probability of finding a significant difference but would decrease the likelihood to find significant
similarity. Monitoring the performance of assessors over time may be useful for increased sensitivity.
All assessors shall be familiar with the mechanics of the duo-trio test (i.e. the format, task and evaluation
procedure).
6.2 Number of assessors
Choose the number of assessors so as to obtain the sensitivity required for the test (see the discussion in
Clause A.3). Using large numbers of assessors increases the probability of detecting small differences between
the products. However, in practice, the number of assessors often is determined by material conditions (e.g.
duration of the experiment, number of available assessors, quantity of product).
As examples, first consider testing for product differences, in which the null hypothesis assumes p = 0 % and
d
the desired power is 80 %. If the alternative hypothesis assumes the true p = 30 %, then a test at the 10 %-
d
significance level requires 53 assessors. A test at the 5 %-significance level for the smaller effect size of
p = 25 % requires 102 assessors.
d
Next, consider testing for product similarity, in which the alternative hypothesis assumes p = 0 % and the
d
desired power is 80 %. If similarity is evaluated using the equivalence margin of pd = 30 %, i.e. the null
hypothesis assumes p = 30 %, then a test at the 10 %-significance level requires 49 assessors. A test at the
d
5 %-significance level using the more conservative equivalence margin p = 25 % requires 102 assessors.
d
As these examples show, a test for product differences at a specific α-risk, β-risk, and values for p under the
d
null and alternative hypotheses requires a particular sample size that is nearly the same as, and often identical
to, the sample size needed to test for equivalence given these same parameter values, but where the p values
d
under the null and alternative hypotheses have been reversed.
Avoid replicate evaluations by the same assessor whenever possible. However, if replicate evaluations are
needed to produce a sufficient number of total evaluations, every effort should be made to have each assessor
perform the same number of replicate evaluations. For example, if only 12 assessors are available, have each
assessor evaluate 3 triads to obtain a total of 36 evaluations.
NOTE Treating 3 evaluations performed by 12 assessors as 36 independent evaluations is not statistically valid
when testing for similarity using Table A.2. However, the test for difference using Table A.1 is statistically valid even
[7][8]
when replicate evaluations are performed. Recent publications on replicated discrimination tests suggest alternative,
[5]
model-based approaches for analysing replicated evaluations in discrimination tests, or for analysing replicated
[10]
evaluations in discrimination tests with the purpose of showing similarity.
7 Procedure
7.1 If the product is familiar to the assessors (e.g. a control sample from the production line), use the
constant reference technique (see 7.2). If neither product is more familiar than the other, use the balanced-
reference technique (see 7.3).
7.2 Constant-reference technique: Prepare worksheets and scoresheets (see Clause B.2 in the
informative Annex B)) in advance of the test so as to utilize an equal number of the two possible
sequences of two products, A and B:
A-REF     A     B  A-REF     B     A
Distribute these at random in groups of two among the assessors (i.e. use each sequence once among the first
two assessors; use each sequence once again among the next two assessors, etc.) This will minimize the
imbalance that results if the total number of assessors is not an even number.
7.3 Balanced-reference technique: Prepare worksheets and scoresheets (see Clause B.1 in the
informative Annex B)) in advance of the test so as to utilize an equal number of the four possible
sequences of two products, A and B:
A-REF    A     B  A-REF      B     A
B-REF    A     B  B-REF      B     A
where the first two triads contain product A as the reference (i.e. A-REF) and the last two triads contain
product B as the reference (i.e. B-REF). Distribute these at random in groups of four among the assessors (i.e.
use each sequence once among the first group of four assessors; use each sequence once again among the next
group of four assessors, etc.). This will minimize the imbalance that results if the total number of assessors is
not a multiple of four.
7.4 Present the three samples of each triad simultaneously if possible, following the same spatial
arrangement for each assessor (e.g. on a line to be sampled always from left to right, in a triangular array).
Within the triad, assessors are generally allowed to make repeated evaluations of each sample as desired (if,
of course, the nature of the product allows for repeated evaluations).
7.5 Instruct the assessors to evaluate the reference sample first, then evaluate the two coded samples in the
order in which they were presented. Inform the assessors that one of the coded samples is the same as the
reference and that one is different from the reference. Instruct the assessors to indicate either which of the
two coded samples is the same as the reference, or which of the two coded samples is different from the
reference.
NOTE When deciding whether to instruct the assessors to select the sample that is the same as the reference or to
select the sample that is different from the reference, consideration is given to whether or not the panel routinely uses
other discrimination test methods. Many discrimination test methods such as the triangle test, for example, focus on
identifying the “odd” or “different” sample in the test. Instructing the assessors to identify the “different” sample in one
method and to identify the “same” sample in another method can cause confusion and lead to higher levels of incorrect
responses.
7.6 Each scoresheet should provide for a single triad of samples. If an assessor is to carry out more than one
test in a session, collect the completed scoresheet and unused samples prior to serving the subsequent triad.
The assessor shall not go back to any samples from previous triads or change the verdict on any previous test.
7.7 Do not ask questions about preference, acceptance or degree of difference after the assessor has made
a selection. The selection the assessor has just made can bias the reply to any additional questions. Responses
to such questions may be obtained through separate tests for preference, acceptance, degree of difference,
etc., see ISO 6658. A comment section asking why the choice was made may be included for the assessor’s
remarks.
7.8 The duo-trio test is a forced-choice procedure; assessors are not allowed the option of reporting “no
difference”. An assessor who detects no difference between the samples should be instructed to randomly
select one of the samples and to indicate that the selection was only a guess in the comments section of the
scoresheet.
8 Analysis and interpretation of results
8.1 When testing for a difference
Use Table A.1 in the normative Annex Ato analyse the data obtained from a duo-trio test. If the number of
correct responses is greater than or equal to the number given in Table A.1 (corresponding to the number of
assessors and the α-risk level chosen for the test), conclude that a perceptible difference exists between the
samples (see Clause B.1 in the informative Annex B).).
If desired, calculate a confidence interval on the proportion of the population that can distinguish the samples.
The method is described in B.1.5 in the informative Annex B.
8.2 When testing for similarity
NOTE In this document, “similar” does not mean “identical”. Rather, “similar” means that the two products are
sufficiently alike to be used interchangeably. It is not possible to prove that two products are identical. However, it can
be demonstrated that any difference that does exist between two products is so small as to have no practical significance.
The maximum difference that is still considered as small enough (e.g. not deemed consumer-meaningful by the project
team) is indicated by pd or δ.
Use Table A.2 in the normative Annex A to analyse the data obtained from a duo-trio test. If the number of
correct responses is less than or equal to the number given in Table A.2 (corresponding to the number of
assessors, the α-risk level and the value of p or δ chosen for the test), conclude that no meaningful difference
d
(i.e. no difference of more than p or δ) exists between the samples (see Clause B.2 in the informative Annex
d
B).). If results will be compared from one test to another, then the same value of pd or δ should be chosen for
all tests.
If desired, calculate a confidence interval on the proportion of the population that can distinguish the samples.
The method is described in B.2.5 in the informative Annex B.
9 Precision and bias
Because the results of sensory discrimination tests are functions of individual sensitivities, a general
statement regarding the reproducibility of results that is applicable to all populations of assessors cannot be
made. Precision regarding a particular population of assessors increases as the size of the panel increases and
also with training and with exposure to the product.
As a forced-choice procedure is used, results obtained by this method are bias-free, provided that the
precautions in Clause 7 are fully observed.
10 Test report
Report the test objective, the results and the conclusions. The following additional information is
recommended:
— the purpose of the test and the nature of the treatment studied;
— full identification of the samples (i.e. origin, method of preparation, quantity, shape, storage prior to
testing, serving size, temperature); sample information should communicate that all storage, handling and
preparation was done in such a way as to yield samples that differ only due to the variable of interest, if at
all;
— the International Standard used (including its year of publication);
— the number of assessors, the number of correct responses and the result of the statistical evaluation
(including the values of α, β and p or δ used for the test);
d
— assessors: experience (in sensory testing, with the product, with the samples in the test), age and gender
(see ISO 8586 for guidance);
— any information and any specific recommendations given to the assessors in connection with the test;
— the test environment (i.e. the test facility used, simultaneous or sequential presentation, if the identity of
samples was disclosed after the test, if so, in what manner);
— the result(s), including a reference to the clause which explains how the results were calculated;
— any deviations from the procedure;
— any unusual features observed;
— the location, date of the test and name of the panel leader.
Annex A
(normative)
Tables
A.1 The values given in Table A.1 are the minimum number of correct responses required for significance at
the stated α level (i.e. column) for the corresponding number of assessors, n (i.e. row). Reject the assumption
of “no difference” if the number of correct responses is greater than or equal to the value in Table A.1.
Values in the table are exact because they are based on the binomial distribution. For values of n not in
Table A.1the table,, compute approximate values for the missing entries based on the normal approximation
to the binomial as follows:
minimum number of responses (x) = nearest whole number greater than:
...


PROJET
Norme
internationale
ISO/DIS 10399
ISO/TC 34/SC 12
Analyse sensorielle — Méthodologie
Secrétariat: AFNOR
— Essai duo-trio
Début de vote:
Sensory analysis — Methodology — Duo-trio test
2025-07-01
Vote clos le:
ICS: 67.240
2025-09-23
CE DOCUMENT EST UN PROJET DIFFUSÉ
POUR OBSERVATIONS ET APPROBATION. IL
EST DONC SUSCEPTIBLE DE MODIFICATION
ET NE PEUT ÊTRE CITÉ COMME NORME
INTERNATIONALE AVANT SA PUBLICATION EN
TANT QUE TELLE.
Le présent document est distribué tel qu’il est parvenu du secrétariat
du comité. OUTRE LE FAIT D’ÊTRE EXAMINÉS POUR
ÉTABLIR S’ILS SONT ACCEPTABLES À DES
FINS INDUSTRIELLES, TECHNOLOGIQUES ET
COMMERCIALES, AINSI QUE DU POINT DE VUE
DES UTILISATEURS, LES PROJETS DE NORMES
INTERNATIONALES DOIVENT PARFOIS ÊTRE
TRAITEMENT PARALLÈLE ISO/CEN
CONSIDÉRÉS DU POINT DE VUE DE LEUR
POSSIBILITÉ DE DEVENIR DES NORMES
POUVANT SERVIR DE RÉFÉRENCE DANS LA
RÉGLEMENTATION NATIONALE.
LES DESTINATAIRES DU PRÉSENT PROJET
SONT INVITÉS À PRÉSENTER, AVEC LEURS
OBSERVATIONS, NOTIFICATION DES DROITS
DE PROPRIÉTÉ DONT ILS AURAIENT
ÉVENTUELLEMENT CONNAISSANCE
ET À FOURNIR UNE DOCUMENTATION
EXPLICATIVE.
Numéro de référence
ISO/DIS 10399:2025(fr)
̹ ʹͲʹͷ–‘—•†”‘‹–•”±•‡”˜±•
ISO/DIS 10399:2025(fr)
ISO/TC 34/SC 12
ƒ–‡ǣʹͲʹͷǦͲͻǦʹ͵
ISO/DIS 10399:2025(F)
Ȁ͵ͶȀͳʹ
‡…”±–ƒ”‹ƒ–ǣ 
Analyse sensorielle — Méthodologie — Essai duo-trio
Sensory analysis — Methodology — Duo-trio test

Avertissement
‡†‘…—‡–’‡•–’ƒ•—‡‘”‡‹–‡”ƒ–‹‘ƒŽ‡†‡Ž’ Ǥ އ•–†‹•–”‹„—±’‘—”‡šƒ‡‡–‘„•‡”˜ƒ–‹‘•Ǥ
އ•–•—•…‡’–‹„އ†‡‘†‹ˆ‹…ƒ–‹‘•ƒ•’”±ƒ˜‹•‡–‡’‡—–²–”‡…‹–±…‘‡‘”‡‹–‡”ƒ–‹‘ƒŽ‡Ǥ
‡•†‡•–‹ƒ–ƒ‹”‡•†—’”±•‡–’”‘Œ‡–•‘–‹˜‹–±•’”±•‡–‡”ǡƒ˜‡…އ—”•‘„•‡”˜ƒ–‹‘•ǡ‘–‹ˆ‹…ƒ–‹‘†‡•
†”‘‹–•†‡’”‘’”‹±–±†‘–‹Ž•ƒ—”ƒ‹‡–±˜‡–—‡ŽŽ‡‡–…‘ƒ‹••ƒ…‡‡–ˆ‘—”‹”—‡†‘…—‡–ƒ–‹‘
‡š’Ž‹…ƒ–‹˜‡Ǥ

ǣ͸͹ǤʹͶͲ

DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2025
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org ›’‡†—†‘…—‡–ǣ‘”‡‹–‡”ƒ–‹‘ƒŽ‡
Web: www.iso.org
‘—•Ǧ–›’‡†—†‘…—‡–ǣ
Publié en Suisse –ƒ†‡†—†‘…—‡–ǣȋͶͲȌ“—²–‡
ƒ‰—‡†—†‘…—‡–ǣ 



ii
ISO/DIS 10399:2025(F)
Sommaire Page
Avant-propos . iv
1 Domaine d’application .1
2 Références normatives .1
3 Termes et définitions .2
4 Principe .3
5 Conditions générales d’essai et exigences .4
6 Sujets .5
6.1 Qualification .5
6.2 Nombre de sujets .5
7 Mode opératoire.5
8 Analyse et interprétation des résultats .7
8.1 Lors d’un essai de différence .7
8.2 Lors d’un essai de similitude .7
9 Rapport d’essai .7
10 Fidélité et erreurs systématiques .8
(normative) Tableaux .9
(informative) Exemples . 15
Bibliographie . 22

iii
ISO/DIS 10399:2025(F)
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude a le
droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2
(voir www.iso.org/directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. Le ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété. Les détails concernant les références aux droits de
propriété intellectuelle ou autres droits analogues identifiés lors de l’élaboration du document sont
indiqués dans l’Introduction et/ou dans la liste des déclarations de brevets reçues par l’ISO
(voir www.iso.org/brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir le lien suivant : www.iso.org/avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 34, Produits alimentaires,
sous-comité SC 12, Analyse sensorielle.
Cette quatrième édition annule et remplace la troisième édition (ISO 10399:2011), qui a fait l’objet
d’une révision mineure. Le document a été généralisé au-delà des applications pour les aliments et
boissons. La description de la méthode d’essai de similitude a été mise à jour pour intégrer les
meilleures pratiques et certaines définitions et descriptions ont été modifiées pour englober aussi ce
scénario. Des informations de base sur la façon d’utiliser le modèle thurstonien en complément du
modèle de supposition précédemment décrit ont été ajoutées. Le principe a été quelque peu développé
pour plus de clarté. En outre, un code R est fourni dans les tableaux de l’Annexe A à titre d’alternative
pour obtenir des résultats exacts, lequel est explicité dans les exemples de l’Annexe B. L’exemple B.2 a
été modifié pour refléter les essais de similitude de l’état de l’art, tandis que l’exemple B.3 a été
supprimé car l’approche de l’intervalle de confiance est désormais intégrée dans les exemples
précédents. Les références ont été mises à jour.

iv
PROJET DE NORME INTERNATIONALE ISO/DIS 10399:2025(F)

Analyse sensorielle — Méthodologie — Essai duo-trio
1 Domaine d’application
Le présent document spécifie un mode opératoire permettant de déterminer s’il existe une différence
sensorielle perceptible ou une similitude entre les échantillons de deux produits. La méthode est une
procédure à choix forcé. Elle s’applique s’il existe une différence pour une seule propriété sensorielle ou
pour plusieurs.
La méthode est statistiquement moins efficace que l’essai triangulaire (décrit dans l’ISO 4120), mais elle
est plus facile à réaliser par les sujets.
La méthode est applicable même lorsque la nature de la différence est inconnue (ce qui signifie qu’elle
ne détermine ni la taille ni le sens de la différence entre des échantillons et qu’elle ne donne pas non
plus d’indications sur l’attribut/les attributs à l’origine de cette différence). La présente méthode n’est
applicable que si les produits sont relativement homogènes.
La méthode est efficace dans les cas suivants :
a) déterminer
1) qu’il existe une différence perceptible (essai duo-trio de différence) ; ou
2) qu’il n’existe pas de différence perceptible significative (essai duo-trio de similitude), quand,
par exemple, des modifications sont apportées aux ingrédients, à la transformation,
à l’emballage, aux opérations de manutention ou de stockage, et
b) pour sélectionner, entraîner et contrôler les sujets.
Deux formes de cette méthode sont décrites :
— la technique de la référence constante, utilisée lorsque les sujets connaissent bien un produit
(un échantillon de fabrication courante par exemple) ; et
— la technique de la référence équilibrée, utilisée quand aucun des produits n’est plus connu que
l’autre.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.
Pour les références non datées, la dernière édition du document de référence s’applique (y compris les
éventuels amendements).
ISO 5492, Analyse sensorielle — Vocabulaire.
ISO 8589, Analyse sensorielle — Directives générales pour la conception de locaux destinés à l’analyse.
ISO/DIS 10399:2025(F)
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO 5492 ainsi que les suivants
s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en
normalisation, consultables aux adresses suivantes :
— IEC Electropedia : disponible à l’adresse https://www.electropedia.org/
— ISO Online browsing platform : disponible à l’adresse https://www.iso.org/obp
3.1
risque alpha
risque α
probabilité de rejeter l’hypothèse nulle d’un test statistique alors qu’en réalité l’hypothèse nulle est
vraie
Note 1 à l’article : Ceci est également appelé taux d’erreur de type I, niveau de significativité ou taux de faux
positifs.
Note 2 à l’article : Dans le cadre des essais de différence de produits, le risque alpha est la probabilité de conclure
à tort qu’une différence perceptible existe lorsqu’en réalité il n’en existe pas. Dans le cadre des essais de
similitude, le risque alpha est la probabilité de conclure à tort que les produits sont perceptiblement similaires
lorsqu’en réalité ils ne le sont pas.
3.2
risque bêta
risque β
probabilité de ne pas rejeter l’hypothèse nulle d’un test statistique lorsqu’en réalité l’hypothèse nulle
n’est pas vraie
Note 1 à l’article : Ceci est également appelé taux d’erreur de type II ou taux de faux négatifs. Par ailleurs, 1 – β est
également appelé la puissance du test.
Note 2 à l’article : Dans le cadre des essais de différence de produits, le risque bêta est la probabilité de ne pas
conclure qu’une différence perceptible existe lorsqu’en réalité les produits sont perceptiblement différents.
Dans le cadre des essais de similitude, le risque bêta est la probabilité de ne pas conclure que les produits sont
perceptiblement similaires lorsqu’en réalité ils le sont.
3.3
différence
situation dans laquelle les échantillons (3.5) peuvent être distingués sur la base de leurs propriétés
sensorielles
3.4
p
d
la proportion d’évaluations au cours desquelles une différence perceptible est détectée entre les deux
produits est donnée par le symbole p
d
3.5
produit
matériau à évaluer
ISO/DIS 10399:2025(F)
3.6
échantillon
unité de produit (3.4) préparée, présentée et évaluée au cours de l’essai
3.7
sensibilité
paramètres statistiques qui mesurent les caractéristiques de performance de l’analyse
Note 1 à l’article : En termes statistiques, la sensibilité de l’essai est définie par les valeurs de α, β et pd (ou δ).
3.8
similitude
situation dans laquelle les différences (3.3) perceptibles entre les échantillons (3.5) sont si petites que
les produits (3.4) peuvent être utilisés de manière interchangeable
3.9
δ thurstonien
mesure de l’ampleur de la différence sensorielle entre deux produits
Note 1 à l’article : La différence perceptuelle vraie entre deux produits est notée δ. L’estimation de δ à partir des
données est notée d’ (« d prime »).
Note 2 à l’article : Pour un protocole donné, toute valeur de δ est équivalente à une valeur p de sorte qu’elles
d
[5],[7]
peuvent être utilisées de manière interchangeable, mais la relation change avec le protocole d’essai .
3.10
triade
trois échantillons (3.5) fournis à un sujet au cours de l’essai duo-trio
Note 1 à l’article : Dans l’essai duo-trio, un échantillon est étiqueté comme référence, les deux autres portent des
codes différents. L’un des échantillons codés est le même produit que la référence ; l’autre échantillon codé est
l’autre produit de l’essai.
4 Principe
Le nombre de sujets est choisi en fonction de la sensibilité souhaitée pour l’essai (voir 6.2 et la
discussion en A.3).
Les sujets reçoivent un ensemble de trois échantillons (c’est-à-dire une triade), dont l’un est étiqueté
comme étant l’échantillon de référence et les deux autres portent des codes différents. Les deux
échantillons codés se composent d’un échantillon qui est le même produit que l’échantillon de référence
étiqueté (c’est-à-dire la référence cachée) et d’un échantillon qui est un produit différent de
l’échantillon de référence étiqueté (c’est-à-dire l’échantillon d’essai). L’ordre de présentation des
échantillons codés est attribué aux sujets sur la base de schémas équilibrés aléatoires (voir 7.1).
Les sujets sont informés que l’un des échantillons codés est identique à l’échantillon de référence et que
l’autre est différent. Sur la base de leur entraînement et des instructions données avant l’essai, les sujets
identifient l’échantillon codé dont ils pensent qu’il est le même que l’échantillon de référence, ou celui
dont ils pensent qu’il diffère de l’échantillon de référence.
Le nombre de réponses correctes est compté et sa significativité déterminée par référence à une table
statistique ou à un programme ou à une application informatique applicable.

ISO/DIS 10399:2025(F)
5 Conditions générales d’essai et exigences
5.1 Définir l’objectif de l’essai par écrit de manière claire.
5.2 Effectuer l’essai dans des conditions empêchant toute communication entre les sujets jusqu’à
ce que toutes les évaluations aient été terminées, en utilisant des installations et des cabines conformes
à l’ISO 8589.
5.3 Préparer les échantillons à l’abri du regard des sujets et de manière identique (c’est-à-dire même
appareillage, mêmes récipients, mêmes quantités de produit).
5.4 Les sujets ne doivent pas être capables d’identifier les échantillons d’après la manière dont ils
sont présentés. Par exemple, lors d’un essai portant sur le goût, éviter toute différence d’aspect.
Masquer toutes les différences de couleur non pertinentes en utilisant des filtres à lumière et/ou une
lumière tamisée.
5.5 Coder les échantillons d’essai de façon uniforme, en utilisant de préférence des nombres à trois
chiffres, choisis au hasard pour chaque essai. Chaque triade est composée de trois échantillons,
un étiqueté comme échantillon de référence et deux étiquetés avec des codes différents. De préférence,
il convient d’utiliser des codes différents pour chaque sujet au cours d’une session. Cependant, les deux
mêmes codes peuvent être utilisés pour tous les sujets au sein d’un essai, à condition que chaque code
ne soit utilisé qu’une fois par sujet au cours d’une session (par exemple, si plusieurs essais duo-trio
portant sur le même produit ou sur différents produits sont conduits au cours de la même session).
5.6 Il est préférable de présenter les échantillons dans les conditions dans lesquelles le produit est
généralement utilisé (par exemple, lors de la dégustation, présenter les échantillons à la température à
laquelle le produit est généralement consommé). Les conditions de présentation des trois échantillons
de chaque triade doivent être identiques, de même que celles de tous les autres échantillons d’une série
d’essais effectués sur un type donné de produit.
5.7 La taille, la quantité ou le volume présenté(e) doit être identique pour les trois échantillons de
chaque triade, de même que la taille, la quantité ou le volume de tous les autres échantillons d’une série
d’essais effectués sur un type donné de produit. La taille, la quantité ou le volume à évaluer peut être
imposée. Sinon, il convient cependant de spécifier aux sujets de prendre des tailles, des quantités ou des
volumes toujours similaires quel que soit l’échantillon.
5.8 Selon les produits et les objectifs de l’essai, une nouvelle dégustation (de la référence ou de tous
les échantillons) peut être acceptée. Les sujets doivent recevoir des instructions en conséquence.
5.9 Dans le cadre d’une dégustation, il doit être indiqué aux sujets s’ils doivent ou non avaler les
échantillons ou s’ils sont libres de procéder comme ils le veulent. Dans ce dernier cas, il doit leur être
demandé de procéder de la même manière pour tous les échantillons. En fonction des objectifs du
projet et des produits d’essai, des agents neutralisants appropriés peuvent être utilisés entre les essais
individuels ou même au cours de ceux-ci. Les sujets doivent recevoir des instructions en conséquence.
5.10 Pendant les sessions d’essai, éviter de donner des informations sur l’identité du produit, les effets
attendus du traitement ou les performances individuelles jusqu’à la fin de tous les essais.

ISO/DIS 10399:2025(F)
6 Sujets
6.1 Qualification
Il convient que tous les sujets possèdent le même niveau de qualification et de formation, ce niveau
étant choisi sur la base de l’objectif de l’essai (voir l’ISO 8586 à titre d’indication). L’expérience et
l’habitude du produit peuvent améliorer les performances d’un sujet et peuvent de ce fait augmenter les
chances d’aboutir à un résultat correct, ce qui augmentera alors la probabilité de trouver une différence
significative mais diminuera la probabilité de trouver une similitude significative. La mesure des
performances des sujets en fonction du temps peut se révéler utile pour suivre l’augmentation de la
sensibilité.
Tous les sujets doivent bien connaître les mécanismes de l’essai duo-trio (c’est-à-dire le format, la tâche
et le mode opératoire d’évaluation).
6.2 Nombre de sujets
Choisir le nombre de sujets de manière à obtenir la sensibilité requise pour l’essai (voir la discussion
en A.3). L’utilisation de grands nombres de sujets accroît les chances de détecter de petites différences
entre les produits. Toutefois, dans la pratique, le nombre de sujets est souvent déterminé par des
conditions matérielles (par exemple, la durée de l’expérience, le nombre de sujets disponibles,
la quantité de produit). Lors d’un essai de différence, le nombre habituel de sujets est
approximativement de 32 à 36. Lors d’un essai sur une différence non significative (c’est-à-dire une
similitude), deux fois plus de sujets (c’est-à-dire approximativement 72) sont généralement nécessaires
pour une sensibilité équivalente.
Éviter, autant que possible, les évaluations répétées par un même sujet. Cependant, si des évaluations
répétées sont nécessaires pour réaliser un nombre total d’évaluations suffisant, il convient de s’efforcer
que chaque sujet réalise le même nombre d’évaluations répétées. Par exemple, si seulement 12 sujets
sont disponibles, faire évaluer à chaque sujet 3 triades pour obtenir un nombre total de 36 évaluations.
NOTE Analyser 3 évaluations réalisées par 12 sujets comme 36 évaluations indépendantes n’est pas valide
pour un essai de similitude en utilisant le Tableau A.2. En revanche, l’essai de différence en utilisant le Tableau A.1
[8],[9]
est valide même lorsque des évaluations répétées sont réalisées . Des publications récentes sur des essais de
discrimination avec répétitions suggèrent des approches alternatives, basées sur des modèles, pour analyser les
[6]
évaluations répétées dans les essais de discrimination , ou pour analyser les évaluations répétées dans les essais
[11]
de discrimination visant à montrer la similitude .
7 Mode opératoire
7.1 Si les sujets connaissent bien le produit (par exemple un échantillon de contrôle de la ligne de
production), employer la technique de la référence constante. Si aucun des deux produits ne leur est
plus familier l’un que l’autre, employer la technique de la référence équilibrée.
a) Technique de la référence constante : avant l’essai, préparer des feuilles de protocole et des
formulaires de réponse (voir B.2), de manière à utiliser un nombre égal des deux jeux possibles
de deux produits, A et B :
A-REF     A     B A-REF     B     A
Distribuer ces jeux au hasard par groupe de deux parmi les sujets (en d’autres termes, utiliser chaque
jeu une fois parmi les deux premiers sujets ; utiliser chaque jeu une seconde fois parmi les deux sujets
suivants, etc.). Le fait de procéder ainsi réduit le déséquilibre survenant lorsque le nombre total de
sujets n’est pas un nombre pair.
ISO/DIS 10399:2025(F)
b) Technique de la référence équilibrée : avant l’essai, préparer des feuilles de protocole et des
formulaires de réponse (voir B.1), de manière à utiliser un nombre égal des quatre jeux possibles
de deux produits, A et B :
A-REF    A     B A-REF     B     A
B-REF    A     B B-REF     B     A
où les deux premières triades comprennent le produit A comme échantillon de référence (c’est-à-dire
A-REF) et les deux dernières triades comprennent le produit B comme échantillon de référence
(c’est-à-dire B-REF). Distribuer ces jeux au hasard par groupe de quatre parmi les sujets (en d’autres
termes, utiliser chaque jeu une fois parmi le premier groupe de quatre sujets ; utiliser chaque jeu une
seconde fois parmi le groupe de quatre sujets suivants, etc.). Procéder ainsi réduit le déséquilibre
survenant lorsque le nombre total de sujets n’est pas un multiple de quatre.
7.2 Présenter les trois échantillons de chaque triade simultanément si possible, en suivant la même
disposition spatiale pour chaque sujet (par exemple, en ligne devant toujours être examinée de gauche à
droite, en triangle). Au sein de la triade, les sujets sont généralement autorisés à faire des évaluations
répétées de chaque échantillon autant de fois qu’ils le désirent (si, bien sûr, la nature du produit permet
des évaluations répétées).
7.3 Demander aux sujets d’évaluer tout d’abord l’échantillon de référence, et ensuite d’évaluer les
deux échantillons codés dans l’ordre dans lequel ils leur ont été présentés. Informer les sujets que l’un
des échantillons codés est le même que l’échantillon de référence, et que l’autre est différent de
l’échantillon de référence. Demander aux sujets d’indiquer l’échantillon codé qui est le même que
l’échantillon de référence, ou bien l’échantillon codé qui diffère de l’échantillon de référence.
NOTE Quand on décide de demander aux sujets de sélectionner l’échantillon qui est le même que l’échantillon
de référence ou de sélectionner l’échantillon qui est différent de l’échantillon de référence, il y a lieu de se
demander si le jury utilise, ou non, systématiquement d’autres méthodes d’essais de discrimination. Un grand
nombre de méthodes d’essais de discrimination tels que l’essai triangulaire, par exemple, se concentrent sur
l’identification de l’échantillon « intrus » ou « différent ». Le fait de demander aux sujets d’identifier l’échantillon
« différent » dans une méthode et d’identifier l’échantillon qui est « le même » dans une autre méthode peut être
source de confusion et mener à de hauts niveaux de réponses incorrectes.
7.4 Il convient que chaque formulaire de réponse ne concerne qu’une seule triade d’échantillons.
Si un sujet doit effectuer plusieurs essais au cours d’une session, collecter le formulaire de réponse
complété et les échantillons inutilisés avant de présenter la triade suivante. Le sujet ne doit pas revenir
sur l’un des échantillons des triades précédentes, ni modifier son verdict sur l’un des essais précédents.
7.5 Ne pas poser de questions sur la préférence, l’acceptabilité ou le degré de différence après que le
sujet a fait un choix. Le choix que le sujet vient juste de faire peut biaiser la réponse à toute question
supplémentaire. Les réponses à de telles questions peuvent être obtenues au moyen d’essais distincts
portant sur la préférence, l’acceptabilité, le degré de différence, etc. (voir l’ISO 6658). Une section
« Commentaires » demandant les raisons du choix peut être incorporée pour recueillir les remarques
du sujet.
7.6 L’essai duo-trio est une procédure à choix forcé ; les sujets ne sont pas autorisés à choisir l’option
« pas de différence ». Il convient de demander à un sujet qui ne trouve pas de différence entre les
échantillons de choisir au hasard l’un des échantillons et d’indiquer dans la section « Commentaires »
du formulaire de réponse que ce choix n’est qu’une supposition.
ISO/DIS 10399:2025(F)
8 Analyse et interprétation des résultats
8.1 Lors d’un essai de différence
Utiliser le Tableau A.1 pour analyser les données obtenues à partir d’un essai duo-trio. Si le nombre de
réponses correctes est supérieur ou égal au nombre donné dans le Tableau A.1 (correspondant au
nombre de sujets et au niveau de risque α choisis pour l’essai), conclure qu’il existe une différence
perceptible entre les échantillons (voir B.1).
Si cela est souhaité, calculer un intervalle de confiance sur la proportion de la population capable de
distinguer les échantillons. La méthode est décrite en B.1.5.
8.2 Lors d’un essai de similitude
NOTE Dans le présent document, « similaire » ne signifie pas « identique ». « Similaire » signifie plutôt que les
deux produits sont de nature suffisamment proche pour être utilisés de manière interchangeable. Il n’est pas
possible de prouver que deux produits sont identiques. En revanche, il peut être démontré qu’une différence
existant entre deux produits est tellement faible qu’elle n’est pas significative dans la pratique. La différence
maximale qui est encore considérée comme suffisamment faible (par exemple, non jugée par l’équipe de projet
comme significative pour le consommateur) est indiquée par p ou δ.
d
Utiliser le Tableau A.2 pour analyser les données obtenues à partir d’un essai duo-trio. Si le nombre de
réponses correctes est inf
...


PROJET FINAL
Norme
internationale
ISO/TC 34/SC 12
Analyse sensorielle — Méthodologie
Secrétariat: AFNOR
— Essai duo-trio
Début de vote:
Sensory analysis — Methodology — Duo-trio test 2026-02-26
Vote clos le:
2026-04-23
LES DESTINATAIRES DU PRÉSENT PROJET SONT
INVITÉS À PRÉSENTER, AVEC LEURS OBSERVATIONS,
NOTIFICATION DES DROITS DE PROPRIÉTÉ DONT ILS
AURAIENT ÉVENTUELLEMENT CONNAISSANCE ET À
FOURNIR UNE DOCUMENTATION EXPLICATIVE.
OUTRE LE FAIT D’ÊTRE EXAMINÉS POUR
ÉTABLIR S’ILS SONT ACCEPTABLES À DES FINS
INDUSTRIELLES, TECHNOLOGIQUES ET COM-MERCIALES,
AINSI QUE DU POINT DE VUE DES UTILISATEURS, LES
PROJETS DE NORMES
TRAITEMENT PARALLÈLE ISO/CEN
INTERNATIONALES DOIVENT PARFOIS ÊTRE CONSIDÉRÉS
DU POINT DE VUE DE LEUR POSSI BILITÉ DE DEVENIR DES
NORMES POUVANT
SERVIR DE RÉFÉRENCE DANS LA RÉGLEMENTATION
NATIONALE.
Numéro de référence
PROJET FINAL
Norme
internationale
ISO/TC 34/SC 12
Analyse sensorielle — Méthodologie
Secrétariat: AFNOR
— Essai duo-trio
Début de vote:
Sensory analysis — Methodology — Duo-trio test
2026-02-26
Vote clos le:
2026-04-23
LES DESTINATAIRES DU PRÉSENT PROJET SONT
INVITÉS À PRÉSENTER, AVEC LEURS OBSERVATIONS,
NOTIFICATION DES DROITS DE PROPRIÉTÉ DONT ILS
AURAIENT ÉVENTUELLEMENT CONNAISSANCE ET À
FOURNIR UNE DOCUMENTATION EXPLICATIVE.
DOCUMENT PROTÉGÉ PAR COPYRIGHT
OUTRE LE FAIT D’ÊTRE EXAMINÉS POUR
ÉTABLIR S’ILS SONT ACCEPTABLES À DES FINS
© ISO 2026 INDUSTRIELLES, TECHNOLOGIQUES ET COM-MERCIALES,
AINSI QUE DU POINT DE VUE DES UTILISATEURS, LES
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
PROJETS DE NORMES
TRAITEMENT PARALLÈLE ISO/CEN
INTERNATIONALES DOIVENT PARFOIS ÊTRE CONSIDÉRÉS
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
DU POINT DE VUE DE LEUR POSSI BILITÉ DE DEVENIR DES
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
NORMES POUVANT
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
SERVIR DE RÉFÉRENCE DANS LA RÉGLEMENTATION
NATIONALE.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse Numéro de référence
ii
Sommaire Page
Avant-propos .iv
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Principe. 3
5 Conditions générales d’essai et exigences . 3
6 Sujets . 4
6.1 Qualification .4
6.2 Nombre de sujets .4
7 Mode opératoire . 5
8 Analyse et interprétation des résultats . 6
8.1 Lors d’un essai de différence .6
8.2 Lors d’un essai de similitude .6
9 Fidélité et erreurs systématiques . . 7
10 Rapport d’essai . 7
Annexe A (normative) Tableaux . 8
Annexe B (informative) Exemples .16
Bibliographie .21

iii
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes nationaux
de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est en général
confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude a le droit de faire
partie du comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l’ISO participent également aux travaux. L’ISO collabore étroitement avec
la Commission électrotechnique internationale (IEC) en ce qui concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document
a été rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2
(voir www.iso.org/directives).
L’ISO attire l’attention sur le fait que la mise en application du présent document peut entraîner l’utilisation
d’un ou de plusieurs brevets. L’ISO ne prend pas position quant à la preuve, à la validité et à l’applicabilité de
tout droit de brevet revendiqué à cet égard. À la date de publication du présent document, l’ISO n’avait pas
reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires à sa mise en application. Toutefois,
il y a lieu d’avertir les responsables de la mise en application du présent document que des informations
plus récentes sont susceptibles de figurer dans la base de données de brevets, disponible à l’adresse
www.iso.org/brevets. L’ISO ne saurait être tenue pour responsable de ne pas avoir identifié de tels droits de
propriété et averti de leur existence.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de
l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au
commerce (OTC), voir www.iso.org/avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 34, Produits alimentaires, sous-comité
SC 12, Analyse sensorielle, en collaboration avec le Comité européen de normalisation (CEN), conformément à
l’Accord de coopération technique entre l’ISO et le CEN (Accord de Vienne).
Cette quatrième édition annule et remplace la troisième édition (ISO 10399:2017), qui a fait l’objet d’une
révision technique.
Les principales modifications sont les suivantes:
— le document a été généralisé au-delà des applications pour les aliments et boissons;
— la description de la méthode d’essai de similitude a été mise à jour pour intégrer les meilleures pratiques
et certaines définitions et descriptions ont été modifiées pour englober aussi ce scénario;
— des informations de base sur la façon d’utiliser le modèle thurstonien en complément du modèle de
supposition précédemment décrit ont été ajoutées;
— le principe a été quelque peu développé pour plus de clarté;
— un code R a été fourni dans les tableaux de l’Annexe A à titre d’alternative pour obtenir des résultats
exacts, lequel est explicité dans les exemples de l’Annexe B;
— l’exemple de l’Article B.2 a été modifié pour refléter les essais de similitude de l’état de l’art, tandis que
l’exemple de l’Article B.3 a été supprimé car l’approche de l’intervalle de confiance est désormais intégrée
dans les exemples précédents;
— les références ont été mises à jour.

iv
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve à l’adresse www.iso.org/fr/members.html.

v
PROJET FINAL Norme internationale ISO/FDIS 10399:2026(fr)
Analyse sensorielle — Méthodologie — Essai duo-trio
1 Domaine d’application
Le présent document spécifie un mode opératoire permettant de déterminer s’il existe une différence
sensorielle perceptible ou une similitude entre les échantillons de deux produits. La méthode est une
procédure à choix forcé. Elle s’applique s’il existe une différence pour une seule propriété sensorielle ou pour
plusieurs.
La méthode est statistiquement moins efficace que l’essai triangulaire (décrit dans l’ISO 4120), mais elle est
plus facile à réaliser par les sujets.
La méthode est applicable même lorsque la nature de la différence est inconnue (ce qui signifie qu’elle
ne détermine ni la taille ni le sens de la différence entre des échantillons et qu’elle ne donne pas non plus
d’indications sur l’attribut/les attributs à l’origine de cette différence). La présente méthode n’est applicable
que si les produits sont relativement homogènes.
La méthode est efficace dans les cas suivants:
a) déterminer:
1) qu’il existe une différence perceptible (essai duo-trio de différence); ou
2) qu’il n’existe pas de différence perceptible significative (essai duo-trio de similitude), quand, par
exemple, des modifications sont apportées aux ingrédients, à la transformation, à l’emballage, aux
opérations de manutention ou de stockage;
b) sélectionner, entraîner et contrôler les sujets.
Deux formes de cette méthode sont décrites:
— la technique de la référence constante, utilisée lorsque les sujets connaissent bien un produit
(un échantillon de fabrication courante par exemple); et
— la technique de la référence équilibrée, utilisée quand aucun des produits n’est plus connu que l’autre.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour
les références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO 5492, Analyse sensorielle — Vocabulaire
ISO 8589, Analyse sensorielle — Directives générales pour la conception de locaux destinés à l’analyse
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO 5492 ainsi que les suivants
s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:

— ISO Online browsing platform: disponible à l’adresse https://www.iso.org/obp
— IEC Electropedia: disponible à l’adresse https://www.electropedia.org/
3.1
risque alpha
risque α
taux d’erreur de type I
niveau de significativité
taux de faux positifs
α
probabilité de rejeter l’hypothèse nulle d’un test statistique alors qu’en réalité l’hypothèse nulle est vraie
Note 1 à l'article: Dans le cadre des essais de différence (3.3) de produits (3.5), le risque α est la probabilité de conclure
à tort qu’une différence perceptible existe lorsqu’en réalité il n’en existe pas. Dans le cadre des essais de similitude
(3.8), le risque α est la probabilité de conclure à tort que les produits sont perceptiblement similaires lorsqu’en réalité
ils ne le sont pas.
3.2
risque bêta
risque β
taux d’erreur de type II
taux de faux négatifs
β
probabilité de ne pas rejeter l’hypothèse nulle d’un test statistique lorsqu’en réalité l’hypothèse nulle n’est
pas vraie
Note 1 à l'article: 1 – β est également appelé la puissance du test.
Note 2 à l'article: Dans le cadre des essais de différence (3.3) de produits (3.5), le risque β est la probabilité de ne
pas conclure qu’une différence perceptible existe lorsqu’en réalité les produits sont perceptiblement différents.
Dans le cadre des essais de similitude (3.8), le risque β est la probabilité de ne pas conclure que les produits sont
perceptiblement similaires lorsqu’en réalité ils le sont.
3.3
différence
situation dans laquelle les échantillons (3.6) peuvent être distingués sur la base de leurs propriétés
sensorielles
3.4
p
d
proportion d’évaluations au cours desquelles une différence perceptible (3.3) est détectée entre les deux
produits (3.5)
3.5
produit
matériau à évaluer
3.6
échantillon
unité de produit (3.5) préparée, présentée et évaluée au cours de l’essai
3.7
sensibilité
paramètres statistiques qui mesurent les caractéristiques de performance de l’analyse
Note 1 à l'article: En termes statistiques, la sensibilité de l’essai est définie par les valeurs de α, β et p (3.4) (ou δ).
d
3.8
similitude
situation dans laquelle les différences (3.3) perceptibles entre les échantillons (3.6) sont si petites que les
produits (3.5) peuvent être utilisés de manière interchangeable

3.9
δ thurstonien
δ
mesure de l’ampleur de la différence (3.3) sensorielle entre deux produits (3.5)
Note 1 à l'article: La différence perceptuelle vraie entre deux produits est notée δ. L’estimation de δ à partir des
données est notée d’ ("d prime").
Note 2 à l'article: Pour un protocole donné, toute valeur de δ est équivalente à une valeur p (3.4) de sorte qu’elles
d
[4][6]
peuvent être utilisées de manière interchangeable, mais la relation change avec le protocole d’essai.
3.10
triade
trois échantillons (3.6) fournis à un sujet au cours de l’essai duo-trio
Note 1 à l'article: Dans l’essai duo-trio, un échantillon est étiqueté comme référence, les deux autres portent des codes
différents. L’un des échantillons codés est le même produit (3.5) que la référence; l’autre échantillon codé est l’autre
produit de l’essai.
4 Principe
Le nombre de sujets est choisi en fonction de la sensibilité souhaitée pour l’essai (voir 6.2 et la discussion à
l’Article A.3).
Les sujets reçoivent un ensemble de trois échantillons (c’est-à-dire une triade), dont l’un est étiqueté comme
étant l’échantillon de référence et les deux autres portent des codes différents. Les deux échantillons codés
se composent d’un échantillon qui est le même produit que l’échantillon de référence étiqueté (c’est-à-dire
la référence cachée) et d’un échantillon qui est un produit différent de l’échantillon de référence étiqueté
(c’est-à-dire l’échantillon d’essai). L’ordre de présentation des échantillons codés est attribué aux sujets sur
la base de schémas équilibrés aléatoires (voir 7.1). Les sujets sont informés que l’un des échantillons codés
est identique à l’échantillon de référence et que l’autre est différent. Sur la base de leur entraînement et des
instructions données avant l’essai, les sujets identifient l’échantillon codé dont ils pensent qu’il est le même
que l’échantillon de référence, ou celui dont ils pensent qu’il diffère de l’échantillon de référence.
Le nombre de réponses correctes est compté et sa significativité déterminée par référence à une table
statistique ou à un programme ou à une application informatique applicable.
5 Conditions générales d’essai et exigences
5.1 Indiquer l’objectif de l’essai par écrit de manière claire.
5.2 Effectuer l’essai dans des conditions empêchant toute communication entre les sujets jusqu’à ce que
toutes les évaluations aient été terminées, en utilisant des installations et des cabines conformes à l’ISO 8589.
5.3 Préparer les échantillons à l’abri du regard des sujets et de manière identique (c’est-à-dire même
appareillage, mêmes récipients, mêmes quantités de produit).
5.4 Les sujets ne doivent pas être capables d’identifier les échantillons d’après la manière dont ils sont
présentés. Par exemple, lors d’un essai portant sur le goût, éviter toute différence d’aspect. Masquer toutes
les différences de couleur non pertinentes en utilisant des filtres à lumière et/ou une lumière tamisée.
5.5 Coder les échantillons d’essai de façon uniforme, en utilisant de préférence des nombres à trois chiffres,
choisis au hasard pour chaque essai. Chaque triade est composée de trois échantillons, un étiqueté comme
échantillon de référence et deux étiquetés avec des codes différents. De préférence, il convient d’utiliser des
codes différents pour chaque sujet au cours d’une session. Cependant, les deux mêmes codes peuvent être
utilisés pour tous les sujets au sein d’un essai, à condition que chaque code ne soit utilisé qu’une fois par
sujet au cours d’une session (par exemple, si plusieurs essais duo-trio portant sur le même produit ou sur
différents produits sont conduits au cours de la même session).

5.6 Il convient de présenter les échantillons dans les conditions dans lesquelles le produit est généralement
utilisé (par exemple, lors de la dégustation, présenter les échantillons à la température à laquelle le produit
est généralement consommé). Les conditions de présentation des trois échantillons de chaque triade doivent
être identiques, de même que celles de tous les autres échantillons d’une série d’essais effectués sur un type
donné de produit.
5.7 La taille, la quantité ou le volume présenté(e) doit être identique pour les trois échantillons de chaque
triade, de même que la taille, la quantité ou le volume de tous les autres échantillons d’une série d’essais
effectués sur un type donné de produit. La taille, la quantité ou le volume à évaluer peut être imposée. Sinon,
il convient cependant de spécifier aux sujets de prendre des tailles, des quantités ou des volumes toujours
similaires quel que soit l’échantillon.
5.8 Selon les produits et les objectifs de l’essai, une nouvelle dégustation (de la référence ou de tous les
échantillons) peut être acceptée. Les sujets doivent recevoir des instructions en conséquence.
5.9 Dans le cadre d’une dégustation, il doit être indiqué aux sujets s’ils doivent ou non avaler les
échantillons ou s’ils sont libres de procéder comme ils le veulent. Dans ce dernier cas, il doit leur être
demandé de procéder de la même manière pour tous les échantillons. En fonction des objectifs du projet et
des produits d’essai, des agents neutralisants appropriés peuvent être utilisés entre les essais individuels ou
même au cours de ceux-ci. Les sujets doivent recevoir des instructions en conséquence.
5.10 Pendant les sessions d’essai, éviter de donner des informations sur l’identité du produit, les effets
attendus du traitement ou les performances individuelles jusqu’à la fin de tous les essais.
6 Sujets
6.1 Qualification
Il convient que tous les sujets possèdent le même niveau de qualification et de formation et que ce niveau soit
choisi selon l’objectif de l’essai (voir l’ISO 8586 à titre de document d’orientation). L’expérience et l’habitude
du produit peuvent améliorer les performances d’un sujet et peuvent de ce fait augmenter les chances
d’aboutir à un résultat correct, ce qui augmentera alors la probabilité de trouver une différence significative
mais diminuera la probabilité de trouver une similitude significative. La mesure des performances des sujets
en fonction du temps peut se révéler utile pour suivre l’augmentation de la sensibilité.
Tous les sujets doivent bien connaître les mécanismes de l’essai duo-trio (c’est-à-dire le format, la tâche et le
mode opératoire d’évaluation).
6.2 Nombre de sujets
Choisir le nombre de sujets de manière à obtenir la sensibilité requise pour l’essai (voir la discussion à
l’Article A.3). L’utilisation de grands nombres de sujets accroît les chances de détecter de petites différences
entre les produits. Toutefois, dans la pratique, le nombre de sujets est souvent déterminé par des conditions
matérielles (par exemple, la durée de l’expérience, le nombre de sujets disponibles, la quantité de produit).
À titre d’exemples, dans le cas d’essais de différence de produits tout d’abord, où p = 0 % est posé pour
d
l’hypothèse nulle et pour une puissance souhaitée de 80 %, s’il est posé pour l’hypothèse alternative que le
vrai p = 30 %, alors un essai au niveau de significativité de 10 % nécessite 53 sujets. Un essai au niveau de
d
significativité de 5 % pour une plus petite valeur d’effet de p = 25 % nécessite 102 sujets.
d
Dans le cas d’essais de similitude à présent, où p = 0 % est posé pour l’hypothèse alternative et pour
d
une puissance souhaitée de 80 %, si la similitude est évaluée avec une marge d’équivalence de p = 30 %,
d
c’est-à-dire que p = 30 % est posé pour l’hypothèse nulle, alors un essai au niveau de significativité de
d
10 % nécessite 49 sujets. Un essai au niveau de significativité de 5 % avec une marge d’équivalence plus
conservatrice de p = 25 % nécessite 102 sujets.
d
Comme le montrent ces exemples, un essai de différence de produits à un risque α, un risque β et pour les
valeurs de p posées pour les hypothèses nulle et alternative nécessite un certain nombre de sujets qui
d
est quasi identique, et souvent identique, au nombre de sujets nécessaire à un essai d’équivalence avec ces
mêmes valeurs de paramètres, mais où les valeurs de p posées pour les hypothèses nulle et alternative ont
d
été inversées.
Éviter, autant que possible, les évaluations répétées par un même sujet. Cependant, si des évaluations
répétées sont nécessaires pour réaliser un nombre total d’évaluations suffisant, il convient de s’efforcer
que chaque sujet réalise le même nombre d’évaluations répétées. Par exemple, si seulement 12 sujets sont
disponibles, faire évaluer à chaque sujet 3 triades pour obtenir un nombre total de 36 évaluations.
NOTE Analyser 3 évaluations réalisées par 12 sujets comme 36 évaluations indépendantes n’est pas
statistiquement valide pour un essai de similitude en utilisant le Tableau A.2. En revanche, l’essai de différence en
[7][8]
utilisant le Tableau A.1 est statistiquement valide même lorsque des évaluations répétées sont réalisées. Des
publications récentes sur des essais de discrimination avec répétitions suggèrent des approches alternatives, basées
[5]
sur des modèles, pour analyser les évaluations répétées dans les essais de discrimination, ou pour analyser les
[10]
évaluations répétées dans les essais de discrimination visant à montrer la similitude.
7 Mode opératoire
7.1 Si les sujets connaissent bien le produit (par exemple un échantillon de contrôle de la ligne de
production), employer la technique de la référence constante (voir 7.2). Si aucun des deux produits ne leur
est plus familier l’un que l’autre, employer la technique de la référence équilibrée (voir 7.3).
7.2 Technique de la référence constante: avant l’essai, préparer des feuilles de protocole et des formulaires
de réponse (voir l’Article B.2), de manière à utiliser un nombre égal des deux jeux possibles de deux produits,
A et B:
A-REF     A     B  A-REF     B     A
Distribuer ces jeux au hasard par groupe de deux parmi les sujets (en d’autres termes, utiliser chaque jeu
une fois parmi les deux premiers sujets; utiliser chaque jeu une seconde fois parmi les deux sujets suivants,
etc.). Le fait de procéder ainsi réduit le déséquilibre survenant lorsque le nombre total de sujets n’est pas un
nombre pair.
7.3 Technique de la référence équilibrée: avant l’essai, préparer des feuilles de protocole et des formulaires
de réponse (voir l’Article B.1), de manière à utiliser un nombre égal des quatre jeux possibles de deux
produits, A et B:
A-REF    A     B  A-REF      B     A
B-REF    A     B  B-REF      B     A
où les deux premières triades comprennent le produit A comme échantillon de référence (c’est-à-dire A-REF)
et les deux dernières triades comprennent le produit B comme échantillon de référence (c’est-à-dire B-REF).
Distribuer ces jeux au hasard par groupe de quatre parmi les sujets (en d’autres termes, utiliser chaque
jeu une fois parmi le premier groupe de quatre sujets; utiliser chaque jeu une seconde fois parmi le groupe
de quatre sujets suivants, etc.). Procéder ainsi réduit le déséquilibre survenant lorsque le nombre total de
sujets n’est pas un multiple de quatre.
7.4 Présenter les trois échantillons de chaque triade simultanément si possible, en suivant la même
disposition spatiale pour chaque sujet (par exemple, en ligne devant toujours être examinée de gauche à
droite, en triangle). Au sein de la triade, les sujets sont généralement autorisés à faire des évaluations
répétées de chaque échantillon autant de fois qu’ils le désirent (si, bien sûr, la nature du produit permet des
évaluations répétées).
7.5 Demander aux sujets d’évaluer tout d’abord l’échantillon de référence, et ensuite d’évaluer les deux
échantillons codés dans l’ordre dans lequel ils leur ont été présentés. Informer les sujets que l’un des

échantillons codés est le même que l’échantillon de référence, et que l’autre est différent de l’échantillon de
référence. Demander aux sujets d’indiquer l’échantillon codé qui est le même que l’échantillon de référence,
ou bien l’échantillon codé qui diffère de l’échantillon de référence.
NOTE Quand on décide de demander aux sujets de sélectionner l’échantillon qui est le même que l’échantillon de
référence ou de sélectionner l’échantillon qui est différent de l’échantillon de référence, il y a lieu de se demander si le
jury utilise, ou non, systématiquement d’autres méthodes d’essais de discrimination. Un grand nombre de méthodes
d’essais de discrimination tels que l’essai triangulaire, par exemple, se concentrent sur l’identification de l’échantillon
"intrus" ou "différent". Le fait de demander aux sujets d’identifier l’échantillon "différent" dans une méthode et
d’identifier l’échantillon qui est "le même" dans une autre méthode peut être source de confusion et mener à de hauts
niveaux de réponses incorrectes.
7.6 Il convient que chaque formulaire de réponse ne concerne qu’une seule triade d’échantillons. Si un
sujet doit effectuer plusieurs essais au cours d’une session, collecter le formulaire de réponse complété et
les échantillons inutilisés avant de présenter la triade suivante. Le sujet ne doit pas revenir sur l’un des
échantillons des triades précédentes, ni modifier son verdict sur l’un des essais précédents.
7.7 Ne pas poser de questions sur la préférence, l’acceptabilité ou
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.

Loading comments...