ISO 8253-3:2012
(Main)Acoustics — Audiometric test methods — Part 3: Speech audiometry
Acoustics — Audiometric test methods — Part 3: Speech audiometry
ISO 8253-3:2012 specifies basic methods for speech recognition tests for audiological applications. In order to ensure minimum requirements of precision and comparability between different test procedures including speech recognition tests in different languages, ISO 8253-3:2012 specifies requirements for the composition, validation and evaluation of speech test materials, and the realization of speech recognition tests. ISO 8253-3:2012 does not specify the contents of the speech material because of the variety of languages. Furthermore, ISO 8253-3:2012 also specifies the determination of reference values and fulfilment requirements for the realization and manner of presentation. ISO 8253-3:2012 specifies procedures and requirements for speech audiometry with the recorded test material being presented by air conduction through an earphone, or from a loudspeaker for sound field audiometry. Methods for using noise either for masking the non-test ear or as a competing sound are described. Some test subjects, for example children, can require amended test procedures not specified in ISO 8253-3:2012. Specialized tests such as those used for evaluating directional hearing and dichotic hearing are outside the scope of ISO 8253-3:2012.
Acoustique — Méthodes d'essais audiométriques — Partie 3: Audiométrie vocale
General Information
Relations
Standards Content (Sample)
INTERNATIONAL ISO
STANDARD 8253-3
Second edition
2012-03-01
Acoustics — Audiometric test methods —
Part 3:
Speech audiometry
Acoustique — Méthodes d’essais audiométriques —
Partie 3: Audiométrie vocale
Reference number
ISO 8253-3:2012(E)
©
ISO 2012
---------------------- Page: 1 ----------------------
ISO 8253-3:2012(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2012
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or ISO’s
member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2012 – All rights reserved
---------------------- Page: 2 ----------------------
ISO 8253-3:2012(E)
Contents Page
Foreword . v
Introduction .vi
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Requirements for recording of speech material . 5
4.1 General requirements . 5
4.2 Reference recording . 5
4.3 Recording environment . 6
4.4 Frequency response of recording equipment . 6
4.5 Interval between successive test items . 6
4.6 Levels . 6
4.7 Signal-to-noise ratio . 6
4.8 Phonemic balance across test lists . 6
4.9 Perceptual balance across test lists . 7
5 Validation of speech material recordings . 7
5.1 General . 7
5.2 Determination of reference speech recognition curve . 7
5.3 Determination of perceptual equivalence of test lists . 8
5.4 Determination of repeatability of results (average test-retest reliability) . 8
5.5 Documentation . 9
6 Requirements for speech audiometry . 9
7 Ambient sound pressure levels in test room for speech audiometry . 9
8 Sound field speech audiometry . 9
9 Preparation and instruction of test subject .10
9.1 General .10
9.2 Preparation of test subject .10
9.3 Instruction of test subject .10
10 Subject’s response mode .10
11 Determination of speech detection threshold level . 11
12 Determination of speech recognition threshold level . 11
12.1 General . 11
12.2 Descending procedure using 5 dB steps .12
12.3 Alternative descending procedure .12
12.4 Adaptive procedure using fixed step sizes .13
12.5 Other adaptive procedure .14
13 Determination of speech recognition scores .14
14 Contralateral masking .14
15 Speech audiometry with competing sound .15
15.1 Type of competing sound .15
15.2 Presentation of competing sound .15
15.3 Speech and competing sound levels .15
15.4 Test procedure .15
16 Format of speech audiogram .17
17 Measurement uncertainty .17
18 Maintenance and calibration of equipment .18
18.1 General .18
© ISO 2012 – All rights reserved iii
---------------------- Page: 3 ----------------------
ISO 8253-3:2012(E)
18.2 Intervals between tests .18
18.3 Stage A: Routine checking and listening tests .18
18.4 Stage B: Periodic electroacoustic tests .19
18.5 Stage C: Basic calibration tests .19
Annex A (informative) Example of speech materials .20
Annex B (informative) Examples of competing sound conditions .21
Annex C (informative) Typical results .22
Annex D (informative) Optimization of perceptual balance of test lists .24
Annex E (informative) Measurement uncertainty .25
Bibliography .30
iv © ISO 2012 – All rights reserved
---------------------- Page: 4 ----------------------
ISO 8253-3:2012(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the International
Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 8253-3 was prepared by Technical Committee ISO/TC 43, Acoustics.
This second edition cancels and replaces the first edition (ISO 8253-3:1996), which has been technically revised.
ISO 8253 consists of the following parts, under the general title Acoustics — Audiometric test methods:
— Part 1: Pure-tone air and bone conduction threshold audiometry
— Part 2: Sound field audiometry with pure-tone and narrow-band test signals
— Part 3: Speech audiometry
© ISO 2012 – All rights reserved v
---------------------- Page: 5 ----------------------
ISO 8253-3:2012(E)
Introduction
Speech audiometry is used for the assessment of hearing in connection with diagnostic evaluation and
audiological rehabilitation.
The results of speech audiometry depend on the speech material and test method used. This part of ISO 8253
sets conditions for speech materials in order to assure minimum requirements of precision and comparability
between different tests using different speech materials including materials in different languages. It also
specifies procedures to be used when testing speech recognition.
vi © ISO 2012 – All rights reserved
---------------------- Page: 6 ----------------------
INTERNATIONAL STANDARD ISO 8253-3:2012(E)
Acoustics — Audiometric test methods —
Part 3:
Speech audiometry
1 Scope
This part of ISO 8253 specifies basic methods for speech recognition tests for audiological applications.
In order to ensure minimum requirements of precision and comparability between different test procedures
including speech recognition tests in different languages, this part of ISO 8253 specifies requirements for the
composition, validation and evaluation of speech test materials, and the realization of speech recognition tests.
This part of ISO 8253 does not specify the contents of the speech material because of the variety of languages.
Furthermore, this part of ISO 8253 also specifies the determination of reference values and fulfilment
requirements for the realization and manner of presentation.
This part of ISO 8253 specifies procedures and requirements for speech audiometry with the recorded
test material being presented by air conduction through an earphone, or from a loudspeaker for sound field
audiometry. Methods for using noise either for masking the non-test ear or as a competing sound are described.
Some test subjects, for example children, can require amended test procedures not specified in this part of ISO 8253.
Specialized tests such as those used for evaluating directional hearing and dichotic hearing are outside the
scope of this part of ISO 8253.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced document
(including any amendments) applies.
ISO 266, Acoustics — Preferred frequencies
ISO 8253-1, Acoustics — Audiometric test methods — Part 1: Pure-tone air and bone conduction audiometry
ISO 8253-2, Acoustics — Audiometric test methods — Part 2: Sound field audiometry with pure-tone and
narrow-band test signals
ISO/IEC Guide 98-3, Uncertainty of measurement — Part 3: Guide to the expression of uncertainty in
measurement (GUM:1995)
IEC 60645-1, Electroacoustics — Audiological equipment — Part 1: Pure-tone audiometers
IEC 60645-2:1993, Audiometers — Part 2: Equipment for speech audiometry
IEC 61672-1, Electroacoustics — Sound level meters — Part 1: Specifications
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 8253-1 and ISO 8253-2 and the
following apply.
© ISO 2012 – All rights reserved 1
---------------------- Page: 7 ----------------------
ISO 8253-3:2012(E)
3.1
speech signal
acoustic signal which carries information in a given language
NOTE A speech signal may be a voice signal or an acoustic signal simulating a voice signal.
3.2
test item
particular monosyllabic or polysyllabic word or logatom, or sentence, or time-limited segment of connected
speech, used in accordance with defined rules of presentation and scoring in a speech audiometric procedure
NOTE Scoring may be based on a complete test item or parts thereof being correctly recognized.
3.3
speech material
entire set of test items which is used for speech recognition tests
NOTE Usually the speech material is subdivided into several test lists.
3.4
open-set test material
set of test items in which the number of alternative responses to each test item is unlimited
3.5
closed-set test material
set of test items in which the number of alternative responses to each test item is limited
3.6
phoneme
smallest recognizable unit of speech in a given natural language
3.7
phoneme class
subdivision of phonemes that show characteristic similarities in vocal production mode as well as in acoustical
signal properties
3.8
syllable
segment of speech which consists of a vowel with or without one or more accompanying consonants immediately
preceding or following
3.9
spondee
two-syllable word with equal stress on each syllable
3.10
logatom
syllabic unit that has no verbal meaning to the listener
NOTE A logatom is sometimes called a “nonsense syllable”.
3.11
test list
number of selected test items, presented and scored as a single unit
3.12
set of test items
selected number of test items from a test list
2 © ISO 2012 – All rights reserved
---------------------- Page: 8 ----------------------
ISO 8253-3:2012(E)
3.13
phonemically balanced test list
test list which contains approximately the same proportions of the various phonemes as are present in typical
speech communication within a given language
3.14
perceptually balanced test list
test list which yield equivalent speech recognition score with minimized variance at a specified speech level
under equivalent conditions (specified manner of presentation and specified group of listeners)
NOTE Usually the specified group of listeners consists of otologically normal persons with an age from 18 years to
25 years inclusive. For special tests, different groups (e.g. otologically normal children within a specified age range) may
be used as well.
3.15
carrier phrase
sentence or phrase in which a test item is embedded such that the correct recognition of the test item is not
dependent upon the context or meaning of the sentence or phrase
3.16
reference recording of speech material
master recording
well-defined recording that represents the speech material and that is used for validation and application of the
speech material
3.17
speech level
equivalent continuous sound pressure level of the speech material as measured in an appropriate coupler, ear
simulator or in a sound field, with frequency weighting C according to IEC 61672-1
NOTE For speech test lists based on single test items separated by silent intervals, the integration does not include
these intervals. For test lists based on single test items with a carrier phrase, the integration includes the test items only. In
a digital recording, the silent intervals can be removed by editing. Numerical correction may also be made by determination
of the total duration of the test items and the total duration of the silent intervals.
3.18
equivalent continuous sound pressure level
L
p,eqT
ten times the logarithm to the base 10 of the ratio of the time average of the square of the sound pressure, p,
during a stated time interval of duration, T (starting at t and ending at t ), to the square of a reference value,
1 2
p , expressed in decibels
0
t
2
1
2
pt()dt
∫
T
t
1
L =10 lg dB
pT,eq
2
p
0
where the reference value, p , is 20 µPa
0
2
NOTE Because of practical limitations of the measuring instruments, p is always understood to denote the square
of a frequency-weighted and frequency-band-limited sound pressure. If a specific frequency weighting as specified in
IEC 61672-1 and/or specific frequency bands are applied, this should be indicated by appropriate subscripts; e.g. L
p,A,10 s
denotes the A-weighted time-averaged sound pressure level over 10 s.
[3]
[ISO/TR 25417 , 2.3]
3.19
speech detection threshold level
for a given test subject, for specified speech material and a specified manner of signal presentation, the speech
level at which it is detected (not necessarily understood) in 50 % of the trials
© ISO 2012 – All rights reserved 3
---------------------- Page: 9 ----------------------
ISO 8253-3:2012(E)
3.20
speech recognition score
for a given test subject, for specified speech material, a specified manner of signal presentation and at a
specified speech level, the percentage of correctly recognized test items or scorable items if the scoring
method is not based on whole test items
3.21
maximum speech recognition score
for a given test subject, for specified speech material and a specified manner of signal presentation, the
maximum speech recognition score obtained regardless of speech level
3.22
speech recognition threshold level
for a given test subject, for specified speech material and a specified manner of signal presentation, the lowest
speech level or speech-to-noise ratio at which the speech recognition score is equal to 50 %
NOTE Speech recognition threshold has been called “speech reception threshold”.
3.23
reference speech recognition threshold level
for specified speech material and a specified manner of signal presentation, the median value of the speech
recognition threshold levels of a sufficiently large number of otologically normal persons, of both sexes, between
18 years and 25 years inclusive for whom the test material is appropriate
3.24
optimum speech level
for a given test subject, for specified speech material and a specified manner of signal presentation, the speech
level or range of speech levels at which maximum speech recognition score is obtained
3.25
half-optimum speech level
for a given test subject, for specified speech material and a specified manner of signal presentation, the speech
level at which half of the maximum speech recognition score is obtained
3.26
speech recognition curve
for a given test subject, for specified speech material and a specified manner of signal presentation, a curve
that describes the speech recognition score as a function of speech level
3.27
reference speech recognition curve
for specified speech material and a specified manner of presentation, a curve that describes the median speech
recognition score as a function of speech level for a sufficiently large number of otologically normal persons of
both sexes, aged between 18 years and 25 years inclusive and for whom the test material is appropriate
3.28
hearing level for speech
for specified speech material and a specified manner of signal presentation, the speech level minus the
appropriate reference speech recognition threshold level
3.29
competing sound
additional sound that is presented during speech recognition tests
3.30
competing sound pressure level
equivalent continuous sound pressure level of a competing sound as measured in an appropriate coupler, ear
simulator or in a sound field, with frequency weighting C according to IEC 61672-1
4 © ISO 2012 – All rights reserved
---------------------- Page: 10 ----------------------
ISO 8253-3:2012(E)
3.31
speech-to-noise level difference
speech-to-noise ratio
SNR
difference between the speech level and the competing sound level
3.32
effective masking level for speech
level of a specified masking sound which is numerically equal to that hearing level for speech to which the
speech recognition threshold level for a specified speech signal would be raised by the presence of that
masking sound
3.33
most comfortable level for speech
for a given test subject and a specified manner of presentation, the speech level at which the loudness of the
speech signal is judged by the test subject to be the most comfortable
3.34
connected speech
running speech
continuous speech with natural intonation, consisting of consecutive sentences with logical connections
4 Requirements for recording of speech material
4.1 General requirements
Each copy of the recording shall contain the following signals:
a) the speech material;
b) a signal for the calibration of the equipment for speech audiometry, of a duration not less than 60 s; the
calibration signal shall be a weighted random noise, e.g. as specified in IEC 60645-2:1993, 13.1, a band
of noise centred at 1 kHz and having a bandwidth of one-third octave, or a frequency-modulated tone at
1 kHz having a bandwidth of at least one-third octave — the modulating signal shall be either sinusoidal or
triangular with a repetition rate in the range from 4 Hz to 20 Hz;
c) signals for testing the frequency response of the equipment to be used for speech audiometry including
the playback equipment and the recording — such signals shall have a duration of not less than 15 s and
consist of one-third-octave bands of white noise centred at the preferred one-third-octave frequencies in
accordance with ISO 266 in the frequency range 125 Hz to 8 000 Hz.
NOTE For speech material based on other time and/or frequency weightings than C-weighted equivalent sound
pressure level, correction factors can be determined describing the difference related to C-weighted equivalent sound
pressure level for speech level, calibration signal level and competing noise level.
4.2 Reference recording
A suitable speaker, either male or female, should have a normal and clear articulation without pronounced
dialect. The speaker should be instructed to maintain clarity, natural pace, and vocal effort and avoid emphasis
on key words.
A reference recording mainly consists of the elements specified in 4.1. The reference recording shall not be
modified. All copies shall be made from the reference recording. Any changes of the reference recording (e.g.
a new recording or changes of levels or frequency content) require a new validation (see Clause 5).
For speech audiometry intended to be performed in noise the reference recording shall also include the
associated competing noise or noises, either on the same or on separate channels.
© ISO 2012 – All rights reserved 5
---------------------- Page: 11 ----------------------
ISO 8253-3:2012(E)
4.3 Recording environment
The room in which the speech is recorded shall be sufficiently quiet to provide a signal-to-noise ratio of at least
40 dB and shall have a reverberation time of less than 0,5 s at any frequency in the range from 125 Hz to 8 000 Hz.
4.4 Frequency response of recording equipment
The frequency response of the recording equipment including the microphone used shall be flat within 2 dB in
the frequency range from 125 Hz to 8 000 Hz.
NOTE The quality of the recording and negligible loss of quality after repeated use make digital recordings superior.
4.5 Interval between successive test items
The intervals between the successive test items of the recording should be specified and constant within ±10 %.
For single test words, an interval of not less than 4 s is suggested.
4.6 Levels
4.6.1 Speech material
The average reference speech recognition threshold level of the smallest set of test items to be used at a
predetermined sound pressure level shall not deviate by more than ±1 dB from the average of all test items
within the list. The reference speech recognition threshold level of any single test item shall not deviate by
more than ±3 dB from the average reference speech recognition threshold level of all test items of the list.
The average speech recognition threshold level of test lists shall not differ from the average reference speech
recognition threshold level of all test items recorded by more than ±1 dB, see Annex D.
4.6.2 Calibration signal
The level of the calibration signal shall not deviate by more than ±0,5 dB from the average speech level of all
test items of the specific speech material. The level of the calibration signal shall be measured using the same
frequency weighting as when measuring the speech level.
4.7 Signal-to-noise ratio
The level of any inherent background noise on the recording shall be at least 40 dB below the level of the
calibration signal in accordance with 4.6.2 as measured using the same frequency weighting as when measuring
the speech level.
4.8 Phonemic balance across test lists
All test lists of a specific speech material shall be phonemically balanced.
In some cases, it may not be possible to achieve perfect phonemic balance. In such cases, the test lists shall
be phonemically balanced based on phoneme classes, i.e. voiced and unvoiced plosives and fricatives, nasals,
long and short vowels.
The distribution of phonemes of the speech material should approximate the phoneme distribution of the
test language as closely as possible. Speech materials consisting of a large amount of items allow a closer
approximation than smaller speech materials. In some cases, the possibility of achieving a close approximation
to the phoneme distribution is limited, e.g. in screening tests or tests for children, because the speech material
has to be limited to a relatively small number of test items.
6 © ISO 2012 – All rights reserved
---------------------- Page: 12 ----------------------
ISO 8253-3:2012(E)
4.9 Perceptual balance across test lists
All test lists of a specific speech material shall be perceptually balanced, i.e. the result of the speech recognition
test shall be independent of the choice of test list.
Perceptually balanced test lists shall fulfil the requirements given in 4.6.1. Additional requirements for
perceptually balanced test lists are given in the following.
The speech recognition curves for all test lists shall have been determined in such a way that the speech
recognition threshold level can be determined with an expanded uncertainty not exceeding 1 dB (the width
of the 95 % confidence interval shall not exceed 2 dB); see Annex E. To achieve this, speech recognition
measurements at different presentation levels (or speech-to-noise ratios in case of a speech recognition test
in noise) shall be performed with at least 10 otologically normal persons whose native language is the same
as the language of the speech material. The speech recognition measurements shall be performed within
the normal context of the speech stimulus (e.g. presentation of sentences when using a sentence test). The
speech recognition of each particular test item shall then be scored and analysed independently (e.g. scoring
of particular words of the sentences).
In order to achieve a
...
NORME ISO
INTERNATIONALE 8253-3
Deuxième édition
2012-03-01
Acoustique — Méthodes d’essais
audiométriques —
Partie 3:
Audiométrie vocale
Acoustics — Audiometric test methods —
Part 3: Speech audiometry
Numéro de référence
ISO 8253-3:2012(F)
©
ISO 2012
---------------------- Page: 1 ----------------------
ISO 8253-3:2012(F)
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2012
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être reproduite ni utilisée sous
quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l’accord écrit
de l’ISO à l’adresse ci-après ou du comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Publié en Suisse
ii © ISO 2012 – Tous droits réservés
---------------------- Page: 2 ----------------------
ISO 8253-3:2012(F)
Sommaire Page
Avant-propos . v
Introduction .vi
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 2
4 Exigences relatives à l’enregistrement d’un message vocal . 5
4.1 Exigences générales . 5
4.2 Enregistrement de référence . 6
4.3 Environnement d’enregistrement . 6
4.4 Réponse en fréquence du matériel d’enregistrement . 6
4.5 Intervalle séparant les items successifs . 6
4.6 Niveaux . 6
4.7 Rapport signal/bruit . 6
4.8 Listes d’items phonémiquement équilibrées . 7
4.9 Listes d’items perceptuellement équilibrées . 7
5 Validation des enregistrements des messages vocaux . 7
5.1 Généralités . 7
5.2 Détermination de la courbe d’intelligibilité vocale de référence . 7
5.3 Détermination de l’équivalence perceptuelle des listes d’items . 8
5.4 Détermination de la répétabilité des résultats [fiabilité moyenne «test-retest» (essai/contre-
essai)] . 9
5.5 Documentation . 9
6 Exigences relatives à l’audiométrie vocale .10
7 Niveaux de pression acoustique du bruit ambiant dans la salle d’essai d’audiométrie vocale .10
8 Audiométrie vocale en champ acoustique .10
9 Préparation et instruction du sujet .10
9.1 Généralités .10
9.2 Préparation du sujet .10
9.3 Instruction du sujet . 11
10 Mode de réponse du sujet . 11
11 Détermination du niveau liminaire de perception vocale . 11
12 Détermination du niveau liminaire d’intelligibilité vocale .12
12.1 Généralités .12
12.2 Mode opératoire de la méthode descendante de 5 dB en 5 dB .12
12.3 Mode opératoire de la méthode descendante alternative .13
12.4 Mode opératoire adaptatif à valeur de pas fixe .13
12.5 Autre mode opératoire adaptatif .14
13 Détermination des scores de reconnaissance vocale .14
14 Masquage controlatéral .15
15 Audiométrie vocale en présence d’un bruit de fond .16
15.1 Nature du bruit de fond .16
15.2 Présentation du bruit de fond .16
15.3 Niveaux sonores des signaux vocaux et du bruit de fond .16
15.4 Mode opératoire d’essai .16
16 Présentation de l’audiogramme vocal .18
17 Incertitude de mesure .18
18 Entretien et étalonnage de la chaîne audiométrique .19
© ISO 2012 – Tous droits réservés iii
---------------------- Page: 3 ----------------------
ISO 8253-3:2012(F)
18.1 Généralités .19
18.2 Intervalles entre les contrôles .19
18.3 Type A: contrôles de routine et essais d’écoute .19
18.4 Type B: contrôles électroacoustiques périodiques .20
18.5 Type C: contrôles d’étalonnage de base .20
Annexe A (informative) Exemple de messages vocaux .21
Annexe B (informative) Exemples de conditions de bruit de fond .22
Annexe C (informative) Résultats caractéristiques .23
Annexe D (informative) Optimisation de l’équilibre perceptuel des listes d’items .26
Annexe E (informative) Incertitude de mesure .27
Bibliographie .32
iv © ISO 2012 – Tous droits réservés
---------------------- Page: 4 ----------------------
ISO 8253-3:2012(F)
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes nationaux de
normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est en général confiée aux
comités techniques de l’ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du comité
technique créé à cet effet. Les organisations internationales, gouvernementales et non gouvernementales,
en liaison avec l’ISO participent également aux travaux. L’ISO collabore étroitement avec la Commission
électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI, Partie 2.
La tâche principale des comités techniques est d’élaborer les Normes internationales. Les projets de Normes
internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur publication
comme Normes internationales requiert l’approbation de 75 % au moins des comités membres votants.
L’attention est appelée sur le fait que certains des éléments du présent document peuvent faire l’objet de droits
de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable de ne pas avoir
identifié de tels droits de propriété et averti de leur existence.
L’ISO 8253-3 a été élaborée par le comité technique ISO/TC 43, Acoustique.
Cette deuxième édition annule et remplace la première édition (ISO 8253-3:1996), qui a fait l’objet d’une
révision technique.
L’ISO 8253 comprend les parties suivantes, présentées sous le titre général Acoustique — Méthodes d’essais
audiométriques:
— Partie 1: Audiométrie à sons purs en conduction aérienne et en conduction osseuse
— Partie 2: Audiométrie en champ acoustique avec des sons purs et des bruits à bande étroite comme
signaux d’essai
— Partie 3: Audiométrie vocale
© ISO 2012 – Tous droits réservés v
---------------------- Page: 5 ----------------------
ISO 8253-3:2012(F)
Introduction
L’audiométrie vocale est utilisée pour l’évaluation de l’audition dans le cadre du diagnostic et de la réhabilitation
audiologique.
Les résultats de l’audiométrie vocale dépendent des messages vocaux et de la méthode d’essai utilisés. La
présente partie de l’ISO 8253 définit les conditions concernant les messages vocaux utilisés afin d’assurer
l’existence d’exigences minimales de précision et de comparabilité entre différents essais utilisant différents
messages vocaux, y compris des messages vocaux dans différentes langues. Elle spécifie également les
modes opératoires à utiliser lors des essais de reconnaissance vocale.
vi © ISO 2012 – Tous droits réservés
---------------------- Page: 6 ----------------------
NORME INTERNATIONALE ISO 8253-3:2012(F)
Acoustique — Méthodes d’essais audiométriques —
Partie 3:
Audiométrie vocale
1 Domaine d’application
La présente partie de l’ISO 8253 spécifie les méthodes fondamentales d’essais de reconnaissance vocale
pour les applications audiologiques.
Afin d’assurer l’existence d’exigences minimales de précision et de comparabilité entre différents modes
opératoires d’essai, y compris pour des essais de reconnaissance vocale dans différentes langues, la présente
partie de l’ISO 8253 spécifie les exigences relatives à la composition, à la validation et à l’évaluation des
messages vocaux et à la réalisation des essais de reconnaissance vocale. La présente partie de l’ISO 8253
ne spécifie pas le contenu des messages vocaux, en raison de la multiplicité des langues.
De plus, la présente partie de l’ISO 8253 spécifie également la détermination de valeurs de référence et les
exigences à remplir pour ce faire, ainsi que le mode de présentation.
La présente partie de l’ISO 8253 spécifie les modes opératoires et les exigences applicables à l’audiométrie
vocale, la présentation des messages vocaux enregistrés s’effectuant par conduction aérienne au moyen d’un
écouteur ou en champ acoustique à l’aide d’un haut-parleur. Elle décrit des méthodes d’utilisation de bruits, soit
comme bruits de masquage appliqués à l’oreille non testée, soit comme bruits de fond.
Pour certains sujets, par exemple les enfants, il peut être nécessaire de recourir à des modes opératoires
d’essai modifiés, qui ne sont pas spécifiés dans la présente partie de l’ISO 8253.
La présente partie de l’ISO 8253 ne traite pas des essais spécialisés tels que ceux qui servent à évaluer
l’audition directionnelle et l’audition dichotique.
2 Références normatives
Les documents de référence suivants sont indispensables pour l’application du présent document. Pour les
références datées, seule l’édition citée s’applique. Pour les références non datées, la dernière édition du
document de référence s’applique (y compris les éventuels amendements).
ISO 266, Acoustique — Fréquences normales
ISO 8253-1, Acoustique — Méthodes d´essais audiométriques — Partie 1: Audiométrie à sons purs en
conduction aérienne et en conduction osseuse
ISO 8253-2, Acoustique — Méthodes d’essais audiométriques — Partie 2: Audiométrie en champ acoustique
avec des sons purs et des bruits à bande étroite comme signaux d’essai
Guide ISO/CEI 98-3, Incertitude de mesure — Partie 3: Guide pour l’expression de l’incertitude de mesure
(GUM:1995)
CEI 60645-1, Électroacoustique — Appareils d’audiologie — Partie 1: Audiomètres tonaux
CEI 60645-2:1993, Audiomètres — Partie 2: Appareils pour l’audiométrie vocale
CEI 61672-1, Électroacoustique — Sonomètres — Partie 1: Spécifications
© ISO 2012 – Tous droits réservés 1
---------------------- Page: 7 ----------------------
ISO 8253-3:2012(F)
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions donnés dans l’ISO 8253-1 et dans l’ISO 8253-2
ainsi que les suivants s’appliquent.
3.1
signal vocal
signal acoustique porteur d’information dans une langue donnée
NOTE Un signal vocal peut être un signal de voix ou un signal acoustique simulant un signal de voix.
3.2
item
mot ou logatome monosyllabique ou polysyllabique particulier, ou phrase, ou fragment de parole enchaînée
limité dans le temps, utilisé lors d’un essai d’audiométrie vocale selon des règles définies de présentation et
de comptabilisation
NOTE La comptabilisation peut être basée sur un item complet ou des parties d’item correctement identifiées.
3.3
message vocal
série complète d’items utilisée pour des essais de reconnaissance vocale
NOTE Le message vocal est normalement subdivisé en plusieurs listes d’items.
3.4
message vocal ouvert
série d’items dans laquelle le nombre de réponses alternatives pour chaque item est illimité
3.5
message vocal fermé
série d’items dans laquelle le nombre de réponses alternatives pour chaque item est limité
3.6
phonème
plus petite unité sonore identifiable dans une langue naturelle donnée
3.7
classe de phonèmes
sous-groupe de phonèmes présentant de fortes similitudes du point de vue du mode de production vocale et
des propriétés des signaux acoustiques
3.8
syllabe
segment de parole constitué d’une voyelle, accompagnée ou non d’une ou plusieurs consonnes la précédant
ou la suivant immédiatement
3.9
spondée
mot composé de deux syllabes également accentuées
3.10
logatome
unité syllabique n’ayant pas de signification pour l’auditeur
NOTE Un logatome est parfois appelé «syllabe vide de sens».
3.11
liste d’items
groupe d’items sélectionnés, présenté et comptabilisé comme un essai élémentaire
2 © ISO 2012 – Tous droits réservés
---------------------- Page: 8 ----------------------
ISO 8253-3:2012(F)
3.12
série d’items
groupe d’items sélectionné dans une liste d’items
3.13
liste d’items phonémiquement équilibrée
liste d’items contenant les différents phonèmes en proportion sensiblement égale à celle dans laquelle ils sont
présents dans une conversation type dans une langue donnée
3.14
liste d’items perceptuellement équilibrée
liste d’items fournissant des résultats équivalents en termes de reconnaissance vocale, avec une variance très
réduite, pour un niveau vocal spécifié et dans des conditions équivalentes (mode de présentation spécifié et
groupe d’auditeurs spécifié)
NOTE Le groupe d’auditeurs spécifié est habituellement composé de sujets otologiquement normaux âgés de 18 ans
à 25 ans inclus. Pour les essais spéciaux, il est admis d’avoir recours également à des groupes différents (par exemple
des enfants otologiquement normaux appartenant à un groupe d’âge spécifié).
3.15
phrase porteuse
phrase ou segment de phrase contenant un item dont la reconnaissance correcte est indépendante du contexte
ou de la signification de la phrase ou du segment de phrase
3.16
enregistrement de référence d’un message vocal
enregistrement maître
enregistrement parfaitement défini qui représente le message vocal et qui sert à sa validation et à son application
3.17
niveau vocal
niveau de pression acoustique continu équivalent du message vocal, mesuré dans un coupleur ou un simulateur
d’oreille approprié ou dans un champ acoustique en utilisant la pondération fréquentielle C selon la CEI 61672-1
NOTE Pour les listes d’items vocaux basées sur des items isolés séparés par des intervalles de silence, l’intégration
ne comprend pas les intervalles en question. Pour les listes d’items basées sur des items isolés comportant une phrase
porteuse, l’intégration comprend uniquement les items. Dans un enregistrement numérique, les intervalles de silence
peuvent être supprimés lors de la lecture. On peut également procéder à une correction numérique en déterminant la
durée totale des items et la durée totale des intervalles de silence.
3.18
niveau de pression acoustique continu équivalent
L
p,eqT
dix fois le logarithme décimal du rapport de la moyenne temporelle du carré de la pression acoustique, p,
pendant un intervalle de temps spécifié de durée T (commençant à t et se terminant à t ), au carré d’une
1 2
valeur de référence, p , exprimé en décibels
0
t
2
1
2
pt dt
()
∫
T
t
1
L =10lg dB
pT,eq
2
p
0
où la valeur de référence, p , est 20 µPa
0
© ISO 2012 – Tous droits réservés 3
---------------------- Page: 9 ----------------------
ISO 8253-3:2012(F)
2
NOTE En raison des limites pratiques imposées par les instruments de mesure, on considère toujours que p désigne
le carré d’une pression acoustique pondérée en fréquence et à bande de fréquences limitée. Il convient d’indiquer, le cas
échéant, l’application d’une pondération fréquentielle spécifique, telle que spécifiée dans la CEI 61672-1, et/ou l’utilisation
de bandes de fréquence spécifiques en utilisant des indices appropriés; par exemple, L désigne le niveau de
p,A,10 s
pression acoustique moyenné dans le temps et à pondération A pendant 10 s.
[3]
[ISO/TR 25417 , 2.3]
3.19
niveau liminaire de perception vocale
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, niveau vocal auquel
le message vocal est perçu (mais pas forcément compris) dans 50 % des essais
3.20
score de reconnaissance vocale
pour un sujet donné et pour un signal vocal, un mode de présentation du signal et un niveau vocal spécifiés,
pourcentage d’items correctement reconnus ou d’items susceptibles d’être comptabilisés si la méthode de
comptabilisation n’est pas basée sur l’ensemble des items
3.21
score maximal de reconnaissance vocale
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, valeur maximale
du score de reconnaissance vocale obtenue indépendamment du niveau vocal
3.22
niveau liminaire d’intelligibilité vocale
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, niveau vocal ou
rapport parole/bruit le plus faible pour lequel le score de reconnaissance vocale est égal à 50 %
NOTE Le niveau d’intelligibilité vocale était autrefois dénommé «seuil de réception vocale».
3.23
niveau liminaire d’intelligibilité vocale de référence
pour un signal vocal et un mode de présentation du signal spécifiés, valeur médiane des niveaux liminaires
d’intelligibilité vocale d’un nombre suffisamment grand de sujets otologiquement normaux des deux sexes,
âgés de 18 ans à 25 ans inclus, pour lesquels les messages vocaux utilisés sont appropriés
3.24
niveau vocal optimal
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, niveau vocal ou
gamme de niveaux vocaux auxquels le score maximal de reconnaissance vocale est obtenu
3.25
niveau vocal demi-optimal
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, niveau vocal auquel
la moitié du score maximal de reconnaissance vocale est obtenue
3.26
courbe d’intelligibilité vocale
pour un sujet donné et pour un signal vocal et un mode de présentation spécifiés, courbe de variation du score
de reconnaissance vocale en fonction du niveau vocal
3.27
courbe d’intelligibilité vocale de référence
pour un signal vocal et un mode de présentation du signal spécifiés, courbe de variation, en fonction du niveau vocal,
du score de reconnaissance vocale médian d’un nombre suffisamment élevé de sujets otologiquement normaux
des deux sexes, âgés de 18 ans à 25 ans inclus, pour lesquels les messages vocaux utilisés sont appropriés
4 © ISO 2012 – Tous droits réservés
---------------------- Page: 10 ----------------------
ISO 8253-3:2012(F)
3.28
niveau d’audition de la parole
pour un signal vocal et un mode de présentation du signal spécifiés, différence entre le niveau vocal et le
niveau liminaire d’intelligibilité vocale de référence approprié
3.29
bruit de fond
son supplémentaire présenté au cours des essais de reconnaissance vocale
3.30
niveau de pression acoustique du bruit de fond
niveau de pression acoustique continu équivalent d’un bruit de fond, mesuré dans un coupleur ou un simulateur
d’oreille approprié ou dans un champ acoustique en utilisant la pondération fréquentielle C selon la CEI 61672-1
3.31
différence de niveau parole/bruit
rapport parole/bruit
RPB
différence entre le niveau vocal et le niveau de bruit de fond
3.32
niveau de masquage effectif de la parole
niveau d’un son masquant spécifié, numériquement égal au niveau d’audition de la parole auquel s’élèverait
le niveau liminaire d’intelligibilité vocale pour un signal vocal donné du fait de la présence du son masquant
3.33
niveau de confort optimal pour la parole
pour un sujet donné et un mode de présentation du signal spécifié, niveau vocal auquel la sonie du signal vocal
est considérée par le sujet comme correspondant au niveau de confort optimal
3.34
parole enchaînée
paroles enchaînées
message émis en continu avec une intonation naturelle, composé de phrases consécutives reliées par des
connexions logiques
4 Exigences relatives à l’enregistrement d’un message vocal
4.1 Exigences générales
Chaque copie de l’enregistrement doit contenir les signaux suivants:
a) le message vocal;
b) un signal d’étalonnage de l’audiomètre vocal, de durée supérieure ou égale à 60 s; ce signal doit être
constitué par un bruit aléatoire pondéré, par exemple tel que spécifié dans la CEI 60645-2:1993, 13.1,
une bande de bruit d’un tiers d’octave centrée sur 1 kHz ou un son modulé en fréquence à 1 kHz ayant
une largeur de bande d’au moins un tiers d’octave; le signal de modulation doit être soit sinusoïdal, soit
triangulaire, avec un taux de répétition compris dans la gamme entre 4 Hz et 20 Hz;
c) des signaux permettant de contrôler la réponse en fréquence de l’audiomètre devant être utilisé, y compris
le matériel de lecture et l’enregistrement; ces signaux doivent avoir une durée supérieure ou égale à 15 s
et se composer de bandes de bruit blanc d’un tiers d’octave centrées sur les fréquences de tiers d’octave
recommandées selon l’ISO 266 pour la gamme de fréquences comprise entre 125 Hz et 8 000 Hz.
NOTE Pour les messages vocaux auxquels sont appliquées d’autres pondérations temporelles et/ou fréquentielles
que le niveau de pression acoustique équivalent pondéré C, il est admis de déterminer des facteurs de correction rendant
compte des différences de niveau vocal, de niveau du signal d’étalonnage et de niveau du bruit de fond liées au niveau de
pression acoustique équivalent pondéré C.
© ISO 2012 – Tous droits réservés 5
---------------------- Page: 11 ----------------------
ISO 8253-3:2012(F)
4.2 Enregistrement de référence
Il convient que le locuteur ou la locutrice prononce le message vocal de façon naturelle, en articulant
distinctement et sans accent prononcé. Il convient d’inviter le locuteur ou la locutrice à parler distinctement, à
un rythme normal, en fournissant un effort vocal constant et sans insister sur les mots clés.
Un enregistrement de référence se compose principalement des éléments spécifiés en 4.1. L’enregistrement
de référence ne doit pas être modifié. Toutes les copies doivent être réalisées à partir de l’enregistrement de
référence. Toute modification de l’enregistrement de référence (par exemple un nouvel enregistrement ou des
changements de niveau ou de contenu fréquentiel) nécessite une nouvelle validation (voir Article 5).
Pour l’audiométrie vocale destinée à être réalisée dans le bruit, l’enregistrement de référence doit inclure
également le ou les bruits de fond associés, sur les mêmes canaux ou sur des canaux séparés.
4.3 Environnement d’enregistrement
La salle dans laquelle le message est enregistré doit être suffisamment silencieuse pour permettre l’obtention
d’un rapport signal/bruit d’au moins 40 dB et doit avoir une durée de réverbération inférieure à 0,5 s pour toute
fréquence située dans la gamme comprise entre 125 Hz et 8 000 Hz.
4.4 Réponse en fréquence du matériel d’enregistrement
La réponse en fréquence du matériel d’enregistrement utilisé, microphone compris, doit être plate, à 2 dB, dans
la gamme de fréquences comprise entre 125 Hz et 8 000 Hz.
NOTE Les enregistrements numériques présentent le double avantage d’être de meilleure qualité et de subir une
baisse de qualité négligeable après de multiples utilisations.
4.5 Intervalle séparant les items successifs
Il convient que l’intervalle séparant les items successifs de l’enregistrement soit fixé et constant, à ±10 %.
Pour les mots isolés, il est suggéré de prendre un intervalle au moins égal à 4 s.
4.6 Niveaux
4.6.1 Message vocal
Le niveau liminaire d’intelligibilité vocale de référence moyen de la plus petite série d’items à utiliser à un niveau
de pression acoustique prédéterminé ne doit pas différer de plus de ±1 dB du niveau moyen de l’ensemble des
items de la liste. Le niveau liminaire d’intelligibilité vocale de référence de n’importe quel item individuel ne doit
pas différer de plus de ±3 dB du niveau liminaire d’intelligibilité vocale de référence moyen de l’ensemble des
items de la liste. Le niveau liminaire d’intelligibilité vocale moyen des listes d’items ne doit pas différer de ±1 dB du
niveau liminaire d’intelligibilité vocale de référence moyen de l’ensemble des items enregistrés (voir Annexe D).
4.6.2 Signal d’étalonnage
Le niveau du signal d’étalonnage ne doit pas différer de plus de ±0,5 dB du niveau vocal moyen de l’ensemble
des items du message vocal spécifique. Le niveau du signal d’étalonnage doit être mesuré en utilisant les
mêmes pondérations fréquentielles que lors du mesurage du niveau vocal.
4.7 Rapport signal/bruit
Le niveau de tout bruit de fond présent dans l’enregistrement doit être inférieur d’au moins 40 dB au niveau
du signal d’étalonnage prescrit en 4.6.2 lorsque le mesurage a été effectué en utilisant la même pondération
fréquentielle que lors du mesurage du niveau vocal.
6 © ISO 2012 – Tous droits réservés
---------------------- Page: 12 ----------------------
ISO 8253-3:2012(F)
4.8 Listes d’items phonémiquement équilibrées
Toutes les listes d’items d’un message vocal spécifique doivent être phonémiquement équilibrées.
Dans certains cas, un équilibrage phonémique parfait peu
...
Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.