ISO 3494:1976
(Main)Statistical interpretation of data — Power of tests relating to means and variances
Statistical interpretation of data — Power of tests relating to means and variances
Follows on from ISO 2854 and puts forward notions of the type II risk, the probability of not rejecting the null hypothesis when it is false. Deals with comparison of a mean with a given value (variance known or unknown), of two means (variance known or unknown), of a variance with a given value, and of two variances, and gives sets of curves for these type II risk for a given alternative and given size of sample and to determine the size of sample to be selected for a given alternative and a given values of type II risk.
Interprétation statistique des données — Efficacité des tests portant sur des moyennes et des variances
Statistical interpretation of data - Power of tests relating to means and variances
General Information
Buy Standard
Standards Content (Sample)
INTERNATIONAL STANDARD
3494
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION .MEX~YHAPOlIHAfi OPI-AHM3AUMII no CTAHLIAPTM3AUMM.ORGANISATlON INTERNATIONALE DE NORMALISATION
Statistical interpretation of data - Power of tests relating to
means and variances
Efficacitt! des tests portant sur des moyennes et des variances
In terprkta tion s ta tistique des donnees -
First edition - 1976-12-01
UDC 519.28 Ref. No. ISO 3494-1976 (E)
variance (statistics), tests, statistical tests, efficiency , effectivness.
Descriptors : statistics, data, mean,
Price based on 44 pages
---------------------- Page: 1 ----------------------
FOREWORD
ISO (the International Organization for Standardization) is a worldwide federation
of national Standards institutes (ISO Member Bodies). The work of developing
International Standards is carried out through ISO Technical Committees. Every
Member Body interested in a subject for which a Technical Committee has been set
up has the right to be represented on that Committee. International organizations,
governmental and non-governmental, in liaison with ISO, also take part in the work.
Draft International Standards adopted by the Technical Committees are circulated
to the Member Bodies for approval before their acceptance as International
Standards by the ISO Council.
International Standard ISO 3494 was drawn up by Technical Committee
ISO/TC 69, Applications of statistica/ methods, and was circulated to the Member
Bodies in March 1975.
lt has been approved by the Member Bodies of the following countries :
Australia Hungary South Africa, Rep. of
Austria India Switzerland
Belgium Israel Turkey
Brazil Mexico United Kingdom
Bulgaria Netherlands U.S.A.
Ca nada New Zealand U.S.S.R.
cz echoslova kia Poland Yugoslavia
France Portugal
Germany Romania
The Member Ilowing countries expressed disapproval of the
Bod ies of the fo
document on technica
grounds :
Japan
Sweden
0 International Organkation for Standardkation, 1976 l
Printed in Switzerland
---------------------- Page: 2 ----------------------
CONTENTS
Page
SECTION ONE : COMPARISON TESTS
. . . . . . . 1
- General remarks . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . 2
- Histwical note . . . . . . . . . . . . . . . . . . . . . . . . .
MEANS
Reference
to table
Clause Variancek)
Comparison tests
Comparison of a mean with
known . . . . . . . 3
a given value
Comparison of a mean with
unknown . . . . . * . 4
a given value
. . . . . . . 6
Zomparison of two means known
. . . . . . . 8
un known
Comparison of two means
VARIANCES
Reference
to table
Clause Comparison tests
of
) ISO 2854
I
5 Comparison of a variance with a given
. . .
value E 10
. . . 11
6 Comparison of two variances G
SECTION TWO : SETS OF CURVES
- References of the sets of curves . . . . . . . . . . . . . . . . . . . . . . . 12
. . . 13
- Sets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iii
---------------------- Page: 3 ----------------------
This page intentionally left blank
---------------------- Page: 4 ----------------------
INTERNATIONAL STANDARD ISO 3494-1976 (E)
Statistical interpretation of data - Power of tests relating to
means and variances
SECTION ONE : COMPARISON TESTS
GENERAL REMARKS In the tests of comparison of means, fl also depends on the
Standard deviation of the population(s). Where this is
1) This international Standard follows on from ISO 2854,
unknown, the risk fl cannot be known exactly.
Statistical interpretation of data - Techniques of
estimation and tests relating to means and variances.
5) The operating characteristic curves allow the following
Problems to be solved.
The conditions of application of this International Standard
are as stated in the “General remarks” in ISO 2854. It will a) Problem 1 : For a given alternative and given size of
be recalled that the tests used are valid if the distribution of Sample, determine the probability fl of not rejecting the
the observed variable is assumed to be normal in each null hypothesis (type II risk).
population (see comments on Paragraph 3 of the “General
b) Problem 2 : For a given alternative and a given value
remarks” in ISO 2854). ISO 2854 is concerned only with
of p determine the size of Sample to be selected.
the type I risk (or significance level). This International
Standard puts forward notions of the type II risk and of
Although a Single series of curve sets allows both Problems
power of the test.
to be solved, two series of sets will be presented, in Order to
facil itate practical appl ications :
2) lt will also be recalled that the type I risk is the
probability of rejecting the null hypothesis (tested
_-
sets 1.1 to 14.1, giving the risk fl as a function of the
hypothesis) if this hypothesis is true (case of two-sided
alternative, for cy x 0,05 or 0 = 0,Ol and for different
tests), or the maximum value of this pt-obability (case of
values of the size(s) of Sample.
one-sided tests). The non-rejection of the null hypothesis
-
sets 1.2 to 14.2, giving the size(s) of Sample to be
produces, in pt-actice, acceptance of the hypothesis, yet
selected as a function of the alternative, for cy = 0,05 or
non-rejection does not mean that the hypothesis is true.
a = 0,Ol and for different values of the risk fl.
Accordingly, the type ll risk, designated by fl, is the
6) Attention is drawn to the practical significance of
probability of not rejecting the null hypothesis when it is
interpreting statistics by means of tests of hypotheses and
false. The complement of the probability of committing
curves. When testing a hypothesis such as m = mo (or
IIV et-t-or of the second kind (1 -0) is the “power” of the
m 1 = m2), it is generally desired to know whether it tan be
test (see “Historical note” following these general remarks).
concluded with little risk of mistake, that m does not differ
3) Whereas the value of the type I risk is Chosen by the
too greatly from m o (or ml does not differ too greatly
consumers according to the consequences that could arise
from m2). Moreover, the choice of the value a = 0,05 or
from that risk (either of the values cy = O,O5 or a - 0,Ol is
CY = 0,Ol for the type I risk associated with the test has a
commonly employed), the type II risk is dependent on the
degree of arbitrariness. Therefore, it may be useful to
true hypothesis (the null hypothesis Ho being false), i.e.
examine what the result of the test would be with values
the alternative hypothesis to the null hypothesis. In the
close to m. (or value of the differente D = ml .- m2 close
comparison of a population mean with a given value mO,
to 0), possibly using both values of the type I risk a = 0,05
for example, a specific alternative corresponds to a value of
and a = 0,Ol and, in these circumstances, to evaluate by
the population mean of m fm, being a deviation
means of the operating characteristic curves the risk fl
m -m. # 0. As a general rule, in tests of comparison of
associated with different alternatives.
means and variances, the alternatives are defined by the
values that might be assumed by a Parameter. 7) The sets of curves which are given in section two
of this International Standard are described and discussed
4) The operating characteristic curve of a test is the curve
in six clauses which correspond to the tables in ISO 2854.
which Shows the value fl of the type II risk as a function of
The detailed correspondence between the different Sets,
the Parameter defining the alternative. ß is also dependent
the Problems which they allow to be solved, the clauses
on the value Chosen for the type I risk, on size(s) of
of this International Standard and the tables of ISO 2854,
Sample(s) and on the nature of the test (two-sided or
appear at the top of the group of Sets.
one-sided).
1
---------------------- Page: 5 ----------------------
ISO 3494-1976 (El
(when such is truly the case) by at least a given quantity
HISTORICAL NOTE
from the specified value Ao,
or, in relation to it, in a ratio at
The concepts “type I risk” and “type II risk” were
least equal to a given number.
introduced by J. Neyman and E. S. Pearson in an article
The Change in notation was probably introduced in the
which appeared in 1928. Subsequently, these authors
United States by users of industrial applications of
considered that the complement of the probability of
statistics, in Order that the “consumer’s risk”, when
committing the error of the second kind - which they
designated by ß, might be taken into consideration at the
called “power” of the test, in its aptitude to reveal as
same time as the “producer’s risk a”.
significant a specified alternative to the null hypothesis
(tested hypothesis) - was in general an easier concept for
The Symbol ß was adopted for the type II risk in ISO 3534,
the users to understand. lt is this “power”, or the
Sta tis tics Vocabulary and symbols, and it has therefore
-
probability of revealing a given deviation from the null
been adopted with the same significance in this
hypothesis, which they designated by the Symbol ß.
International Standard. However, as this Symbol is used,
lt is moreover not necessary to introduce the term and will continue no doubt to be used, with both meanings
“power”. One tan more simply speak of the probability in statistical Iiterature, it is advisable to find out, in each
that a statistical test applied to a Sample, at a significance case of use, the meaning which is effectively attributed to
level 0, reveals that a Parameter X of the population differs it.
---------------------- Page: 6 ----------------------
ISO 3494-1976 (E)
m-m0
1 COMPARISON OF A MEAN WITH A GIVEN VALUE
b) h =-------- (one-sided test m < mo) alternatives
(VARIANCE KNOWN)
f.3
n7>mo
See table A of ISO 2854.
m-m0
c) AZ---
> mo) alternatives
(one-sided test m
1 .l Notations
0
m
n = Sample size
According to the case, the set to be consulted is
m = population mean
-
1.2 (two-sided test) type I risk Ei = 0,05
mo = given value
-
2.2 (two-sided test) type I risk cy = 0,Ol
0 = Standard deviation for the population
-
3.2 (one-sided test) type I risk QY - 0,05
-
4.2 (one-sided test) type I risk & y= 0,Ol
1.2 Tested hypotheses
n is the Ordinate of the Point on the abscissa h on the
For a two-sided test, the null hypothesis is m = mol the
straight line (broken line) which corresponds to the given
alternative hypothesis corresponding to m # mo.
value ß.
For a one-sided test, the null hypothesis is
1.5
a) either m < m,, the alternative hypothesis corres-
ponding to m > mg;
A Producer of cotton yarn guarantees, for each of the
batches he delivers, a mean breaking load (expressed in
b) or m > mol the alternative hypothesis corresponding
newtons) at least equal to m. - 2,30. The consumer only
tom
agrees to accept the batches after having verified on
elements of yarn of a given length, taken from different
bobbins, that the one-sided test, as described in ISO 2854,
risk ß
1.3 Problem 1 : n being given, determine the
does not lead to a rejection of the hypothesis
m > m. = 2,30, the value Chosen for the type I risk being
is defined by
For the different values of m, the alternative
a, - 0,05 (cy is therefore here the “producer’s risk”).
the Parameter X (0 < h
The consumer knows from experience that the mean of
nm
d-l -nd
a) X= (two-sided test) alternatives the different batches may vary, but the dispersion of the
0
breaking loads within any one batch is practically constant
m#mo
with a Standard deviation u = 0,33.
n m-mo)
Af(
(one-sided test m < mo) alter-
b) X=
1.5.1 The consumer envisages selecting n - 10 bobbins pei
0
batch, and wishes to know the probability that he will not
natives m > m,
reject the hypothesis m > 2,30 (hence to accept the batch)
-
n m-mo) where in fact the mean breaking load would be m = 2,lO.
d-f
alter-
c) x= (one-sided test m 2 mo)
0
The set to be consulted is set 3.1. The value of the
natives m < mg
Parameter h for m = 2,lO is
According to the case, the set to be consulted is
nm
-mo) fi (2,30 -2,10)
J (
-
AE- - = 1,92
-
1.1 (two-sided test) type I risk a = 0,05
0
0,33
-
2.1 (two-sided test) type I risk a = 0,Ol
The straight line 1) = 00 gives for 100 ß the value 36 :
ß = 0,36 or 36 %.
-
3.1 (one-sided test) type I risk ai = 0,05
-
4.1 (one-sided test) type l risk CY = 0,Ol 1.5.2 This value being considered by the consumer as
much too high, he decides to select a Sample of sufficient
curve
ß is the ordi nate of t oint of the abscissa X on the
he P
size for the risk ß to be reduced to OJO (or 10 %) if
v=ca()
f the suitable test.
m = 2,lO.
The set to be consulted is set 3.2. The value of the
Parameter X for m = 2,lO is
1.4 Problem 2 : ß being given, determine the size n
m-m0
For the different values of m, the al Iternative is defined by 2,30 - 2,IO
XI--------
= 0,6l
the Parameter h (0 < X < 4, with
0 -
0,33
Im -mol The value of n, read on the straight lines (broken) ß = O,lO
a) X= (two-sided test ) alternatives m # m.
is n = 22.
0
3
---------------------- Page: 7 ----------------------
ISO 34944976 (E)
2 COMPARISON OF A MEAN WITH A GIVEN VALUE According to the case, the set to be consulted is
(VARIANCE UNKNOWN)
- 1 .I (:wo-sided test) type I risk Q = 0,05
See table A’ of ISO 2854.
- 2.1 (two-sided test) type I risk a = 0,OI
-
IMPORTANT NOTE
3.1 (one-sided test) type I risk ai = 0,05
The type II risk /3 depends on the true value 0 of the
- 4.1 (one-sided test) type I risk a: = 0,OI
Standard deviation for the population, which is unknown.
fl is the Ordinate of the Point on the abscissa h on the curve
Hence, fl tan only be known approximately, and this
v = n - 1 of the suitable set.
provided that an Order of magnitude of 0 is available. In the
absence of any valid previous information, one will take
2.4 Problem 2 : fl being given, determine the size n
for o the estimation s obtained from the Sample.
For the different values of m, the alternative is defined by
It is strongly recommended that the influence on the values
the Parameter X ( 0 < h
read from the operating characteristic curve of an error
made for the Standard deviation o should be considered.
Im -m01
a) X=
(two-sided test) alternatives m # m.
The inaccuracy tan be very great where 0 has been
0
estimated from a Sample of small size : allowance for this
m-m0
Situation tan be made by placing s within the confidence
hx-
b) (one-sided test m < rno) alternatives
limits for u calculated by the method in table F of
0
ISO 2854.
m>mo
m-m0
c) x=---
2.1 Notations
(one-sided test m > mo) alternatives
0
n = Sample size m
According to the case, the set to be consulted is
m = Population mean
- 1.2 (two-sided test) type I risk cy = 0,05
m. = given value
- 2.2 (two-sided test) type I risk a: = 0,OI
CT = Standard deviation for the population (which will be
replaced by an approximate value)
.- 3.2 (one-sided test) type I risk 0 = 0,05
-n-I
1)
-
4.2 (one-sided test) type 1 risk a! = 0,OI
n is the Ordinate o f the Point of the absc issa X on the curve
2.2 Tested hypotheses
which corresponds to th e given value .
P
For a two-sided test, the null hypothesis is m = mol the
alternative hypotheses corresponding to m # mo. 2.5 Example
For a one-sided test, the null hypothesis is The example is the Same as in 1.5, but the consumer does
not know the exact value of the Standard deviation of the
eithei m Gnof the alternative hypotheses
a)
breaking loads. He knows, however, from experience, that
corresponding to m > mo;
this is almost certainly within the limits
b) or m 2 mO, the alternative hypotheses corresponding
01 = 0,30 OS = 0,45
to m
2.5.1 The consumer envisages selecting n = IO bobbins
2.3 Problem 1 : n being given, determine the risk ß per batch, and wishes to know the probability that he will
not reject the hypothesis m > 2,30 (hence to accept the
For the different values of m, the alternative is defined by
batch), while in fact the mean breaking load would be
the Parameter x (0 < X < m), with
m = 2,IO.l)
fiim-m0l
The set to be consulted is set 3.1. The values of the
a) h=
(two-sided test) alternativesm # m.
0
Parameter X which correspond to the extreme values of 0
-
are
2: -mo)
4 (
b) h= n’
(one-sided test m < mo) alter-
0
\m’ (2,30 - 2,10) = 2 ,
hl = I
natives m > mg
0,30
n m-mo)
4-t
c) h=--
(one-sided test m > mo) alter-
hs m (2,30 - 2,10)
-
a
-
= I,4
natives m < 0,45
mg
0,05, the value m -
1) That is, the probability th at when using the Student test with the significance level ~1 2,lO is not revealed to be
significantly lower than mg -- 2
,30.
---------------------- Page: 8 ----------------------
ISO 3494-1976 (E)
The corresponding values of 100 fl read (by interpolation) The set to he consulted is set 3.2, curve ß = O,lO, with
v = 9 are 40 and 64; i.e.
2,30 - 2,10
x= = 0,44
ßr = 0,40 (or 40 %)
0,45
= 0,64 (or 64 %)
Ps
For ß = 0,lO and X = 0,44, one finds n in the Order of 45.
If, after inspection of several batches, it is found that the
Standard deviation is stable, o tan be estimated with greater
2.5.2 The consumer wishes, in the most unfavourable precision :
the Sample size to be taken from the following
hypothesis (o = os = 0,45), ß not to exceed 0,lO (or IO %)
batches tan probably be reduced, with the guarantees of
if m = 2,10. the Producer and the consumer being maintained.
---------------------- Page: 9 ----------------------
ISO 3494-1976 (E)
When the total size of the two samples is fix@
3 COMPARISON OF TWO MEANS (VARIANCES
n1 + n2 = 2 n, the best efficiency (ß minimum) is obtained
KNOWN)
with :
See table C of ISO 2854.
"1 n2
---
-
(3 02
3.1 Notations
hence
Population
Population
(3
No. 2 =2n-----
No. 1
"1
a1 + 02
Sample size
"2
“1
Mean
“1 m2 n 2=2no*
1
2
2 2
Variante
7 O2
-4
Im,
x=y/n
Standard deviation of the
01 + 02
differente of the mean of
the two samples
n Im, -4
\
x= , if 0, = 02 = u
2 CJ
( f
i
\
3.2 Tested hypotheses
For a two-sided test, the null hypothesis is ml = m2, the
alternative hypotheses corresponding to ml # m2.
3.4 Problem 2 : ß being given, deterrnine the sizes /q and
n2
For a one-sided test, the null hypothesis is
Using, according to the case, set 1 .l, 2.1, 3.1 or 4.1, the
alternative hypotheses
a) either the
ml Qm2r
curve v =
00 allows the Problem to be solved in the general
corresponding to ml > m2;
case. The Ordinate ß corresponds to the Point on the
>
b) or the alternative hypotheses
mlAm2r abscissa x of this curve, and any pair (n,, n,) is suitable on
corresponding to m1 < m2.
the condition that
o2
o2
ml -m2
1,2=
x
(
"1 n2
3.3 Problem 1 : nl and n2 being given, determine the
risk ß
The most economical Sample (nl + n2 minimum) is such
For the different values of the differente ml - m2, the that
alternative is defined by the Parameter x (0 < x
“1 n2
-=-
Im1 77721
Ol O2
a) X= (two-sided test) alternatives ml # m2
Od
hence
b) hxrn' -m2
(one-sided test m1 < m2) alternatives
h 2
Od
= 0, (0, + 02) -
"1
mA -m2
ml >m2 i 1
m2 -1731 A *
c) h =-----
(one-sided test m1 >m2) alternatives
n2=02 (0, fo,) p
Od
1 1
M1 -m2
m-l
ho 2
According to the case, the set to be consulted is
=n,=2 -
, if (J1 = u2 = 0
"1
! 1 i
i M-l -m2
-
1.1 (two-sided test) type I risk al = 0,05
In the particular case where u1 = o2 = a, nl = n2 = n, it
- 2.1 (two-sided test) type I risk Q = 0,Ol
is more suitable to define, for the different values of the
- 3.1 (one-sided test) type I risk & = 0,05
differente ml -m2
the alternative by the Parameter
I
x (0 < x < m), with
- 4.1 (one-sided test) type I risk Q = 0,Ol
Im1 77721
ß is the Ordinate of the Point on the abscissa h on the curve
a) X-
(two-sided test) alternatives ml # m2
4-
v = 00 of the suitable set.
6
---------------------- Page: 10 ----------------------
ISO 3494-1976 (E)
3.5.1 The consumer envisages selecting 10 bobbins from a
mg-m2
b) X= (one-sided test ml
batch of each of the two processes, and wishes to know the
d-
probability that he will not reject the hypothesis m1 = m2
mdm2
(hence to accept the batch of the new process) while in
fact Im1 - m2 1 would be equal to 0,30.
m2--m
c) x= (one-sided test ml > m2) alternatives
04
The set to be consulted is set 1.1, with
m
-m21
Im1
and to use according to the case, one of the following sets :
x=
“d
- 1.2 (two-sided test) type I risk cy = 0,05
-m2J = 0,30
- 2.2 (two-sided test) type I risk cy = 0,Ol
Im,
- 3.2 (one-sided test) type I risk a = 0,05
- 4.2 (one-sided test) type I risk CY = 0,Ol
od- ,/j+~=,,$= ,/$&33=-0,,476
n is the Ordinate of the Point on the abscissa h on the
straight line (broken line) which corresponds to the given
0,30
value ß.
x= -= 2,03
0,147 6
3.5 Example
The curve v = 00 gives for 100 ß the value 47 : ß = 0,47 or
47 %.
A Producer of cotton yarn has modified his process, but
according to his declaration, the mean breaking load
remains the same (m, = m2), m1 corresponding to the old
process and m2 to the new.
The consumer is prepared to adopt the new process, but
3.5.2 This value being considered by the consumer as
wishes to verify the declaration of the Producer, by
much too high, he decides to select samples of a sufficiently
carrying out on elements of yarn of a given length taken
large size for the risk ß to be reduced to 0,lO (or 10 %)
from different bobbins, the two-sided test of the hypothesis
when ml - m2 = 0,30.
= m2 as described in ISO 2854, with for the value of
ml
the type I risk cy = 0,05 (a! is therefore here the “producer’s The set to be consulted is set 1.2, with
risk”).
0,30
- m21
JMl
--= -=
0,64
h=
The consumer knows, from experience, that for all the
0,33 fl-
4-
productions of this Producer, the dispersion of the breaking
The value of n, read on the straight line (broken line)
load is practically constant and characterized by a Standard
ß = O,lO, isn = 26.
deviation CJ = 0,33.
7
---------------------- Page: 11 ----------------------
ISO 3494-1976 (E)
ml -m2
4 COMPARISON OF TWO MEANS (VARIANCES
b) h= (one-sided test m,
UNKNOWN BUT MAY BE ASSUMED EQUAL)
Od
mdm2
See table C’ of ISO 2854.
m2777-I
c) x=--- (one-sided test m, 2 m2) alternatives
IMPORTANT NOTE
Od
m-l
The type ll risk ß depends on the true value o of the
Standard deviation of the two populations, which is
According to the case, the set to be consulted is
unknown. Hence ß tan only be known approximately, and
-
1.1 (two-sided test) type I risk a! = 0,05
this provided that an Order of magnitude of o is available.
In the absence of any valid previous information, one will
- 2.1 (two-sided test) type I risk cy = 0,Ol
take for o the estimation s obtained from samples.
- 3.1 (one-sided test) type I risk LX = 0,05
lt is strongly recommended that the influence on the values
read on the curves of an error made for the Standard -
4.1 (one-sided test) type I risk ~1: = 0,Ol
deviation u should be considered. The inaccuracy tan be
ß is the Ordinate of the Point on the abscissa X on the curve
very great where u has been estimated from samples of
h = nl + n2 - 2 of the suitable set.
small size; allowance for this Situation tan be made by
placing s within the confidence limits for u, calculated by
When only the total size of the two samples is fixed,
the method in table F of ISO 2854.
nl $172 = 2n, it
is of interest to take nl = n2 = n
(p minimum). One then has :
4.1 Notations
n Im, -m21
x=
Population Population
2 0
i-
No. 1 No. 2
-- -P
r
Sample stze
“1 2
4.4 Problem 2 : ß being given, determine the common
Mean
m2
M-l
size n of the samples
Variante (whlch wrll be
/
2
,
o2 CJ For the different values of the differente ml - m2, the
replaced by an approxmate
value) alternative is defined by the Parameter ?I (0 < X < m), with
-.~- ~ _ _. _ __._. ._. . . .- - 1.
1’ n1+n2 2 Im1 - m21
Number of degrees of freedom a) X- (two-sided test) alternatives ml # m2
O\h
12 (n l),Ifn, n2 nJ
m1-m2
!rq + n2
b) AZ----------
/ (one-sided test m1 Gm,) alternatives
~ 17
rrd 1
4-
Standard deviation of the k’ "l"2
m1 >m*
differente between the
means of the two samples
0, if n1 -- n2 n
m2-ml
c) x=------ (one-sided test ml Zm2) alternatives
(4
m+l cf772
4.2 Tested hypotheses
According to the case, the set to be consulted is
For a two-sided test, the null hypothesis is ml = m2, the
- 1.2 (two-sided test) type I risk cx = 0,05
alternative hypotheses corresponding to ml # m2.
- 2.2 (two-sided test) type I risk cx = 0,Ol
For a one-sided test, the null hypothesis is
- 3.2 (one-sided test) type I risk a = 0,05
alternative hypotheses
a) either the
m6m2,
-
corresponding to ml > m2;
4.2 (one-sided test) type I risk CY = 0,Ol
>
b) or the alternative hypotheses
n is the Ordinate of the Point on the abscissa h on the
m--l Hm21
corresponding to ml < m2.
curve which corresponds to the given value ß.
4.3 Problem 1 : nl and n2 being given, determine the
4.5 Example
risk ß
The example is the Same as in 3.5, but the consumer does
For the different values of the differente ml -m2, the
not know the exact value of the Standard deviation of the
alternative is defined by the Parameter h (0 < X
breaking loads. He only knows that there is a great
im1 77721 likelihood that it will be the same for the two batches
a) h= (two-sided test) alternatives m 1 # m2
= 0,).
(01
Od
8
---------------------- Page: 12 ----------------------
ISO 3494-1976 ( E)
It is therefore not very probable that o will be greater than
4.5.1 The consumer envisages selecting IO bobbins from a
batch of each of the two processes, and wishes to know the
probability that he will not reject the hypothesis ml = m2
OS =&BiT= 0,53
(hence to accept the batch of the new process), while in
fact Im, -m2 / would be equal to 0,30.1)
The set to be consulted is set 1.1, with
n Im1 77.721
The measurements carried out on the two samples give the
A, z
/ 1,27
following results : 2 OS =
il: (x, GL,)2 = 1,256 3 For v = 18, one finds (by interpolation) that the
a) First batch : XI = 2,176
corresponding value of 100 ß is close to 80 : the upper limit
b) Second batch : X2 = 2,520 31 (x2 - X2)2 = 1,389 7
of the type I I risk is about 0,80 (or 80 %).
The small differente between the two sums of the squares
4.5.2 The consumer wishes, in the most unfavourable
is perfectly compatible with the hypothesis made above
hypothesis (o = os = 0,53), fl not to exceed 0,20 (or 20 %)
that : 0: = 02 (see table G of ISO 2854).
when Im, - m21 = 0,30.
The estimation of the common variance 02 for the two
The set to be consulted is set 1.2, curve ß = 0,20, with
batches is
0,30
1,256 3 + 1,389 7 2,646 0 im1 774
s2 = = - = 0,147 0 x= -=0,4
10+10-2 18 = 0,53 fl
0s 4
The upper limit of 02, at the confidence level 1 - a = 0,95, For fl = 0,20 and h = 0,4, one finds n = 49.
is (see table F of ISO 2854)
The 2 x 50 = 100 measurements will permit a quite
accurate estimation of o, on the basis of which set 1 .l will
0
lJ2 - 2,646 0 ----=0,281 - 2,646 8
give an approximate value of the type II risk associated
S-
9,39
y; o5 (18)
with the alternative ml - m2 = 0,30.
I
1) That is, the probability that when using the Student test with the significance level u’ 0,05, a differente iml “2, . Cl,30 will not be
revealed.
9
---------------------- Page: 13 ----------------------
ISO 3494-1976 (E)
5 COMPARISON OF A VARIANCE OR OF A 5.4 Problem 2 : p being given, determine the size n
STANDARD DEVIATION WITt-! A GIVEN VALUE
According to the case, the set to be consulted is
See table E of ISO 2854.
-
5.2 (two-sided test) type I risk 0 = 0,05
- 6.2 (two-sided test) type I risk u = 0,Ol
5.1 Notations
-
7.2 (one-sided test ~2 < c$) type I risk CY = O,O5
n = Sample size
- 8.2 (one-sided test 02 G 0;) type I risk CI = 0,Ol
02 = variance of the population (o = Standard deviation of
- 9.2 (one-sided test 02 > 06) type I risk 2 = 0,05
the population)
- 10.2 (one-sided test o 2 > 0;) type I risk a = 0,Ol
0; = given value for the variance (o. = given value for the
n is the Ordinate of the Point on the abscissa h on the curve
Standard deviation)
which corresponds to the give n value .
ß
5.5 Example
5.2 Tested hypotheses
A Producer of cotton yarn states that he has improved the
For a two-sided test, the null hypothesis is 02 = CJ$
quality of his process by a reduction in the dispersion of
(0 = OO), the alternative hypotheses corresponding to
the breaking loads which was formerly characterised by a
02 # 0; (0 # o()),
Standard deviation o. = 0,45 (CJ~ = 0,202 5).
For a one-sided test, the null hypothesis is
A possible consumer is prepared to pay a higher price for
this improvement on condition that it really exists, but he
a) either 02 < 0; (0 < oo), the alternative hypotheses
only wishes to run a small risk of finding an improvement
corresponding to 02 > 00 (0 > oo);
when there would be none. He decides to carry out a
b) or 02 > 0; (a > oO), the alternative hypotheses
one-sided test 02 > o. 2 = 0,202 5 (o 2 0,45), as described
corresponding to 02 < 0; (o. < oo).
in ISO 2854, taking for the type I risk the value cy = 0,05
(CY is therefore here the “consumer’s risk”).
In all cases, the alternative is defined by the Parameter
h = o/oo 5.5.1 The consumer envisages selecting n = 12 bobbins
from a batch of the new process, and wishes to know the
0 < h < 00, for the two-sided test;
probability that he will not reject the hypothesis o > 0,45
(hence not finding an improvement), while in fact the
...
SLOVENSKI STANDARD
SIST ISO 3494:1996
01-september-1996
Statistical interpretation of data - Power of tests relating to means and variances
Statistical interpretation of data -- Power of tests relating to means and variances
Interprétation statistique des données -- Efficacité des tests portant sur des moyennes et
des variances
Ta slovenski standard je istoveten z: ISO 3494:1976
ICS:
03.120.30 8SRUDEDVWDWLVWLþQLKPHWRG Application of statistical
methods
SIST ISO 3494:1996 en
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.
---------------------- Page: 1 ----------------------
SIST ISO 3494:1996
---------------------- Page: 2 ----------------------
SIST ISO 3494:1996
INTERNATIONAL STANDARD
3494
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION .MEX~YHAPOlIHAfi OPI-AHM3AUMII no CTAHLIAPTM3AUMM.ORGANISATlON INTERNATIONALE DE NORMALISATION
Statistical interpretation of data - Power of tests relating to
means and variances
Efficacitt! des tests portant sur des moyennes et des variances
In terprkta tion s ta tistique des donnees -
First edition - 1976-12-01
UDC 519.28 Ref. No. ISO 3494-1976 (E)
variance (statistics), tests, statistical tests, efficiency , effectivness.
Descriptors : statistics, data, mean,
Price based on 44 pages
---------------------- Page: 3 ----------------------
SIST ISO 3494:1996
FOREWORD
ISO (the International Organization for Standardization) is a worldwide federation
of national Standards institutes (ISO Member Bodies). The work of developing
International Standards is carried out through ISO Technical Committees. Every
Member Body interested in a subject for which a Technical Committee has been set
up has the right to be represented on that Committee. International organizations,
governmental and non-governmental, in liaison with ISO, also take part in the work.
Draft International Standards adopted by the Technical Committees are circulated
to the Member Bodies for approval before their acceptance as International
Standards by the ISO Council.
International Standard ISO 3494 was drawn up by Technical Committee
ISO/TC 69, Applications of statistica/ methods, and was circulated to the Member
Bodies in March 1975.
lt has been approved by the Member Bodies of the following countries :
Australia Hungary South Africa, Rep. of
Austria India Switzerland
Belgium Israel Turkey
Brazil Mexico United Kingdom
Bulgaria Netherlands U.S.A.
Ca nada New Zealand U.S.S.R.
cz echoslova kia Poland Yugoslavia
France Portugal
Germany Romania
The Member Ilowing countries expressed disapproval of the
Bod ies of the fo
document on technica
grounds :
Japan
Sweden
0 International Organkation for Standardkation, 1976 l
Printed in Switzerland
---------------------- Page: 4 ----------------------
SIST ISO 3494:1996
CONTENTS
Page
SECTION ONE : COMPARISON TESTS
. . . . . . . 1
- General remarks . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . 2
- Histwical note . . . . . . . . . . . . . . . . . . . . . . . . .
MEANS
Reference
to table
Clause Variancek)
Comparison tests
Comparison of a mean with
known . . . . . . . 3
a given value
Comparison of a mean with
unknown . . . . . * . 4
a given value
. . . . . . . 6
Zomparison of two means known
. . . . . . . 8
un known
Comparison of two means
VARIANCES
Reference
to table
Clause Comparison tests
of
) ISO 2854
I
5 Comparison of a variance with a given
. . .
value E 10
. . . 11
6 Comparison of two variances G
SECTION TWO : SETS OF CURVES
- References of the sets of curves . . . . . . . . . . . . . . . . . . . . . . . 12
. . . 13
- Sets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iii
---------------------- Page: 5 ----------------------
SIST ISO 3494:1996
This page intentionally left blank
---------------------- Page: 6 ----------------------
SIST ISO 3494:1996
INTERNATIONAL STANDARD ISO 3494-1976 (E)
Statistical interpretation of data - Power of tests relating to
means and variances
SECTION ONE : COMPARISON TESTS
GENERAL REMARKS In the tests of comparison of means, fl also depends on the
Standard deviation of the population(s). Where this is
1) This international Standard follows on from ISO 2854,
unknown, the risk fl cannot be known exactly.
Statistical interpretation of data - Techniques of
estimation and tests relating to means and variances.
5) The operating characteristic curves allow the following
Problems to be solved.
The conditions of application of this International Standard
are as stated in the “General remarks” in ISO 2854. It will a) Problem 1 : For a given alternative and given size of
be recalled that the tests used are valid if the distribution of Sample, determine the probability fl of not rejecting the
the observed variable is assumed to be normal in each null hypothesis (type II risk).
population (see comments on Paragraph 3 of the “General
b) Problem 2 : For a given alternative and a given value
remarks” in ISO 2854). ISO 2854 is concerned only with
of p determine the size of Sample to be selected.
the type I risk (or significance level). This International
Standard puts forward notions of the type II risk and of
Although a Single series of curve sets allows both Problems
power of the test.
to be solved, two series of sets will be presented, in Order to
facil itate practical appl ications :
2) lt will also be recalled that the type I risk is the
probability of rejecting the null hypothesis (tested
_-
sets 1.1 to 14.1, giving the risk fl as a function of the
hypothesis) if this hypothesis is true (case of two-sided
alternative, for cy x 0,05 or 0 = 0,Ol and for different
tests), or the maximum value of this pt-obability (case of
values of the size(s) of Sample.
one-sided tests). The non-rejection of the null hypothesis
-
sets 1.2 to 14.2, giving the size(s) of Sample to be
produces, in pt-actice, acceptance of the hypothesis, yet
selected as a function of the alternative, for cy = 0,05 or
non-rejection does not mean that the hypothesis is true.
a = 0,Ol and for different values of the risk fl.
Accordingly, the type ll risk, designated by fl, is the
6) Attention is drawn to the practical significance of
probability of not rejecting the null hypothesis when it is
interpreting statistics by means of tests of hypotheses and
false. The complement of the probability of committing
curves. When testing a hypothesis such as m = mo (or
IIV et-t-or of the second kind (1 -0) is the “power” of the
m 1 = m2), it is generally desired to know whether it tan be
test (see “Historical note” following these general remarks).
concluded with little risk of mistake, that m does not differ
3) Whereas the value of the type I risk is Chosen by the
too greatly from m o (or ml does not differ too greatly
consumers according to the consequences that could arise
from m2). Moreover, the choice of the value a = 0,05 or
from that risk (either of the values cy = O,O5 or a - 0,Ol is
CY = 0,Ol for the type I risk associated with the test has a
commonly employed), the type II risk is dependent on the
degree of arbitrariness. Therefore, it may be useful to
true hypothesis (the null hypothesis Ho being false), i.e.
examine what the result of the test would be with values
the alternative hypothesis to the null hypothesis. In the
close to m. (or value of the differente D = ml .- m2 close
comparison of a population mean with a given value mO,
to 0), possibly using both values of the type I risk a = 0,05
for example, a specific alternative corresponds to a value of
and a = 0,Ol and, in these circumstances, to evaluate by
the population mean of m fm, being a deviation
means of the operating characteristic curves the risk fl
m -m. # 0. As a general rule, in tests of comparison of
associated with different alternatives.
means and variances, the alternatives are defined by the
values that might be assumed by a Parameter. 7) The sets of curves which are given in section two
of this International Standard are described and discussed
4) The operating characteristic curve of a test is the curve
in six clauses which correspond to the tables in ISO 2854.
which Shows the value fl of the type II risk as a function of
The detailed correspondence between the different Sets,
the Parameter defining the alternative. ß is also dependent
the Problems which they allow to be solved, the clauses
on the value Chosen for the type I risk, on size(s) of
of this International Standard and the tables of ISO 2854,
Sample(s) and on the nature of the test (two-sided or
appear at the top of the group of Sets.
one-sided).
1
---------------------- Page: 7 ----------------------
SIST ISO 3494:1996
ISO 3494-1976 (El
(when such is truly the case) by at least a given quantity
HISTORICAL NOTE
from the specified value Ao,
or, in relation to it, in a ratio at
The concepts “type I risk” and “type II risk” were
least equal to a given number.
introduced by J. Neyman and E. S. Pearson in an article
The Change in notation was probably introduced in the
which appeared in 1928. Subsequently, these authors
United States by users of industrial applications of
considered that the complement of the probability of
statistics, in Order that the “consumer’s risk”, when
committing the error of the second kind - which they
designated by ß, might be taken into consideration at the
called “power” of the test, in its aptitude to reveal as
same time as the “producer’s risk a”.
significant a specified alternative to the null hypothesis
(tested hypothesis) - was in general an easier concept for
The Symbol ß was adopted for the type II risk in ISO 3534,
the users to understand. lt is this “power”, or the
Sta tis tics Vocabulary and symbols, and it has therefore
-
probability of revealing a given deviation from the null
been adopted with the same significance in this
hypothesis, which they designated by the Symbol ß.
International Standard. However, as this Symbol is used,
lt is moreover not necessary to introduce the term and will continue no doubt to be used, with both meanings
“power”. One tan more simply speak of the probability in statistical Iiterature, it is advisable to find out, in each
that a statistical test applied to a Sample, at a significance case of use, the meaning which is effectively attributed to
level 0, reveals that a Parameter X of the population differs it.
---------------------- Page: 8 ----------------------
SIST ISO 3494:1996
ISO 3494-1976 (E)
m-m0
1 COMPARISON OF A MEAN WITH A GIVEN VALUE
b) h =-------- (one-sided test m < mo) alternatives
(VARIANCE KNOWN)
f.3
n7>mo
See table A of ISO 2854.
m-m0
c) AZ---
> mo) alternatives
(one-sided test m
1 .l Notations
0
m
n = Sample size
According to the case, the set to be consulted is
m = population mean
-
1.2 (two-sided test) type I risk Ei = 0,05
mo = given value
-
2.2 (two-sided test) type I risk cy = 0,Ol
0 = Standard deviation for the population
-
3.2 (one-sided test) type I risk QY - 0,05
-
4.2 (one-sided test) type I risk & y= 0,Ol
1.2 Tested hypotheses
n is the Ordinate of the Point on the abscissa h on the
For a two-sided test, the null hypothesis is m = mol the
straight line (broken line) which corresponds to the given
alternative hypothesis corresponding to m # mo.
value ß.
For a one-sided test, the null hypothesis is
1.5
a) either m < m,, the alternative hypothesis corres-
ponding to m > mg;
A Producer of cotton yarn guarantees, for each of the
batches he delivers, a mean breaking load (expressed in
b) or m > mol the alternative hypothesis corresponding
newtons) at least equal to m. - 2,30. The consumer only
tom
agrees to accept the batches after having verified on
elements of yarn of a given length, taken from different
bobbins, that the one-sided test, as described in ISO 2854,
risk ß
1.3 Problem 1 : n being given, determine the
does not lead to a rejection of the hypothesis
m > m. = 2,30, the value Chosen for the type I risk being
is defined by
For the different values of m, the alternative
a, - 0,05 (cy is therefore here the “producer’s risk”).
the Parameter X (0 < h
The consumer knows from experience that the mean of
nm
d-l -nd
a) X= (two-sided test) alternatives the different batches may vary, but the dispersion of the
0
breaking loads within any one batch is practically constant
m#mo
with a Standard deviation u = 0,33.
n m-mo)
Af(
(one-sided test m < mo) alter-
b) X=
1.5.1 The consumer envisages selecting n - 10 bobbins pei
0
batch, and wishes to know the probability that he will not
natives m > m,
reject the hypothesis m > 2,30 (hence to accept the batch)
-
n m-mo) where in fact the mean breaking load would be m = 2,lO.
d-f
alter-
c) x= (one-sided test m 2 mo)
0
The set to be consulted is set 3.1. The value of the
natives m < mg
Parameter h for m = 2,lO is
According to the case, the set to be consulted is
nm
-mo) fi (2,30 -2,10)
J (
-
AE- - = 1,92
-
1.1 (two-sided test) type I risk a = 0,05
0
0,33
-
2.1 (two-sided test) type I risk a = 0,Ol
The straight line 1) = 00 gives for 100 ß the value 36 :
ß = 0,36 or 36 %.
-
3.1 (one-sided test) type I risk ai = 0,05
-
4.1 (one-sided test) type l risk CY = 0,Ol 1.5.2 This value being considered by the consumer as
much too high, he decides to select a Sample of sufficient
curve
ß is the ordi nate of t oint of the abscissa X on the
he P
size for the risk ß to be reduced to OJO (or 10 %) if
v=ca()
f the suitable test.
m = 2,lO.
The set to be consulted is set 3.2. The value of the
Parameter X for m = 2,lO is
1.4 Problem 2 : ß being given, determine the size n
m-m0
For the different values of m, the al Iternative is defined by 2,30 - 2,IO
XI--------
= 0,6l
the Parameter h (0 < X < 4, with
0 -
0,33
Im -mol The value of n, read on the straight lines (broken) ß = O,lO
a) X= (two-sided test ) alternatives m # m.
is n = 22.
0
3
---------------------- Page: 9 ----------------------
SIST ISO 3494:1996
ISO 34944976 (E)
2 COMPARISON OF A MEAN WITH A GIVEN VALUE According to the case, the set to be consulted is
(VARIANCE UNKNOWN)
- 1 .I (:wo-sided test) type I risk Q = 0,05
See table A’ of ISO 2854.
- 2.1 (two-sided test) type I risk a = 0,OI
-
IMPORTANT NOTE
3.1 (one-sided test) type I risk ai = 0,05
The type II risk /3 depends on the true value 0 of the
- 4.1 (one-sided test) type I risk a: = 0,OI
Standard deviation for the population, which is unknown.
fl is the Ordinate of the Point on the abscissa h on the curve
Hence, fl tan only be known approximately, and this
v = n - 1 of the suitable set.
provided that an Order of magnitude of 0 is available. In the
absence of any valid previous information, one will take
2.4 Problem 2 : fl being given, determine the size n
for o the estimation s obtained from the Sample.
For the different values of m, the alternative is defined by
It is strongly recommended that the influence on the values
the Parameter X ( 0 < h
read from the operating characteristic curve of an error
made for the Standard deviation o should be considered.
Im -m01
a) X=
(two-sided test) alternatives m # m.
The inaccuracy tan be very great where 0 has been
0
estimated from a Sample of small size : allowance for this
m-m0
Situation tan be made by placing s within the confidence
hx-
b) (one-sided test m < rno) alternatives
limits for u calculated by the method in table F of
0
ISO 2854.
m>mo
m-m0
c) x=---
2.1 Notations
(one-sided test m > mo) alternatives
0
n = Sample size m
According to the case, the set to be consulted is
m = Population mean
- 1.2 (two-sided test) type I risk cy = 0,05
m. = given value
- 2.2 (two-sided test) type I risk a: = 0,OI
CT = Standard deviation for the population (which will be
replaced by an approximate value)
.- 3.2 (one-sided test) type I risk 0 = 0,05
-n-I
1)
-
4.2 (one-sided test) type 1 risk a! = 0,OI
n is the Ordinate o f the Point of the absc issa X on the curve
2.2 Tested hypotheses
which corresponds to th e given value .
P
For a two-sided test, the null hypothesis is m = mol the
alternative hypotheses corresponding to m # mo. 2.5 Example
For a one-sided test, the null hypothesis is The example is the Same as in 1.5, but the consumer does
not know the exact value of the Standard deviation of the
eithei m Gnof the alternative hypotheses
a)
breaking loads. He knows, however, from experience, that
corresponding to m > mo;
this is almost certainly within the limits
b) or m 2 mO, the alternative hypotheses corresponding
01 = 0,30 OS = 0,45
to m
2.5.1 The consumer envisages selecting n = IO bobbins
2.3 Problem 1 : n being given, determine the risk ß per batch, and wishes to know the probability that he will
not reject the hypothesis m > 2,30 (hence to accept the
For the different values of m, the alternative is defined by
batch), while in fact the mean breaking load would be
the Parameter x (0 < X < m), with
m = 2,IO.l)
fiim-m0l
The set to be consulted is set 3.1. The values of the
a) h=
(two-sided test) alternativesm # m.
0
Parameter X which correspond to the extreme values of 0
-
are
2: -mo)
4 (
b) h= n’
(one-sided test m < mo) alter-
0
\m’ (2,30 - 2,10) = 2 ,
hl = I
natives m > mg
0,30
n m-mo)
4-t
c) h=--
(one-sided test m > mo) alter-
hs m (2,30 - 2,10)
-
a
-
= I,4
natives m < 0,45
mg
0,05, the value m -
1) That is, the probability th at when using the Student test with the significance level ~1 2,lO is not revealed to be
significantly lower than mg -- 2
,30.
---------------------- Page: 10 ----------------------
SIST ISO 3494:1996
ISO 3494-1976 (E)
The corresponding values of 100 fl read (by interpolation) The set to he consulted is set 3.2, curve ß = O,lO, with
v = 9 are 40 and 64; i.e.
2,30 - 2,10
x= = 0,44
ßr = 0,40 (or 40 %)
0,45
= 0,64 (or 64 %)
Ps
For ß = 0,lO and X = 0,44, one finds n in the Order of 45.
If, after inspection of several batches, it is found that the
Standard deviation is stable, o tan be estimated with greater
2.5.2 The consumer wishes, in the most unfavourable precision :
the Sample size to be taken from the following
hypothesis (o = os = 0,45), ß not to exceed 0,lO (or IO %)
batches tan probably be reduced, with the guarantees of
if m = 2,10. the Producer and the consumer being maintained.
---------------------- Page: 11 ----------------------
SIST ISO 3494:1996
ISO 3494-1976 (E)
When the total size of the two samples is fix@
3 COMPARISON OF TWO MEANS (VARIANCES
n1 + n2 = 2 n, the best efficiency (ß minimum) is obtained
KNOWN)
with :
See table C of ISO 2854.
"1 n2
---
-
(3 02
3.1 Notations
hence
Population
Population
(3
No. 2 =2n-----
No. 1
"1
a1 + 02
Sample size
"2
“1
Mean
“1 m2 n 2=2no*
1
2
2 2
Variante
7 O2
-4
Im,
x=y/n
Standard deviation of the
01 + 02
differente of the mean of
the two samples
n Im, -4
\
x= , if 0, = 02 = u
2 CJ
( f
i
\
3.2 Tested hypotheses
For a two-sided test, the null hypothesis is ml = m2, the
alternative hypotheses corresponding to ml # m2.
3.4 Problem 2 : ß being given, deterrnine the sizes /q and
n2
For a one-sided test, the null hypothesis is
Using, according to the case, set 1 .l, 2.1, 3.1 or 4.1, the
alternative hypotheses
a) either the
ml Qm2r
curve v =
00 allows the Problem to be solved in the general
corresponding to ml > m2;
case. The Ordinate ß corresponds to the Point on the
>
b) or the alternative hypotheses
mlAm2r abscissa x of this curve, and any pair (n,, n,) is suitable on
corresponding to m1 < m2.
the condition that
o2
o2
ml -m2
1,2=
x
(
"1 n2
3.3 Problem 1 : nl and n2 being given, determine the
risk ß
The most economical Sample (nl + n2 minimum) is such
For the different values of the differente ml - m2, the that
alternative is defined by the Parameter x (0 < x
“1 n2
-=-
Im1 77721
Ol O2
a) X= (two-sided test) alternatives ml # m2
Od
hence
b) hxrn' -m2
(one-sided test m1 < m2) alternatives
h 2
Od
= 0, (0, + 02) -
"1
mA -m2
ml >m2 i 1
m2 -1731 A *
c) h =-----
(one-sided test m1 >m2) alternatives
n2=02 (0, fo,) p
Od
1 1
M1 -m2
m-l
ho 2
According to the case, the set to be consulted is
=n,=2 -
, if (J1 = u2 = 0
"1
! 1 i
i M-l -m2
-
1.1 (two-sided test) type I risk al = 0,05
In the particular case where u1 = o2 = a, nl = n2 = n, it
- 2.1 (two-sided test) type I risk Q = 0,Ol
is more suitable to define, for the different values of the
- 3.1 (one-sided test) type I risk & = 0,05
differente ml -m2
the alternative by the Parameter
I
x (0 < x < m), with
- 4.1 (one-sided test) type I risk Q = 0,Ol
Im1 77721
ß is the Ordinate of the Point on the abscissa h on the curve
a) X-
(two-sided test) alternatives ml # m2
4-
v = 00 of the suitable set.
6
---------------------- Page: 12 ----------------------
SIST ISO 3494:1996
ISO 3494-1976 (E)
3.5.1 The consumer envisages selecting 10 bobbins from a
mg-m2
b) X= (one-sided test ml
batch of each of the two processes, and wishes to know the
d-
probability that he will not reject the hypothesis m1 = m2
mdm2
(hence to accept the batch of the new process) while in
fact Im1 - m2 1 would be equal to 0,30.
m2--m
c) x= (one-sided test ml > m2) alternatives
04
The set to be consulted is set 1.1, with
m
-m21
Im1
and to use according to the case, one of the following sets :
x=
“d
- 1.2 (two-sided test) type I risk cy = 0,05
-m2J = 0,30
- 2.2 (two-sided test) type I risk cy = 0,Ol
Im,
- 3.2 (one-sided test) type I risk a = 0,05
- 4.2 (one-sided test) type I risk CY = 0,Ol
od- ,/j+~=,,$= ,/$&33=-0,,476
n is the Ordinate of the Point on the abscissa h on the
straight line (broken line) which corresponds to the given
0,30
value ß.
x= -= 2,03
0,147 6
3.5 Example
The curve v = 00 gives for 100 ß the value 47 : ß = 0,47 or
47 %.
A Producer of cotton yarn has modified his process, but
according to his declaration, the mean breaking load
remains the same (m, = m2), m1 corresponding to the old
process and m2 to the new.
The consumer is prepared to adopt the new process, but
3.5.2 This value being considered by the consumer as
wishes to verify the declaration of the Producer, by
much too high, he decides to select samples of a sufficiently
carrying out on elements of yarn of a given length taken
large size for the risk ß to be reduced to 0,lO (or 10 %)
from different bobbins, the two-sided test of the hypothesis
when ml - m2 = 0,30.
= m2 as described in ISO 2854, with for the value of
ml
the type I risk cy = 0,05 (a! is therefore here the “producer’s The set to be consulted is set 1.2, with
risk”).
0,30
- m21
JMl
--= -=
0,64
h=
The consumer knows, from experience, that for all the
0,33 fl-
4-
productions of this Producer, the dispersion of the breaking
The value of n, read on the straight line (broken line)
load is practically constant and characterized by a Standard
ß = O,lO, isn = 26.
deviation CJ = 0,33.
7
---------------------- Page: 13 ----------------------
SIST ISO 3494:1996
ISO 3494-1976 (E)
ml -m2
4 COMPARISON OF TWO MEANS (VARIANCES
b) h= (one-sided test m,
UNKNOWN BUT MAY BE ASSUMED EQUAL)
Od
mdm2
See table C’ of ISO 2854.
m2777-I
c) x=--- (one-sided test m, 2 m2) alternatives
IMPORTANT NOTE
Od
m-l
The type ll risk ß depends on the true value o of the
Standard deviation of the two populations, which is
According to the case, the set to be consulted is
unknown. Hence ß tan only be known approximately, and
-
1.1 (two-sided test) type I risk a! = 0,05
this provided that an Order of magnitude of o is available.
In the absence of any valid previous information, one will
- 2.1 (two-sided test) type I risk cy = 0,Ol
take for o the estimation s obtained from samples.
- 3.1 (one-sided test) type I risk LX = 0,05
lt is strongly recommended that the influence on the values
read on the curves of an error made for the Standard -
4.1 (one-sided test) type I risk ~1: = 0,Ol
deviation u should be considered. The inaccuracy tan be
ß is the Ordinate of the Point on the abscissa X on the curve
very great where u has been estimated from samples of
h = nl + n2 - 2 of the suitable set.
small size; allowance for this Situation tan be made by
placing s within the confidence limits for u, calculated by
When only the total size of the two samples is fixed,
the method in table F of ISO 2854.
nl $172 = 2n, it
is of interest to take nl = n2 = n
(p minimum). One then has :
4.1 Notations
n Im, -m21
x=
Population Population
2 0
i-
No. 1 No. 2
-- -P
r
Sample stze
“1 2
4.4 Problem 2 : ß being given, determine the common
Mean
m2
M-l
size n of the samples
Variante (whlch wrll be
/
2
,
o2 CJ For the different values of the differente ml - m2, the
replaced by an approxmate
value) alternative is defined by the Parameter ?I (0 < X < m), with
-.~- ~ _ _. _ __._. ._. . . .- - 1.
1’ n1+n2 2 Im1 - m21
Number of degrees of freedom a) X- (two-sided test) alternatives ml # m2
O\h
12 (n l),Ifn, n2 nJ
m1-m2
!rq + n2
b) AZ----------
/ (one-sided test m1 Gm,) alternatives
~ 17
rrd 1
4-
Standard deviation of the k’ "l"2
m1 >m*
differente between the
means of the two samples
0, if n1 -- n2 n
m2-ml
c) x=------ (one-sided test ml Zm2) alternatives
(4
m+l cf772
4.2 Tested hypotheses
According to the case, the set to be consulted is
For a two-sided test, the null hypothesis is ml = m2, the
- 1.2 (two-sided test) type I risk cx = 0,05
alternative hypotheses corresponding to ml # m2.
- 2.2 (two-sided test) type I risk cx = 0,Ol
For a one-sided test, the null hypothesis is
- 3.2 (one-sided test) type I risk a = 0,05
alternative hypotheses
a) either the
m6m2,
-
corresponding to ml > m2;
4.2 (one-sided test) type I risk CY = 0,Ol
>
b) or the alternative hypotheses
n is the Ordinate of the Point on the abscissa h on the
m--l Hm21
corresponding to ml < m2.
curve which corresponds to the given value ß.
4.3 Problem 1 : nl and n2 being given, determine the
4.5 Example
risk ß
The example is the Same as in 3.5, but the consumer does
For the different values of the differente ml -m2, the
not know the exact value of the Standard deviation of the
alternative is defined by the Parameter h (0 < X
breaking loads. He only knows that there is a great
im1 77721 likelihood that it will be the same for the two batches
a) h= (two-sided test) alternatives m 1 # m2
= 0,).
(01
Od
8
---------------------- Page: 14 ----------------------
SIST ISO 3494:1996
ISO 3494-1976 ( E)
It is therefore not very probable that o will be greater than
4.5.1 The consumer envisages selecting IO bobbins from a
batch of each of the two processes, and wishes to know the
probability that he will not reject the hypothesis ml = m2
OS =&BiT= 0,53
(hence to accept the batch of the new process), while in
fact Im, -m2 / would be equal to 0,30.1)
The set to be consulted is set 1.1, with
n Im1 77.721
The measurements carried out on the two samples give the
A, z
/ 1,27
following results : 2 OS =
il: (x, GL,)2 = 1,256 3 For v = 18, one finds (by interpolation) that the
a) First batch : XI = 2,176
corresponding value of 100 ß is close to 80 : the upper limit
b) Second batch : X2 = 2,520 31 (x2 - X2)2 = 1,389 7
of the type I I risk is about 0,80 (or 80 %).
The small differente between the two sums of the squares
4.5.2 The consumer wishes, in the most unfavourable
is perfectly compatible with the hypothesis made above
hypothesis (o = os = 0,53), fl not to exceed 0,20 (or 20 %)
that : 0: = 02 (see table G of ISO 2854).
when Im, - m21 = 0,30.
The estimation of the common variance 02 for the two
The set to be consulted is set 1.2, curve ß = 0,20, with
batches is
0,30
1,256 3 + 1,389 7 2,646 0 im1 774
s2 = = - = 0,147 0 x= -=0,4
10+10-2 18 = 0,53 fl
0s 4
The upper limit of 02, at the confidence level 1 - a = 0,95, For fl = 0,20 and h = 0,4, one finds n = 49.
is (see table F of ISO 2854)
The 2 x 50 = 100 measurements will permit a quite
accurate estimation of o, on the basis of which set 1 .l will
0
lJ2 - 2,646 0 ----=0,281 - 2,646 8
give an approximate value of the type II risk associated
S-
9,39
y; o5 (18)
with the alternative ml - m2 = 0,30.
I
1) That is, the probability that when using the Student test with the significance level u’ 0,05, a differente iml “2, . Cl,30 will not be
revealed.
9
---------------------- Page: 15 ----------------------
SIST ISO 3494:1996
ISO 3494-1976 (E)
5 COMPARISON OF A VARIANCE OR OF A 5.4 Problem 2 : p being given, determine the size n
STANDARD DEVIATION WITt-! A GIVEN VALUE
According to the case, the set to be consulted is
See table E of ISO 2854.
-
5.2 (two-sided test) type I risk 0 = 0,05
- 6.2 (two-sided test) type I risk u = 0,Ol
5.1 Notations
-
7.2 (one-sided test ~2 < c$) type I risk CY = O,O5
n = Sample size
- 8.2 (one-sided test 02 G 0;) type I risk CI = 0,Ol
02 = variance of the population (o = Standard deviation of
- 9.2 (one-sided test 02 > 06) type I risk 2 = 0,05
the population)
- 10.2 (one-sided test o 2 > 0;) type I risk a = 0,Ol
0; = given value for the variance (o. = given value for the
n is the Ordinate of the Point on the abscissa h on the curve
Standard deviation)
which corresponds to the give n value .
ß
5.5 Example
5.2 Tested hypotheses
A Producer of cotton yarn states that he has improved the
For a two-sided test, the null hypothesis is 02 = CJ$
quality of his process by a reduction in the dispersion of
(0 = OO), the alternative hypotheses corresponding to
the breaking loads which was formerly characterised by a
02
...
NORME INTERNATIONALE 3494
INTERNATIONAL ORGANIZATION FOR STANDAROIZATION .MEWlYHAPOnHAR OPrAHM3AUMII ll0 CTAHDAPTMJAUHH .ORGANISATION INTERNATIONALE DE NORMALISATION
Interprétation statistique des données - Efficacité des tests
portant sur des moyennes et des variances
Statistical interpretation of data - Power of tests relating to means and variances
Premiere Bdition - 1976-12-01
1
LL
-
RBf. no : IS0 3494-1976 (FI
CDU 519.28
m
s
IF
Descripteurs : statistique, donnée, moyenne mathématique, variance, essai, test statistique, rendement, efficacité.
O
2
Prix base sur 44 pages
i!
---------------------- Page: 1 ----------------------
AVANT-PROPOS
L'ISO (Organisation Internationale de Normalisation) est une fédération mondiale
d'organismes nationaux de normalisation (Comités Membres ISO). L'élaboration des
Normes Internationales est confiée aux Comités Techniques ISO. Chaque Comité
Membre intéressé par une étude a le droit de faire partie du Comité Technique
correspondant. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l'lS0, participent également aux travaux.
Les Projets de Normes Internationales adoptés par les Comités Techniques sont
soumis aux Comités Membres pour approbation, avant leur acceptation comme
Normes Internationales par le Conseil de I'ISO.
La Norme Internationale IS0 3494 a été établie par le Comité Technique
ISO/TC 69, Applicatïon des méthodes statistiques, et a été soumise aux Comités
Membres en mars 1975.
Elle a été approuvée par les Comités Membres des pays suivants
Afrique du Sud, Rép. d' Hongrie Ro+aume-Uni
Allemagne Inde Suisse
Tchécoslovaquie
Australie Israël
Turquie
Autriche Mexique
U.R.S.S.
Belgique Nouvelle-Zélande
Brésil Pays-Bas U.S.A.
Bulgarie Pologne Yougoslavie
Canada Portugal
France Roumanie
Les Comités Membres des pays suivants ont désapprouvé le document pour des
raisons techniques :
Japon
Suède
O Organisation Internationale de Normalisation, 1976
Imprime en Suisse
ii
---------------------- Page: 2 ----------------------
SOMMAI RE
Page
SECTION UN : TESTS DE COMPARAISON
- Remarques générales .
...............
1
.................
- Note historique .
2
MOYENNES
? Bf Brence
du
:hapitre Tests de comparaison Variance(s1
tableau
I'ISO
de
2854
1 Comparaison d'une moyenne a
une valeur donnee connue
A .
.. 3
2 Comparaison d'une moyenne a
A'
une valeur donnee inconnue . . 4
3 Comparaison de deux moyennes connues C . .
6
Comparaison de deux moyennes inconnues
4 C' . .
8
-
VARIANCES
RBfBrence
du
Chapitre Tests de comparaison tableau
de I'ISO
2854
6 une valeur
5 Comparaison d'une variance
E .
donnee . . 10
G .
6 Comparaison de deux variances . . 11
SECTION DEUX : DIAGRAMMES
- Références des diagrammes .
...............
12
.............
............... 13
- Diagrammes
iii
---------------------- Page: 3 ----------------------
-
NORME INTERNATIONALE IS0 3494- 1976 (F)
Interprétation statistique des données - Efficacité des tests
portant sur des moyennes et des variances
SECTION UN : TESTS DE COMPARAISON
REMARQUES GÉNÉRALES pour le risque de 1" espèce, de l'effectif du (ou des)
échantillon(s) et de la nature du test (bilatéral ou
unilatéral).
1) La présente Norme Internationale fait suite à
I'ISO 2854, Interprétation statistique des données -
les tests de comparaison de moyennes, 0 dépend aussi
Dans
Techniques d'estimation et tests portant sur des moyennes
de I'écart-type de la (ou des) population(s). Lorsque celui-ci
et des variances.
est inconnu, le risque 0 ne peut pas être connu exactement.
Les conditions d'emploi de la présente Norme
5) Les courbes d'efficacité peuvent être utilisées dans les
Internationale sont celles qui sont spécifiées dans les
problèmes suivants :
((Remarques générales)) de I'ISO 2854. II est rappelé que
les tests utilisés ne sont valables que si la distribution du
a) problème 1 : Pour une alternative et un effectif (ou
caractère étudié est supposée normale (voir commentaires
des effectifs) d'échantillon donnés, déterminer la
au point 3) des ((Remarques générales)) dans I'ISO 2854).
probabilité fi de ne pas rejeter l'hypothèse nulle (risque
Dans I'ISO 2854, le risque de Ire espèce (ou niveau de
de 2'3 espèce);
signification) est seul pris en considération. La présente
Norme Internationale introduit les notions de risque de 2e b) problème 2 : Pour une alternative et une valeur
espèce et d'efficacité d'un test. données de 0, déterminer l'effectif (ou les effectifs)
d'échantillon à prélever.
2) II est aussi rappelé que le risque de Ire espèce est la
probabilité de rejeter l'hypothèse soumise au test Bien qu'une seule série de diagrammes permette de
(hypothèse nulle) lorsque cette hypothèse est vraie (cas des résoudre les deux problèmes, deux séries de diagrammes
tests bilatéraux), ou la valeur maximale de cette probabilité seront présentées, afin de faciliter les applications
(cas des tests unilatéraux). Le non-rejet de l'hypothèse nulle pratiques :
conduit, dans la pratique, à l'acceptation de cette
- diagrammes 1.1 à 14.1, donnant en fonction de
hypothèse, mais il n'en résulte pas que celle-ci est vraie.
l'alternative, pour a = 0,05 ou a! = 0,Ol et pour diffé-
rentes valeurs de l'effectif (ou des effectifs) d'échan-
0, est, en conséquence,
Le risque de 2e espèce, désigné par
tillon, le risque 0;
la probabilité de ne pas rejeter l'hypothèse nulle alors que
celle-ci est fausse. Le complément de la probabilité de
- diagrammes 1.2 à 14.2, donnant en fonction de
commettre l'erreur de 2e espèce (1 -0) est la ((puissance))
l'alternative, pour a = 0.05 ou a = 0,Ol et pour
du test (voir ((Note historique)) à la suite de ces
différentes valeurs du risque 0, l'effectif (ou les effectifs)
((Remarques générales))).
d'échantillon à prélever.
3) Tandis que la valeur du risque de 1'8 espèce est choisie
6) L'attention est attirée sur la signification pratique de
le client, compte tenu des conséquences que ce risque
par
l'interprétation statistique au moyen des tests d'hypothèse
est susceptible d'entraîner (on prend généralement l'une des
et des courbes d'efficacité. Lorsqu'on teste une hypothèse
valeurs (Y= 0,05 ou a= 0,01), le risque de 2" espèce
telle que m = mo (ou ml = m2), on désire généralement
dépend de l'hypothèse vraie (Ho étant fausse), c'est-à-dire
savoir si t'on peut conclure, avec un faible risque de se
de l'hypothèse alternative opposée à l'hypothèse nulle.
tromper, que m n'est pas trop différent de mo (ou ml pas
Dans la comparaison de la moyenne d'une population a une
trop différent de m2). De même, le choix de la valeur
valeur donnée mo, par exemple, une alternative particulière
a! = 0,05 ou (Y = 0,Ol pour le risque de 1" espèce associé
correspond 6 une valeur de la moyenne de la population
au test comporte une part d'arbitraire. II peut donc être
m fmo, c'est-à-dire à une différence m -mo f O. D'une
utile d'examiner quel serait le résultat du test pour des
façon générale, dans les tests portant sur des moyennes et
valeurs voisines de mo (ou des valeurs de la différence
des variances, les alternatives sont définies par les valeurs
D = ml - m2 voisines de O), avec éventuellement les deux
susceptibles d'être prises par un paramètre.
risque de
valeurs du Ire espèce 01 = 0,05 et a = 0.01 et,
dans de telles circonstances, d'évaluer au moyen des
4) La courbe d'efficacité d'un test est la courbe qui donne,
courbes d'efficacité le risque associé à différentes
en fonction du paramètre qui définit l'alternative, la valeur
alternatives.
0 du risque de 2e espèce; 0 dépend aussi de la valeur choisie
---------------------- Page: 4 ----------------------
IS0 3494-1976 (FI
7) Les diagrammes qui sont donnés dans la section deux II n'est d'ailleurs pas nécessaire d'introduire le terme de
de la présente Norme Internationale sont décrits et
((puissance)). On peut plus simplement parler de la
commentés dans six chapitres qui correspondent aux
probabilité qu'un test statistique appliqué B un échantillon,
tableaux de I'ISO 2854.
4 un niveau de signification (Y, révèle qu'un paramètre h de
la population diffère (lorsqu'il en est bien ainsi) d'au moins
La correspondance détaillée entre les différents
une quantité donnée d'une valeur spécifiée ho ou soit, par
diagrammes, les problèmes qu'ils permettent de résoudre,
rapport à celle-ci, dans un rapport au moins égal B un
les chapitres de la présente Norme Internationale et les
nombre donné.
tableaux de I'ISO 2854, figure en tête de l'ensemble des
diagrammes.
Le changement de notation a probablement été introduit
aux U.S.A. par les praticiens des applications industrielles
NOTE HISTORIQUE
de la statistique, afin qu'en même temps que le ((risque du
fournisseur (Y)), soit pris en considération le ((risque du
Les concepts de risques de 1re et de 28 espèce ont été
client)), désigné alors par p.
introduits par J. Neyman et ES. Pearson dans un article
1928. Par la suite, ces auteurs ont estimé que le
paru en
complément de la probabilité de commettre l'erreur de
Le symbole a été retenu pour le risque de 28 espèce dans
2e espèce - qu'ils appelèrent la ((puissance)) du test, dans I'ISO3534, Statistique - Vocabu/aire et symboles. II a
sont aptitude B révéler comme significative une alternative donc été adopté avec la même signification dans la présente
spécifiée à l'hypothèse nulle (ou hypothèse testée) - était
Norme Internationale. Cependant, comme ce symbole
en général un concept plus facile à comprendre pour les est utilisé, et continuera sans doute à &re utilisé dans les
praticiens. C'est cette ((puissance)), ou probabilité de révéler deux sens dans la littérature statistique, il convient de
un écart donné à l'hypothèse nulle, qu'ils désignèrent par le s'assurer, dans chaque cas d'utilisation, du sens qui lui est
symbole p. effectivement attribué.
2
---------------------- Page: 5 ----------------------
IS0 3494-1976 (FI
1 COMPARAISON DUNE MOYENNE A UNE VALEUR
m -mo
b)
A=- (test unilatéral m < mo) alternatives
DONNeE (VARIANCE CONNUE)
U
m >mo
A de I'ISO 2854.
Voir tableau
m -mo
c) A=-- (test unilatéral m 2 mol alternatives
Q
1 .I Notations
m
n = effectif de I'échantillon
Suivant le cas, le diagramme à consulter est
m = moyenne de la population
- 1.2 (test bilatéral) risque de 1" espèce a! = 0,05
mo = valeur donnée
- 2.2 (test bilatéral) risque de 1'8 espèce a! = 0,Ol
U = écart-type de la population
- 3.2 (test unilatéral) risque de 1 re espèce (Y = 0,05
- 4.2 (test unilatéral) risque de 1 re espèce a = 0,Ol
1.2 Hypothèses testées
n est l'ordonnée du point d'abscisse A sur la droite (tracée
Pour un test bilatéral, l'hypothèse nulle est m = mo, les
en pointillé) qui correspond à la valeur donnée p.
hypothèses alternatives correspondant à m f mo.
1.5 Exemple
Pour un test unilatéral, l'hypothèse nulle est
Un fournisseur de fil de coton garantit, pour chacun des
a) soit m < mo, les hypothèses alternatives correspon-
lots qu'il livre, une charge de rupture moyenne (exprimée
dant à m > mo;
en newtons) au moins égale à mo = 2,30. Le client ne
consent à accepter les lots qu'après avoir vérifié sur des
b) soit m'> mo, les hypothèses alternatives correspon-
dantàm
le test unilatéral, tel qu'il est décrit
différentes bobines, que
dans I'ISO 2854, ne conduit pas à rejeter l'hypothèse
m >mo = 2,30, la valeur choisie pour le risque de
1.3 Problème 1 : n étant donné, déterminer le risque
1re espèce étant a! = 0,05 (a! est donc ici le ((risque du
Pour les différentes valeurs de m, on définit l'alternative par fournisseur,).
le paramètre A (O < A <-I, avec
Le client sait, par expérience, que la moyenne des différents
GIm-mOI lots peut varier, mais que la dispersion des charges de
a) A= (test bilatéral) alternativesm # mo
rupture, à l'intérieur d'un même lot, est pratiquement
U
constante et caractérisée par un écart-type U = 0,33.
fi(m-mo)
A= (test unilatéral m Q mo) alterna-
b)
1.5.1 Le client envisage de prélever n = 10 bobines par lot,
tives m > mo et désire connaltre la probabilité qu'il aura de ne pas rejeter
l'hypothèse m 2 2,30 (donc d'accepter le lot), alors qu'en
-41 (m -mol
fait la charge moyenne de rupture serait m = 2,lO.
c) A= (test unilatéral m 2 mol alterna-
U
Le diagramme à consulter est le diagramme 3.1. La valeur
tives m < mo
du paramètre A, pour m = 2,10, est
Suivant le cas, le diagramme à consulter est
-fi(m-mo) fi (2.30-2,IO)
-
A= -
= ,,92
- 1.1 (test bilatéral) risque de 1 re espèce a = 0,05
U 0,33
- 2.1 (test bilatéral) risque de lre espèce a = 0,Ol
La droite v = 00 donne pour 100 p la valeur 36 : p = 0,36
ou 36 %.
- 3.1 (test unilatéral) risque de lre espèce a = 0,05
- 4.1 (test unilatéral) risque de lre espèce a = 0,Ol
1.5.2 Cette valeur étant considérée par le client comme
beaucoup trop élevée, celui-ci décide de prélever un
p est l'ordonnée du point d'abscisse A sur la courbe v = 00
échantillon d'effectif suffisamment important pour que le
du diagramme convenable.
risque s'abaisse à 0,lO (ou 10 %) si m = 2,lO.
Le diagramme à consulter est le diagramme 3.2. La valeur
du paramètre A, pour m = 2,10, est
1.4 Problème 2 : p Btant donné, déterminer l'effectif n
m-mo 2,3Q-2,lO
Pour les différentes valeurs de m, on définit l'alternative par
A=--- - = 0.61
U O ,33
le paramètre A (O < X < -), avec
La valeur de n, lue sur la droite (tracée en pointillé)
Im -mol
a) A= (test bilatéral) alternatives m # mo
fi= 0,10, est n = 22.
~
3
---------------------- Page: 6 ----------------------
IS0 3494-1976 (FI
2 COMPARAISON DUNE MOYENNE A UNE VALEUR
Suivant le cas, le diagramme à consulter est
DONNÉE (VARIANCE INCONNUE)
- 1.1 (test bilatéral) risque de Ire espèce a! = 0,05
Voir tableau A' de I'ISO 2854.
- 2.1 (test bilatéral) risque de Ire espèce (Y = 0,Ol
R EMARQUE IMPORTANTE
- 3.1 (test unilatéral) risque de Ire espèce a! = 0,05
Le risque de 2e espèce 0 dépend de la vraie valeur U de
- 4.1 (test unilatéral) risque de 1" espèce a! = 0,Ol
I'écart-type de la population, qui est inconnu. On ne peut
est l'ordonnée du point d'abscisse X sur la courbe
donc connaltre 0 que de façon approximative, et à
U = n - 1 du diagramme convenable.
condition de disposer d'un ordre de grandeur de U. A défaut
d'information antérieure valable, on prendra pour U
2.4 Problème 2 : /3 &ant donné, déterminer l'effectif n
l'estimations obtenue sur I'échantillon.
Pour les différentes valeurs de rn, on définit l'alternative par
II est vivement conseillé d'examiner la répercussion sur les
le paramètre X (O < X < m), avec
valeurs lues sur les courbes, d'une erreur commise sur
I'écart-type U. L'imprécision peut être très grande lorsque U
Im -mol
a été estimé à partir d'un échantillon de faible effectif; on a) h= (test bilatéral) alternatives rn # rno
U
pourra s'en rendre compte en encadrant s par les limites de
confiance de U calculées selon la méthode du tableau F de
rn -rno
b) A=- (test unilatéral m Grno) alternatives
I'ISO 2854.
U
rn >rno
2.1 Notations
rn -rno
n = effectif de I'échantillon
c) A=-- (test unilatéral rn 2 rno) alternatives
U
rn
rn = moyenne de la population
mo = valeur donnée Suivant le cas, le diagramme à consulter est
- 1.2 (test bilatéral) risque de 1" espèce a! = 0,05
U = écart-type de la population (que l'on remplacera par
une valeur approchée)
- 2.2 (test bilatéral) risque de 1'8 espèce a! = 0,Ol
U =n-I
- 3.2 (test unilatéral) risque de l'a espèce a! = 0,05
- 4.2 (test unilatéral) risque de 1 re espèce a = 0,Ol
2.2 Hypothèses testées
n est l'ordonnée du point d'abscisse X sur la courbe qui
Pour un test bilatéral, l'hypothèse nulle est rn =mo, les
correspond à la valeur donnée 0.
hypothèses alternatives correspondant à rn # rno.
Pour un test unilatéral, l'hypothèse nulle est
2.5 Exemple
a) soit rn G rno, les hypothèses alternatives correspon-
L'exemple est le même que celui traité en 1.5, mais le client
dant à rn > rno;
ignore la valeur exacte de l'kart-type des charges de
rupture. II sait cependant par expérience que celui-ci est
b) soit m 2 rno, les hypothèses alternatives correspon-
quasi-certainement compris entre les limites
dant àm
UI = 0,30 US = 0,45
2.3 Problème 1 : n étant donné, déterminer le risque 0
2.5.1 Le client envisage de prélever n = 10 bobines par lot,
Pour les différentes valeurs de rn, on définit l'alternative par et désire connaltre la probabilité qu'il aura de ne pas rejeter
le paramètre X (O < X
fait la charge moyenne de rupture serait rn = 2,lO.l)
film -mol
(test bilatéral) alternatives m # rno
a) X=-
Le diagramme à consulter est le diagramme 3.1. Les valeurs
U
du paramètre h qui correspondent aux valeurs extrêmes de
-mol U sont
b) X= (test unilatéral rn < rno) alterna-
U
60 (2.30 -2,101
tives rn > mo
= 2,l
'I = 0,30
-.\/;;(m-rno)
c) X= (test unilatéral rn 2 rno) alterna-
.\/io (2,30-2,10)
U
= 1,4
hs =
0,45
tives rn < rno
1) C'est-Adire la probabilité qu'en utilisant le test t de Student avec le niveau de signification 01 = 0.05. la valeur m = 2.10 ne soit pas révélée
comme significativement inférieure B mo = 2,30.
4
---------------------- Page: 7 ----------------------
IS0 3494-1976 (FI
Les valeurs correspondantes de 100 0, lues (par
Le diagramme à consulter est le diagramme 3.2, courbe
interpolation) pour v = 9, sont 40 et 64; soit P = O, 1 O, avec
PI = 0,40 (OU 40 %)
2,30 - 2,lO
h= = 0,44
0.45
0s = 0,64 (OU 64 %)
Pour 0 = 0,lO et h = 0,44, on trouve n de l’ordre de 45.
Après contrble de quelques lots, s‘il est constaté que
l’écart-type est stable, U pourra être estimé avec une
2.5.2 Le clien désire que, dans l’hypothèse la plus meilleure précision; l‘effectif à prélever dans les lots
défavorable (U = US = 0,45), 0 ne dépasse pas 0,lO (ou suivants pourra vraisemblablement Btre réduit, les garanties
10 %) si rn = 2,lO. du fournisseur et du client étant conservées.
---------------------- Page: 8 ----------------------
IS0 3494-1976 (FI
3 COMPARAISON DE DEUX MOYENNES (VARIAN-
Lorsque l'effectif total des deux échantillons esf fixé,
CES CONNUES)
nl +n2 = 2 n, on obtient la meilleure efficacité (0
minimum) avec
Voir tableau C de I'ISO 2854.
"I "2
-=-
3.1 Notations
01 02
d'oh
Population 1 Population 2
U.
n1 =2n -
Effectif de I'dchantillon
01 +a2
"1 "2
Moyenne
02
n2=2n -
Variance
01 +O2
I
~ ~~
Écart-type de la
difference des moyennes
des deux Bchantillons
3.2 Hypothèses testées
Pour un test bilatéral, l'hypothèse nulle est ml =m2, les
hypothèses alternatives correspondant à ml # m2.
3.4 Probleme 2 : 0 étant donné, déterminer les effectifs
Pour un test unilatéral, l'hypothèse nulle est
nl et n2
a) soit ml < m2, les hypothèses alternatives correspon-
Utilisant, suivant le cas, les diagrammes 1.1, 2.1, 3.1 ou 4.1,
à ml >m2;
dant
la courbe v = 00 permet de résoudre le problème dans le cas
général. Au point d'ordonnée 0 de cette courbe correspond
b) soit ml > m2, les hypothèses alternatives correspon-
l'abscisse A, et tout couple (nl, n2) convient, à condition
dant à ml < m2.
que
3.3 Probldme 1 : n1 et n2 étant donnés, déterminer le
risque 0
Le prélèvement le plus économique (nl + n2 minimum) est
tel que
Pour les différentes valeurs de la différence ml -m2, on
définit l'alternative par le paramètre h (O < h
"I n2
-=-
01 02
Im1 -m2l
a) X= (test bilatéral) alternatives ml # m2
ad
d'où
ml -m2
b) A= (test unilatéral ml
ad
n1 =al (a, +a2)
ml >m2
m2 -ml
c) h= (test unilatéral ml 2 m2) alternatives
n2 = a2 (al + a2)
ad
ml
Suivant le cas, le diagramme à consulter est
- 1 .I (test bilatéral) risque de 1 r* espèce a = 0,05
Dans le cas particulier où u1 = a2 = a, n, = n2 = n, il est
- 2.1 (test bilatéral) risque de Ire espèce a = 0,Ol
plus commode de définir, pour les différentes valeurs de la
- 3.1 (test unilatéral) risque de Ire espèce OL = 0,05
différence ml -m2, l'alternative par le paramètre
h (O < h < 04, avec
- 4.1 (test unilatéral) risque de Ire espèce a = 0,Ol
I~I -m2l
0 est l'ordonnée du point d'abscisse h sur la courbe v = O0
a) A= (test bilatéral) alternatives ml #ma
du diagramme convenable.
6
---------------------- Page: 9 ----------------------
IS0 3494- 1976 ( F)
3.5.1 Le client envisage de prélever 10 bobines dans un lot
ml -m2
b) A= (test unilatéral ml < m2) alternatives
de chacune des deux fabrications, et désire connaOtre la
probabilité qu'il aura de ne pas rejeter l'hypothèse
ml = m2 (donc d'accepter le lot de la nouvelle fabrication),
m2 -ml alors qu'en fait Iml -m21 serait égale a 0,30.
c) X = 7 (test unilatéral ml 2 m2) alternatives
a2
Le diagramme à consulter est le diagramme 1.1, avec
ml
Iml -+I
et d'utiliser, suivant le cas, l'un des diagrammes suivants :
h=
ud
- 1.2 (test bilatéral) risque de 1" espèce a = 0.05
- 2.2 (test bilatéral) risque de Ire espèce (Y = 0,Ol
Im, -m21 = 0,30
- 3.2 (test unilatéral) risque de Ire espèce a = 0,05
- 4.2 (test unilatéral) risque de lre espèce a = 0,Ol
ad = i:+ ;=&a = GxO.33 = 0,147 6
n est l'ordonnée du point d'abscisse X sur la droite (tracée
en pointillé) qui correspond à la valeur donnée p.
O ,30
= -= 2,03
3.5 Exemple
0,147 6
Un fournisseur de fil de coton a modifié sa fabrication,
La courbe v = m donne pour 100 0 la valeur 47 : = 0.47
mais selon sa déclaration, la charge de rupture moyenne
ou 47 %.
reste la même (ml = m2), ml correspondant à l'ancienne
fabrication et m2 à la nouvelle.
3.5.2 Cette valeur étant considérée par le client comme
Le client est disposé à adopter la nouvelle fabrication, mais
beaucoup trop élevée, celui-ci décide de prélever des
désire vérifier la déclaration du fournisseur en effectuant,
échantillons d'effectif suffisamment important pour que le
sur des éléments de fil d'une longueur donnée, prélevés dans
risque 0 s'abaisse à 0,lO (ou 10 %) lorsque
différentes bobines, le test bilatéral de l'hypothèse
Iml - m2 I = 0,30.
ml = m2, tel qu'il est décrit dans I'ISO 2854, avec pour
Le diagramme à consulter est le diagramme 1.2, avec
valeur du risque de Ire espèce a = 0.05 (a est donc ici
le ((risque du fournisseur))).
Le client sait, par expérience, que, pour toutes les
productions du fournisseur, la dispersion des charges de
rupture est pratiquement constante et caractérisée par un La valeur de n, lue sur la droite (tracée en pointillé)
= 0,10, est n = 26.
écart-type a = 0.33.
7
---------------------- Page: 10 ----------------------
IS0 3494 976 (FI
4 COMPARAISON DE DEUX MOYE,NNES (VARIAN-
ml -m2
b) A= (test unilatéral ml < m2) alternatives
CES INCONNUES, MAIS PRESUMEES EGALES)
ud
Voir tableau C' de I'ISO 2854.
m2 -m1
c) A=- (test unilatéral ml 2 m2) alternatives
REMARQUE IMPORTANTE
(Jd
ml
Le risque de 2e espèce @ dépend de la vraie valeur O de
I'écart-type des deux populations, qui est inconnu. On ne
Suivant le cas, le diagramme à consulter est
peut donc connaltre @ que de façon approximat[ve, et à
- 1 .I (test bilatéral) risque de Ire espèce a! = 0,05
condition de disposer d'un ordre de grandeur de U. A défaut
d'information antérieure valable, on prendra pour U
- 2.1 (test bilatéral) risque de Ire espèce a! = 0,Ol
l'estimation, s, obtenue sur les échantillons.
- 3.1 (test unilatéral) risque de 1'8 espèce a! = 0,05
II est vivement conseillé d'examiner la répercussion sur les
valeurs lues sur les courbes, d'une erreur commise sur - 4.1 (test unilatéral) risque de 1" espèce 01 = 0,Ol
I'écart-type U. L'imprécision peut être très grande lorsque
fl est l'ordonnée du point d'abscisse A sur la courbe
O a été estimé à partir d'échantilions de faible effectif; on
v = nl + n2 - 2 du diagramme convenable.
pourra s'en rendre compte en encadrant s par les limites
de confiance de U, calculées selon la méthode du tableau F
Lorsque l'effectif total des deux échantillons est seul fixé,
de I'ISO 2854.
nl +n2 = 2n, il y a intérêt à prendre nl =n2 = n (6
minimum). On a alors
4.1 Notations
I Population 1 Population 2
Effectif de I'Bchantillon
"1 " 2
4.4 Problème 2 : fl étant donné, déterminer l'effectif
Moyenne
ml m2
commun n des échantillons
Variance (que l'on
remplacera par une valeur U2 U2
Pour les différentes valeurs de la différence ml -m2, on
approchde)
définit l'alternative par le paramètre h (O < A < 4, avec
v=nl +n2-2,
lm1 -m2l
Degres de liberte
a) A= (test bilatéral) alternatives ml # m2
12 (n- 1),si n1 =n2= n]
Ofi
I I
ml -m2
"1 +"2
b) A= (test unilatéral ml Q m2) alternatives
Écart-type de la ad= is
difference des moyennes
des deux Bchantillons
m2 -m1
c) A =----J-- (test unilatéral ml >m2) alternatives
O2
ml
4.2 Hypothèses testées
Suivant le cas, le diagramme à consulter est
Pour un test bilatéral, l'hypothèse nulle est ml =m2, les
- 1.2 (test bilatéral) risque de 1" espèce a! = 0,05
hypothèses alternatives correspondant à ml # m2.
- 2.2 (test bilatéral) risque de 1'8 espèce a! = 0,Ol
Pour un test unilatéral, l'hypothèse nulle est
- 3.2 (test unilatéral) risque de 1 re espèce a = 0,05
a) soit ml < m2, les hypothèses alternatives correspon-
dant àml >m2;
- 4.2 (test unilatéral) risque de Ire espèce a! = 0,Ol
b) soit ml >m2, les hypothèses alternatives correspon-
n est I'ordonnbe du point d'abscisse X sur la courbe qui
dant àml
correspond à la valeur donnée p.
et n2 étant donnés, déterminer le
4.3 Problème 1 : nl
risque @
4.5 Exemple
Pour les différentes valeurs de la différence ml -m2, on
L'exemple est le même que celui traité en 3.5, mais le client
définit l'alternative par le paramètre X (O < X < M), avec
ignore la valeur exacte de l'kart-type des charges de
rupture. II sait seulement qu'il y a de très fortes chances
Im1 -m21
a) X= (test bilatéral) alternatives ml # m2
qu'il soit le m&me pour les deux lots (al = ~2).
ad
8
---------------------- Page: 11 ----------------------
IS0 3494- 1976 ( F)
4.5.1 Le client envisage de prélever 10 bobines dans un lot
Le diagramme à consulter est le diagramme 1.1, avec
de chacune des deux fabrications, et désire connaltre la
10 0,30
probabilité qu'il aura de ne pas rejeter l'hypothèse
-x-= 1.27
S-
ml = mz (donc d'accepter le lot de la nouvelle fabrication),
2 0,53
US
alors qu'en fait Im, -mpl serait égale à 0,30.1)
Pour v= 18, on trouve (par interpolation) que la valeur
Les mesures effectuées sur les deux échantillons donnent les correspondante de IOOP est voisine de 80 : la limite
résultats suivants : supérieure du risque de 2e espèce est d'environ 0,80 (ou
80 %).
18' lot : XI = 2,176 X(x1 -XI)? = 1,2563
a)
b) 28 lot : X2 = 2,520 Z(x2 --X2)' = 1,389 7
La faible différence entre les deux sommes de carrés est
parfaitement compatible avec l'hypothèse précédente que
U: = U; (voir tableau G de I'ISO 2854).
4.5.2 Le client désire que, dans l'hypothèse la plus
défavorable (U = us = 0,531, 0 ne dépasse pas 0,20 (ou
L'estimation de la variance 02 commune aux deux lots est
20 %) lorsque Iml -m21 = 0,30.
2,646 O
1,256 3 + 1,389 7
=--
Le diagramme à consulter est le diagramme 1.2, courbe
s2 = -0,147 O ,
10+10-2 18
0 = 0,20, avec
La limite supérieure de u2, au niveau de confiance
1 -(Y = 0,95, est (voir tableau F de I'ISO 2854)
2,646 O 2,646 O
Pour P= 0.20 et X = 0,4, on trouve n = 49.
=-- - 0,281 8
02 =
S (18) 9,39
Les 2 x 50 = 100 mesures permettront une estimation assez
précise de U, B partir de laquelle le diagramme 1.1 donnera
II est donc peu probable que U soit supérieur B
28 espèce associé B
une valeur approximative du risque de
l'alternative Iml -m21 = 0,30.
1) C'est-Bdire la probabilité qu'en utilisant le test t de Student avec le niveau de signification 01 = 0.05. une différence Iml -m2l = 0.30 ne
soit pas mise en Bvidence.
9
---------------------- Page: 12 ----------------------
IS0 3494-1976 (FI
5 COMPARAISON DUNE VARIANCE OU DUN
5.4 Problhme 2 : 0 étant donné, déterminer l'effectif n
ÉCART-TYPE À UNE VALEUR DONNÉE
Suivant le cas, le diagramme à consulter est
Voir tableau E de I'ISO 2854.
- 5.2 (test bilatéral) risque de 1" espèce a = 0.05
5.1 Notations
- 6.2 (test bilatéral) risque de Ire espèce (Y = 0,Ol
n = effectif de I'échantillon
- 7.2 (test unilatéral 02
a = 0,05
02 = variance de la population (a = écart-type de la
population)
- 8.2 (test unilatéral 02 Gu:) risque de 1" espèce
a = 0,Ol
U% = valeur donnée pour la variance (a0 = une valeur
donnée pour I'écart-type)
- 9.2 (test unilatéral u2 >a;) risque de Ire espèce
(Y = 0,05
- 10.2 (test unilatéral u2 2 U$) risque de Ire espèce
a = 0,Ol
5.2 Hypotheses testées
n est l'ordonnée du point d'abscisse h sur la courbe qui
correspond à la valeur donnée 0.
Pour un test bilatéral, l'hypothèse nulle est a2 = U!
(U = (IO), les hypothèses alternatives correspondant a
U2 f a; (0. f 00).
5.5 Exemple
Pour un test unilatéral, l'hypothèse nulle est
Un fournisseur de fil de coton affirme avoir amélioré la
qualité de sa fabrication par une diminution de la dispersion
a) soit a2 < U: (U Q uo), les hypothèses alternatives
des charges de rupture qui était antérieurement caractérisée
correspondant à a2 > a8 (a > u0);
par un écart-type uo = 0,45 (U; = 0,202 5).
b) soit a2 2 U; (a > uo), les hypothèses alternatives
Un client éventuel est disposé à payer un prix plus élevé
correspondant à 02 < U$ (a < uo).
pour cette amélioration à condition qu'elle soit bien réelle,
mais il ne veut courir qu'un faible risque de conclure à une
Dans tous les cas, on définit l'alternative par le paramètre
amélior
...
3494
NORME INTERNATIONALE
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION .MEl(AYHAPOAHAA OPTAHM3ALWl II0 CTAH~APTM3ALIMW~ORGANISATION INTERNATIONALE DE NORMALISATION
Interprétation statistique des données - Efficacité des tests
portant sur des moyennes et des variantes
Statistical interpretation of data - Po wer of tests relating to means and variantes
Première édition - 1976-12-01
Réf. no : ISO 3494-1976 (F)
CDU 519.28
Descripteurs : statistique, donnée, moyenne mathématique, variante, essai, test statistique, rendement, efficacité.
Prix basé sur 44 pages
---------------------- Page: 1 ----------------------
AVANT-PROPOS
L’ISO (Organisation Internationale de Normalisation) est une fédération mondiale
d’organismes nationaux de normalisation (Comités Membres ISO). L’élaboration des
Normes Internationales est confiée aux Comités Techniques ISO. Chaque Comité
Membre intéressé par une étude a le droit de faire partie du Comité Technique
correspondant. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec I’ISO, participent également aux travaux.
Les Projets de Normes Internationales adoptés par les Comités Techniques sont
soumis aux Comités Membres pour approbation, avant leur acceptation comme
Normes Internationales par le Conseil de I’ISO.
La Norme Internationale ISO 3494 a été établie par le Comité Technique
ISO/TC 69, Application des méthodes statistiques, et a été soumise aux Comités
Membres en mars 1975.
Elle a été approuvée par les Comités Membres des pays suivants :
Afrique du Sud, Rép. d’ Hongrie Royaume-Uni
Allemagne Inde Suisse
Australie Israël Tchécoslovaquie
Autriche Mexique Turquie
Belgique Nouvelle-Zélande U.R.S.S.
Brésil Pays-Bas U.S.A.
Yougoslavie
Bulgarie Pologne
Canada Portugal
France Roumanie
Les Comités Membres des pays suivants ont désapprouvé le document pour des
raisons techniques :
Japon
Suède
@ Organisation Internationale de Normalisation, 1976 l
Imprimé en Suisse
ii
---------------------- Page: 2 ----------------------
SOMMAI RE
Page
SECTION UN TESTS DE COMPARAISON
- Remarques a jnérales . . . . . . . . . . . . . . . . . . . . . . . . - . . . l l 1
- Note historique . . . . . . . . . . . . . . . . . . . . . . . . l . l l . . l . 2
1
MOYENNES
Référence
du
Chapitre Tests de comparaison Variante(s) tableau
de I’ISO
2854
Comparaison d’une moyenne à
connue A . . . . . . . . . . . . . . . . . 3
une valeur donnée
Comparaison d’une moyenne à
A’ 4
une valeur donnée inconnue . . . . . . . . . . . . . . . . .
C . . . . . . . . . . . . . . . . . 6
Comparaison de deux moyennes connues
C’ . . . . . . . . . . . . . . . . .
Comparaison de deux moyennes inconnues 8
VARIANCES
I
Référence
du
Chapitre Tests de comparaison tableau
de I’ISO
2854
5 Comparaison d’une variante à une valeur
E . 10
donnée
11
6 Comparaison de deux variantes G .
SECTION DEUX : DIAGRAMMES
..................
- Références des diagrammes . . . . . l l . . 12
..................
- Diagrammes . . . . . . . . . g . . . 13
. . .
III
---------------------- Page: 3 ----------------------
Page blanche
---------------------- Page: 4 ----------------------
NORME INTERNATIONALE ISO 34944976 (F)
Interprétation statistique des données - Efficacité des tests
portant sur des moyennes et des variantes
SECTION UN : TESTS DE COMPARAISON
REMARQUES GÉNÉRALES pour le risque de Ire espèce, de l’effectif du (ou des)
échantillon(s) et de la nature du test (bilatéral ou
unilatéral).
1) La présente Norme Internationale fait suite à
1’60 2854, Interprétation Stat&ique des données -
Dans les tests de comparaison de moyennes, p dépend aussi
Techniques d’estimation et tests portant sur des moyennes
de l’écart-type de la (ou des) population(s). Lorsque celui-ci
et des variantes.
est inconnu, le risque 6 ne peut pas être connu exactement.
Les conditions d’emploi de la présente Norme
5) Les courbes d’efficacité peuvent être utilisées dans les
Internationale sont celles qui sont spécifiées dans les
problèmes suivants :
«Remarques générales» de I’ISO 2854. II est rappelé que
les tests utilisés ne sont valables que si la distribution du
a) problème 1 : Pour une alternative et un effectif (ou
caractère étudié est supposée normale (voir commentaires
des effectifs) d’échantillon donnés, déterminer la
au point 3) des ((Remarques générales» dans I’ISO 2854).
probabilité fl de ne pas rejeter l’hypothèse nulle (risque
Dans I’ISO 2854, le risque de Ire espèce (ou niveau de
de 2e espèce);
signification) est seul pris en considération. La présente
Norme Internationale introduit les notions de risque de 2e b) problème 2 : Pour une alternative et une valeur
espèce et d’efficacité d’un test. données de /3, déterminer l’effectif (ou les effectifs)
d’échantillon à prélever.
2) II est aussi rappelé que le risque de Ire espèce est la
de diagrammes permette de
probabilité de rejeter l’hypothèse soumise au test Bien qu’une seule série
résoudre les deux problèmes, deux séries de diagrammes
(hypothèse nulle) lorsque cette hypothèse est vraie (cas des
afin de faciliter les applications
tests bilatéraux), ou la valeur maximale de cette probabilité seront présentées,
pratiques :
(cas des tests unilatéraux). Le non-rejet de l’hypothèse nulle
conduit, dans la pratique, à l’acceptation de cette
- diagrammes 1.1 à 14.1, donnant en fonction de
hypothèse, mais il n’en résulte pas que celle-ci est vraie.
l’alternative, pour a = 0’05 ou a = 0’01 et pour diffé-
rentes valeurs de l’effectif (ou des effectifs) d’échan-
Le risque de 2e espèce, désigné par-$, est, en conséquence,
tillon, le risque p;
la probabilité de ne pas rejeter l’hypothèse nulle alors que
celle-ci est fausse. Le complément de la probabilité de
- diagrammes 1.2 à 14.2, donnant en fonction de
commettre l’erreur de 2e espèce (1 --fi) est la «puissance»
l’alternative, pour cy = 0’05 ou cI1= 0’01 et pour
du test (voir ((Note historique» à la suite de ces
différentes valeurs du risque p, l’effectif (ou les effectifs)
(( Remarques générales»).
d’échantillon à prélever.
3) Tandis que la valeur du risque de Ire espèce est choisie
6) L’attention est attirée sur la signification pratique de
par le client, compte tenu des conséquences que ce risque
l’interprétation statistique au moyen des tests d’hypothèse
est susceptible d’entraîner (on prend généralement l’une des
et des courbes d’efficacité. Lorsqu’on teste une hypothèse
valeurs a = 0’05 ou a! = O,Ol), le risque de 2e espèce
telle que m =mo (ou ml = m2), on désire généralement
dépend de l’hypothèse vraie (Ho étant fausse), c’est-à-dire
savoir si l’on peut conclure, avec un faible risque de se
de l’hypothèse alternative opposée à l’hypothèse nulle.
tromper, que m n’est pas trop différent de m. (ou ml pas
Dans la comparaison de la moyenne d’une population à une
trop différent de m2). De même, le choix de la valeur
valeur donnée mo, par exemple, une alternative particulière
CI~= 0’05 ou a = 0’01 pour le risque de Ire espèce associé
correspond à une valeur de la moyenne de la population
au test comporte une part d’arbitraire. II peut donc être
m # mol c’est-à-dire à une différence m - m. # 0. D’une
utile d’examiner quel serait le résultat du test pour des
facon générale, dans les tests portant sur des moyennes et
valeurs voisines de m o (ou des valeurs de la différence
des variantes, les alternatives sont définies par les valeurs
D=m, -m2 voisines de 0), avec éventuellement les deux
susceptibles d’être prises par un paramètre.
valeurs du risque de Ire espèce CY = 0’05 et cy = 0’01 et,
dans de telles circonstances, d’évaluer au moyen des
4) La courbe d’efficacité d’un test est la courbe qui donne,
en fonction du paramètre qui définit l’alternative, la valeur courbes d’efficacité le risque /3 associé à différentes
p du risque de 2e espèce; p dépend aussi de la valeur choisie alternatives.
1
---------------------- Page: 5 ----------------------
ISO 3494-1976 (F)
7) Les diagrammes qui sont donnés dans la section deux
II n’est d’ailleurs pas nécessaire d’introduire le terme de
de la présente
Norme Internationale sont décrits et ((puissance)). On peut plus simplement parler de la
commentés dans six chapitres qui correspondent aux
probabilité qu’un test statistique appliqué à un échantillon,
tableaux de I’ISO 2854.
à un niveau de signification cy, révèle qu’un paramètre X de
la population diffère (lorsqu’il en est bien ainsi) d’au moins
La correspondance détaillée entre les différents
une quantité donnée d’une valeur spécifiée Xo ou soit, par
diagrammes, les problèmes qu’ils permettent de résoudre,
rapport à celle-ci, dans un rapport au moins égal à un
les chapitres de la présente Norme Internationale et les
nombre donné.
tableaux de I’ISO 2854, figure en tête de l’ensemble des
diagrammes.
Le changement de notation a probablement été introduit
aux U.S.A. par les praticiens des applications industrielles
NOTE HISTORIQUE
de la statistique, afin qu’en même temps que le ((risque du
fournisseur a)), soit pris en considération le «risque du
Les concepts de risques de Ire et de 2e espèce ont été
client)), désigné alors par /3.
introduits par J. Neyman et E.S. Pearson dans un article
paru en 1928. Par la suite, ces auteurs ont estimé que le
complément de la probabilité de commettre l’erreur de
Le symbole /3 a été retenu pour le risque de 2e espèce dans
2e espèce - qu’ils appelèrent la «puissance)) du test, dans
I’ISO 3534, Statistique - Vocabulaire et symboles. II a
sont aptitude à révéler comme significative une alternative
donc été adopté avec la même signification dans la présente
spécifiée à l’hypothèse nulle (ou hypothèse testée) - était
Norme Internationale. Cependant, comme ce symbole
en général un concept plus facile à comprendre pour les
est utilisé, et continuera sans doute à être utilisé dans les
praticiens. C’est cette ((puissance», ou probabilité de révéler deux sens dans la littérature statistique, il convient de
un écart donné à l’hypothèse nulle, qu’ils désignèrent par le s’assurer, dans chaque cas d’utilisation, du sens qui lui est
symbole p. effectivement attribué.
---------------------- Page: 6 ----------------------
ISO 34941976 (F)
l
m-m0
1 COMPARAISON D’UNE MOYENNE À UNE VALEUR
= - (test unilatéral m < mo) alternatives
b) X
DONNÉE (VARIANCE CONNUE)
0
m>mo
Voir tableau A de I’ISO 2854.
m
-mo
c) x=-- (test unilatéral m > mo) alternatives
(T
1 .l Notations
m
n = effectif de l’échantillon
Suivant le cas, le diagramme à consulter est
m = moyenne de la population
- 1.2 (test bilatéral) risque de 1 re espèce CU = Of05
= valeur donnée
m0
- 2.2 (test bilatéral) risque de Ire espèce a = Of01
0 = écart-type de la population
- 3.2 (test unilatéral) risque de Ire espèce a = Of05
- 4.2 (test unilatéral) risque de Ire espèce cy = Of01
1.2 Hypothèses testées
n est l’ordonnée du point d’abscisse X sur la droite (tracée
Pour un test bilatéral, l’hypothèse nulle est m = mol les en pointillé) qui correspond à la valeur donnée 0.
hypothèses alternatives correspondant à m #mg.
1.5 Exemple
Pour un test unilatéral, l’hypothèse nulle est
Un fournisseur de fil de coton garantit, pour chacun des
a) soit m
lots qu’il livre, une charge de rupture moyenne (exprimée
dant à m >mg;
en newtons) au moins égale à m. = 2’30. Le client ne
consent à accepter les lots qu’après avoir vérifié sur des
b) soit m >rno, les hypothèses alternatives correspon-
éléments de fil d’une longueur donnée, prélevés dans
dant àm
différentes bobines, que le test unilatéral, tel qu’il est décrit
dans I’ISO 2854, ne conduit pas à rejeter l’hypothèse
m > mo = 2’30, la valeur choisie pour le risque de
1.3 Problème 1 : n étant donné, déterminer le risque /3
Ire espèce étant a = Of05 (a! est donc ici le «risque du
Pour les différentes valeurs de m, on définit l’alternative par fournisseur»).
le paramètre X (0 < X <=), avec
Le client sait, par expérience, que la moyenne des différents
n m-mol lots peut varier, mais que la dispersion des charges de
61
(test bilatéral) alternativesm # m.
a) X=
rupture, à l’intérieur d’un même lot, est pratiquement
0
constante et caractérisée par un écart-type 0 = 0’33.
n m-mo)
d-l
b) X= (test unilatéral m < mo) alterna-
0 1.5.1 Le client envisage de prélever n = 10 bobines par lot,
tives m > rno ( et désire connaître la probabilité qu’il aura de ne pas rejeter
l’hypothèse m > 2’30 (donc d’accepter le lot), alors qu’en
-
n m-mo)
Af(
fait la charge moyenne de rupture serait m = 2’10.
c) x=
(test unilatéral m > mo) alterna-
ct
Le diagramme à consulter est le diagramme 3.1. La valeur
tives m < mg
du paramètre X, pour m = 2,10, est
Suivant le cas, le diagramme à consulter est
n m-mo)
m (2’30 - 2’10)
4-t
-
A=-
= 1’92
- 1 .l (test bilatéral) risque de 1 re espèce CU = Of05
0 -
0’33
- 2.1 (test bilatéral) risque de Ire espèce cy = Of01
00 donne pour 100 6 la valeur 36 : fl= 0,36
La droite v =
ou 36 %.
- 3.1 (test unilatéral) risque de 1 re espèce cy = Of05
- 4.1 (test unilatéral) risque de Ire espèce a = Of01
1.5.2 Cette valeur étant considérée par le client comme
beaucoup trop élevée, celui-ci décide de prélever un
fl est l’ordonnée du point d’abscisse X sur la courbe v = 00
échantillon d’effectif suffisamment important pour que le
du diagramme convenable.
risque fi s’abaisse à Of1 0 (ou 10 %) si m = 2’10.
Le diagramme à consulter est le diagramme 3.2. La valeur
du paramètre X, pour m = 2,10, est
1.4 Problème 2 : /3 étant donné, déterminer l’effectif n
2’30 - 2’10
Pour les différentes valeurs de m, on définit l’alternative par
X=-m-m,=
= 0’61
le paramètre X (0 < X < 00)’ avec CJ 0’33
Im --QI La valeur de n, lue sur la droite (tracée en pointillé)
a) X= (test bilatéral) alternatives m # mo
fi = 0,10, estn = 22.
ci
3
---------------------- Page: 7 ----------------------
ISO 3494-1976 (F)
2 COMPARAISON D’UNE MOYENNE À UNE VALEUR Suivant le cas, le diagramme à consulter est
DONNÉE (VARIANCE INCONNUE)
-
1 .l (test bilatéral) risque de 1 re espèce a! = 0,05
Voir tableau A’ de I’ISO 2854.
- 2.1 (test bilatéral) risque de 1 re espèce cy = 0,Ol
REMARQUE IMPORTANTE
- 3.1 (test unilatéral) risque de Ire espèce a = 0,05
-
Le risque de 2e espèce p dépend de la vraie valeur 0 de
4.1 (test unilatéral) risque de 1 re espèce ar = 0,Ol
l’écart-type de la population, qui est inconnu. On ne peut
fi est l’ordonnée du point d’abscisse X sur la courbe
donc connaître fl que de façon approximative, et à
v=n- 1 du diagramme convenable.
condition de disposer d’un ordre de grandeur de o. À défaut
d’information antérieure valable, on prendra pour CJ
2.4 Problème 2 : p étant donné, déterminer l’effectif n
l’estimation s obtenue sur l’échantillon.
Pour les différentes valeurs de m, on définit l’alternative par
II est vivement conseillé d’examiner la répercussion sur les
le paramètre X (0 < h < m), avec
valeurs lues sur les courbes, d’une erreur commise sur
l’écart-type o. L’imprécision peut être très grande lorsque o
Im -mol
a été estimé à partir d’un échantillon de faible effectif; on a)X= ~ (test bilatéral) alternatives m # m.
pourra s’en rendre compte en encadrant s par les limites de
confiance de o calculées selon la méthode du tableau F de
m-m0
=- (test unilatéral m < mo) alternatives
I’ISO 2854. b) h
(T
m>mo
2.1 Notations
m
-m0
n = effectif de l’échantillon c) X=-y- (test unilatéral m > mo) alternatives
m
m = moyenne de la population
= valeur donnée Suivant le cas, le diagramme à consulter est
m0
- 1.2 (test bilatéral) risque de Ire espèce ~1 = 0,05
(7 = écart-type de la population (que l’on remplacera par
une valeur approchée)
- 2.2 (test bilatéral) risque de Ire espèce a = 0,Ol
V =n-1
- 3.2 (test unilatéral) risque de Ire espèce a = 0,05
-
4.2 (test unilatéral) risque de Ire espèce cy = 0,Ol
2.2 Hypothèses testées
n est l’ordonnée du point d’abscisse X sur la courbe qui
Pour un test bilatéral, l’hypothèse nulle est m = mol les
correspond à la valeur donnée /3.
hypothèses alternatives correspondant à m # mo.
Pour un test unilatéral, l’hypothèse nulle est
2.5 Exemple
a) soit m G mo, les hypothèses alternatives correspon-
L’exemple est le même que celui traité en 1.5, mais le client
dant à m >mg;
ignore la valeur exacte de l’écart-type des charges de
rupture. II sait cependant par expérience que celui-ci est
b) soit m 2 mg, les hypothèses alternatives correspon-
quasi-certainement compris entre les limites
dant à m
01 = 0,30 os = 0,45
2.3 Problème 1 : n étant donné, déterminer le risque /3
Le client envisage de prélever n = 10 bobines par lot,
2.5.1
Pour les différentes valeurs de m, on définit l’alternative par
et désire connaître la probabilité qu’il aura de ne pas rejeter
le paramètre X (0 < X < oo), avec
l’hypothèse m > 2,30 (donc d’accepter le lot), alors qu’en
fait la charge moyenne de rupture serait m = 2,lO.l)
n m-mol
d-l
a) X= (test bilatéral) alternatives m # mO
Le diagramme à consulter est le diagramme 3.1. Les valeurs
CT
du paramètre X qui correspondent aux valeurs extrêmes de
fi(m --mol
0 sont
b) X= (test unilatéral m < mo) alterna-
(T
m (230 -2,lO) = 2 ,
tives m > mo
I
h1=
0,30
-
n m-mo)
d-t
c) x= (test unilatéral 113 >mo) alterna-
hs m (230 - 2,W = 1 4
0
-
-
I
tives m < m0 0,45
1) C’est-à-dire la probabilité qu’en utilisant le test t de Student avec le niveau de signification Q! = 0,05, la valeur m = 2,lO ne soit pas révélée
comme significativement inférieure à mg = 2,30.
4
---------------------- Page: 8 ----------------------
ISO 34944976 (F)
Les valeurs correspondantes de 100 /3, lues (par
Le diagramme à consulter est le diagramme 3.2, courbe
interpolation) pour v = 9, sont 40 et 64; soit
fi = O,lO, avec
p1 = 0,40 (ou 40 %)
2,30 - 2,lO
A= = 0,44
0,45
PS = 0,64 (ou 64 %)
Pour fi = 0,lO et X = 0,44, on trouve n de l’ordre de 45.
Après contrôle de quelques lots, s’il est constaté que
l’écart-type est stable, 0 pourra être estimé avec une
2.5.2 Le client désire que, dans l’hypothèse la plus meilleure précision; l’effectif à prélever dans les lots
défavorable (0 = os = 0,45), p ne dépasse pas 0,lO (ou suivants pourra vraisemblablement être réduit, les garanties
10 %) si m = 2,lO. du fournisseur et du client étant conservées.
5
---------------------- Page: 9 ----------------------
ISO 34944976 (F)
Lorsque l’effectif total des deux échantillons est fixé,
3 COMPARAISON DE DEUX MOYENNES (VARIAN-
= 2 n, on obtient la meilleure efficacité (fi
CES CONNUES)
n1 +n2
minimum) avec
Voir tableau C de I’ISO 2854.
"1 n2
---
-
3.1 Notations
01 O2
d’où
Population 1 Population 2
I
(71
=2n-
n1
(3 + (J2
Effectif de l’échantillon
"1 "2
Moyenne
ml m2
O2
n2=2noT
Variante
1 2
-m21
Écart-type de la
Iml
A=& o
différence des moyennes
1 +a 2
des deux échantillons
-m21
n Iml
x=
i f ? 0 , si 0, = 02 = 0 1
3.2 Hypothèses testées
Pour un test bilatéral, l’hypothèse nulle est ml = m2, les
hypothèses alternatives correspondant à ml # m2.
3.4 Problème 2 : p étant donné, déterminer les effectifs
Pour un test unilatéral, l’hypothèse nulle est
nl etn2
a) soit ml < m2, les hypothèses alternatives correspon-
Utilisant, suivant le cas, les diagrammes 1.1, 2.1, 3.1 ou 4.1,
dant àml >m2;
la courbe v = 00 permet de résoudre le problème dans le cas
général. Au point d’ordonnée /3 de cette courbe correspond
les hypothèses alternatives correspon-
b) soit ml >m2,
l’abscisse X, et tout couple (n,, n2) convient, à condition
dant àml
que
2
o2
o2
ml --m2
1+x= -
x
n1 n2 1 1
3.3 Problème 1 : nl et n2 étant donnés, déterminer le
risque fl
Le prélèvement le plus économique (nl + n2 minimum) est
tel que
Pour les différentes valeurs de la différence ml -m2, on
définit l’alternative par le paramètre X (0 < X
"1 n2
-=-
01 O2
-3321
Im1
(test bilatéral) alternatives ml #m2
a) X=
Od d’où
b) A,ml -m2
(test unilatéral ml < m2) alternatives
x 2
od
= 0, (0, + 02) -
"1
ml --m2
ml >m2 ( 1
m2 -ml
x 2
(test unilatéral ml 2 m2) alternatives
c) A=
=02 (0, +a,) -
n2
od
( 1
ml cm2
Suivant le cas, le diagramme à consulter est
in, =n2=2 [m<~~Lq =02=oj
-
1 .l (test bilatéral) risque de 1 re espèce a! = 0,05
-
Dans le cas particulier où ol = o2 = 0, nl = n2 = n, il est
2.1 (test bilatéral) risque de Ire espèce CY = 0,Ol
plus commode de définir, pour les différentes valeurs de la
- 3.1 (test unilatéral) risque de Ire espèce Q! = 0,05
différence ml -m2, l’alternative par le paramètre
X (0 < X <-), avec
- 4.1 (test unilatéral) risque de 1 re espèce cy = 0,Ol
77721
If-4
fi est l’ordonnée du point d’abscisse X sur la courbe v = 00
a) X= a G (test bilatéral) alternatives ml #m2
du diagramme convenable.
6
---------------------- Page: 10 ----------------------
ISO 34941976 (F)
3.5.1 Le client envisage de prélever 10 bobines dans un lot
m-m2
b) A= afi (test unilatéral ml < m2) alternatives
de chacune des deux fabrications, et désire connaître la
probabilité qu’il aura de ne pas rejeter l’hypothèse
m1>m2
= m2 (donc d’accepter le lot de la nouvelle fabrication),
ml
alors qu’en fait Iml - m2 1 serait égale à 0,30.
m2-1711
c) x=- 0* (test unilatéral ml > m2) alternatives
Le diagramme à consulter est le diagramme 1.1, avec
m1
-m2I
Iml
et d’utiliser, suivant le cas, l’un des diagrammes suivants :
A=
Od
-
1.2 (test bilatéral) risque de Ire espèce cy = 0,05
- 2.2 (test bilatéral) risque de Ire espèce a = 0,Ol
-m,l = 0,30
Iml
- 3.2 (test unilatéral) risque de Ire espèce ar = 0,05
-
4.2 (test unilatéral) risque de Ire espèce a = 0,Ol
Od = jz=EO= ~~~0,33=0,~~~6
n est l’ordonnée du point d’abscisse X sur la droite (tracée
en pointillé) qui correspond à la valeur donnée 0.
0,30
z-z
x
2,03
3.5 Exemple
0,147 6
.
Un fournisseur de fil de coton a modifié sa fabrication,
La courbe v = 00 donne pour 100 p la valeur 47 : /3 = 0,47
mais selon sa déclaration, la charge de rupture moyenne
ou 47 %.
reste la même (ml = m2), ml correspondant à l’ancienne
fabrication et m2 à la nouvelle.
3.5.2 Cette valeur étant considérée par le client comme
Le client est disposé à adopter la nouvelle fabrication, mais
beaucoup trop élevée, celui-ci décide de prélever des
désire vérifier la déclaration du fournisseur en effectuant,
échantillons d’effectif suffisamment important pour que le
sur des éléments de fil d’une longueur donnée, prélevés dans
risque /3 s’abaisse à 0,lO (ou 10 %) lorsque
différentes bobines, le test bilatéral de l’hypothèse
- mal = 0,30.
14
= m2, tel qu’il est décrit dans I’ISO 2854, avec pour
ml
Le diagramme à consulter est le diagramme 1.2, avec
valeur du risque de Ire espèce cy = 0,05 (a est donc ici
le «risque du fournisseur»).
-m2l 0,30
Iml
x= - -= 0,64
Le client sait, par expérience, que, pour toutes les
- 0,33 fi
afi
la dispersion des charges de
productions du fournisseur,
La valeur de n, lue sur la droite (tracée en pointillé)
rupture est pratiquement constante et caractérisée par un
fl= O,lO, est n = 26.
écart-type 0 = 0,33.
---------------------- Page: 11 ----------------------
ISO 3494-1976 (F)
4 COMPARA~~~~I DE DEUX MOYENNES (VARIA~~
ml -m2
b) A= (test unilatéral ml < m2) alternatives
CES INCONNUES, MAIS PRÉWIVIÉES ÉGALES)
od
ml >m2
Voir tableau C’ de I’ISO 2854.
f772 -ml
c) x= (test unilatéral ml 2 m2) alternatives
REMARQUE IMPORTANTE
od
1731 cm2
Le risque de 2e espèce p dépend de la vraie valeur (T de
l’écart-type des deux populations, qui est inconnu. On ne
Suivant le cas, le diagramme à consulter est
peut donc connaître 0 que de façon approximative, et à
1 .l (test bilatéral) risque de 1 re espèce cw = Of05
-
condition de disposer d’un ordre de grandeur de 0. À défaut
d’information antérieure valable, on prendra pour 0
2.1 (test bilatéral) risque de Ire espèce a! = Of01
-
l’estimation, s, obtenue sur les échantillons.
- 3.1 (test unilatéral) risque de 1 re espèce & = Of05
II est vivement conseillé d’examiner la répercussion sur les
4.1 (test unilatéral) risque de Ire espèce Q = Of01
valeurs lues sur les courbes, d’une erreur commise sur -
l’écart-type 0. L’imprécision peut être très grande lorsque
fi est l’ordonnée du point d’abscisse X sur la courbe
0 a été estimé à partir d’échantillons de faible effectif; on
V =nl +n2 - 2 du diagramme convenable.
pourra s’en rendre compte en encadrant s par les limites
de confiance de 0, calculées selon la méthode du tableau F
Lorsque l’effectif total des deux échantillons est seul fixé,
de I’ISO 2854.
nl d-n2 = 2 n, il y a intérêt à prendre nl = n2 = n (0
minimum). On a alors
4.1 Notations
n I~I -mal
x=
? 0
c
Population 1 Population 2
Effectif de l’échantillon
"1 Il2
4.4 Problème 2 : p étant donné, déterminer l’effectif
Moyenne
ml m2
commun n des échantillons
Variante (que l’on
02 02
remplacera par une valeur
Pour les différentes valeurs de la différence ml -m2, on i
approchée) 1
définit l’alternative par le paramètre X (0 < X
\
U=n1 +n2-2,
-77721
IfnI
Degrés de liberté
a) X= (test bilatéral) alternatives ml #m2
0G
[2 in- l), si n1 = n2 = n]
ml 7772
b) X= o G (test unilatéral ml
Od = -0
Écart-type de la
différence des moyennes
ml >m2
des deux échantillons
-o,sinl =n2=n
m2 -ml
c) A= (test unilatéral ml 2m2) alternatives
0 fi
ml cm2
4.2 Hypothèses testées
Suivant le cas, le diagramme à consulter est
Pour un test bilatéral, l’hypothèse nulle est ml = m2, les
- 1.2 (test bilatéral) risque de 1 re espèce a! = Of05
hypothèses alternatives correspondant à ml # m2.
- 2.2 (test bilatéral) risque de Ire espèce CI~= Of01
Pour un test unilatéral, l’hypothèse nulle est
- 3.2 (test unilatéral) risque de 1 re espèce Q! = Of05
a) soit ml < m2, les hypothèses alternatives correspon-
dant à ml >m2;
- 4.2 (test unilatéral) risque de Ire espèce CY = Of01
soit ml > m2, les hypothèses alternatives correspon-
b)
n est l’ordonnée du point d’abscisse X sur la courbe qui
dant àml
correspond à la valeur donnée fl.
4.3 Problème 1 : nl et n2 étant donnés, déterminer le
risque p
4.5 Exemple
Pour les différentes valeurs de la différence ml -m2, on
L’exemple est le même que celui traité en 3.5, mais le client
définit l’alternative par le paramètre X (0
ignore la valeur exacte de l’écart-type des charges de
77721
Im1 rupture. II sait seulement qu’il y a de très fortes chances
a) X= (test bilatéral) alternatives ml # m2
qu’il soit le même pour les deux lots (ol = (Jo).
Od
8
---------------------- Page: 12 ----------------------
ISO 34941976 (F)
4.5.1 Le client envisage de prélever 10 bobines dans un lot Le diagramme à consulter est le diagramme 1 .l, avec
de chacune des deux fabrications, et désire connaître la
-ml
probabilité qu’il aura de ne pas rejeter l’hypothèse
-
-
= m2 (donc d’accepter le lot de la nouvelle fabrication),
OS
4
alors qu’en fait Iml -m21 serait égale à 0,30.1)
Pour v= 18, on trouve (par interpolation) que la valeur
correspondante de 100 fi est voisine de 80 : la limite
Les mesures effectuées sur les deux échantillons donnent les
supérieure du risque de 2e espèce est d’environ Of80 (ou
résultats suivants :
80 %).
a) 1erlot:E = 2,176 = 1’2563
m, -x,)2
1
b) 2e lot : X2 = 2,520 ux2 - x# = 1,389 7
La faible différence entre les deux sommes de carrés est
parfaitement compatible avec l’hypothèse précédente que
a: = 02 (voir tableau G de VIS0 2854).
4.5.2 Le client désire que, dans l’hypothèse la plus
défavorable (a = as = 0’53)’ /3 ne dépasse pas Of20 (ou
L’estimation de la variante 02 commune aux deux lots est
20 %) lorsque Iml -m21 = 0’30.
1,256 3 + 7 2,646 0
Le diagramme à consulter est le diagramme 1.2, courbe
s2 = 1,389 - - - = 0,147 0
lO+lO-2 18
0 = 0,20, avec
La limite supérieure de 02, au niveau de confiance
7774 0’30
If?
z-z
x=
1 - cy = 0’95, est (voir tableau F de I’ISO 2854)
0’53 fi Of4
0s 4
Pour p = Of20 et h = 0’4, on trouve n = 49.
o2 2,646 0 --=Of281 - 2,646 0 8
s= 2
9’39
(18)
.x0,05 Les 2 x 50 = 100 mesures permettront une estimation assez
précise de (T, à partir de laquelle le diagramme 1.1 donnera
II est donc peu probable que o soit supérieur à
une valeur approximative du risque de 2e espèce associé à
l’alternative Iml - m21 = 0’30.
os = d&%n = 0’53
1) C’est-àdire la probabilité qu’en utilisant le test t de Student avec le niveau de signification ~1 = 0,05, une différence Iml -m21 = Of30 ne
soit pas mise en évidence.
9
---------------------- Page: 13 ----------------------
ISO 3494-1976 (F)
5 COMPARAISON D’UNE VARIANCE OU D’UN 5.4 Problème 2 : fi étant donné, déterminer l’effectif n
ÉCART-TYPE À UNE VALEUR DONNÉE
Suivant le cas, le diagramme à consulter est
Voir tableau E de I’ISO 2854.
-
5.2 (test bilatéral) risque de Ire espèce a! = Of05
5.1 Notations
- 6.2 (test bilatéral) risque de Ire espèce cy = Of01
= effectif de l’échantillon
n -
7.2 (test unilatéral 02 < 06) risque de Ire espèce
a - 0’05
= variante de la population (o = écart-type de la
02
population)
-
8.2 (test unilatéral 02 < 0:) risque de Ire espèce
a = 0’01
= valeur donnée pour la variante (~0 = une valeur
4
donnée pour l’écart-type)
- 9.2 (test unilatéral 02 > 0;) risque de Ire espèce
a = 0’05
-
10.2 (test unilatéral 02 2 c# risque de 1 re espèce
cy = 0’01
5.2 Hypothèses testées
n est l’ordonnée du point d’abscisse X sur la courbe qui
Pour un test bilatéral, l’hypothèse nulle est 02 = a$ correspond à la valeur donnée /3.
les hypothèses alternatives correspondant à
b = q)),
02 # 0; (0 # a(j).
5.5 Exemple
Pour un test unilatéral, l’hypothèse nulle est
Un fournisseur de fil de coton affirme avoir amélioré la
qualit
...
Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.