ISO/IEC 13818-1:2000/Amd 3:2004
(Amendment)Information technology - Generic coding of moving pictures and associated audio information: Systems - Part 1: - Amendment 3: Transport of AVC video data over ITU-T Rec H.222.0 | ISO/IEC 13818-1 streams
Information technology - Generic coding of moving pictures and associated audio information: Systems - Part 1: - Amendment 3: Transport of AVC video data over ITU-T Rec H.222.0 | ISO/IEC 13818-1 streams
Technologies de l'information — Codage générique des images animées et du son associé: Systèmes — Partie 1: — Amendement 3: Transport de données vidéo AVC sur flux Rec. UIT-T H.222.0 | ISO/CEI 13818-1
General Information
Relations
Frequently Asked Questions
ISO/IEC 13818-1:2000/Amd 3:2004 is a standard published by the International Organization for Standardization (ISO). Its full title is "Information technology - Generic coding of moving pictures and associated audio information: Systems - Part 1: - Amendment 3: Transport of AVC video data over ITU-T Rec H.222.0 | ISO/IEC 13818-1 streams". This standard covers: Information technology - Generic coding of moving pictures and associated audio information: Systems - Part 1: - Amendment 3: Transport of AVC video data over ITU-T Rec H.222.0 | ISO/IEC 13818-1 streams
Information technology - Generic coding of moving pictures and associated audio information: Systems - Part 1: - Amendment 3: Transport of AVC video data over ITU-T Rec H.222.0 | ISO/IEC 13818-1 streams
ISO/IEC 13818-1:2000/Amd 3:2004 is classified under the following ICS (International Classification for Standards) categories: 35.040 - Information coding; 35.040.40 - Coding of audio, video, multimedia and hypermedia information. The ICS classification helps identify the subject area and facilitates finding related standards.
ISO/IEC 13818-1:2000/Amd 3:2004 has the following relationships with other standards: It is inter standard links to ISO/IEC 13818-1:2000, ISO/IEC 13818-1:2007; is excused to ISO/IEC 13818-1:2000. Understanding these relationships helps ensure you are using the most current and applicable version of the standard.
You can purchase ISO/IEC 13818-1:2000/Amd 3:2004 directly from iTeh Standards. The document is available in PDF format and is delivered instantly after payment. Add the standard to your cart and complete the secure checkout process. iTeh Standards is an authorized distributor of ISO standards.
Standards Content (Sample)
INTERNATIONAL ISO/IEC
STANDARD 13818-1
Second edition
2000-12-01
AMENDMENT 3
2004-11-01
Information technology — Generic
coding of moving pictures and
associated audio information: Systems
AMENDMENT 3
Technologies de l'information — Codage générique des images
animées et du son associé: Systèmes
AMENDEMENT 3
Reference number
ISO/IEC 13818-1:2000/Amd.3:2004(E)
©
ISO/IEC 2004
ISO/IEC 13818-1:2000/Amd.3:2004(E)
PDF disclaimer
This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but
shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In
downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat
accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation
parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In
the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.
© ISO/IEC 2004
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO/IEC 2004 – All rights reserved
ISO/IEC 13818-1:2000/Amd.3:2004(E)
CONTENTS
Page
1) Subclause 1.2.2. 1
2) Subclause 2.1.1. 1
3) New subclauses 2.1.2 to 2.1.7 . 1
4) Subclause 2.1.52. 2
5) New subclause 2.4.2.8. 2
6) Subclause 2.4.3.5. 2
7) Subclause 2.4.3.7. 4
8) Subclause 2.4.4.10. 6
9) Subclause 2.5.2.4. 7
10) New subclause 2.5.2.7. 7
11) Subclause 2.5.3.6. 7
12) Subclause 2.5.5. 7
13) Subclause 2.6.1. 8
14) Subclause 2.6.6. 9
15) Subclause 2.6.7. 9
16) Subclause 2.6.11. 9
17) Subclause 2.6.32. 10
18) Subclause 2.6.34. 10
19) New subclauses 2.6.64-2.6.67 . 10
20) Subclause 2.7.4. 13
21) Subclause 2.7.5. 13
22) Subclause 2.7.6. 14
23) Subclause 2.7.9. 15
24) Subclause 2.7.10. 16
25) Subclause 2.11.1. 16
26) Subclause 2.11.2.1. 16
27) New subclause 2.14. 17
© ISO/IEC 2004 – All rights reserved iii
ISO/IEC 13818-1:2000/Amd.3:2004(E)
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical
Commission) form the specialized system for worldwide standardization. National bodies that are members of
ISO or IEC participate in the development of International Standards through technical committees
established by the respective organization to deal with particular fields of technical activity. ISO and IEC
technical committees collaborate in fields of mutual interest. Other international organizations, governmental
and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information
technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of the joint technical committee is to prepare International Standards. Draft International
Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as
an International Standard requires approval by at least 75 % of the national bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights.
Amendment 3 to ISO/IEC 13818-1:2000 was prepared by Joint Technical Committee ISO/IEC JTC 1,
Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia
information, in collaboration with ITU-T. The identical text is published as ITU-T Rec. H.222.0/Amd. 3.
iv © ISO/IEC 2004 – All rights reserved
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
INTERNATIONAL STANDARD
ITU-T RECOMMENDATION
Information technology – Generic coding of moving pictures and associated
audio information: Systems
Amendment 3
Transport of AVC video data over ITU-T Rec. H.222.0 | ISO/IEC 13818-1 streams
1) Subclause 1.2.2
Add the following "paired" reference to subclause 1.2.2:
– ITU-T Recommendation H.264 (2003), Advanced video coding for generic audiovisual services.
ISO/IEC 14496-10:2003, Information technology – Coding of audio-visual objects – Part 10: Advanced
video coding.
2) Subclause 2.1.1
Add to the definition for access unit in subclause 2.1.1:
For the definition of an access unit for ITU-T Rec. H.264 | ISO/IEC 14496-10 video, see the AVC access unit definition
in 2.1.3.
3) New subclauses 2.1.2 to 2.1.7
Insert the following definitions as subclauses 2.1.2 to 2.1.7 and renumber existing ones accordingly:
2.1.2 AVC 24-hour picture (system): An AVC access unit with a presentation time that is more than 24 hours in
the future. For the purpose of this definition, AVC access unit n has a presentation time that is more than 24 hours in the
future if the difference between the initial arrival time t (n) and the DPB output time t (n) is more than 24 hours.
ai o,dpb
2.1.3 AVC access unit (system): An access unit as defined for byte streams in ITU-T Rec. H.264 | ISO/IEC 14496-
10 with the constraints specified in 2.14.1.
2.1.4 AVC Slice (system): A byte_stream_nal_unit as defined in ITU-T Rec. H.264 | ISO/IEC 14496-10 with
nal_unit_type values of 1 or 5, or a byte_stream_nal_unit data structure with nal_unit_type value of 2 and any
associated byte_stream_nal_unit data structures with nal_unit_type equal to 3 and/or 4.
2.1.5 AVC still picture (system): An AVC still picture consists of an AVC access unit containing an IDR picture,
preceded by SPS and PPS NAL units that carry sufficient information to correctly decode the IDR picture. Preceding an
AVC still picture, there shall be another AVC still picture or an End of Sequence NAL unit terminating a preceding
coded video sequence.
2.1.6 AVC video sequence (system): Coded video sequence as defined in ITU-T Rec. H.264 | ISO/IEC 14496-10,
clause 3.27.
2.1.7 AVC video stream (system): An ITU-T Rec. H.264 | ISO/IEC 14496-10 stream. An AVC video stream
consists of one or more AVC video sequences.
ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004) 1
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
4) Subclause 2.1.52
Replace the still picture definition in subclause 2.1.52:
2.1.52 still picture: A coded still picture consists of a video sequence containing exactly one coded picture which is
intra-coded. This picture has an associated PTS and the presentation time of succeeding pictures, if any, is later than
that of the still picture by at least two picture periods.
by:
2.1.52 still picture: A still picture consists of a video sequence, coded as defined in ITU-T Rec. H.262 | ISO/IEC
13818-2, ISO/IEC 11172-2 or ISO/IEC 14496-2, that contains exactly one coded picture which is intra-coded. This
picture has an associated PTS and in case of coding according to ISO/IEC 11172-2, ITU-T Rec. H.262 | ISO/IEC
13818-2 or ISO/IEC 14496-2, the presentation time of succeeding pictures, if any, is later than that of the still picture by
at least two picture periods.
5) New subclause 2.4.2.8
Add after subclause 2.4.2.7:
2.4.2.8 T-STD extensions for carriage of ITU-T Rec. H.264 | ISO/IEC 14496-10 Video
To define the decoding in the T-STD of ITU-T Rec. H.264 | ISO/IEC 14496-10 video streams carried in a Transport
Stream, the T-STD model needs to be extended. The T-STD extension and T-STD parameters for decoding of ITU-T
Rec. H.264 | ISO/IEC 14496-10 video streams are defined in 2.14.3.1.
6) Subclause 2.4.3.5
a) Replace in the semantics of discontinuity_indicator under subclause 2.4.3.5 starting from the 5th paragraph:
For the purpose of this clause, an elementary stream access point is defined as follows:
• Video – The first byte of a video sequence header.
• Audio – The first byte of an audio frame.
After a continuity counter discontinuity in a Transport packet which is designated as containing elementary stream data,
the first byte of elementary stream data in a Transport Stream packet of the same PID shall be the first byte of an
elementary stream access point or in the case of video, the first byte of an elementary stream access point or a
sequence_end_code followed by an access point.
by:
For the purpose of this clause, an elementary stream access point is defined as follows:
• ISO/IEC 11172-2 video and ITU-T Rec. H.262 | ISO/IEC 13818-2 video – The first byte of a video
sequence header.
• ISO/IEC 14496-2 visual – The first byte of the visual object sequence header.
• ITU-T Rec. H.264 | ISO/IEC 14496-10 video – The first byte of an AVC access unit. The SPS and PPS
parameter sets referenced in this and all subsequent AVC access units in the coded video stream shall be
provided after this access point in the byte stream and prior to their activation.
• Audio – The first byte of an audio frame.
After a continuity counter discontinuity in a Transport packet which is designated as containing elementary stream data,
the first byte of elementary stream data in a Transport Stream packet of the same PID shall be the first byte of an
elementary stream access point. In the case of ISO/IEC 11172-2, or ITU-T Rec. H.262 | ISO/IEC 13818-2 or ISO/IEC
14496-2 video, the first byte of an elementary stream access point may also be the first byte of a sequence_end_code
followed by an elementary stream access point.
b) Replace in the semantics of random_access_indicator under subclause 2.4.3.5:
Specifically, when the bit is set to '1', the next PES packet to start in the payload of Transport Stream packets with the
current PID shall contain the first byte of a video sequence header if the PES stream type (refer to Table 2-29) is 1 or 2,
or shall contain the first byte of an audio frame if the PES stream type is 3 or 4. In addition, in the case of video, a
presentation timestamp shall be present in the PES packet containing the first picture following the sequence header.
2 ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004)
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
by:
Specifically, when the bit is set to '1', the next PES packet to start in the payload of Transport Stream packets with the
current PID shall contain an elementary stream access point as defined in the semantics for the discontinuity_indicator
field. In addition, in the case of video, a presentation timestamp shall be present for the first picture following the
elementary stream access point.
c) Replace in the semantics of elementary_stream_priority_indicator under subclause 2.4.3.5:
In the case of video, this field may be set to '1' only if the payload contains one or more bytes from an intra-coded slice.
by:
In the case of ISO/IEC 11172-2 or ITU-T Rec. H.262 | ISO/IEC 13818-2 or ISO/IEC 14496-2 video, this field may be
set to '1' only if the payload contains one or more bytes from an intra-coded slice.
In the case of ITU-T Rec. H.264 | ISO/IEC 14496-10 video, this field may be set to '1' only if the payload contains one
or more bytes from a slice with slice_type set to 2, 4, 7, or 9.
d) Replace in the semantics of splice_countdown under subclause 2.4.3.5:
For the purpose of this subclause, an access point is defined as follows:
• Video – The first byte of a video_sequence_header.
• Audio – The first byte of an audio frame.
by:
For the definition of an elementary stream access point, see the semantics of discontinuity_indicator in 2.4.3.5.
e) Replace in the semantics of seamless_splice_flag under subclause 2.4.3.5 the sentences:
When this flag is set, if the elementary stream carried in this PID is an audio stream, the splice_type field shall be set to
'0000'. If the elementary stream carried in this PID is a video stream, it shall fulfil the constraints indicated by the
splice_type value.
by:
When this flag is set, and if the elementary stream carried in this PID is not an ITU-T Rec. H.262 | ISO/IEC 13818-2
video stream, then the splice_type field shall be set to '0000'. If the elementary stream carried in this PID is an ITU-T
Rec. H.262 | ISO/IEC 13818-2 video stream, it shall fulfil the constraints indicated by the splice_type value.
f) Replace in the semantics of splice_type under subclause 2.4.3.5 the sentences:
If the elementary stream carried in that PID is an audio stream, this field shall have the value '0000'. If the elementary
stream carried in that PID is a video stream, this field indicates the conditions that shall be respected by this elementary
stream for splicing purposes.
by:
If the elementary stream carried in that PID is not an ITU-T Rec. H.262 | ISO/IEC 13818-2 video stream, then this field
shall have the value '0000'. If the elementary stream carried in that PID is an ITU-T Rec. H.262 | ISO/IEC 13818-2
video stream, then this field indicates the conditions that shall be respected by this elementary stream for splicing
purposes.
ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004) 3
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
7) Subclause 2.4.3.7
a) Replace Table 2-18 in subclause 2.4.3.7 by:
Table 2-18 – Stream_id assignments
Stream_id Note stream coding
1011 1100 1 program_stream_map
1011 1101 2 private_stream_1
1011 1110 padding_stream
1011 1111 3 private_stream_2
ISO/IEC 13818-3 or ISO/IEC 11172-3 or ISO/IEC 13818-7 or
110x xxxx
ISO/IEC 14496-3 audio stream number x xxxx
ITU-T Rec. H.262 | ISO/IEC 13818-2, ISO/IEC 11172-2, ISO/IEC
1110 xxxx
14496-2 or ITU-T Rec. H.264 | ISO/IEC 14496-10 video stream
number xxxx
1111 0000 3 ECM_stream
1111 0001 3 EMM_stream
1111 0010 5 ITU-T Rec. H.222.0 | ISO/IEC 13818-1 Annex A or ISO/IEC 13818-
6_DSMCC_stream
1111 0011 2 ISO/IEC_13522_stream
1111 0100 6 ITU-T Rec. H.222.1 type A
1111 0101 6 ITU-T Rec. H.222.1 type B
1111 0110 6 ITU-T Rec. H.222.1 type C
1111 0111 6 ITU-T Rec. H.222.1 type D
1111 1000 6 ITU-T Rec. H.222.1 type E
1111 1001 7 ancillary_stream
1111 1010 ISO/IEC 14496-1_SL-packetized_stream
1111 1011 ISO/IEC 14496-1_FlexMux_stream
1111 1100 metadata stream
1111 1101 extended_stream_id
1111 1110 reserved data stream
1111 1111 4 program_stream_directory
The notation x means that the values '0' or '1' are both permitted and results in the same stream type. The stream number is given
by the values taken by the x's.
NOTE 1 – PES packets of type program_stream_map have unique syntax specified in 2.5.4.1.
NOTE 2 – PES packets of type private_stream_1 and ISO/IEC_13552_stream follow the same PES packet syntax as those for
ITU-T Rec. H.262 | ISO/IEC 13818-2 video and ISO/IEC 13818-3 audio streams.
NOTE 3 – PES packets of type private_stream_2, ECM_stream and EMM_stream are similar to private_stream_1 except no
syntax is specified after PES_packet_length field.
NOTE 4 – PES packets of type program_stream_directory have a unique syntax specified in 2.5.5.
NOTE 5 – PES packets of type DSM-CC_stream have a unique syntax specified in ISO/IEC 13818-6.
NOTE 6 – This stream_id is associated with stream_type 0x09 in Table 2-29.
NOTE 7 – This stream_id is only used in PES packets, which carry data from a Program Stream or an ISO/IEC 11172-1 System
Stream, in a Transport Stream (refer to 2.4.3.7).
b) Replace the semantics of data_alignment_indicator in subclause 2.4.3.7 by:
data_alignment_indicator – This is a 1-bit flag. When set to a value of '1', it indicates that the PES packet header is
immediately followed by the video syntax element or audio sync word indicated in the
data_stream_alignment_descriptor in 2.6.10 if this descriptor is present. If set to a value of '1' and the descriptor is not
present, alignment as indicated in alignment_type '01' in Table 2-47, Table 2-48 or Table AMD3-1 is required. When
set to a value of '0', it is not defined whether any such alignment occurs or not.
4 ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004)
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
c) Replace in the semantics of PTS in subclause 2.4.3.7:
In the case of video, if a PTS is present in a PES packet header it shall refer to the access unit containing the first picture
start code that commences in this PES packet. A picture start code commences in PES packet if the first byte of the
picture start code is present in the PES packet.
For audio presentation units (PUs), video PUs in low_delay sequences, and B-pictures, the presentation time tp (k) shall
n
be equal to the decoding time td (k).
n
For I- and P-pictures in non-low_delay sequences and in the case when there is no decoding discontinuity between
access units (AUs) k and k', the presentation time tpn(k) shall be equal to the decoding time td (k') of the next
n
transmitted I- or P-picture (refer to 2.7.5). If there is a decoding discontinuity, or the stream ends, the difference
between tp (k) and td (k) shall be the same as if the original stream had continued without a discontinuity and without
n n
ending.
NOTE 1 – A low_delay sequence is a video sequence in which the low_delay flag is set (refer to 6.2.2.3 of ITU-T Rec. H.262 |
ISO/IEC 13818-2).
by:
In the case of ISO/IEC 11172-2 video, ITU-T Rec. H.262 | ISO/IEC 13818-2 video, or ISO/IEC 14496-2 video, if a
PTS is present in a PES packet header, it shall refer to the access unit containing the first picture start code that
commences in this PES packet. A picture start code commences in a PES packet if the first byte of the picture start code
is present in the PES packet. For I- and P-pictures in non-low_delay sequences and in the case when there is no
decoding discontinuity between access units (AUs) k and k', the presentation time tp (k) shall be equal to the decoding
n
time td (k') of the next transmitted I- or P-picture (refer to 2.7.5). If there is a decoding discontinuity, or the stream
n
ends, the difference between tp (k) and td (k) shall be the same as if the original stream had continued without a
n n
discontinuity and without ending.
NOTE 1 – A low_delay sequence is an ITU-T Rec. H.262 | ISO/IEC 13818-2 or ISO/IEC 14496-2 video sequence in which the
low_delay flag is set to '1' (refer to 6.2.2.3 of ITU-T Rec. H.262 | ISO/IEC 13818-2 and to 6.2.3 of ISO/IEC 14496-2).
For ITU-T Rec. H.264 | ISO/IEC 14496-10 video, if a PTS is present in the PES packet header, it shall refer to the first
AVC access unit that commences in this PES packet. An AVC access unit commences in a PES packet if the first byte
of the AVC access unit is present in the PES packet. To achieve consistency between the STD model and the HRD
model defined in Annex C of ITU-T Rec. H.264 | ISO/IEC 14496-10, for each decoded AVC access unit, the PTS value
in the STD shall, within the accuracy of their respective clocks, indicate the same instant in time as the nominal DPB
output time in the HRD, defined herein as t (n) = t ( n ) + t * dpb_output_delay( n ), where t ( n ), t , and
o,n,dpb r,n c r,n c
dpb_output_delay( n ) are defined as in Annex C of ITU-T Rec. H.264 | ISO/IEC 14496-10.
NOTE 2 – Different clocks may be used for derivation of PTS and t (n).
o,n,dpb
The presentation time tp (k) shall be equal to the decoding time td (k) for:
n n
• audio access units;
• access units in ITU-T Rec. H.262 | ISO/IEC 13818-2 or ISO/IEC 14496-2 low delay video sequences;
• B-pictures in ISO/IEC 11172-2, ITU-T Rec. H.262 | ISO/IEC 13818-2 or ISO/IEC 14496-2 video
streams.
d) Replace in the semantics of DTS in subclause 2.4.3.7:
In the case of video, if a DTS is present in a PES packet header it shall refer to the access unit containing the first
picture start code that commences in this PES packet. A picture start code commences in PES packet if the first byte of
the picture start code is present in the PES packet.
by:
In the case of ISO/IEC 11172-2 video, ITU-T Rec. H.262 | ISO/IEC 13818-2 video, or ISO/IEC 14496-2 video, if a
DTS is present in a PES packet header, it shall refer to the access unit containing the first picture start code that
commences in this PES packet. A picture start code commences in a PES packet if the first byte of the picture start code
is present in the PES packet.
For ITU-T Rec. H.264 | ISO/IEC 14496-10 video, if a DTS is present in the PES packet header, it shall refer to the first
AVC access unit that commences in this PES packet. An AVC access unit commences in a PES packet if the first byte
of the AVC access unit is present in the PES packet. To achieve consistency between the STD model and the HRD
model defined in Annex C of ITU-T Rec. H.264 | ISO/IEC 14496-10, for each AVC access unit the DTS value in the
STD shall, within the accuracy of their respective clocks, indicate the same instant in time as the nominal CPB removal
time t ( n ) in the HRD, as defined in Annex C of ITU-T Rec. H.264 | ISO/IEC 14496-10.
r,n
NOTE 3 – Different clocks may be used for derivation of DTS and t ( n ).
r,n
ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004) 5
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
e) Add to the semantics of P-STD_buffer_size under subclause 2.4.3.7:
The size BS shall be larger than or equal to the size of the CPB signalled by the CpbSize[ cpb_cnt_minus1 ] specified
n
by the NAL hrd_parameters() in the AVC video stream. If the NAL hrd_parameters() are not present in the AVC video
stream, then BS shall be larger than or equal to the size of the NAL CPB for the byte stream format defined in Annex
n
A of ITU-T Rec. H.264 | ISO/IEC 14496-10 as 1200 × MaxCPB for the applied level.
8) Subclause 2.4.4.10
Replace Table 2-29 in subclause 2.4.4.10 by:
Table 2-29 – Stream type assignments
Value Description
0x00 ITU-T | ISO/IEC Reserved
0x01 ISO/IEC 11172-2 Video
0x02 ITU-T Rec. H.262 | ISO/IEC 13818-2 Video or ISO/IEC 11172-2 constrained parameter video stream
0x03 ISO/IEC 11172-3 Audio
0x04 ISO/IEC 13818-3 Audio
0x05 ITU-T Rec. H.222.0 | ISO/IEC 13818-1 private_sections
0x06 ITU-T Rec. H.222.0 | ISO/IEC 13818-1 PES packets containing private data
0x07 ISO/IEC 13522 MHEG
0x08 ITU-T Rec. H.222.0 | ISO/IEC 13818-1 Annex A DSM-CC
0x09 ITU-T Rec. H.222.1
0x0A ISO/IEC 13818-6 type A
0x0B ISO/IEC 13818-6 type B
0x0C ISO/IEC 13818-6 type C
0x0D ISO/IEC 13818-6 type D
0x0E ITU-T Rec. H.222.0 | ISO/IEC 13818-1 auxiliary
0x0F ISO/IEC 13818-7 Audio with ADTS transport syntax
0x10 ISO/IEC 14496-2 Visual
0x11 ISO/IEC 14496-3 Audio with the LATM transport syntax as defined in ISO/IEC 14496-3/AMD-1
0x12 ISO/IEC 14496-1 SL-packetized stream or FlexMux stream carried in PES packets
0x13 ISO/IEC 14496-1 SL-packetized stream or FlexMux stream carried in ISO/IEC14496_sections
0x14 ISO/IEC 13818-6 Synchronized Download Protocol
0x15 Metadata carried in PES packets
0x16 Metadata carried in metadata_sections
0x17 Metadata carried in ISO/IEC 13818-6 Data Carousel
0x18 Metadata carried in ISO/IEC 13818-6 Object Carousel
0x19 Metadata carried in ISO/IEC 13818-6 Synchronized Download Protocol
0x1A IPMP stream (defined in ISO/IEC 13818-11, MPEG-2 IPMP)
0x1B AVC video stream as defined in ITU-T Rec. H.264 | ISO/IEC 14496-10 Video
0x1C-0x7E ITU-T Rec. H.222.0 | ISO/IEC 13818-1 Reserved
0x7F IPMP stream
0x80-0xFF User Private
6 ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004)
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
9) Subclause 2.5.2.4
Add in subclause 2.5.2.4 "PES streams" the sentence:
– For ITU-T Rec. H.264 | ISO/IEC 14496-10 video:
BS = 1200 × MaxCPB[level] + BS
n oh
Where MaxCPB[level] is defined in Table A.1 (Level Limits) in ITU-T Rec. H.264 | ISO/IEC 14496-10
for each level.
10) New subclause 2.5.2.7
Add after subclause 2.5.2.6:
2.5.2.7 P-STD extensions for carriage of ITU-T Rec. H.264 | ISO/IEC 14496-10 Video
For decoding of ITU-T Rec. H.264 | ISO/IEC 14496-10 video streams carried in a Program Stream in the P-STD model,
see 2.14.3.2.
11) Subclause 2.5.3.6
a) Replace in the semantics of the system_video_lock_flag in subclause 2.5.3.6:
The system_video_lock_flag is a 1-bit field indicating that there is a specified, constant rational relationship between
the video frame rate and the system clock frequency in the system target decoder. Subclause 2.5.2.1 defines
system_clock_frequency and the video frame rate is specified in ITU-T Rec. H.262 | ISO/IEC 13818-2. The
system_video_lock_flag may only be set to '1' if, for all presentation units in all video elementary streams in the ITU-T
Rec. H.222.0 | ISO/IEC 13818-1 program, the ratio of system_clock_frequency to the actual video frame rate, SCFR, is
constant and equal to the value indicated in the following table at the nominal frame rate indicated in the video stream.
by:
The system_video_lock_flag is a 1-bit field indicating that there is a specified, constant rational relationship between
the video time base and the system clock frequency in the system target decoder. The system_video_lock_flag may only
be set to '1' if, for all presentation units in all video elementary streams in the ITU-T Rec. H.222.0 | ISO/IEC 13818-1
program, the ratio of system_clock_frequency to the frequency of the actual video time base is constant.
For ISO/IEC 11172-2 and ITU-T Rec. H.262 | ISO/IEC 13818-2 video streams, if the system_video_lock_flag is set to
'1', then the ratio of system_clock_frequency to the actual video frame rate, SCFR, shall be constant and equal to the
value indicated in the following table at the nominal frame rate indicated in the video stream.
For ISO/IEC 14496-2 video streams, if the system_video_lock_flag is set to '1', then the time base of the ISO/IEC
14496-2 video stream, as defined by vop_time_increment_resolution, shall be locked to the STC and shall be exactly
equal to N times system_clock_frequency divided by K, with N and K integers that have a fixed value within each
visual object sequence, with K greater than or equal to N.
For ITU-T Rec. H.264 | ISO/IEC 14496-10 video streams, the frequency of the AVC time base is defined by the AVC
parameter time_scale. If the system_video_lock_flag is set to '1' for an AVC video stream, then the frequency of the
AVC time base shall be locked to the STC and shall be exactly equal to N times system_clock_frequency divided by K,
with N and K integers that have a fixed value within each AVC video sequence, with K greater than or equal to N.
b) Replace the semantics of video_bound in subclause 2.5.3.6 by:
The video_bound is a 5-bit integer in the inclusive range from 0 to 16 and is set to a value greater than or equal to the
maximum number of video streams in the Program Stream of which the decoding processes are simultaneously active.
For the purpose of this subclause, the decoding process of a video stream is active if one of the buffers in the P-STD
model is not empty, or if a Presentation Unit is being presented in the P-STD model.
12) Subclause 2.5.5
Add the following semantics in subclause 2.5.5 "Program Stream directory" immediately after NOTE 2:
Directory entries may be required to reference IDR picture or pictures associated with a recovery point SEI message in
an AVC video stream. Each such directory entry shall refer to the first byte of an AVC access unit.
ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004) 7
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
13) Subclause 2.6.1
Replace Table 2-39 in subclause 2.6.1 by:
Table 2-39 – Program and program element descriptors
descriptor_tag TS PS Identification
0 n/a n/a Reserved
1 n/a n/a Reserved
2 X X video_stream_descriptor
3 X X audio_stream_descriptor
4 X X hierarchy_descriptor
5 X X registration_descriptor
6 X X data_stream_alignment_descriptor
7 X X target_background_grid_descriptor
8 X X Video_window_descriptor
9 X X CA_descriptor
10 X X ISO_639_language_descriptor
11 X X System_clock_descriptor
12 X X Multiplex_buffer_utilization_descriptor
13 X X Copyright_descriptor
14 X Maximum_bitrate_descriptor
15 X X Private_data_indicator_descriptor
16 X X Smoothing_buffer_descriptor
17 X STD_descriptor
18 X X IBP_descriptor
19-26 X Defined in ISO/IEC 13818-6
27 X X MPEG-4_video_descriptor
28 X X MPEG-4_audio_descriptor
29 X X IOD_descriptor
30 X SL_descriptor
31 X X FMC_descriptor
32 X X External_ES_ID_descriptor
33 X X MuxCode_descriptor
34 X X FmxBufferSize_descriptor
35 X MultiplexBuffer_descriptor
36 X X Content_labeling_descriptor
37 X X Metadata_pointer_descriptor
38 X X Metadata_descriptor
39 X X Metadata_STD_descriptor
40 X X AVC video descriptor
41 X X IPMP_descriptor (defined in ISO/IEC 13818-11, MPEG-2 IPMP)
42 X X AVC timing and HRD descriptor
43-63 n/a n/a ITU-T Rec. H.222.0 | ISO/IEC 13818-1 Reserved
64-255 n/a n/a User Private
8 ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004)
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
14) Subclause 2.6.6
Replace in subclause 2.6.6 'Hierarchy descriptor':
The hierarchy descriptor provides information to identify the program elements containing components of
hierarchically-coded video and audio, and private streams which are multiplexed in multiple streams as described in this
Recommendation | International Standard, in ITU-T Rec. H.262 | ISO/IEC 13818-2 and in ISO/IEC 13818-3. (See
Table 2-43.)
by:
The hierarchy descriptor provides information to identify the program elements containing components of
hierarchically-coded video, audio, and private streams. (See Table 2-43.)
15) Subclause 2.6.7
Replace the following entries in Table 2-44 ‘Hierarchy_type field values’ in subclause 2.6.7:
ITU-T Rec. H.262 | ISO/IEC 13818-2 Spatial Scalability
ITU-T Rec. H.262 | ISO/IEC 13818-2 SNR Scalability
ITU-T Rec. H.262 | ISO/IEC 13818-2 Temporal Scalability
ITU-T Rec. H.262 | ISO/IEC 13818-2 Data partitioning
ISO/IEC 13818-3 Extension bitstream
ITU-T Rec.H222.0 | ISO/IEC 13818-1 Private Stream
ITU-T Rec. H.262 | ISO/IEC 13818-2 Multi-view Profile
by, respectively:
Spatial Scalability
SNR Scalability
Temporal Scalability
Data partitioning
Extension bitstream
Private Stream
Multi-view Profile
16) Subclause 2.6.11
a) Replace in the semantics of alignment_type in subclause 2.6.11:
Table 2-47 describes the video alignment type when the data_alignment_indicator in the PES packet header has a value
of '1'. In each case of alignment_type value the first PES_packet_data_byte following the PES header shall be the first
byte of a start code of the type indicated in Table 2-47. At the beginning of a video sequence, the alignment shall occur
at the start code of the first sequence header.
NOTE – Specifying alignment type '01' from Table 2-47 does not preclude the alignment from beginning at a GOP or SEQ
header.
The definition of access unit for video data is given in 2.1.1.
by:
Table 2-47 describes the alignment type for ISO/IEC 11172-2 video, ITU-T Rec. H.262 | ISO/IEC 13818-2 video, or
ISO/IEC 14496-2 visual streams when the data_alignment_indicator in the PES packet header has a value of '1'. For
these video streams, the first PES_packet_data_byte following the PES header shall be the first byte of a start code of
the type indicated in Table 2-47. At the beginning of a video sequence, the alignment shall occur at the start code of the
first sequence header.
NOTE – Specifying alignment type '01' from Table 2-47 does not preclude the alignment from beginning at a GOP or SEQ
header.
The definition of an access unit is given in 2.1.1.
ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004) 9
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
b) Insert the following text and table AMD3-1 immediately after Table 2-47 in subclause 2.6.11:
Table AMD3-1 describes the alignment type for ITU-T Rec. H.264 | ISO/IEC 14496-10 video when the
data_alignment_indicator in the PES packet header has a value of '1'. In this case the first PES_packet_data_byte
following the PES header shall be the first byte of an AVC access unit or the first byte of an AVC slice, as signalled by
the alignment_type value.
Table AMD3-1 – AVC video stream alignment values
Alignment type Description
00 Reserved
01 AVC slice or AVC access unit
02 AVC access unit
03-FF Reserved
17) Subclause 2.6.32
Replace in subclause 2.6.32 'STD descriptor':
This descriptor is optional and applies only to the T-STD model and to video elementary streams, and is used as
specified 2.4.2. This descriptor does not apply to Program Streams (see Table 2-60).
by:
This descriptor is optional and applies only to the T-STD model and to ITU-T Rec. H.262 | ISO/IEC 13818-2 video
elementary streams, and is used as specified in 2.4.2. This descriptor does not apply to Program Streams (see
Table 2-60).
18) Subclause 2.6.34
Replace in subclause 2.6.34 'IBP descriptor':
This optional descriptor provides information about some characteristics of the sequence of frame types in the video
sequence (see Table 2-61).
by:
This optional descriptor provides information about some characteristics of the sequence of frame types in an ISO/IEC
11172-2, ITU-T Rec. H.262 | ISO/IEC 13818-2, or ISO/IEC 14496-2 video stream (see Table 2-61).
19) New subclauses 2.6.64-2.6.67
Add after subclause 2.6.63:
2.6.64 AVC video descriptor
For ITU-T Rec. H.264 | ISO/IEC 14496-10 video streams, the AVC video descriptor provides basic information for
identifying coding parameters of the associated AVC video stream, such as on profile and level parameters included in
the SPS of an AVC video stream.
The AVC video descriptor also signals the presence of AVC still pictures and the presence of AVC 24-hour pictures in
the AVC video stream. If this descriptor is not included in the PMT for an AVC video stream in a transport stream or in
the PSM, if present, for an AVC video stream in a program stream, then such AVC video stream shall not contain AVC
still pictures and shall not contain AVC 24-hour pictures. (See Table AMD3-2.)
10 ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004)
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
Table AMD3-2 – AVC video descriptor
Syntax No. of bits Mnemonic
AVC_video_descriptor () {
descriptor_tag 8 uimsbf
descriptor_length 8 uimsbf
profile_idc 8 uimsbf
constraint_set0_flag 1 bslbf
constraint_set1_flag 1 bslbf
constraint_set2_flag 1 bslbf
AVC_compatible_flags 5 bslbf
level_idc 8 uimsbf
AVC_still_present 1 bslbf
AVC_24_hour_picture_flag 1 bslbf
reserved 6 bslbf
}
2.6.65 Semantic definition of fields in AVC video descriptor
profile_idc, constraint_set0_flag, constraint_set1_flag, constraint_set2_flag, AVC_compatible_flags and
level_idc – These fields, with the exception of AVC_compatible_flags shall be coded according to the semantics for
these fields defined in ITU-T Rec. H.264 | ISO/IEC 14496-10. The semantics of AVC_compatible_flags are exactly
equal to the semantics of the field(s) defined for the 5 bits between the constraint_set2 flag and the level_idc field in the
Sequence Parameter Set, as defined in ITU-T Rec. H.264 | ISO/IEC 14496-10. The entire AVC video stream to which
the AVC descriptor is associated shall conform to the profile, level and constraints signalled by these fields.
NOTE – In one or more sequences in the AVC video stream the level may be lower than the level signalled in the AVC video
descriptor, while also a profile may occur that is a subset of the profile signalled in the AVC video descriptor. However, in the
entire AVC video stream, only tools shall be used that are included in the profile signalled in the AVC video descriptor, if
present. For example, if the main profile is signalled, then the baseline profile may be used in some sequences, but only using
those tools that are in the main profile. If the sequence parameter sets in an AVC video stream signal different profiles, and no
additional constraints are signalled, then the stream may need examination to determine which profile, if any, the entire stream
conforms to. If an AVC video descriptor is to be associated with an AVC video stream that does not conform to a single profile,
then the AVC video stream must be partitioned into two or more sub-streams, so that AVC video descriptors can signal a single
profile for each such sub-stream.
AVC_still_present – This 1-bit field when set to '1' indicates that the AVC video stream may include AVC still
pictures. When set to '0', then the associated AVC video stream shall not contain AVC still pictures.
AVC_24_hour_picture_flag – This 1-bit flag when set to '1' indicates that the associated AVC video stream may
contain AVC 24-hour pictures. For the definition of an AVC 24-hour picture, see 2.1.2. If this flag is set to '0', the
associated AVC video stream shall not contain any AVC 24-hour picture.
2.6.66 AVC timing and HRD descriptor
The AVC timing and HRD descriptor provides timing and HRD parameters of the associated AVC video stream. For
each AVC video stream carried in an ITU-T Rec. H.222.0 | ISO/IEC 13818-1 stream, the AVC timing and HRD
descriptor shall be included in the PMT or in the PSM, if PSM is present in the program stream, unless the AVC video
stream carries VUI parameters with the timing_info_present_flag set to '1':
• for each IDR picture; and
• for each picture that is associated with a recovery point SEI message.
Absence of the AVC timing and HRD descriptor in the PMT for an AVC video stream signals usage of the leak method
in the T-STD is defined in 2.14.3.1 for the transfer from MB to EB , but such usage can also be signalled by the
n n
hrd_management_valid_flag set to '0' in the AVC timing and HRD descriptor. If the transfer rate into buffer EB can be
n
determined from HRD parameters contained in an AVC video stream, and if this transfer rate is used in the T-STD for
the transfer between MB to EB , then the AVC timing and HRD descriptor with the hrd_management_valid_flag set to
n n
'1' shall be included in the PMT for that AVC video stream. (See Table AMD3-3.)
ITU-T Rec. H.222.0 (2000)/Amd.3 (03/2004) 11
ISO/IEC 13818-1:2000/Amd.3:2004 (E)
Table AMD3-3 – AVC timing and HRD descriptor
Syntax No. of bits Mnemonic
AVC timing and HRD descriptor () {
descriptor_tag 8 uimsbf
descriptor_length 8 uimsbf
hrd_management_valid_flag 1 bslbf
reserved 6 bslbf
picture_and_timing_info_present 1 bslbf
if (picture_and_timing_info_present) {
90kHz_flag 1 bslbf
reserved 7 bslbf
if (90kHz_flag = = '0') {
N 32 uimsbf
K 32 uimsbf
}
num_units_in_tick 32 uimsbf
}
fixed_frame_rate_flag 1 bslbf
temporal_poc_flag 1 bslbf
picture_to_display_conversion_flag 1 bslbf
reserved 5 bslbf
}
2.6.67 Semantic definition of fields in AVC timing and HRD descriptor
hrd_management_valid_flag – This 1-bit field is only defined for use in transport streams.
When the AVC timing and HRD descriptor is associated to an AVC video stream carried in a transport stream, then the
following applies. If the hrd_management_valid_flag is set to '1', then Buffering Period SEI and Picture Timing SEI
messages, as defined in Annex C of ITU-T Rec. H.264 | ISO/IEC 14496-10, shall be present in the associated AVC
video stream. These Buffering Period SEI messages shall carry coded initial_cpb_removal_delay and
initial_cpb_removal_delay_offset values for the NAL HRD. If the hrd_management_valid_flag is set to '1', then the
transfer of each byte from MB to EB in the T-STD shall be according to the delivery schedule for that byte into the
n n
CPB in the NAL HRD, as determined from the coded initial_cpb_removal_delay and initial_cpb_removal_delay_offset
values for SchedSelIdx = cpb_cnt_minus1. When the hrd_management_valid_flag is set to '0', the leak method as
defined in 2.14.3.1 shall be used for the transfer from MB to EB in the T-STD.
n n
When the AVC timing and HRD descriptor is associated to an AVC video stream carried in a program stre
...
NORME ISO/CEI
INTERNATIONALE 13818-1
Deuxième édition
2000-12-01
AMENDEMENT 3
2004-11-01
Technologies de l'information — Codage
générique des images animées et du son
associé: Systèmes
AMENDEMENT 3
Information technology — Generic coding of moving pictures and
associated audio information: Systems
AMENDMENT 3
Numéro de référence
ISO/CEI 13818-1:2000/Amd.3:2004(F)
©
ISO/CEI 2004
ISO/CEI 13818-1:2000/Amd.3:2004(F)
PDF – Exonération de responsabilité
Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier
peut être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence
autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées
acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute
responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.
Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info
du fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir
l'exploitation de ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation,
veuillez en informer le Secrétariat central à l'adresse donnée ci-dessous.
© ISO/CEI 2004
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être reproduite ni utilisée sous
quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l'accord écrit
de l'ISO à l'adresse ci-après ou du comité membre de l'ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax. + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Publié en Suisse
ii © ISO/CEI 2004 – Tous droits réservés
ISO/CEI 13818-1:2000/Amd.3:2004(F)
TABLE DES MATIÈRES
Page
1) Paragraphe 1.2.2. 1
2) Paragraphe 2.1.1. 1
3) Nouveaux paragraphes 2.1.2 à 2.1.7 . 1
4) Paragraphe 2.1.52. 1
5) Nouveau paragraphe 2.4.2.8. 2
6) Paragraphe 2.4.3.5. 2
7) Paragraphe 2.4.3.7. 4
8) Paragraphe 2.4.4.10. 6
9) Paragraphe 2.5.2.4. 7
10) Nouveau paragraphe 2.5.2.7. 7
11) Paragraphe 2.5.3.6. 7
12) Paragraphe 2.5.5. 8
13) Paragraphe 2.6.2. 8
14) Paragraphe 2.6.6. 9
15) Paragraphe 2.6.7. 9
16) Paragraphe 2.6.11. 9
17) Paragraphe 2.6.32. 10
18) Paragraphe 2.6.34. 10
19) Nouveaux paragraphes 2.6.64 à 2.6.67. 10
20) Paragraphe 2.7.4. 13
21) Paragraphe 2.7.5. 13
22) Paragraphe 2.7.6. 14
23) Paragraphe 2.7.9. 15
24) Paragraphe 2.7.10. 16
25) Paragraphe 2.11.1. 17
26) Paragraphe 2.11.2.1. 17
27) Nouveau paragraphe 2.14. 17
© ISO/CEI 2004 – Tous droits réservés iii
ISO/CEI 13818-1:2000/Amd.3:2004(F)
Avant-propos
L'ISO (Organisation internationale de normalisation) et la CEI (Commission électrotechnique internationale)
forment le système spécialisé de la normalisation mondiale. Les organismes nationaux membres de l'ISO ou
de la CEI participent au développement de Normes internationales par l'intermédiaire des comités techniques
créés par l'organisation concernée afin de s'occuper des domaines particuliers de l'activité technique. Les
comités techniques de l'ISO et de la CEI collaborent dans des domaines d'intérêt commun. D'autres
organisations internationales, gouvernementales et non gouvernementales, en liaison avec l'ISO et la CEI
participent également aux travaux. Dans le domaine des technologies de l'information, l'ISO et la CEI ont créé
un comité technique mixte, l'ISO/CEI JTC 1.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI,
Partie 2.
La tâche principale du comité technique mixte est d'élaborer les Normes internationales. Les projets de
Normes internationales adoptés par le comité technique mixte sont soumis aux organismes nationaux pour
vote. Leur publication comme Normes internationales requiert l'approbation de 75 % au moins des
organismes nationaux votants.
L'attention est appelée sur le fait que certains des éléments du présent document peuvent faire l'objet de
droits de propriété intellectuelle ou de droits analogues. L'ISO et la CEI ne sauraient être tenues pour
responsables de ne pas avoir identifié de tels droits de propriété et averti de leur existence.
L'Amendement 3 à l’lSO/CEI 13818-1:2000 a été élaborée par le comité technique mixte ISO/CEI JTC 1,
Technologies de l'information, sous-comité SC 29, Codage du son, de l’image, de l’information multimédia et
hypermédia, en collaboration avec l'UIT-T. Le texte identique est publié en tant que
Rec. UIT-T H.222.0/Amd.3.
iv © ISO/CEI 2004 – Tous droits réservés
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
NORME INTERNATIONALE
RECOMMANDATION UIT-T
Technologies de l'information – Codage générique des
images animées et du son associé: systèmes
Amendement 3
Transport de données vidéo AVC sur des flux conformes
à la Rec. UIT-T H.222.0 | ISO/CEI 13818-1
1) Paragraphe 1.2.2
Ajouter la paire de références suivante au § 1.2.2:
– Recommandation UIT-T H.264 (2003), Codage vidéo évolué pour les services audiovisuels génériques.
ISO/CEI 14496-10:2003, Technologies de l'information – Codage des objets audiovisuels – Partie 10:
Codage visuel avancé.
2) Paragraphe 2.1.1
Ajouter la phrase suivante à la définition de l'unité d'accès (2.1.1):
Concernant la définition d'une unité d'accès pour données vidéo conformes à la Rec. UIT-T H.264 | ISO/CEI 14496-10,
voir la définition de l'unité d'accès AVC donnée au § 2.1.3.
3) Paragraphes 2.1.2 à 2.1.7
Insérer les définitions suivantes en tant que § 2.1.2 à 2.1.7 et renuméroter en conséquence:
2.1.2 image 24 heures AVC (système): unité d'accès AVC dont l'instant de présentation se situe au-delà des
24 heures à venir. Dans le cadre de la présente définition, l'unité d'accès AVC n a un instant de présentation qui se situe
au-delà des 24 heures à venir si la différence entre l'instant d'arrivée initial t (n) et l'instant de sortie du tampon DPB
ai
t (n) est supérieure à 24 heures.
o,dpb
2.1.3 unité d'accès AVC (système): unité d'accès définie pour les flux d'octets de la Rec. UIT-T H.264 | ISO/CEI
14496-10 avec les contraintes spécifiées au 2.14.1.
2.1.4 tranche AVC (système): structure de données byte_stream_nal_unit définie dans la Rec. UIT-T H.264 |
ISO/CEI 14496-10 ayant une valeur nal_unit_type de 1 ou 5, ou structure de données byte_stream_nal_unit ayant une
valeur nal_unit_type de 2 ou toute structure de données byte_stream_nal_unit associée ayant une valeur de
nal_unit_type de 3 ou 4.
2.1.5 image fixe AVC (système): une image fixe AVC est formée d'une unité d'accès AVC contenant une image
IDR, précédée d'unités NAL SPS et PPS qui acheminent suffisamment d'informations pour décoder correctement
l'image IDR. Une image fixe AVC sera précédée d'une autre image fixe AVC ou d'une unité NAL de fin de séquence
terminant une séquence vidéo codée précédente.
2.1.6 séquence vidéo AVC (système): séquence vidéo codée définie au § 3.27 de la Rec. UIT-T H.264 |
ISO/CEI 14496-10.
2.1.7 flux vidéo AVC (système): flux conforme à la Rec. UIT-T H.264 | ISO/CEI 14496-10. Un flux vidéo AVC
est formé d'une ou de plusieurs séquences vidéo AVC.
4) Paragraphe 2.1.52
Remplacer la définition suivante de "image fixe" donnée au § 2.1.52:
2.1.52 image fixe: image fixe qui se compose d'une séquence vidéo contenant exactement une seule image à codage
intratrame. Cette image est assortie d'un horodatage de présentation et l'instant de présentation des images suivantes (si
elles existent) est d'au moins deux périodes d'image après celui de l'image fixe.
Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004) 1
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
par
2.1.52 image fixe: image fixe qui se compose d'une séquence vidéo, codée selon la Rec. UIT-T H.262 | ISO/CEI
13818-2, l'ISO/CEI 11172-2 ou l'ISO/CEI 14496-2, contenant exactement une image à codage intratrame. Une horodate
PTS est associée à cette image et, en cas de codage conforme à l'ISO/CEI 11172-2, la Rec. UIT-T H.262 | ISO/CEI
13818-2 ou l'ISO/CEI 14496-2, l'instant de présentation des images suivantes (si elles existent) est d'au moins deux
périodes d'image après celui de l'image fixe.
5) Nouveau paragraphe 2.4.2.8
Ajouter, après le § 2.4.2.7:
2.4.2.8 Extensions du décodeur T-STD pour l'acheminement de données vidéo Rec. UIT-T H.264 | ISO/CEI
14496-10
Pour définir le codage au niveau du décodeur T-STD des flux vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10 acheminés
dans un flux de transport, il faut étendre le modèle du décodeur T-STD. L'extension du décodeur T-STD et les
paramètres du décodeur T-STD nécessaires au décodage des flux vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10 sont
définis au § 2.14.3.1.
6) Paragraphe 2.4.3.5
a) Remplacer, à partir du 5ème alinéa de la sémantique de discontinuity_indicator donnée au § 2.4.3.5, le texte
suivant:
Aux fins de ce paragraphe, la définition d'un point d'accès de flux élémentaire est la suivante:
• données vidéo – Premier octet d'un en-tête de séquence vidéo;
• données audio – Premier octet d'une trame audio.
A la suite d'une discontinuité du compteur de continuité d'un paquet de transport identifié comme contenant des
données de flux élémentaire, le premier octet de données de flux élémentaire d'un paquet de transport ayant le même
identificateur PID doit être le premier octet du point d'accès du flux élémentaire ou, dans le cas des données vidéo, le
premier octet d'un point d'accès du flux élémentaire ou encore d'un code de fin de séquence suivi d'un point d'accès.
par
Aux fins de ce paragraphe, la définition d'un point d'accès de flux élémentaire est la suivante:
• données vidéo ISO/CEI 11172-2 et Rec. UIT-T H.262 | ISO/CEI 13818-2 – Le premier octet d'un en-tête
de séquence vidéo;
• données visuelles ISO/CEI 14496-2 – Le premier octet de l'en-tête de séquence d'objet visuel;
• données vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10 – Le premier octet d'une unité d'accès AVC. Les
ensembles de paramètres SPS et PPS référencés dans cette unité d'accès AVC et dans toutes les unités
d'accès AVC suivantes du flux vidéo codé seront introduits dans le flux d'octets après ce point d'accès et
ce, avant leur activation;
• données audio – Le premier octet d'une trame audio.
A la suite d'une discontinuité du compteur de continuité dans un paquet de transport identifié comme contenant des
données de flux élémentaire, le premier octet de données de flux élémentaire d'un paquet de flux de transport ayant le
même identificateur PID doit être le premier octet d'un point d'accès de flux élémentaire. Dans le cas de données vidéo
ISO/CEI 11172-2, Rec. UIT-T H.262 | ISO/CEI 13818-2 ou ISO/CEI 14496-2, le premier octet d'un point d'accès de
flux élémentaire peut aussi être le premier octet d'un code de fin de séquence suivi d'un point d'accès de flux
élémentaire.
b) Remplacer, dans la sémantique de random_access_indicator donnée au § 2.4.3.5:
En particulier, lorsqu'il est mis à '1', le prochain paquet PES du début de capacité utile des paquets de transport (voir le
Tableau 2-29) de même identificateur PID doit contenir le premier octet d'un en-tête de séquence vidéo, s'il s'agit d'un
flux de transport PES de type 1 ou 2 (données vidéo) ou doit contenir le premier octet d'une trame audio s'il s'agit d'un
flux de transport de type 3 ou 4 (données audio). En outre, et dans ces différents cas, la présence d'un horodateur de
présentation est indispensable dans ce paquet PES ou dans un paquet ultérieur pour la première image suivant l'en-tête
de séquence ou pour la trame audio.
2 Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004)
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
par
En particulier, lorsque ce bit est mis à '1', le paquet PES suivant du début de capacité utile des paquets de transport de
même identificateur PID doit contenir un point d'accès de flux élémentaire tel que défini dans la sémantique du champ
discontinuity_indicator. De plus, dans le cas de données vidéo, une horodate de présentation doit être présente pour la
première image qui suit le point d'accès de flux élémentaire.
c) Remplacer, dans la sémantique de elementary_stream_priority_indicator donnée au § 2.4.3.5:
En cas de données vidéo, ce fanion ne peut être mis à '1' que si la capacité utile contient un ou plusieurs octets issus
d'une tranche à codage intratrame.
par
Dans le cas de données vidéo ISO/CEI 11172-2, Rec. UIT-T H.262 | ISO/CEI 13818-2 ou ISO/CEI 14496-2, ce champ
ne peut être mis à '1' que si la capacité utile contient un ou plusieurs octets issus d'une tranche à codage intratrame.
Dans le cas de données vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10, ce champ ne peut être mis à '1' que si la capacité
utile contient un ou plusieurs octets issus d'une tranche dont le type est mis à 2, 4, 7 ou 9.
d) Remplacer, dans la sémantique de splice_countdown donnée au § 2.4.3.5:
Aux fins du présent paragraphe, la définition d'un point d'accès est la suivante:
• données vidéo – Le premier octet d'un en-tête de séquence vidéo;
• données audio – Le premier octet d'une trame audio.
par
Pour la définition du point d'accès de flux élémentaire, voir la sémantique de discontinuity_indicator donnée au
§ 2.4.3.5.
e) Remplacer, dans la sémantique de seamless_splice_flag donnée au § 2.4.3.5:
Lorsque la valeur de ce fanion est fixée, si le flux élémentaire contenu dans cet identificateur PID est un flux audio, le
champ réservé au type de combinaison doit être mis à '0000'; si le flux élémentaire est un flux vidéo, il doit vérifier les
contraintes correspondant à la valeur du type de combinaison.
par
Lorsque ce fanion est mis à '1' et que le flux élémentaire transporté sous cet identificateur PID n'est pas un flux vidéo
Rec. UIT-T H.262 | ISO/CEI 13818-2, le champ splice_type doit être mis à '0000'; si le flux élémentaire transporté sous
cet identificateur PID est un flux vidéo Rec. UIT-T H.262 | ISO/CEI 13818-2, il doit vérifier les contraintes
correspondant à la valeur de splice_type.
f) Remplacer, dans la sémantique de splice_type donnée au § 2.4.3.5:
Si le flux élémentaire transporté sous cet identificateur PID est un flux de données audio, le champ splice_type doit
prendre la valeur '0000'. Si le flux élémentaire transporté sous cet identificateur PID est un flux de données vidéo, ce
champ indique les conditions de combinaison que doit vérifier ce flux élémentaire.
par
Si le flux élémentaire transporté sous cet identificateur PID n'est pas un flux vidéo Rec. UIT-T H.262 | ISO/CEI
13818-2, ce champ doit prendre la valeur '0000'. Si le flux élémentaire transporté sous cet identificateur PID est un flux
vidéo Rec. UIT-T H.262 | ISO/CEI 13818-2, ce champ indique les conditions de combinaison que doit vérifier ce flux
élémentaire.
Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004) 3
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
7) Paragraphe 2.4.3.7
a) Remplacer le Tableau 2-18 du § 2.4.3.7 par le suivant:
Tableau 2-18 – Affectations de l'identificateur stream_id
Identificateur de flux Note Codage du flux
program_stream_map
1011 1100 1
private_stream_1
1011 1101 2
padding_stream
1011 1110
private_stream_2
1011 1111 3
numéro de flux audio x xxxx ISO/CEI 13818-3 ou ISO/CEI 11172-3 ou
110x xxxx
ISO/CEI 13818-7 ou ISO/CEI 14496-3
numéro de flux vidéo xxxx de la Rec. UIT-T H.262 | ISO/CEI 13818-2 ou
1110 xxxx
ISO/CEI 11172-2 ou ISO/CEI 14496-2 ou Rec. UIT-T H.264 | ISO/CEI
14496-10
ECM_stream
1111 0000 3
EMM_stream
1111 0001 3
Annexe A de la Rec. UIT-T H.222.0 | ISO/CEI 13818-1 ou ISO/CEI
1111 0010 5
13818-6_DSMCC_stream
1111 0011 2 ISO/CEI_13522_stream
Rec. UIT-T H.222.1 type A
1111 0100 6
Rec. UIT-T H.222.1 type B
1111 0101 6
Rec. UIT-T H.222.1 type C
1111 0110 6
Rec. UIT-T H.222.1 type D
1111 0111 6
Rec. UIT-T H.222.1 type E
1111 1000 6
ancillary_stream
1111 1001 7
ISO/CEI 14496-1_SL-packetized_stream
1111 1010
ISO/CEI 14496-1_FlexMux_stream
1111 1011
flux de métadonnées
1111 1100
extended_stream_id
1111 1101
flux de données réservé
1111 1110
program_stream_directory
1111 1111 4
La notation x signifie que la valeur '0' ou la valeur '1' est autorisée et aboutit au même type de flux. Le numéro de flux est donné
par les valeurs prises par les x.
NOTE 1 – Les paquets PES de type program_stream_map ont une syntaxe unique, qui est spécifiée au § 2.5.4.1.
NOTE 2 – Les paquets de type private_stream_1 et l'ISO/CEI_13552_stream suivent la même syntaxe de paquet PES que pour les
flux vidéo Rec. UIT-T H.262 | ISO/CEI 13818-2 et que pour les flux audio ISO/CEI 13818-3.
NOTE 3 – Les paquets PES de type private_stream_2, ECM_stream et EMM_stream sont analogues au champ private_stream_1
sauf qu'aucune syntaxe n'est spécifiée après le champ PES_packet_length.
NOTE 4 – Les paquets PES de type program_stream_directory ont une syntaxe unique, spécifiée au § 2.5.5.
NOTE 5 – Les paquets PES de type DSM-CC_stream ont une syntaxe unique, qui est spécifiée dans l'ISO/CEI 13818-6.
NOTE 6 – Cet identificateur stream_id est associé au type de flux 0x09 indiqué au Tableau 2-29.
NOTE 7 – Cet identificateur stream_id est utilisé uniquement dans les paquets de flux PES, qui transportent des données
provenant d'un flux de programme ou d'un flux de système ISO/CEI 11172-1, dans un flux de transport (voir § 2.4.3.7).
b) Remplacer la sémantique de data_alignment_indicator donnée au § 2.4.3.7 par la suivante:
data_alignment_indicator (indicateur d'alignement de données) – indicateur logique codé sur un bit. La valeur '1'
indique que l'en-tête de paquet PES est immédiatement suivi de l'élément de syntaxe vidéo ou du mot de
synchronisation audio indiqué dans le descripteur d'alignement de flux de données défini au § 2.6.10, si ce descripteur
est présent. Si la valeur est à '1' et que le descripteur est absent, il faut utiliser l'alignement de type '01' tel que défini
dans les Tableaux 2-47, 2-48 ou AMD3-1. La valeur '0' indique que la question de savoir si un tel alignement est
exécuté ou non n'est pas définie.
c) Remplacer, dans la sémantique de PTS donnée au § 2.4.3.7, le texte suivant:
Dans le cas de données vidéo, si l'en-tête de paquet PES contient un horodateur PTS, celui-ci doit se rapporter à l'unité
d'accès contenant le premier code de déclenchement d'image qui commence dans ledit paquet. Un code de
4 Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004)
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
déclenchement d'image commence dans un paquet PES si le premier octet de ce code est présent dans les données du
paquet.
Pour les unités de présentation de données audio (PU, presentation unit), pour les unités de présentation de données
vidéo en séquences à faible délai et pour les images à codage de type B, l'instant de présentation tp (k) doit être égal à
n
l'instant de décodage td (k).
n
Pour les images à codage de type I ou P en séquences sans faible délai et s'il n'y a pas d'indication de discontinuité du
décodage entre les unités d'accès (AU, access unit) k et k′, l'instant de présentation tp (k) doit être égal à l'instant de
n
décodage td (k′) de la prochaine image I ou P transmise (voir § 2.7.5). S'il y a une discontinuité de décodage, ou si le
n
flux se termine, la différence entre les instants tp (k) et td (k) doit être la même que si le flux initial avait continué sans
n n
discontinuité, ni terminaison.
NOTE 1 – Une séquence à faible délai est une suite de données vidéo dans laquelle le fanion low_delay est activé (voir 6.2.2.3 de
la Rec. UIT-T H.262 | ISO/CEI 13818-2).
par
Si, dans le cas de données vidéo ISO/CEI 11172-2, Rec. UIT-T H.262 | ISO/CEI 13818-2 ou ISO/CEI 14496-2, l'en-tête
de paquet PES contient une horodate PTS, celle-ci doit se rapporter à l'unité d'accès contenant le premier code de
déclenchement d'image qui commence dans le paquet PES. Un code de déclenchement d'image commence dans un
paquet PES si le premier octet de ce code est présent dans le paquet PES. Pour les images à codage de type I ou P
contenues dans des séquences autres qu'à faible délai et s'il n'y a pas de discontinuité de décodage entre les unités
d'accès (AU, access unit) k et k′, l'instant de présentation tp (k) doit être égal à l'instant de décodage td (k′) de la
n n
prochaine image I ou P transmise (voir § 2.7.5). S'il y a une discontinuité de décodage, ou si le flux se termine, la
différence entre les instants tp (k) et td (k) doit être la même que si le flux initial avait continué sans discontinuité, ni
n n
terminaison.
NOTE 1 – Une séquence à faible délai est une séquence vidéo Rec. UIT-T H.262 | ISO/CEI 13818-2 ou ISO/CEI 14496-2 dans
laquelle le fanion low_delay est mis à '1' (voir § 6.2.2.3 de la Rec. UIT-T H.262 | ISO/CEI 13818-2 et § 6.2.3 de ISO/CEI
14496-2).
Si, dans le cas de données vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10, l'en-tête de paquet PES contient une horodate
PTS, celle-ci doit se rapporter à la première unité d'accès AVC qui commence dans ce paquet PES. Une unité d'accès
AVC commence dans un paquet PES si le premier octet de cette unité est présent dans le paquet PES. Dans un souci de
cohérence entre le décodeur STD et le décodeur HRD défini dans l'Annexe C de la Rec. UIT-T H.264 | ISO/CEI
14496-10, pour chaque unité d'accès AVC décodée, la valeur de PTS donnée par le décodeur STD doit, dans les limites
de la précision des horloges respectives, indiquer le même instant que l'instant de sortie nominal du tampon DPB donné
par le décodeur HRD, défini ici comme étant t (n) = t ( n ) + t * dpb_output_delay( n ), où t ( n ), t , et
o,n,dpb r,n c r,n c
dpb_output_delay( n ) sont définis dans l'Annexe C de la Rec. UIT-T H.264 | ISO/CEI 14496-10.
NOTE 2 – On peut utiliser des horloges différentes pour déterminer l'horodate PTS et t (n).
o,n,dpb
L'instant de présentation tp (k) sera identique à l'instant de décodage td (k) pour:
n n
• les unités d'accès audio;
• les unités d'accès des séquences vidéo à faible délai Rec. UIT-T H.262 | ISO/CEI 13818-2 ou ISO/CEI
14496-2;
• les images B des flux vidéo ISO/CEI 11172-2, Rec. UIT-T H.262 | ISO/CEI 13818-2 ou ISO/CEI
14496-2.
d) Remplacer, dans la sémantique de DTS donnée au § 2.4.3.7:
Dans le cas de données vidéo, si l'en-tête de paquet PES contient un horodateur DTS, celui-ci doit se rapporter à l'unité
d'accès contenant le premier code de déclenchement d'image qui commence dans ledit paquet. Un code de
déclenchement d'image commence dans un paquet PES si le premier octet de ce code est présent dans les données du
paquet.
par
Si, dans le cas de données vidéo ISO/CEI 11172-2, Rec. UIT-T H.262 | ISO/CEI 13818-2 ou ISO/CEI 14496-2, l'en-tête
de paquet PES contient une horodate DTS, celle-ci doit se rapporter à l'unité d'accès contenant le premier code de
déclenchement d'image qui commence dans ce paquet PES. Un code de déclenchement d'image commence dans un
paquet PES si le premier octet de ce code est présent dans le paquet.
Si, dans le cas de données vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10, l'en-tête de paquet PES contient une horodate
DTS, celle-ci doit se rapporter à la première unité d'accès AVC qui commence dans ce paquet PES. Une unité d'accès
AVC commence dans un paquet PES si le premier octet de cette unité est présent dans le paquet PES. Dans un souci de
cohérence entre le décodeur STD et le décodeur HRD défini dans l'Annexe C de la Rec. UIT-T H.264 | ISO/CEI
Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004) 5
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
14496-10, pour chaque unité d'accès AVC, la valeur de DTS donnée par le décodeur STD doit, dans les limites de la
précision des horloges respectives, indiquer le même instant que l'instant de sortie nominal du tampon CPB t ( n )
r,n
donné par le décodeur HRD, défini dans l'Annexe C de la Rec. UIT-T H.264 | ISO/CEI 14496-10.
NOTE 3 – On peut utiliser des horloges différentes pour déterminer l'horodate DTS et t ( n ).
r,n
e) Ajouter le texte suivant à la sémantique de P-STD_buffer_size donnée au § 2.4.3.7:
La taille BS sera supérieure ou égale à la taille du tampon d'image codée (CPB) signalée par la taille
n
CpbSize[ cpb_cnt_minus1 ] spécifiée par les paramètres NAL hrd_parameters() dans le flux vidéo AVC. Si les
paramètres NAL hrd_parameters() sont absents du flux vidéo AVC, la taille BS sera supérieure ou égale à la taille du
n
tampon CPB NAL pour le format de flux d'octets défini à l'Annexe A de la Rec. UIT-T H.264 | ISO/CEI 14496-10
comme étant de 1200 × MaxCPB pour le niveau appliqué.
8) Paragraphe 2.4.4.10
Remplacer le Tableau 2-29 du § 2.4.4.10 par le suivant:
Tableau 2-29 – Assignation des types de flux
Valeur Description
0x00 Réservé à l'UIT-T | ISO/CEI
0x01 Vidéo ISO/CEI 11172-2
0x02 Vidéo Rec. UIT-T H.262 | ISO/CEI 13818-2 ou flux vidéo à paramètres contraints ISO/CEI 11172-2
0x03 Audio ISO/CEI 11172-3
0x04 Audio ISO/CEI 13818-3
0x05 Private_sections Rec. UIT-T H.222.0 | ISO/CEI 13818-1
0x06 Paquets PES contenant des données privées Rec. UIT-T H.222.0 | ISO/CEI 13818-1
0x07 MHEG ISO/CEI 13522
0x08 Annexe A DSM-CC Rec. UIT-T H.222.0 | ISO/CEI 13818-1
0x09 Rec. UIT-T H.222.1
0x0A ISO/CEI 13818-6 type A
0x0B ISO/CEI 13818-6 type B
0x0C ISO/CEI 13818-6 type C
0x0D ISO/CEI 13818-6 type D
0x0E Auxiliaire Rec. UIT-T H.222.0 | ISO/CEI 13818-1
0x0F Audio ISO/CEI 13818-7 avec syntaxe de transport ADTS
0x10 Visuel ISO/CEI 14496-2
0x11 Audio ISO/CEI 14496-3 avec syntaxe de transport LATM telle que définie dans l'Amendement 1 de
l'ISO/CEI 14496-3
0x12 Flux de paquets SL ISO/CEI 14496-1 ou flux FlexMux acheminé dans des paquets PES
0x13 Flux de paquets SL ISO/CEI 14496-1 ou flux FlexMux acheminé dans ISO/CEI 14496_sections
0x14 Protocole de téléchargement synchronisé ISO/CEI 13818-6
0x15 Métadonnées acheminées dans des paquets PES
0x16 Métadonnées acheminées dans metadata_sections
0x17 Métadonnées acheminées dans un carrousel de données ISO/CEI 13818-6
0x18 Métadonnées acheminées dans un carrousel d'objets ISO/CEI 13818-6
0x19 Métadonnées acheminées dans le protocole de téléchargement synchronisé ISO/CEI 13818-6
0x1A Flux IPMP (défini dans l'ISO/CEI 13818-11, IPMP MPEG-2)
0x1B Flux vidéo AVC tel que défini dans la Rec. UIT-T H.264 | ISO/CEI 14496-10
0x1C-0x7E Réservés à la Rec. UIT-T H.222.0 | ISO/CEI 13818-1
0x7F Flux IPMP
0x80-0xFF Réservés à l'utilisateur
6 Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004)
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
9) Paragraphe 2.5.2.4
Ajouter ce qui suit au § 2.5.2.4 "Flux de paquets PES":
– Pour les données vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10:
BS = 1200 × MaxCPB[niveau] + BS
n oh
Où MaxCPB[niveau] est défini dans le Tableau A.1 (Limites de niveau) de la Rec. UIT-T H.264 |
ISO/CEI 14496-10 pour chaque niveau.
10) Nouveau paragraphe 2.5.2.7
Ajouter après le § 2.5.2.6:
2.5.2.7 Extensions du décodeur P-STD pour l'acheminement de données vidéo Rec. UIT-T H.264 | ISO/CEI
14496-10
Pour le décodage dans le décodeur P-STD de flux vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10 acheminés dans un flux
de programme, voir le § 2.14.3.2.
11) Paragraphe 2.5.3.6
a) Remplacer, dans la sémantique de system_video_lock_flag donnée au § 2.5.3.6:
system_video_lock_flag (fanion de verrouillage du rapport entre fréquence d'image et fréquence système) – Ce fanion
indique s'il existe une relation spécifiée de rapport constant entre la fréquence d'image et la fréquence d'horloge système
dans le décodeur modèle du système. Le § 2.5.2.1 définit la fréquence d'horloge de base du système et la Rec. UIT-T
H.262 | ISO/CEI 13818-2 spécifie la fréquence d'image vidéo. Le fanion de verrouillage du rapport entre fréquence
d'image et fréquence système ne peut être mis qu'à la valeur '1' si, pour toutes les unités de présentation de tous les flux
élémentaires de données vidéo d'un flux de programme conforme à la Rec. UIT-T H.222.0 | ISO/CEI 13818-1, le
rapport entre la fréquence système et la fréquence d'image réelle, SCFR, est constant et égal à la valeur indiquée dans le
tableau suivant, à la fréquence nominale de trame qui est indiquée dans le flux de données vidéo.
par
system_video_lock_flag (fanion de verrouillage du rapport entre base de temps vidéo et fréquence système) – Ce
fanion codé sur 1 bit indique s'il existe une relation spécifiée de rapport constant entre la base de temps vidéo et la
fréquence d'horloge système dans le décodeur modèle du système. Ce fanion ne peut être mis à la valeur '1' que si, pour
toutes les unités de présentation de tous les flux élémentaires de données vidéo d'un flux de programme Rec. UIT-T
H.222.0 | ISO/CEI 13818-1, le rapport entre la fréquence d'horloge système et la fréquence de la base de temps vidéo
effective est constant.
Dans le cas de flux vidéo ISO/CEI 11172-2 et Rec. UIT-T H.262 | ISO/CEI 13818-2, si le fanion
system_video_lock_flag est mis à '1', le rapport entre la fréquence d'horloge système et la fréquence d'image réelle,
SCFR, sera constant et égal à la valeur indiquée dans le tableau suivant pour la fréquence d'image nominale indiquée
dans le flux vidéo.
Dans le cas de flux vidéo ISO/CEI 14496-2, si le fanion system_video_lock_flag est mis à '1', la base de temps du flux
vidéo ISO/CEI 14496-2, définie par la résolution vop_time_increment_resolution, sera verrouillée sur l'horloge STC et
sera exactement égale à N fois la fréquence d'horloge système divisée par K, N et K étant des entiers qui ont une valeur
fixe dans chaque séquence d'objet visuel, et K étant supérieur ou égal à N.
Dans le cas des flux vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10, la fréquence de la base de temps AVC est définie par
l'échelle de temps du paramètre AVC. Si le fanion system_video_lock_flag est mis à '1' pour un flux vidéo AVC, la
fréquence de la base de temps AVC sera verrouillée sur l'horloge STC et sera exactement égale à N fois la fréquence
d'horloge système divisée par K, N et K étant des entiers qui ont une valeur fixe dans chaque séquence vidéo AVC, et K
étant supérieur ou égal à N.
b) Remplacer la sémantique de video_bound donnée au § 2.5.3.6 par:
video_bound (limite de flux vidéo) – Entier de 5 bits de valeur comprise entre 0 et 16 et mis à une valeur supérieure ou
égale au nombre maximal de flux vidéo dans le flux de programme, pour lesquels les processus de décodage sont
simultanément actifs. Dans le cadre de ce paragraphe, le processus de décodage d'un flux vidéo est actif si l'un des
tampons du décodeur P-STD n'est pas vide ou si une unité de présentation est en cours de présentation dans le décodeur
P-STD.
Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004) 7
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
12) Paragraphe 2.5.5
Ajouter ce qui suit au § 2.5.5 "Répertoire du flux de programme", immédiatement après la NOTE 2:
Des entrées d'annuaire seront éventuellement nécessaires pour faire référence à une ou plusieurs images IDR associées à
un message SEI de point de rétablissement dans un flux vidéo AVC. Chacune de ces entrées de répertoire désignera le
premier octet d'une unité d'accès AVC.
13) Paragraphe 2.6.1
Remplacer le Tableau 2-39 du § 2.6.1 par le suivant:
Tableau 2-39 – Descripteurs de programme et d'élément de programme
descriptor_tag TS PS Identification
0 n/a n/a Réservé
1 n/a n/a Réservé
2 X X video_stream_descriptor
3 X X audio_stream_descriptor
4 X X hierarchy_descriptor
5 X X registration_descriptor
6 X X data_stream_alignment_descriptor
7 X X target_background_grid_descriptor
8 X X Video_window_descriptor
9 X X CA_descriptor
10 X X ISO_639_language_descriptor
11 X X System_clock_descriptor
12 X X Multiplex_buffer_utilization_descriptor
13 X X Copyright_descriptor
14 X Maximum_bitrate_descriptor
15 X X Private_data_indicator_descriptor
16 X X Smoothing_buffer_descriptor
17 X STD_descriptor
18 X X IBP_descriptor
19-26 X Défini dans l'ISO/CEI 13818-6
27 X X MPEG-4_video_descriptor
28 X X MPEG-4_audio_descriptor
29 X X IOD_descriptor
30 X SL_descriptor
31 X X FMC_descriptor
32 X X External_ES_ID_descriptor
33 X X MuxCode_descriptor
34 X X FmxBufferSize_descriptor
35 X MultiplexBuffer_descriptor
36 X X Content_labeling_descriptor
37 X X Metadata_pointer_descriptor
38 X X Metadata_descriptor
39 X X Metadata_STD_descriptor
40 X X descripteur vidéo AVC
41 X X IPMP_descriptor (défini dans l'ISO/CEI 13818-11, IPMP MPEG-2)
42 X X Descripteur de décodeur HRD et de synchronisation AVC
43-63 n/a n/a Réservé à la Rec. UIT-T H.222.0 | ISO/CEI 13818-1
64-255 n/a n/a Réservé à l'utilisateur
8 Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004)
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
14) Paragraphe 2.6.6
Remplacer dans le § 2.6.6 'Descripteur de hiérarchie':
Le descripteur de hiérarchie donne des informations permettant d'identifier les éléments de programme qui contiennent
des composantes de données vidéo et audio à codage hiérarchique, ainsi que des flux privés multiplexés en flux
complexes comme décrit dans la présente Recommandation | Norme internationale, dans la Rec. UIT-T H.262 |
ISO/CEI 13818-2 et dans l'ISO/CEI 13818-3 (voir Tableau 2-43).
par
Le descripteur de hiérarchie donne des informations permettant d'identifier les éléments de programme qui contiennent
des composantes de flux vidéo, audio ou privés à codage hiérarchique (voir Tableau 2-43).
15) Paragraphe 2.6.7
Remplacer les entrées suivantes du Tableau 2-44 ‘Valeurs du descripteur de hiérarchie’ dans le § 2.6.7:
Rec. UIT-T H.262 | ISO/CEI 13818-2 (échelonnabilité spatiale)
Rec. UIT-T H.262 | ISO/CEI 13818-2 (échelonnabilité SNR)
Rec. UIT-T H.262 | ISO/CEI 13818-2 (échelonnabilité temporelle)
Rec. UIT-T H.262 | ISO/CEI 13818-2 (subdivision des données)
ISO/CEI 13818-3 (flux binaire audio d'extension)
Rec. UIT-T H.222.0 | ISO/CEI 13818-1 (flux de données privées)
Rec. UIT-T H.262 | ISO/CEI 13818-2 (profil multiformat)
par, respectivement,
échelonnabilité spatiale
échelonnabilité SNR
échelonnabilité temporelle
subdivision des données
flux binaire d'extension
flux privé
profil multiformat
16) Paragraphe 2.6.11
a) Remplacer dans la sémantique de alignment_type donnée au § 2.6.11:
Le Tableau 2-47 décrit le type d'alignement de données vidéo lorsque l'indicateur d'alignement de données a la valeur '1'
dans l'en-tête de paquet PES. Quelle que soit la valeur de codage du champ alignment_type, le premier octet de données
de paquet PES suivant l'en-tête de paquet PES, est le premier octet d'un code de déclenchement du type indiqué au
Tableau 2-47. Au début d'une séquence vidéo l'alignement doit être observé au niveau du code de déclenchement du
premier en-tête de séquence.
NOTE – Un type d'alignement '01' dans le Tableau 2-47 n'exclut pas un alignement de départ GOP ou SEQ.
La définition de l'unité d'accès pour données vidéo figure au 2.1.1.
par
Le Tableau 2-47 décrit le type d'alignement de données vidéo ISO/CEI 11172-2 ou Rec. UIT-T H.262 | ISO/CEI
13818-2, ou celui de flux visuels ISO/CEI 14496-2 lorsque l'indicateur d'alignement de données de l'en-tête de paquet
PES a la valeur '1'. Pour ces flux vidéo, le premier octet de données de paquet PES qui suit l'en-tête PES est le premier
octet d'un code de déclenchement du type indiqué au Tableau 2-47. Au début d'une séquence vidéo, l'alignement doit
être observé au niveau du code de déclenchement du premier en-tête de séquence.
NOTE – La spécification du type d'alignement '01' du Tableau 2-47 n'exclut pas de commencer l'alignement au niveau d'un
en-tête GOP ou SEQ.
L'unité d'accès est définie au § 2.1.1.
Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004) 9
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
b) Insérer le texte suivant et le Tableau AMD3-1 immédiatement après le Tableau 2-47 du § 2.6.11:
Le Tableau AMD3-1 décrit les types d'alignement pour les données vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10
lorsque l'indicateur d'alignement de données de l'en-tête de paquet PES a la valeur '1'. Dans ce cas, le premier octet de
données de paquet PES qui suit l'en-tête PES est le premier octet d'une unité d'accès AVC ou d'une tranche AVC,
comme indiqué par la valeur du type d'alignement.
Tableau AMD3-1 – Valeurs d'alignement de flux vidéo AVC
Type d'alignement Description
00 Réservé
01 Tranche AVC ou unité d'accès AVC
02 Unité d'accès AVC
03-FF Réservé
17) Paragraphe 2.6.32
Remplacer, dans le § 2.6.32 'Descripteur STD':
Ce descripteur facultatif s'applique uniquement au modèle théorique T-STD et aux flux élémentaires vidéo; ses
modalités d'utilisation sont spécifiées au 2.4.2. Ce descripteur ne s'applique pas aux flux de programme (voir
Tableau 2-60).
par
Ce descripteur facultatif s'applique uniquement au décodeur T-STD et aux flux élémentaires vidéo Rec. UIT-T H.262 |
ISO/CEI 13818-2; les modalités de son utilisation sont spécifiées au § 2.4.2. Ce descripteur ne s'applique pas aux flux
de programme (voir Tableau 2-60).
18) Paragraphe 2.6.34
Remplacer, dans le § 2.6.34 'Descripteur IBP', la phrase:
Ce descripteur facultatif fournit des informations concernant certaines caractéristiques de la séquence de types de
trames dans la séquence vidéo (voir Tableau 2-61).
par
Ce descripteur facultatif fournit des informations concernant certaines caractéristiques de la séquence de types de
trames d'un flux vidéo ISO/CEI 11172-2, Rec. UIT-T H.262 | ISO/CEI 13818-2 ou ISO/CEI 14496-2 (voir
Tableau 2-61).
19) Nouveaux paragraphes 2.6.64 à 2.6.67
Ajouter, après le § 2.6.63:
2.6.64 Descripteur vidéo AVC
Dans le cas des flux vidéo Rec. UIT-T H.264 | ISO/CEI 14496-10, le descripteur vidéo AVC donne des informations de
base pour identifier les paramètres de codage du flux vidéo AVC associé, par exemple des informations sur les
paramètres de profil et de niveau contenus dans l'ensemble SPS d'un flux vidéo AVC.
Le descripteur vidéo AVC signale également la présence d'images fixes AVC et celle d'images 24 heures AVC dans le
flux vidéo AVC. Si ce descripteur n'est pas inclus dans la table PMT pour un flux vidéo AVC d'un flux de transport ou
dans le mappage PSM, s'il est présent, pour un flux vidéo AVC d'un flux de programme, le flux vidéo AVC ne doit
contenir ni image fixe AVC ni image 24 heures AVC (voir Tableau AMD3-2).
10 Rec. UIT-T H.222.0 (2000)/Amd.3 (03/2004)
ISO/CEI 13818-1:2000/Amd.3:2004 (F)
Tableau AMD3-2 – Descripteur vidéo AVC
Syntaxe Nbre de bits Mnémonique
AVC_video_descriptor () {
descriptor_tag 8 uimsbf
descriptor_length 8 uimsbf
profile_idc 8 uimsbf
constraint_set0_flag 1 bslbf
constraint_set1_flag 1 bslbf
constraint_set2_flag 1 bslbf
AVC_compatible_flags 5 bslbf
level_idc 8 uimsbf
AVC_still_present 1 bslbf
AVC_24_hour_picture_flag 1 bslbf
reserved 6 bslbf
}
2.6.65 Définition sémantique des champs du descripteur vidéo AVC
profile_idc, constraint_set0_flag, constraint_set1_flag, constraint_set2_flag, AVC_compatible_flags et level_idc –
Ces champs, à l'exception de AVC_compatible_flags, seront codés conformément à la sémantique de ces champs
définie dans la Rec. UIT-T H.264 | ISO/CEI 14496-10. La sémantique du champ AVC_compatible_flags est exactement
la même que la sémantique du ou des champs définis pour les 5 bits compris entre les champs constraint_set2_flag et
level_idc de l'ensemble de paramètres de séquence, définie dans la Rec. UIT-T H.264 | ISO/CEI 14496-10. L'ensemble
du flux vidéo AVC auquel est associé le descripteur AVC doit être conforme au profil, au niveau et aux contraintes
signalés par ces champs.
NOTE – Dans une ou plusieurs séquences du flux vidéo AVC, le niveau peut être inférieur au niveau signalé dans le descripteur
vidéo AVC et le profil peut être un sous-ensemble du profil signalé dans le descripteur vidéo AVC. Toutefois, dans l'ensemble du
flux vidéo AVC, il ne faut utiliser que les outils inclus dans le profil signalé dans le descripteur vidéo AVC, s'il est présent. Par
exemple, si le profil principal est signalé, on peut utiliser le profil de base dans certaines séquences, mais en n'utilisant que les
outils contenus dans le profil principal. Si les ensembles de paramètres de sé
...










Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.
Loading comments...