Information technology - JPEG 2000 image coding system: Motion JPEG 2000 - Part 3:

ISO/IEC 15444-3:2007 specifies the use of the wavelet-based JPEG 2000 codec for the coding and display of timed sequences of images (motion sequences), possibly combined with audio, and composed into an overall presentation. In this specification, a file format is defined, and guidelines for the use of the JPEG 2000 codec for motion sequences are supplied. ISO/IEC 15444-3:2007 also specifies profiles and the framework, concepts, methodology for testing and the criteria to be achieved to claim compliance to ISO/IEC 15444-3:2007.

Technologies de l'information — Système de codage d'images JPEG 2000: Images JPEG 2000 animées — Partie 3:

L'ISO/CEI 15444-3:2007 spécifie l'utilisation du codec JPEG 2000 fondé sur les ondelettes pour le codage et l'affichage de séquences d'images programmées (séquences d'images animées), éventuellement combinées avec des signaux audio, et composées en une présentation d'ensemble. Elle contient la définition d'un format de fichier et des lignes directrices applicables à l'utilisation du codec JPEG 2000 pour les séquences d'images animées. L'ISO/CEI 15444-3:2007 spécifie par ailleurs des profils ainsi qu'un cadre général, des concepts et une méthodologie concernant les tests, et aussi les critères à respecter pour que la conformité à l'ISO/CEI 15444-3:2007 puisse être déclarée.

General Information

Status
Published
Publication Date
03-May-2007
Current Stage
9060 - Close of review
Completion Date
04-Mar-2029

Relations

Effective Date
06-Jun-2022
Effective Date
06-Jun-2022
Effective Date
06-Jun-2022
Effective Date
15-Apr-2008
Effective Date
18-Dec-2008

Overview

ISO/IEC 15444-3:2007 - "Information technology - JPEG 2000 image coding system: Motion JPEG 2000 - Part 3" specifies how the wavelet-based JPEG 2000 codec is used for coding and displaying timed image sequences (motion sequences), optionally combined with audio, and composed into an overall presentation. The standard defines a file format, provides implementation guidelines for using the JPEG 2000 codec on motion content, and specifies profiles, testing framework, methodology, and conformance criteria to claim compliance with ISO/IEC 15444-3:2007. The published package includes PDF documentation plus electronic test vectors and supporting files.

Key topics and requirements

  • Wavelet-based codec usage: Defines the application of the JPEG 2000 wavelet codec for timed image sequences (motion).
  • File format definition: Specifies the container/format elements needed to store motion JPEG 2000 presentations (images, timing, optional audio, and composition).
  • Synchronization and presentation: Guidelines for composing timed image sequences with audio and controlling playback timing.
  • Profiles and conformance: Sets out profiles and the criteria implementations must meet to claim compliance.
  • Testing framework and methodology: Provides test vectors and a structured approach for interoperability and validation, including attachments distributed with the publication (test disks).
  • Documentation and distribution: The standard is distributed with electronic attachments (test vectors and support files) to enable reproducible conformance testing.

Applications and who uses it

ISO/IEC 15444-3:2007 is relevant for organizations and professionals working with motion image encoding and archival or real-time presentation where JPEG 2000 technology is preferred:

  • Codec and software developers implementing Motion JPEG 2000 encoders/decoders and playback systems
  • System integrators and OEMs building devices or platforms that store, stream, or display JPEG 2000 motion content
  • Broadcasters, digital cinema, and streaming providers evaluating high-quality image coding options
  • Archives and cultural heritage institutions that require standard file formats and conformance testing for long-term preservation
  • Test labs and standards bodies performing conformity and interoperability testing using the supplied test vectors

Related standards

  • Part of the ISO/IEC 15444 (JPEG 2000) family; implementers should consult other parts of the JPEG 2000 series for baseline image coding, extensions, and related file formats.

Keywords: ISO/IEC 15444-3, Motion JPEG 2000, JPEG 2000, wavelet codec, file format, motion sequences, profiles, conformance testing, test vectors.

Standard

ISO/IEC 15444-3:2007 - Information technology -- JPEG 2000 image coding system: Motion JPEG 2000

English language
29 pages
sale 15% off
Preview
sale 15% off
Preview
Standard

ISO/IEC 15444-3:2007 - Information technology -- JPEG 2000 image coding system: Motion JPEG 2000

English language
29 pages
sale 15% off
Preview
sale 15% off
Preview
Standard

ISO/IEC 15444-3:2007 - Technologies de l'information -- Systeme de codage d'images JPEG 2000: Images JPEG 2000 animées

French language
32 pages
sale 15% off
Preview
sale 15% off
Preview
Standard

ISO/IEC 15444-3:2007 - Technologies de l'information -- Systeme de codage d'images JPEG 2000: Images JPEG 2000 animées

French language
32 pages
sale 15% off
Preview
sale 15% off
Preview

Frequently Asked Questions

ISO/IEC 15444-3:2007 is a standard published by the International Organization for Standardization (ISO). Its full title is "Information technology - JPEG 2000 image coding system: Motion JPEG 2000 - Part 3:". This standard covers: ISO/IEC 15444-3:2007 specifies the use of the wavelet-based JPEG 2000 codec for the coding and display of timed sequences of images (motion sequences), possibly combined with audio, and composed into an overall presentation. In this specification, a file format is defined, and guidelines for the use of the JPEG 2000 codec for motion sequences are supplied. ISO/IEC 15444-3:2007 also specifies profiles and the framework, concepts, methodology for testing and the criteria to be achieved to claim compliance to ISO/IEC 15444-3:2007.

ISO/IEC 15444-3:2007 specifies the use of the wavelet-based JPEG 2000 codec for the coding and display of timed sequences of images (motion sequences), possibly combined with audio, and composed into an overall presentation. In this specification, a file format is defined, and guidelines for the use of the JPEG 2000 codec for motion sequences are supplied. ISO/IEC 15444-3:2007 also specifies profiles and the framework, concepts, methodology for testing and the criteria to be achieved to claim compliance to ISO/IEC 15444-3:2007.

ISO/IEC 15444-3:2007 is classified under the following ICS (International Classification for Standards) categories: 35.040 - Information coding; 35.040.30 - Coding of graphical and photographical information. The ICS classification helps identify the subject area and facilitates finding related standards.

ISO/IEC 15444-3:2007 has the following relationships with other standards: It is inter standard links to ISO/IEC 15444-3:2007/Amd 1:2010, ISO/IEC 15444-3:2002/Amd 2:2003, ISO/IEC 15444-3:2002, ISO/IEC 15444-3:2002/FDAM 3; is excused to ISO/IEC 15444-3:2007/Amd 1:2010. Understanding these relationships helps ensure you are using the most current and applicable version of the standard.

You can purchase ISO/IEC 15444-3:2007 directly from iTeh Standards. The document is available in PDF format and is delivered instantly after payment. Add the standard to your cart and complete the secure checkout process. iTeh Standards is an authorized distributor of ISO standards.

Standards Content (Sample)


INTERNATIONAL ISO/IEC
STANDARD 15444-3
Second edition
2007-05-01
Information technology — JPEG 2000
image coding system: Motion JPEG 2000
Technologies de l'information — Système de codage d'image
JPEG 2000: Motion JPEG 2000
Reference number
©
ISO/IEC 2007
PDF disclaimer
PDF files may contain embedded typefaces. In accordance with Adobe's licensing policy, such files may be printed or viewed but shall
not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In
downloading a PDF file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat
accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create the PDF file(s) constituting this document can be found in the General Info relative to
the file(s); the PDF-creation parameters were optimized for printing. Every care has been taken to ensure that the files are suitable for
use by ISO member bodies. In the unlikely event that a problem relating to them is found, please inform the Central Secretariat at the
address given below.
©  ISO/IEC 2007
All rights reserved. Unless otherwise specified, no part of these DVDs may be reproduced, stored in a retrieval system or transmitted in
any form or by any means without prior permission from ISO. Requests for permission to reproduce this product should be addressed to
ISO copyright office • Case postale 56 • CH-1211 Geneva 20 • Switzerland
Internet copyright@iso.org
Reproduction may be subject to royalty payments or a licensing agreement.
Violators may be prosecuted.
Published in Switzerland
ii © ISO/IEC 2007 – All rights reserved

These two DVDs contain:
1) Disk 1:
i) the publication ISO/IEC 15444-3:2007 in portable document format (PDF), which can be viewed
using Adobe® Acrobat® Reader;
ii) electronic attachments containing test vectors; and
iii) a readme file explaining the contents of both disks.
2) Disk 2:
i) the folder “Cpoint3”, which forms an integral part of the test vectors mentioned above, as
explained in the readme file on Disk 1.
Adobe and Acrobat are trademarks of Adobe Systems Incorporated.

This second edition cancels and replaces the first edition (ISO/IEC 15444-3:2002), which has been technically
revised. It also incorporates the amendment ISO/IEC 15444-3:2002/Amd.2:2003.

Installation
If this publication has been packaged as a zipped file, do NOT open the file from the DVDs, but copy it to the
desired
...


INTERNATIONAL ISO/IEC
STANDARD 15444-3
Second edition
2007-05-01
Information technology — JPEG 2000
image coding system: Motion JPEG 2000
Technologies de l'information — Système de codage d'image
JPEG 2000: Motion JPEG 2000
Reference number
©
ISO/IEC 2007
PDF disclaimer
This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but
shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In
downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat
accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation
parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In
the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.

©  ISO/IEC 2007
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO/IEC 2007 – All rights reserved

CONTENTS
Page
1 Scope. 1
2 Normative references . 1
3 Definitions . 1
4 Compatibility and technology derivation. 1
4.1 Family members . 1
4.2 ISO Media file inheritance and compatibility. 2
4.3 JP2 inheritance and compatibility . 2
4.4 Conformance. 2
4.5 Profiles and levels . 2
4.6 Visual composition. 3
4.7 Box order . 4
5 File identification . 4
6 Required additions. 4
6.1 Sample Description Box. 4
7 Template fields used . 7
8 Definition of compliance points. 7
8.1 General . 7
8.2 H, W, C: Image size guarantees . 7
8.3 N : Code-block parsing guarantee. 8
cb
8.4 N : Component parsing guarantee. 8
comp
8.5 L : Coded data buffering guarantee. 8
body
8.6 M: Decoded bit-plane guarantee. 8
8.7 P: 9-7I precision guarantee. 8
8.8 B: 5-3R precision guarantee . 9
8.9 TL: Transform level guarantee. 9
8.10 L: Layer guarantee . 9
8.11 Progressions. 9
8.12 Tiles . 9
8.13 Tile-parts. 9
8.14 Precincts . 10
8.15 Frame-rate and bit-rate. 10
8.16 Profile: Codestream guarantee . 10
9 Compliance point definitions . 10
10 Definition of test methods . 11
11 Executable test suite (ETS). 11
11.1 Test sequences. 11
11.2 Cpoint-3. 12
11.3 Cpoint-2. 13
11.4 Cpoint-1. 13
11.5 Cpoint-0. 14
Annex A – File and codestream profiles . 16
A.1 Profile introduction. 16
A.2 Motion JPEG 2000 simple profile. 16
Annex B – Guidelines for use of the JPEG 2000 codec. 17
B.1 Introduction . 17
B.2 Frequency weighting for motion sequences . 17
B.3 Encoder sub-sampling of components . 18
Annex C – Indicating sub-sampling chroma offset. 19
Annex D – Field Structures for Interlace. 21
© ISO/IEC 2007 – All rights reserved iii

Page
Annex E – Guidelines for implementing Motion JPEG 2000 . 23

E.1 Introduction . 23
E.2 Guidelines . 23
Annex F – Guide to JPEG 2000 . 26
F.1 Structure and status of the standard. 26
F.2 JPEG 2000 file formats . 26
Annex G – Reference components file format. 28
G.1 PGX file format . 28
G.2 Header format . 28
G.3 Data format. 28
Annex H – Patent statements.
Bibliography .   30
Electronic attachment: Binary test files

iv © ISO/IEC 2007 – All rights reserved

Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical
Commission) form the specialized system for worldwide standardization. National bodies that are members of
ISO or IEC participate in the development of International Standards through technical committees
established by the respective organization to deal with particular fields of technical activity. ISO and IEC
technical committees collaborate in fields of mutual interest. Other international organizations, governmental
and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information
technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of the joint technical committee is to prepare International Standards. Draft International
Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as
an International Standard requires approval by at least 75 % of the national bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may involve the use of a
patent, as indicated in Annex H.
ISO/IEC 15444-3 was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology,
Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information, in collaboration with
ITU-T. The identical text is published as ITU-T Rec. T.802.
This second edition cancels and replaces the first edition (ISO/IEC 15444-3:2002), which has been technically
revised. It also incorporates the amendment ISO/IEC 15444-3:2002/Amd.2:2003.
ISO/IEC 15444 consists of the following parts, under the general title Information technology — JPEG 2000
image coding system:
⎯ Part 1: Core coding system
⎯ Part 2: Extensions
⎯ Part 3: Motion JPEG 2000
⎯ Part 4: Conformance testing
⎯ Part 5: Reference software
⎯ Part 6: Compound image file format
⎯ Part 8: Secure JPEG 2000
⎯ Part 9: Interactivity tools, APIs and protocols
⎯ Part 10: Extensions for three-dimensional data
⎯ Part 11: Wireless
⎯ Part 12: ISO base media file format
The following part is under preparation:
⎯ Part 13: An entry level JPEG 2000 encoder
© ISO/IEC 2007 – All rights reserved v

Introduction
This Recommendation | International Standard is the consequent revision of the Motion JPEG 2000 specification, based
on the common text of the MP4 and MJ2 formats, which is called the ISO Base Media File Format.
This Recommendation | International Standard specifies the use of the wavelet-based JPEG 2000 codec for the coding
and display of timed sequences of images. It has been defined by ISO/IEC JTC 1/SC 29/WG 1 as Part 3 of the
JPEG 2000 International Standard. In this Recommendation | International Standard, a file format is defined, and
guidelines for the use of the JPEG 2000 codec for timed sequences are supplied. The Motion JPEG 2000 file
format MJ2 is designed to contain one or more motion sequences of JPEG 2000 images, with their timing, and also
optional audio annotations, all composed into an overall presentation.
To promote interoperability between MJ2 encoders and decoders and to test these systems for compliance to this
Recommendation | International Standard, a framework of compliance testing is provided. Compliance testing is the
testing of a candidate product for the existence of specific characteristics required by a standard. It involves testing the
capabilities of an implementation against both the compliance requirements in the relevant standard and the statement
of the implementation's capability.
Motion JPEG 2000 is expected to be used in a variety of applications, particularly where the codec is already available
for other reasons, or where the high-quality frame-based approach, with no inter-frame coding, is appropriate. These
application areas include:
• digital still cameras;
• error-prone environments such as wireless and the Internet;
• PC-based video capturing;
• high-quality digital video recording for professional broadcasting and motion picture production from
film-based to digital systems; and
• high-resolution medical and satellite imaging.
Motion JPEG 2000 is a flexible format, permitting a wide variety of usages, such as editing, display, interchange, and
streaming.
vi © ISO/IEC 2007 – All rights reserved

INTERNATIONAL STANDARD
ITU-T RECOMMENDATION
Information technology – JPEG 2000 image coding system: Motion JPEG 2000
1 Scope
This Recommendation | International Standard specifies the use of the wavelet-based JPEG 2000 codec for the coding
and display of timed sequences of images (motion sequences), possibly combined with audio, and composed into an
overall presentation. In this Recommendation | International Standard, a file format is defined, and guidelines for the
use of the JPEG 2000 codec for motion sequences are supplied. This Recommendation | International Standard also
specifies profiles and the framework, concepts, methodology for testing and the criteria to be achieved to claim
compliance to this Recommendation | International Standard.
2 Normative references
The following Recommendations and International Standards contain provisions which, through reference in this text,
constitute provisions of this Recommendation | International Standard. At the time of publication, the editions indicated
were valid. All Recommendations and Standards are subject to revision, and parties to agreements based on this
Recommendation | International Standard are encouraged to investigate the possibility of applying the most recent
edition of the Recommendations and Standards listed below. Members of IEC and ISO maintain registers of currently
valid International Standards. The Telecommunication Standardization Bureau of the ITU maintains a list of currently
valid ITU-T Recommendations.
– ITU-T Recommendation T.800 (2002) | ISO/IEC 15444-1:2004, Information technology – JPEG 2000
image coding system: Core coding system.
– ITU-T Recommendation T.803 (2002) | ISO/IEC 15444-4:2004, Information technology – JPEG 2000
image coding system: Conformance testing.
– ISO 639-2:1998, Codes for the representation of names of languages – Part 2: Alpha-3 code.
– ISO/IEC 14496-1:2004, Information technology – Coding of audio-visual objects – Part 1: Systems
[particularly the syntax description language (SDL), clause 14].
– ISO/IEC 15444-12:2005, Information technology – JPEG 2000 image coding system – Part 12: ISO
base media file format (technically identical to ISO/IEC 14496-12).
3 Definitions
For the purposes of this Recommendation | International Standard, the following definitions apply.
3.1 Motion sequence: A timed sequence of JPEG 2000 images.
4 Compatibility and technology derivation
4.1 Family members
This is a stand-alone Recommendation | International Standard; it defines the file format for MJ2. However, it stands as
a member of a family of Recommendations | International Standards with common formatting.
The other family members include:
• the JPEG 2000 single image format, JP2;
• the ISO Base Media File Format, on which the MP4 format is based;
• the QuickTime file format, on which the ISO Base Media format is based.
ITU-T Rec. T.802 (01/2005) 1
These specifications share a common definition for the structure of a file (a sequence of objects, called boxes here and
atoms in QuickTime), and a common definition of the general structure of an object (the size and type).
All these specifications require that readers ignore objects that are unrecognizable to them.
This Recommendation | International Standard takes precedence over those from which it inherits, in any case where
there are differences or conflicts; however, no such conflicts are known to exist.
4.2 ISO Media file inheritance and compatibility
The Motion JPEG 2000 file format is defined as derived from the ISO Base Media file format. Notwithstanding
anything in that base specification, hint tracks are not a normative part of this Recommendation | International Standard.
Clauses 7 (Streaming Support) and 10 (RTP Hint Track Format), though compatible with this Recommendation |
International Standard, do not form normative parts of this Recommendation | International Standard. They may be used
as a compatible, optional, extension, but are not required for compatibility with this Recommendation | International
Standard. There may be license implications in the use of this or other compatible extensions to this format.
4.3 JP2 inheritance and compatibility
The still image format, JP2, defines a number of boxes. The signature box from that specification shall be present. If the
JP2 specification requires a particular position (e.g., first in the file), that positioning shall be followed here.
It is permissible under this Recommendation | International Standard to make a file that adheres to both this
Recommendation | International Standard and the JP2 specification. In that case:
1) The compatibility list shall include all the compatible brands.
2) The objects (boxes or atoms) required by the JP2 specification shall also be present.
3) The objects (boxes or atoms) optional in the JP2 specification may also be present.
A still image reader, reading a file which contains both a presentation (conformant to this Recommendation |
International Standard) and a still image, would 'see' only the still image. Likewise, a motion reader would 'see' only the
presentation. A more powerful reader may display both, or offer the user a choice.
The JP2 specification includes an optional IPR (Intellectual Property Rights) box which is therefore also optional in this
Recommendation | International Standard. Among other issues this addresses unique identification and protection of
content.
4.4 Conformance
Implementations of Motion JPEG 2000 decoders shall support JPEG 2000 image sequences, as well as raw and twos-
complement audio if audio output is available. They may also support compressed audio, using MP4 formats, or other
track types from MPEG-4. The support of such MPEG-4 tracks is not required; however, readers shall not fail if they
are present. If MPEG-4 composition (BIFS) is used, then the simple composition used in this Recommendation |
International Standard should also be set up in such a way that a reader not implementing BIFS will display a suitable
result.
Files conformant with this Recommendation | International Standard shall contain at least one Motion JPEG 2000 video
track. They may contain more video tracks, uncompressed audio, or compressed MP4 audio.
4.5 Profiles and levels
There are two tools for profiling Motion JPEG 2000 files.
The first consists of the optional specification of tools and levels of the JPEG 2000 coding system (codestream
features). These are indicated in the optional sample description extension JP2 Profile Box (see clause 5).
The second tool allows a file overall to be identified as belonging to a definition which forms a proper subset of the
general specification. Such definitions might restrict such features as:
• the use of data references, and multiple files;
• the layout order of the boxes, and the data within the boxes (e.g., that data is in time order and
interleaved);
2 ITU-T Rec. T.802 (01/2005)
• the use of profiles of the JPEG 2000 codestream;
• the existence of other tracks, and their format (e.g., audio, MPEG-7, etc.).
The conformance to these restricted profiles is indicated in the file type box by the addition of the compatible profiles as
brands within the compatibility list. Annex A defines the available profiles in this Recommendation | International
Standard.
4.6 Visual composition
Composition of multiple image sequences in a 2D environment can be achieved by using multiple video tracks which
overlap in time. Their composition is defined by the following structures:
• The matrix in the track header specifies their positioning and scaling.
• The layer field in the track header specifies the front-to-back ordering of the tracks.
• The graphics mode and opcolor fields in the video media header are used to specify the ways in which
each track is composited onto the existing image (this compositing is performed from back to front).
Applications requiring more complex compositing may use the BIFS system from MPEG-4, optionally. The matrix,
graphics mode, and layers should be set up so that a reader not implementing BIFS displays the desired result. Matrix
values which occur in the headers specify a transformation of video images for presentation. The point (p,q) is
transformed into (p',q') using the matrix as follows:
(p q 1) * | a b u | = (m n z)
| c d v |
| x y w |
m = ap + cq + x; n = bp + dq + y; z = up + vq + w;

p' = m/z; q' = n/z
The coordinates {p,q} are on the decompressed frame, and {p',q'} are at the rendering output. Therefore, for example,
the matrix {2,0,0, 0,2,0, 0,0,1} exactly doubles the pixel dimension of an image. The coordinates transformed by the
matrix are not normalized in any way, and represent actual sample locations. Therefore {x,y} can, for example, be
considered a translation vector for the image.
The coordinate origin is located at the upper left corner, and X values increase to the right, and Y values increase
downwards. {p,q} and {p',q'} are to be taken as absolute pixel locations relative to the upper left hand corner of the
original image (after scaling to the size determined by the track header's width and height) and the transformed
(rendering) surface, respectively.
Each track is composed using its matrix as specified into an overall image; this is then transformed and composed
according to the matrix at the movie level in the MovieHeaderBox. It is application-dependent whether the resulting
image is 'clipped' to eliminate pixels, which have no display, to a vertical rectangular region within a window, for
example. So for example, if only one video track is displayed and it has a translation to {20,30}, and a unity matrix is in
the MovieHeaderBox, an application may choose not to display the empty "L" shaped region between the image and the
origin.
All the values in a matrix are stored as 16.16 fixed-point values, except for u, v and w, which are stored as 2.30 fixed-
point values. For upwards compatibility into the MPEG-4 BIFS (scene composition) system, matrices used here restrict
(u,v,w) to be (0,0,1), for which the hex values are (0,0,0x40000000). This permits the simple composition used here to
be mapped into BIFS if a scene later requires full scene management.
The values in the matrix are stored in the order {a,b,u, c,d,v, x,y,w}.
Tracks are composed to the presentation surface from back (highest layer number) to front (lowest layer number),
against an indeterminate initial colour. There are various composition modes available; the backmost (first-rendered)
track would normally use 'copy' as the initial image is indeterminate. Subsequent layers can then be composed on top in
a variety of ways. Table 1 details the composition modes available. Note that (currently) only the 'transparent' mode
uses the opcolor field.
ITU-T Rec. T.802 (01/2005) 3
Table 1 – Graphics composition modes
Mode Code Description
Copy 0x0 Copy the source image over the destination.
Transparent 0x24 Replace the destination pixel with the source pixel if the source pixel is not
equal to the opcolor. (Also known as 'blue-screen').
Alpha 0x100 Replace the destination pixel with a blend of the source and destination
pixels, with the proportion controlled by the alpha channel. The alpha
channel is applied to all channels.
Pre-multiplied black alpha 0x102 Pre-multiplied with black means that the colour components of each pixel
have already been blended with a black pixel, based on their alpha channel
value. Effectively, this means that the image has already been combined
with a black background, which must be removed before composition.
Component alpha 0x110 One or more alpha channels are present, which are applied to individual
colour channels, and the image must be composed channel-by-channel.
Images are only alpha-composed if both the graphics composition mode requests alpha composition, and the images
contain alpha channels, as declared by the Channel Definition Box inside the JP2 Header Box. Therefore the graphics
mode can be used to prevent alpha composition of an image with alpha channels, if that is desired.
If there is a single alpha channel applied to the entire image, then the value of the graphics must be 'Alpha' if that
channel is a straight 'Opacity' channel, and must be 'Pre-multiplied black alpha' if that channel is a 'Pre-multiplied'
opacity channel. If there are one or more alpha channels in the image which are applied to individual channels and not
to the whole image, and alpha composition is desired, then the 'Component alpha' value must be used for the graphics
mode. Support of 'Component alpha' composition is optional in this Recommendation | International Standard.
The alpha blending formulas are defined in ITU-T Rec. T.800 | ISO/IEC 15444-1.
NOTE – Use of the "transparent" opcode may be yield unexpected results when the image codestreams are compressed in a non-
reversible fashion, or are subject to scaling in quality or resolution, either during or after content production. Such operations are
not guaranteed to preserve individual sample values precisely.
4.7 Box order
All JPEG 2000 files start with a signature box, therefore this rule is added to the Box Order rules:
1) The JP2 Signature Box and File Type Box shall occur first and second in the file.
5 File identification
In the file type compatibility box, the brand shall be 'mjp2' for files conforming to this Recommendation | International
Standard, and 'mjp2' shall be a member of the compatibility list.
See Annex A for a complete list of all profile brand names.
The preferred file extension is '.mj2'. The MIME type video/mjp2 is used, as defined in the appropriate RFC.
6 Required additions
6.1 Sample description box
6.1.1 Definition
Box Types: 'mjp2', 'raw '?, 'twos'
Container: Sample Table Box ('stbl')
Mandatory: Yes
Quantity: Exactly one
A Motion JPEG 2000 visual sample entry shall contain a JP2 Header Box from ITU-T Rec. T.800 | ISO/IEC 15444-1;
however, the sRGB YCC enumerated colour space (codepoint 18) from ITU-T Rec. T.801 | ISO/IEC 15444-2 may also
be used to identify the colour space used, in addition to ITU-T Rec. T.800 | ISO/IEC 15444-1 numerated colour spaces
(such as sRGB and greyscale). If the JP2 Header Box indicates the presence of alpha channels, then the 'depth' field in
the VisualSampleEntry must also indicate their presence, with the value 0x20. Similarly, if the JP2 Header Box defines
4 ITU-T Rec. T.802 (01/2005)
a monochrome image with no alpha, the 'depth' field must contain the value indicating grayscale (0x28). Otherwise, the
'depth' field must declare colour images (0x18).
If two fields are present in the samples, the JP2 Header Box applies to the complete image, not to each field
individually. Therefore the height as declared in the JP2 Header Box and the VisualSampleEntry applies to the entire
de-interlaced image.
NOTE – This means that you may not be able to construct a legitimate JP2 file by composing a single field's codestream together
with the JP2 header box found in the sample description.
The sample format for Motion JPEG 2000 data is a set of boxes. Currently this Recommendation | International
Standard permits only JP2 Codestream Boxes ('jp2c') as defined in the JP2 specification. If there is no Field Coding Box
present, or the field count is 1, the sample shall contain precisely one codestream box. If the field count is 2, then there
shall be two codestream boxes. Other boxes, if present in the sample, shall be ignored. The last (or only) box in the
sample may have a value of 0 for its length field, indicating it extends to the end of the sample, as indicated by the
sample size given in the sample size table. The actual codestreams presented to the decoder are formed by
concatenating the contents of the JP2 Prefix Box, if any, in the sample description before each codestream presented in
the jp2c box(es) in the samples. If field coding is used, the same prefix is concatenated before both fields. Typically, the
prefix will contain a JPEG 2000 main header; however, this is not required in the general case, though specific profiles
may limit the use of the prefix box.
If the codestreams used in a sequence conform to a specific profile of the JPEG 2000 coder, a JP2 Profile Box may be
used to indicate such conformance.
The visual sample entry may optionally contain a field-ordering box (see below). If fieldcount is 2, each field will
be half the height of the overall image, as declared in the 'height' field of the sample description. To be precise, if the
height field contains the value H, then the field with the topmost scanline has ((H+1) div 2) lines, and the other field has
(H div 2) lines. The utility of the prefix box may be diminished when field coding is used, especially when H is odd.
The original format of the material (interlace or progressive) may be documented by the Original Format Box. The
original_fieldcount must take the value 1 (progressive) or 2 (interlaced), When the value is 2, the
original_fieldorder documents whether the topmost line came from the earlier or later field. The
documentation of the original format is independent of whether the material has been coded as progressive (frame-
based) or interlaced, which is documented by the field coding box. This box is informative only and may assist readers
in display or transcoding. For example, material that was originally interlaced but is encoded frame-based and must be
displayed on an interlaced display can be positioned so that the display interlace matches the original material's
interlace.
The values present in the VisualSampleEntry, its constituent boxes including the JP2 Header Box, and the codestreams
that these boxes describe, must agree, to the extent that the format and precision of fields allow. This agreement
includes, but is not limited to, width and height information, and the resolution declaration (within the accuracy
permitted by the different representations). Files with conflicts are non-conforming and readers may attempt to decide
which values are correct, or reject the file.
The fields horizresolution and vertresolution document the highest resolution component of the image
(which is typically, but not required to be, the luminance, in a sub-sampled image).
For audio tracks, in the formats defined here (with code points 'raw ' and 'twos'), the data is stored as
uncompressed samples. If stereo is stored, the data consists of interleaved left/right samples. The raw format uses
offset-binary; for 8-bit samples, values range from 0 to 255, with 128 indicating silence. For 'twos', 8-bit values
range from –128 to 127, with 0 being silence. Values of 16 bits are similarly derived (with the bytes in network byte
order, or big-endian format).
6.1.2 Syntax
// Visual Sequences
class MJ2SampleEntry() extends VisualSampleEntry ('mjp2'){
JP2HeaderBox();
FieldCodingBox(); // optional
MJP2ProfileBox(); // optional
MJP2PrefixBox(); // optional
MJP2SubSamplingBox(); // optional
MJP2OriginalFormatBox(); // optional
}
// Field-Based Coding
ITU-T Rec. T.802 (01/2005) 5
class FieldCodingBox() extends Box('fiel'){
int(8) fieldcount;
int(8) fieldorder; // both storage and temporal order
}
class MJP2OriginalFormatBox() extends Box('orfo'){
int(8) original_fieldcount;
int(8) original_fieldorder;
}
class MJP2ProfileBox() extends FullBox('jp2p', 0, 0){
unsigned int(32)[] compatible_brands;
}
class MJP2PrefixBox() extends Box('jp2x'){
int(8)[] data; // the data is the initial codestream part
}
class MJP2SubSamplingBox () extends Box('jsub'){
unsigned int(8) horizontal_sub;
unsigned int(8) vertical_sub;
unsigned int(8) horizontal_offset;
unsigned int(8) vertical_offset;
}
// Audio Sequences
class MJ2AudioSampleEntry() extends AudioSampleEntry (AudioFormat){
}
6.1.3 Semantics
AudioFormat is either 'raw ' or 'twos'.
Compressorname the value "\017Motion JPEG 2000" is recommended (\017 is 15, the length of the string as a byte)
depth takes one of the following values:
0x18 – images are in colour with no alpha;
0x28 – images are in grayscale with no alpha;
0x20 – images have alpha (gray or colour).
compatible_brands is a list, filled to the end of the containing box, of JPEG 2000 profiles, to which the associated
codestreams conform; see the JPEG 2000 specification for the defined values.
Horizontal_sub and vertical_sub indicate whether the chroma components of a YCbCr encoding were
downsampled in the codestream; the value indicates the number of luminance samples to a single chroma sample in the
given direction. This can assist decoders in memory allocation, or in using optimized sub-sampled display interfaces.
Horizontal_offset and vertical_offset specify the offset of the first chroma sample from the first
luminance sample, as measured on the sample grid. If a CRG marker is present in the codestream, these values take
precedence over those in the codestream. See Annex C for example values.
fieldcount specifies the number of fields in the samples, and shall be 1 or 2.
fieldorder describes the order of the two fields, and is only relevant if fieldcount equals 2:
0 Field coding unknown;
1 Field with the topmost line is stored first in the sample; fields are in temporal order;
6 Field with the topmost line is stored second in the sample; fields are in temporal order.
original_fieldcount specifies the number of fields in original material before encoding, and shall be 1 or 2.
original_fieldorder describes the order of the two fields, and is only relevant if original_fieldcount
equals 2:
0 Field coding unknown;
11 Topmost line came from the earlier field;
16 Topmost line came from the later field.
6 ITU-T Rec. T.802 (01/2005)
7 Template fields used
Motion JPEG 2000 uses simple composition, as defined above. Therefore the following fields are required to be
correctly set in conforming files:
1) For Visual composition: matrix in the Movie Header Box and Track Header Box; layer; graphicsmode
and opcolor in the Video Media Header Box; and depth in a VisualSampleEntry;
2) For Audio Composition: volume in the Movie Header Box and Track Header Box; balance in the
Sound Media Header Box;
3) For variable-rate playback, rate in the Movie Header Box;
4) To describe the audio and visual sample correctly, horizresolution, and vertresolution in a
VisualSampleEntry; and channelcount, samplesize and the samplerate in an
AudioSampleEntry.
8 Definition of compliance points
8.1 General
This clause describes a number of compliance points (Cpoints) for this Recommendation | International Standard. The
points and parameters are described to provide assistance in designing a compliant decoder. Actual compliance is
determined by the test methods in clause 10 and the codestreams, reference images, and tolerances in clause 11. The
definitions of compliance points in this clause are useful for the design of an encoder. The parameters may correspond
to particular parts of an implementation.
Because of resource limitations, implementations of Motion JPEG 2000 sometimes will not be able to decode a
codestream in its entirety. This clause defines various parameters for which a specific implementation might be limited.
A set of values for every parameter defines a compliance point. Thus, an implementation of a particular Cpoint must
guarantee resources as defined in all the parameters.
8.2 H, W, C: Image size guarantees
Decoders may be limited in the size of the output image that they are capable of producing, due to physical display
characteristics or memory limitations. H, W, and C are respectively the largest height, width, and number of
components that are required to be decoded for a decoder in the compliance point. Codestreams containing more
samples than the H, W, and C for a Cpoint shall still be decoded, provided they contain a resolution equal to or less than
H × W. Compliance for these codestreams is based on the ability to decode at the largest size smaller than or equal to
that specified by the decoder's Cpoint, while preserving aspect ratio. The requested image size is defined by the height
and width fields in the applicable 'VisualSampleEntry' from the MJ2 file.
Equations 8-1 and 8-2 express these restrictions. The maximum r ≤ T that satisfies both conditions is the number of
L
levels that must be decoded. T is defined in 8.9. The variables w and h denote requested width and height from the
L r r
min( N (i))
VisualSampleEntry segment defined in 6.1. The term denotes the minimum number of decomposition
L
∀i
levels declared in any COD or COC marker segments whether used in main header or in tile-part headers as defined in
Annex A of ITU-T Rec. T.800 | ISO/IEC 15444-1.
If a non-negative r does not exist to satisfy both conditions for any tile or for the whole image, then no decoder
obligation exists. A decoder claiming compliance at some Cpoint with image dimensions H × W and number of
components C, must also be capable of decoding any sequences with width less than or equal to W, height less than or
equal to H, and number of components less than or equal to C. For each Cpoint, the minimum values for H, W, and C
are specified in Table 2.
 
w
r
≤ W
 
min( N (i))−r
L
∀i
2 
(8-1)
 
h
r
≤ H
 
min( N (i))−r
L
∀i
 
(8-2)
ITU-T Rec. T.802 (01/2005) 7
8.3 N : Code-block parsing guarantee
cb
Decoders need not decode compressed bits that cannot be recovered from the codestream due to excessive parser
memory being required. An upper bound for the parser state memory required to reach a point x in the codestream may
be determined from the total number of code-blocks for which state information must be kept, the total number of
precincts for which a packet has been encountered, and the total number of components of the codestream.
At position x in the codestream, N (x) is defined as the total number of code-blocks in every precinct where the first
cb
header byte of at least one received packet for the precinct lies outside the range 0x80 to 0x8F.
Decoders are permitted to stop parsing the codestream at the point, x, once N (x) > N , where N is defined for each
cb cb cb
compliance point. Decoders are permitted to stop parsing the codestream once packet headers with more than N code-
cb
blocks have been encountered. Code-blocks in packets prior to the packet with the N th code-block shall be decoded up
cb
to the limits of other parameters in the compliance point.
NOTE – Packet headers with the first bit set to 0 are defined as empty. The above definition adds all the code-blocks associated
with such precincts to N for these empty packets because a decoder requires more memory for these packets than for packets
cb
starting in the listed range.
8.4 N : Component parsing guarantee
comp
Decoders could be required to buffer information about each component for many thousands of components just to
parse a codestream. To limit the required memory, decoders are permitted to stop parsing the codestream at a point, x,
once the following condition is reached:
C (x) > N
max comp
where C (x) is defined as the largest component index for which a packet has been encountered up to point x
max
regardless of the emptiness or the relevance of the packet.
Code-blocks in packets prior to the above stop condition shall be decoded up to the limits of other parameters in the
compliance point.
8.5 L : Coded data buffering guarantee
body
The parser state memory described in 8.3 is required to parse packets regardless of whether their code-blocks are
relevant to the dimensions and number of components for which compliance is being claimed. For those code-blocks
that are relevant, the implementation is required to store the recovered packet bytes. These are the code bytes that are
processed by the block decoder (Annexes C and D of ITU-T Rec. T.800 | ISO/IEC 15444-1).
After a given number of decoded codestream bytes, x, the quantity L (x) is defined as the total number of packet bytes
body
that have been encountered so far in packets whose precincts are relevant to the dimensions and components for which
compliance is being claimed. Although some implementations may be able to decode some of these packet bytes
incrementally, L represents an upper bound on the number of packet bytes that must be stored by the decoder prior to
body
decoding. If the number of relevant packet bytes exceeds L , then the Implementation Under Test (IUT) is allowed to
body
stop reading the codestream and to decode the code-blocks obtained up to the limits of other parameters in the
compliance point.
8.6 M: Decoded bit-plane guarantee
The decoder shall decode all of the packet bytes recovered by the parser in accordance with the requirements described
above. This obligation is limited to the most significant M bit-planes of each code-block. Specifically, the block decoder
must correctly decode the first 3(M – P )–2
...


NORME ISO/CEI
INTERNATIONALE 15444-3
Deuxième édition
2007-05-01
Technologies de l'information — Système
de codage d'images JPEG 2000: Images
JPEG 2000 animées
Information technology — JPEG 2000 image coding system: Motion
JPEG 2000
Numéro de référence
ISO/CEI 15444-3:2007(F)
©
ISO/CEI 2007
ISO/CEI 15444-3:2007(F)
PDF – Exonération de responsabilité
Les fichiers PDF peuvent contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ils peuvent
être imprimés ou visualisés, mais ne doivent pas être modifiés à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence
autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de fichiers PDF, les parties
concernées acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO
décline toute responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.
Les détails relatifs aux produits logiciels utilisés pour la création du ou des fichiers PDF qui constituent cette publication sont
disponibles dans la rubrique General Info des fichiers; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les
mesures ont été prises pour garantir l'exploitation de ces fichiers par les comités membres de l'ISO. Dans le cas peu probable où
surviendrait un problème d'utilisation, veuillez en informer le Secrétariat central à l'adresse donnée ci-dessous.

DOCUMENT PROTÉGÉ PAR COPYRIGHT

©  ISO/CEI 2007
Tous droits réservés. Sauf exigence particulière d'installation et sauf stipulation contraire, aucune partie de ces DVD ne peut être
reproduite, enregistrée dans un système d'extraction ou transmise, sous quelque forme que ce soit et par aucun procédé, sans l'accord
préalable de l'ISO. Les demandes d'autorisation de reproduction de ce produit doivent être envoyées à l'adresse ci-après.
ISO copyright office • Case postale 56 • CH-1211 Geneva 20 • Switzerland
Internet copyright@iso.org
Toute reproduction est soumise au paiement de droits ou à un contrat de licence.
Les contrevenants pourront être poursuivis.
Version française parue en 2008
Publié en Suisse
ii © ISO/CEI 2007 – Tous droits réservés

ISO/CEI 15444-3:2007(F)
Ces deux DVD contiennent les éléments suivants:
1) disque 1:
i) la publication ISO/CEI 15444-3:2007 au format PDF (portable document format), qui peut être
visualisée en utilisant Adobe® Acrobat® Reader;
ii) des vecteurs de test pour l'ISO/CEI 15444-3:2007;
iii) un fichier «Readme» expliquant le contenu des deux disques.
2) disque 2:
i) le répertoire «Cpoint3», qui fait partie intégrante des vecteurs de test mentionnés ci-dessus,
comme expliqué dans le fichier «Readme» du disque 1.
Adobe et Acrobat sont des marques déposées de Adobe Systems Incorporated.

Cette deuxième édition annule et remplace la première édition (ISO/CEI 15444-3:2002), qui a fait l'objet d'une
révision technique. Elle incorpore également l'Amendement ISO/CEI 15444-3:2002/Amd.2:2003.

Installation
Si cette publication a été sauvegardée en un fichier compressé, NE PAS ouvrir le fichier à parti
...


NORME ISO/CEI
INTERNATIONALE 15444-3
Deuxième édition
2007-05-01
Technologies de l'information — Système
de codage d'images JPEG 2000: Images
JPEG 2000 animées
Information technology — JPEG 2000 image coding system: Motion
JPEG 2000
Numéro de référence
ISO/CEI 15444-3:2007(F)
©
ISO/CEI 2007
ISO/CEI 15444-3:2007(F)
PDF – Exonération de responsabilité
Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier
peut être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence
autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées
acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute
responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.
Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info
du fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir
l'exploitation de ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation,
veuillez en informer le Secrétariat central à l'adresse donnée ci-dessous.

DOCUMENT PROTÉGÉ PAR COPYRIGHT

©  ISO/CEI 2007
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être reproduite ni utilisée sous
quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l'accord écrit
de l'ISO à l'adresse ci-après ou du comité membre de l'ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax. + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Version française parue en 2008
Publié en Suisse
ii © ISO/CEI 2007 – Tous droits réservés

ISO/CEI 15444-3:2007(F)
TABLE DES MATIÈRES
Page
1 Domaine d'application . 1
2 Références normatives. 1
3 Définitions . 1
4 Compatibilité et origines techniques. 1
4.1 Famille de spécifications . 1
4.2 Héritage par rapport au format ISO de base pour les fichiers médias et compatibilité. 2
4.3 Héritage par rapport au format JP2 et compatibilité. 2
4.4 Conformité . 2
4.5 Profils et niveaux . 2
4.6 Composition visuelle . 3
4.7 Ordre des boîtes. 4
5 Identification des fichiers . 4
6 Ajouts requis . 5
6.1 Boîte de description d'échantillon. 5
7 Champs de gabarit utilisés. 7
8 Définition des points de conformité. 7
8.1 Généralités. 7
8.2 H, W, C: garanties de taille d'image . 8
8.3 N : garantie d'analyse des blocs de codes . 8
cb
8.4 N : garantie d'analyse des composantes. 9
comp
8.5 L : garantie de mise en tampon des données codées. 9
body
8.6 M: garantie de décodage des plans binaires . 9
8.7 P: garantie de précision 9-7I. 9
8.8 B: garantie de précision 5-3R . 10
8.9 T : garantie de niveaux de transformation . 10
L
8.10 L: garantie de couche. 10
8.11 Progressions. 10
8.12 Pavés. 10
8.13 Parties de pavé. 10
8.14 Secteurs . 10
8.15 Débit d'images et débit binaire. 11
8.16 Profil: garantie de flux de codes . 11
9 Définition des points de conformité. 11
10 Définition des méthodes de test . 12
11 Suites de tests exécutables (ETS). 12
11.1 Séquences de test . 12
11.2 Cpoint-3. 13
11.3 Cpoint-2. 14
11.4 Cpoint-1. 15
11.5 Cpoint-0. 15
Annexe A – Profils de fichiers et de flux de codes . 17
A.1 Introduction aux profils . 17
A.2 Profil simple d'images JPEG 2000 animées . 17
Annexe B – Lignes directrices applicables à l'utilisation du codec JPEG 2000. 18
B.1 Introduction . 18
B.2 Pondération en fréquence pour les séquences d'images animées. 18
B.3 Sous-échantillonnage de composantes avant le codeur. 19
Annexe C – Indication du décalage de la chrominance en cas de sous-échantillonnage . 20
Annexe D – Structures de trame pour l'entrelacement. 22

© ISO/CEI 2007 – Tous droits réservés iii

ISO/CEI 15444-3:2007(F)
Page
Annexe E – Lignes directrices applicables à l'implémentation de la spécification relative aux images JPEG
2000 animées . 25
E.1 Introduction . 25
E.2 Lignes directrices. 25
Annexe F – Guide concernant la norme JPEG 2000 . 28
F.1 Structure et état de la norme . 28
F.2 Formats de fichier JPEG 2000 . 28
Annexe G – Format de fichier des composantes de référence. 30
G.1 Format de fichier PGX . 30
G.2 Format de l'en-tête. 30
G.3 Format des données . 30
Annexe H – Déclaration de droits de propriété . 31
Bibliographie .
Fichier électronique: Fichiers de test binaires
iv © ISO/CEI 2007 – Tous droits réservés

ISO/CEI 15444-3:2007(F)
Avant-propos
L'ISO (Organisation internationale de normalisation) et la CEI (Commission électrotechnique internationale)
forment le système spécialisé de la normalisation mondiale. Les organismes nationaux membres de l'ISO ou
de la CEI participent au développement de Normes internationales par l'intermédiaire des comités techniques
créés par l'organisation concernée afin de s'occuper des domaines particuliers de l'activité technique. Les
comités techniques de l'ISO et de la CEI collaborent dans des domaines d'intérêt commun. D'autres
organisations internationales, gouvernementales et non gouvernementales, en liaison avec l'ISO et la CEI
participent également aux travaux. Dans le domaine des technologies de l'information, l'ISO et la CEI ont créé
un comité technique mixte, l'ISO/CEI JTC 1.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI,
Partie 2.
La tâche principale du comité technique mixte est d'élaborer les Normes internationales. Les projets de
Normes internationales adoptés par le comité technique mixte sont soumis aux organismes nationaux pour
vote. Leur publication comme Normes internationales requiert l'approbation de 75 % au moins des
organismes nationaux votants.
L'attention est appelée sur le fait que certains des éléments du présent document peuvent faire l'objet de
droits de propriété intellectuelle ou de droits analogues. L'ISO et la CEI ne sauraient être tenues pour
responsables de ne pas avoir identifié de tels droits de propriété et averti de leur existence.
L'ISO/CEI 15444-3 a été élaborée par le comité technique mixte ISO/CEI JTC 1, Technologies de
l'information, sous-comité SC 29, Codage du son, de l'image, de l'information multimédia et hypermédia, en
collaboration avec l’UIT-T. Le texte identique est publié en tant que Rec. UIT-T T.802.
Cette deuxième édition annule et remplace la première édition (ISO/CEI 15444-3:2002), qui a fait l'objet d'une
révision technique. Elle incorpore également l'Amendement ISO/CEI 15444-3:2002/Amd.2:2003.
L'ISO/CEI 15444 comprend les parties suivantes, présentées sous le titre général Technologies de
l'information — Système de codage d'images JPEG 2000:
⎯ Partie 1: Système de codage noyau
⎯ Partie 2: Extensions
⎯ Partie 3: Motion JPEG 2000
⎯ Partie 4: Tests de conformité
⎯ Partie 5: Logiciel de référence
⎯ Partie 6: Format de fichier d'image de composant
⎯ Partie 8: JPEG 2000 sécurisé
⎯ Partie 9: Outils d'interactivité, interfaces de programmes d'application et protocoles
⎯ Partie 10: Extensions pour données tridimensionnelles
⎯ Partie 11: JPEG 2000 sans fil
⎯ Partie 12: Format ISO de base pour les fichiers médias
La partie suivante est en préparation:
⎯ Partie 13: Un encodeur JPEG 2000 de niveau d'entrée
© ISO/CEI 2007 – Tous droits réservés v

ISO/CEI 15444-3:2007(F)
Introduction
La présente Recommandation | Norme internationale sur les images JPEG 2000 animées est fondée sur le format ISO de
base pour les fichiers médias, dont sont issus les formats MP4 et MJ2.
La présente Recommandation | Norme internationale spécifie l'utilisation du codec JPEG 2000 fondé sur les ondelettes
pour le codage et l'affichage de séquences d'images programmées. Cette Recommandation | Norme internationale a été
définie par l'ISO/CEI (JTC 1/SC 29/WG 1) en tant que partie 3 de la Norme internationale JPEG 2000. La présente
Recommandation | Norme internationale contient la définition d'un format de fichier et des lignes directrices applicables
à l'utilisation du codec JPEG 2000 pour les séquences programmées. Le format de fichier MJ2 pour les images
JPEG 2000 animées est conçu pour contenir une ou plusieurs séquences d'images JPEG 2000 animées, avec leur
programmation, ainsi que d'éventuelles annotations audio, composées en une présentation d'ensemble.
Un cadre général pour les tests de conformité est défini afin de promouvoir l'interopérabilité entre les codeurs et les
décodeurs MJ2 et de tester ces systèmes pour vérifier leur conformité à la présente Recommandation | Norme
internationale. Les tests de conformité consistent à tester un produit proposé, afin de vérifier qu'il possède les
caractéristiques requises par la norme en question. Il s'agit de tester les capacités d'une implémentation par rapport aux
exigences de conformité de la norme et à la déclaration de la capacité de l'implémentation.
La présente Recommandation | Norme internationale sur les images JPEG 2000 animées devrait être utilisée dans
diverses applications, notamment lorsque le codec est déjà disponible pour d'autres raisons ou lorsqu'il est utile
d'employer la méthode fondée sur des images de haute qualité, sans codage interimages. Citons, par exemple:
• appareils photonumériques;
• environnements sensibles aux erreurs (réseaux hertziens et Internet, par exemple);
• acquisition vidéo par PC;
• enregistrement vidéo numérique de haute qualité pour la radiodiffusion professionnelle et la production
d'images animées dans des systèmes numériques à partir de films;
• imagerie médicale et imagerie satellite haute résolution.
Le format de fichier pour les images JPEG 2000 animées est un format souple, aux usages multiples (édition, affichage,
échange, transmission en continu, par exemple).

vi © ISO/CEI 2007 – Tous droits réservés

ISO/CEI 15444-3:2007 (F)
NORME INTERNATIONALE
RECOMMANDATION UIT-T
Technologies de l'information – Système de codage d'images JPEG 2000:
images JPEG 2000 animées
1 Domaine d'application
La présente Recommandation | Norme internationale spécifie l'utilisation du codec JPEG 2000 fondé sur les ondelettes
pour le codage et l'affichage de séquences d'images programmées (séquences d'images animées), éventuellement
combinées avec des signaux audio, et composées en une présentation d'ensemble. La présente Recommandation |
Norme internationale contient la définition d'un format de fichier et des lignes directrices applicables à l'utilisation du
codec JPEG 2000 pour les séquences d'images animées. La présente Recommandation | Norme internationale spécifie
par ailleurs des profils ainsi qu'un cadre général, des concepts et une méthodologie concernant les tests et aussi les
critères à respecter pour que la conformité à la présente Recommandation | Norme internationale puisse être déclarée.
2 Références normatives
Les Recommandations et Normes internationales suivantes contiennent des dispositions qui, par suite de la référence
qui y est faite, constituent des dispositions valables pour la présente Recommandation | Norme internationale. Au
moment de la publication, les éditions indiquées étaient en vigueur. Toutes Recommandations et Normes sont sujettes à
révision et les parties prenantes aux accords fondés sur la présente Recommandation | Norme internationale sont
invitées à rechercher la possibilité d'appliquer les éditions les plus récentes des Recommandations et Normes indiquées
ci-après. Les membres de la CEI et de l'ISO possèdent le registre des Normes internationales en vigueur. Le Bureau de
la normalisation des télécommunications de l'UIT tient à jour une liste des Recommandations de l'UIT-T en vigueur.
– Recommandation UIT-T T.800 (2002) | ISO/CEI 15444-1:2004, Technologies de l'information –
Systèmes de codage d'images JPEG 2000: Système de codage noyau.
– Recommandation UIT-T T.803 (2002) | ISO/CEI 15444-4:2004, Technologies de l'information –
Systèmes de codage d'images JPEG 2000: Tests de conformité.
– ISO 639-2:1998, Codes pour la représentation des noms de langue – Partie 2: Code alpha-3.
– ISO/CEI 14496-1:2004, Technologies de l'information – Codage des objets audiovisuels – Partie 1:
Systèmes [notamment le § 14 portant sur le langage de description de syntaxe (SDL)].
– ISO/CEI 15444-12:2005, Technologies de l'information – Système de codage d'image JPEG 2000 –
Partie 12: Format ISO de base pour les fichiers médias (techniquement identique à la norme
ISO/CEI 14496-12).
3 Définitions
Pour les besoins de la présente Recommandation | Norme internationale, les définitions suivantes s'appliquent.
3.1 séquence d'images animées: séquence programmée d'images JPEG 2000.
4 Compatibilité et origines techniques
4.1 Famille de spécifications
Il s'agit d'une Recommandation | Norme internationale autonome, définissant le format de fichier MJ2. Toutefois, elle
fait partie d'une famille de Recommandation | Norme internationale avec des éléments de format communs.
Rec. UIT-T T.802 (01/2005) 1
ISO/CEI 15444-3:2007 (F)
Les autres Recommandations | Normes internationales de la famille définissent notamment les formats suivants:
• Le format pour une seule image JPEG 2000, JP2.
• Le format ISO de base pour les fichiers médias, sur lequel le format MP4 est fondé.
• Le format de fichier QuickTime, sur lequel le format ISO de base pour les fichiers médias est fondé.
Elles reposent sur une définition commune de la structure d'un fichier (séquence d'objets, appelés boîtes ici et atomes
dans la spécification QuickTime) et sur une définition commune de la structure générale d'un objet (taille et type).
Conformément à chacune de ces Recommandations | Normes internationales, les lecteurs doivent ignorer les objets
qu'ils ne savent pas reconnaître.
La présente Recommandation | Norme internationale a la primauté sur les spécifications dont elle hérite, chaque fois
qu'il existe des différences ou des conflits. Toutefois, aucun conflit n'est connu.
4.2 Héritage par rapport au format ISO de base pour les fichiers médias et compatibilité
Le format de fichier pour les images JPEG 2000 animées est défini comme découlant du format ISO de base pour les
fichiers médias. Les pistes indicatives définies dans la spécification de ce format de base ne constituent pas une partie
normative de la présente Recommandation | Norme internationale. Bien que compatibles avec la présente
Recommandation | Norme internationale, les § 7 (Prise en charge de la transmission en continu) et 10 (Format des pistes
indicatives RTP) ne constituent pas des parties normatives de la présente Recommandation | Norme internationale. Ils
peuvent être utilisés sous la forme d'une extension compatible facultative, mais ils ne sont pas nécessaires pour la
compatibilité avec la présente Recommandation | Norme internationale. L'utilisation de cette extension ou d'autres
extensions compatibles avec ce format pourra faire l'objet de licences.
4.3 Héritage par rapport au format JP2 et compatibilité
La spécification du format d'image fixe JP2 définit un certain nombre de boîtes dont la boîte de signature qui est
obligatoire dans la présente Recommandation | Norme internationale. Si la spécification JP2 impose une position
particulière (par exemple, la première position dans le fichier), il faut conserver cette position ici.
Conformément à la présente Recommandation | Norme internationale, il est possible d'élaborer un fichier qui respecte à
la fois la présente Recommandation | Norme internationale et la spécification JP2. Dans ce cas:
1) la liste de compatibilité doit inclure toutes les marques compatibles;
2) les objets (boîtes ou atomes) qui sont obligatoires dans la spécification JP2 le sont aussi ici;
3) les objets (boîtes ou atomes) qui sont facultatifs dans la spécification JP2 le sont aussi ici.
Un lecteur d'images fixes, qui lit un fichier contenant à la fois une présentation (conforme à la présente
Recommandation | Norme internationale) et une image fixe, ne 'verra' que l'image fixe. De même, un lecteur d'images
animées ne 'verra' que la présentation. Un lecteur plus puissant pourra afficher les deux ou offrir le choix à l'utilisateur.
La spécification JP2 comprend une boîte facultative relative aux droits de propriété intellectuelle (IPR, intellectual
property rights), qui est donc aussi facultative dans la présente Recommandation | Norme internationale. Cette boîte
concerne entre autres l'identification unique et la protection du contenu.
4.4 Conformité
Les décodeurs d'images JPEG 2000 animées devront prendre en charge les séquences d'images JPEG 2000 ainsi que les
signaux audio bruts ou en complément à deux si une sortie audio est disponible. Ils pourront aussi prendre en charge les
signaux audio compressés, au moyen de formats MP4, ou d'autres types de pistes issues de la norme MPEG-4. La prise
en charge de ces pistes MPEG-4 n'est pas requise mais la présence de ces pistes ne doit pas entraîner de défaillance des
lecteurs. En cas de recours à une composition MPEG-4 (format BIFS), la composition simple utilisée dans la présente
Recommandation | Norme internationale devrait aussi être configurée de manière à ce qu'un lecteur n'implémentant pas
le format BIFS affiche un résultat convenable.
Les fichiers conformes à la présente Recommandation | Norme internationale contiendront au moins une piste vidéo
pour les images JPEG 2000 animées. Ils pourront contenir d'autres pistes vidéo, des signaux audio non compressés ou
des signaux audio MP4 compressés.
4.5 Profils et niveaux
Il existe deux outils pour déclarer le profil des fichiers d'images JPEG 2000 animées.
2 Rec. UIT-T T.802 (01/2005)
ISO/CEI 15444-3:2007 (F)
Le premier outil correspond à la spécification facultative d'outils et de niveaux du système de codage JPEG 2000
(caractéristiques de flux de codes), qui sont indiqués dans la boîte de profil JP2 d'extension de description d'échantillon
facultative (voir le § 5 ci-dessous).
Le second outil permet d'identifier un fichier d'ensemble comme appartenant à une définition qui constitue un sous-
ensemble propre de la spécification générale. Ce type de définition pourrait restreindre des caractéristiques telles que:
• l'utilisation de références de données et de fichiers multiples;
• l'ordre de présentation des boîtes et des données dans les boîtes (par exemple, les données suivent l'ordre
chronologique et sont entrelacées);
• l'utilisation de profils de flux de codes JPEG 2000;
• l'existence d'autres pistes et leur format (par exemple, audio, MPEG-7, etc.).
La conformité à ces profils restreints est indiquée dans la boîte de type de fichier par l'ajout des profils compatibles sous
la forme de marques dans la liste de compatibilité. L'Annexe A définit les profiles disponibles dans la présente
Recommandation | Norme internationale.
4.6 Composition visuelle
Pour composer plusieurs séquences d'images dans un environnement 2D, on peut utiliser plusieurs pistes vidéo qui se
chevauchent dans le temps. Cette composition est définie par les structures suivantes:
• Le champ matrix de l'en-tête de piste spécifie le positionnement des séquences et le facteur de mise à
l'échelle.
• Le champ layer de l'en-tête de piste spécifie l'ordre des pistes de l'avant vers l'arrière.
• Les champs graphics mode et opcolor de l'en-tête de média vidéo servent à spécifier les modalités de
composition de chaque piste dans l'image existante (cette composition est réalisée de l'arrière vers
l'avant).
Les applications qui nécessitent une composition plus complexe peuvent utiliser le système BIFS de la norme MPEG-4,
qui est facultatif. Les champs matrix, graphics mode et layer devraient être configurés de manière à ce qu'un lecteur
n'implémentant pas le format BIFS affiche le résultat souhaité. Les valeurs de matrice figurant dans les en-têtes
spécifient une transformation des images vidéo pour la présentation. Le point (p,q) est transformé en (p', q') à l'aide de
la matrice, comme suit:
(p q 1) * | a b u | = (m n z)
| c d v |
| x y w |
m = ap + cq + x; n = bp + dq + y; z = up + vq + w;

p' = m/z; q' = n/z
Les coordonnées {p,q} se trouvent sur l'image décompressée et {p', q'} se trouvent sur le rendu d'image. A titre
d'exemple, la matrice {2,0,0, 0,2,0, 0,0,1} double exactement les dimensions en pixels d'une image. Les coordonnées
transformées par la matrice ne sont pas normalisées du tout et représentent les positions d'échantillon réelles. Par
conséquent, {x,y} peut par exemple, être consideré comme un vecteur de translation pour l'image.
L'origine des coordonnées est située dans le coin supérieur gauche, les valeurs de X croissent vers la droite et les valeurs
de Y croissent vers le bas. {p,q} et {p',q'} doivent être considérés comme les positions de pixel absolues par rapport au
coin supérieur gauche de l'image d'origine (après mise à l'échelle conformément à la largeur et à la hauteur définies dans
l'en-tête de piste) et de la surface transformée (rendu), respectivement.
Chaque piste est composée dans une image globale conformément à la spécification de sa matrice; elle est ensuite
transformée et composée conformément à la matrice au niveau du film de la boîte MovieHeaderBox. En fonction de
l'application, l'image résultante peut être 'tronquée' afin d'éliminer des pixels, qui ne sont pas affichés, et être présentée
dans une région rectangulaire verticale à l'intérieur d'une fenêtre, par exemple. Ainsi, si une seule piste vidéo est
affichée et fait l'objet d'une translation de vecteur {20,30} et qu'une matrice unitaire est présente dans la boîte
MovieHeaderBox, une application peut choisir de ne pas afficher la région vide en forme de "L" qui se trouve entre
l'image et l'origine.
Toutes les valeurs d'une matrice sont stockées sous la forme de valeurs à virgule fixe 16.16, sauf pour u, v et w, qui sont
stockées sous la forme de valeurs à virgule fixe 2.30. Pour des raisons de compatibilité amont avec le système BIFS
MPEG-4 (composition de scène), le triplet (u,v,w) des matrices utilisées ici est restreint aux valeurs (0,0,1), les valeurs
Rec. UIT-T T.802 (01/2005) 3
ISO/CEI 15444-3:2007 (F)
hexadécimales correspondantes étant (0,0,0x40000000). Cela permet de projeter la composition simple utilisée ici dans
le format BIFS si une gestion de scène complète est exigée ultérieurement.
Les valeurs de la matrice sont stockées dans l'ordre {a,b,u, c,d,v, x,y,w}.
Les pistes sont composées sur la surface de présentation de l'arrière (numéro de couche le plus grand) à l'avant (numéro
de couche le plus petit), la couleur initiale étant indéterminée. Divers modes de composition sont disponibles; la piste la
plus à l'arrière (la première sur le rendu) utilise en principe le mode 'copy' car l'image initiale est indéterminée. Les
couches subséquentes peuvent ensuite être composées au-dessus de la première de diverses manières. Le Tableau 1
détaille les modes de composition disponibles. Il est à noter que (pour le moment) seul le mode 'transparent' utilise le
champ opcolor.
Tableau 1 – Modes de composition graphique
Mode Code Description
Copy 0x0 Copier l'image de la source sur la destination
Transparent 0x24 Remplacer le pixel de la destination par le pixel de la source si celui-ci est différent
de opcolor. (Egalement appelé 'blue-screen'.)
Alpha 0x100 Remplacer le pixel de la destination par une fusion de pixels de la source et de la
destination, la proportion étant contrôlée par le canal alpha. Le canal alpha est
appliqué à tous les canaux.
Pre-multiplied black 0x102 La prémultiplication avec du noir signifie que les composantes de couleur de
alpha chaque pixel ont déjà été fondues avec un pixel noir, sur la base de la valeur du
canal alpha. Autrement dit, l'image a déjà été combinée avec un fond noir, qui doit
être supprimé avant la composition.
Component alpha 0x110 Un ou plusieurs canaux alpha sont présents et sont appliqués à chacun des canaux
de couleur et l'image doit être composée canal par canal.
La composition des images se fait suivant le mode alpha uniquement si le mode de composition graphique demandé est
le mode alpha et si les images contiennent des canaux alpha, comme déclaré dans la boîte de définition de canal
contenue dans la boîte d'en-tête JP2. On peut donc utiliser le mode graphique pour empêcher la composition alpha d'une
image avec des canaux alpha, si c'est ce qui est souhaité.
Si un seul canal alpha est appliqué à l'image tout entière, le mode graphique doit avoir la valeur 'Alpha' si ce canal est
un canal d'opacité direct et doit avoir la valeur 'Pre-multiplied black alpha' si ce canal est un canal d'opacité
prémultiplié. Si un ou plusieurs canaux alpha de l'image sont appliqués à chacun des canaux et non pas à l'image tout
entière et que le mode de composition alpha est souhaité, le mode graphique doit alors avoir la valeur 'Component
alpha'. La prise en charge du mode 'Component alpha' est facultative dans la présente Recommandation | Norme
internationale.
Les formules de fusion alpha sont définies dans la Rec. UIT-T T.800 | ISO/CEI 15444-1.
NOTE – L'utilisation du mode "transparent" peut conduire à des résultats inattendus lorsque les flux de codes d'image sont
compressés de façon irréversible ou font l'objet d'une modification de la qualité ou de la résolution, pendant ou après la
production de contenu. Ces opérations ne garantissent pas la conservation des valeurs précises des différents échantillons.
4.7 Ordre des boîtes
Tous les fichiers JPEG 2000 commencent par une boîte de signature. Par conséquent, la règle suivante est ajoutée aux
règles régissant l'ordre des boîtes:
1) La boîte de signature JP2 et la boîte de type de fichier doivent respectivement être la première et la
deuxième du fichier.
5 Identification des fichiers
Dans la boîte de compatibilité de type de fichier, le nom de marque doit être 'mjp2' pour les fichiers conformes à la
présente Recommandation | Norme internationale et 'mjp2' doit appartenir à la liste de compatibilité.
L'Annexe A contient la liste complète de tous les noms de marque de profil.
L'extension de fichier préférée est '.mj2'. Le type MIME vidéo/mjp2 est utilisé, comme défini dans le document RFC
applicable.
4 Rec. UIT-T T.802 (01/2005)
ISO/CEI 15444-3:2007 (F)
6 Ajouts requis
6.1 Boîte de description d'échantillon
6.1.1 Définition
Types de boîte: 'mjp2', 'raw?', 'twos'
Conteneur: boîte de table d'échantillons ('stbl')
Obligatoire: oui
Quantité:  exactement une
Une entrée d'échantillon visuel d'images JPEG 2000 animées doit contenir une boîte d'en-tête JP2 conforme à la Rec.
UIT-T T.800 | ISO/CEI 15444-1; toutefois, l'espace chromatique énuméré YCC sRGB (code 18) défini dans la Rec.
UIT-T T.801 | ISO/CEI 15444-2 peut aussi être utilisé pour identifier l'espace chromatique utilisé, en plus des espaces
chromatiques énumérés de la Rec. UIT-T T.800 | ISO/CEI 15444-1 (sRGB et échelle de gris, par exemple). Si la boîte
d'en-tête JP2 indique la présence de canaux alpha, le champ 'depth' de l'entrée VisualSampleEntry doit aussi indiquer
leur présence, avec la valeur 0x20. De même, si la boîte d'en-tête JP2 définit une image monochrome sans alpha, le
champ 'depth' doit contenir la valeur indiquant échelle de gris (0x28). Dans les autres cas, le champ 'depth' doit déclarer
des images en couleur (0x18).
Si deux trames sont présentes dans les échantillons, la boîte d'en-tête JP2 s'applique à l'image complète, et non à chaque
trame séparément. Par conséquent, la hauteur déclarée dans la boîte d'en-tête JP2 et dans l'entrée VisualSampleEntry
s'applique à l'image entière désentrelacée.
NOTE – Cela signifie qu'il ne sera peut-être pas possible d'élaborer un fichier JP2 légitime si on compose le flux de codes d'une
seule trame avec la boîte d'en-tête JP2 de la description d'échantillon.
Le format d'échantillon des données d'images JPEG 2000 animées est un ensemble de boîtes. A l'heure actuelle, la
présente Recommandation | Norme internationale autorise uniquement les boîtes de flux de codes JP2 ('jp2c'), comme
défini dans la spécification JP2. Si aucune boîte de codage fondé sur les trames n'est présente ou si le nombre de trames
vaut 1, l'échantillon doit contenir exactement une boîte de flux de codes. Si le nombre de trames vaut 2, il doit y avoir
deux boîtes de flux de codes. Si d'autres boîtes sont présentes dans l'échantillon, elles devront être ignorées. La dernière
(ou la seule) boîte de l'échantillon peut comporter la valeur 0 dans son champ de longueur, indiquant qu'elle s'étend
jusqu'à la fin de l'échantillon, comme indiqué par la taille d'échantillon donnée dans la table des tailles d'échantillon.
Les flux de codes réels présentés au décodeur sont formés par la concaténation du contenu de la boîte de préfixe JP2, si
une telle boîte est présente, de la description d'échantillon avant chaque flux de codes présenté dans la ou les boîtes jp2c
des échantillons. En cas d'utilisation du codage fondé sur les trames, le même préfixe est concaténé avant les deux
trames. Le préfixe contiendra souvent un en-tête principal JPEG 2000; toutefois, ce n'est pas nécessaire dans le cas
général, même si des profils spécifiques peuvent limiter l'utilisation de la boîte de préfixe.
Si les flux de codes utilisés dans une séquence sont conformes à un profil spécifique du codeur JPEG 2000, une boîte de
profil JP2 peut être utilisée pour indiquer cette conformité.
L'entrée d'échantillon visuel peut facultativement contenir une boîte de codage fondé sur les trames (voir ci-dessous). Si
le champ fieldcount vaut 2, chaque trame fera la moitié de la hauteur de l'image complète, comme déclaré dans le
champ de hauteur de la description d'échantillon. Pour être précis, si le champ de hauteur a la valeur H, la trame
contenant la ligne de balayage du haut comprend ((H+1) div 2) lignes et l'autre trame comprend (H div 2) lignes.
L'utilité de la boîte de préfixe risque d'être réduite en cas d'utilisation du codage fondé sur les trames, notamment
lorsque H est impair.
Le format d'origine des données (entrelacé ou progressif) peut être précisé dans la boîte de format d'origine. Le champ
original_fieldcount doit avoir la valeur 1 (progressif) ou 2 (entrelacé). Lorsque la valeur est 2, le champ
original_fieldorder précise si la ligne de balayage du haut provient de la première ou de la seconde trame. Le
contenu de la boîte de format d'origine est indépendant de la question de savoir si les données sont codées de manière
progressive (codage fondé sur les images) ou entrelacée, qui est précisée dans la boîte de codage fondé sur les trames.
Cette boîte est donnée uniquement à titre d'information et peut faciliter l'affichage ou le transcodage par les lecteurs. A
titre d'exemple, des données qui à l'origine étaient entrelacées mais qui font l'objet d'un codage fondé sur les images et
doivent être affichées de manière entrelacée peuvent être positionnées de sorte que l'entrelacement de l'affichage
corresponde à l'entrelacement des données d'origine.
Les valeurs présentes dans l'entrée VisualSampleEntry, ses boîtes constituantes (y compris la boîte d'en-tête JP2) et les
flux de codes que ces boîtes décrivent, doivent concorder, dans la mesure où le format et la précision des champs le
permettent. Cette concordance porte notamment sur les informations de largeur et de hauteur et sur la déclaration de
résolution (dans les limites de la précision permise par les différentes représentations). Un fichier présentant des conflits
Rec. UIT-T T.802 (01/2005) 5
ISO/CEI 15444-3:2007 (F)
n'est pas conforme et un lecteur donné peut tenter de déterminer les valeurs qui sont correctes ou décider de rejeter le
fichier.
Les champs horizresolution et vertresolution correspondent à la composante de plus haute résolution de
l'image (qui est généralement la luminance, mais ce n'est pas obligatoire, dans une image sous-échantillonnée).
Pour les pistes audio, dans les formats définis ici (avec les codes 'raw ' et 'twos'), les données sont stockées sous
la forme d'échantillons non compressés. Si des données stéréo sont stockées, les données comprennent des échantillons
entrelacés gauche/droite. Le format 'raw' utilise le code binaire décalé; pour des échantillons de 8 bits, les valeurs
sont comprises entre 0 et 255, la valeur 128 correspondant au silence. Pour le format 'twos', les valeurs de 8 bits sont
comprises entre –128 et 127, la valeur 0 correspondant au silence. Les valeurs de 16 bits sont déduites de manière
analogue (l'ordre des octets étant l'ordre des octets dans le réseau, avec le bit de plus fort poids en premier).
6.1.2 Syntaxe
// Séquences visuelles
class MJ2SampleEntry() extends VisualSampleEntry ('mjp2'){
JP2HeaderBox();
FieldCodingBox(); // facultatif
MJP2ProfileBox(); // facultatif
MJP2PrefixBox(); // facultatif
MJP2SubSamplingBox(); // facultatif
MJP2OriginalFormatBox(); // facultatif
}
// codage fondé sur les trames
class FieldCodingBox() extends Box('fiel'){
int(8) fieldcount;
int(8) fieldorder; // ordre de stockage et ordre chronologique
}
class MJP2OriginalFormatBox() extends Box('orfo'){
int(8) original_fieldcount;
int(8) original_fieldorder;
}
class MJP2ProfileBox() extends FullBox('jp2p', 0, 0){
unsigned int(32)[] compatible_brands;
}
class MJP2PrefixBox() extends Box('jp2x'){
int(8)[] data; // partie initiale du flux de codes
}
class MJP2SubSamplingBox () extends Box('jsub'){
unsigned int(8) horizontal_sub;
unsigned int(8) vertical_sub;
unsigned int(8) horizontal_offset;
unsigned int(8) vertical_offset;
}
// Séquences audio
class MJ2AudioSampleEntry() extends AudioSampleEntry (AudioFormat){
}
6.1.3 Sémantique
AudioFormat vaut 'raw ' ou 'twos'.
Compressorname: la valeur "\017Motion JPEG 2000" est recommandée (\017 correspond à 15, la longueur de la
chaîne en tant qu'octets)
6 Rec. UIT-T T.802 (01/2005)
ISO/CEI 15444-3:2007 (F)
depth prend l'une des valeurs suivantes:
0x18 – images en couleur sans alpha
0x28 – images en échelle de gris sans alpha
0x20 – images avec alpha (gris ou couleur)
compatible_brands est une liste, remplie à la fin de la boîte contenante, de profils JPEG 2000 auxquels les flux de
codes associés sont conformes; voir la spécification JPEG 2000 pour les valeurs définies.
Horizontal_sub et vertical_sub indiquent si les composantes de chrominance d'un codage YCbCr ont été
sous-échantillonées dans le flux de codes; la valeur indique le nombre d'échantillons de luminance pour un seul
échantillon de chrominance dans la direction considérée. Cela peut aider les décodeurs pour l'attribution de mémoire ou
pour l'utilisation d'interfaces d'affichage sous-échantillonnées optimisées.
Horizontal_offset et vertical_offset spécifient le décalage du premier échantillon de chrominance par
rapport au premier échantillon de luminance, mesuré sur la grille d'échantillon. Si un marqueur CRG est présent dans le
flux de codes, ces valeurs ont la primauté sur celles qui se trouvent dans le flux de codes. On trouvera des exemples de
valeurs dans l'Annexe C.
fieldcount spécifie le nombre de trames dans les échantillons, ce nombre vaut 1 ou 2.
fieldorder décrit l'ordre des deux trames et n'est applicable que si fieldcount vaut 2:
0 codage des trames inconnu
1 la trame comportant la ligne du haut est stockée en premier dans l'échantillon; les trames sont dans
l'ordre chronologique
6 la trame comportant la ligne du haut est stockée en deuxième dans l'échantillon; les trames sont dans
l'ordre chronologique
original_fieldcount spécifie le nombre de trames dans les données d'origine avant le codage, ce nombre vaut 1
ou 2.
original_fieldorder décrit l'ordre des deux trames et n'est applicable que si original_fieldcount vaut 2:
0 codage des trames inconnu
11 la ligne du haut provient de la première trame
16 la ligne du haut provient de la deuxième trame
7 Champs de gabarit utilisés
Le système de codage des images JPEG 2000 animées utilise la composition simple, comme défini ci-dessus. Les
champs suivants doivent donc être fixés correctement dans les fichiers conformes:
1) pour la composition visuelle: matrix dans la boîte d'en-tête de film et dans la boîte d'en-tête de piste;
layer; graphics mode et opcolor dans la boîte d'en-tête de média vidéo et depth dans une
entrée VisualSampleEntry;
2) pour la composition audio: volume dans la boîte d'en-tête de film et dans la boîte d'en-tête de piste;
balance dans la boîte d'en-tête de média sonore;
3) pour une lecture en différé à vitesse variable, rate dans la boîte d'en-tête de film;
4) pour décrire correctement les échantillons audio et visuels, horizresolution et
vertresolution dans une entrée VisualSampleEntry; channelcount, samplesize et
samplerate dans une entrée AudioSampleEntry.
8 Définition des points de conformité
8.1 Généralités
Le présent paragraphe décrit un certain nombre de points de conformité (Cpoint). Les points et leurs paramètres sont
décrits afin de faciliter la conception d'un décodeur conforme. Pour déterminer la conformité réelle, on utilise les
méthodes de test du § 10 et les flux de codes, images de référence et tolérances du § 11. La définition des points de
conformité donnée dans le présent paragraphe est utile pour la conception d'un codeur. Les paramètres peuvent
correspondre à des parties particulières d'une implémentation.
Rec. UIT-T T.802 (01/2005) 7
ISO/CEI 15444-3:2007 (F)
En fonction des ressources dont ils disposent, les décodeurs d'images JPEG 2000 animées ne seront pas toujours en
mesure de décoder un flux de codes dans sa totalité. Le présent paragraphe définit divers paramètres pour lesquels une
implémentation particulière est susceptible de présenter des limites. Un ensemble de valeurs pour chaque paramètre
définit un point de conformité. L'implémentation d'un Cpoint particulier doit donc garantir les ressources défin
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.

Loading comments...