ISO 19005-2:2011
(Main)Document management — Electronic document file format for long-term preservation — Part 2: Use of ISO 32000-1 (PDF/A-2)
Document management — Electronic document file format for long-term preservation — Part 2: Use of ISO 32000-1 (PDF/A-2)
ISO 19005-2:2011 specifies the use of the Portable Document Format (PDF) 1.7, as formalized in ISO 32000-1, for preserving the static visual representation of page-based electronic documents over time. ISO 19005-2:2011 is not applicable to specific processes for converting paper or electronic documents to the PDF/A format, specific technical design, user interface, implementation, or operational details of rendering, specific physical methods of storing these documents, such as media and storage conditions, required computer hardware and/or operating systems.
Gestion de documents — Format de fichier des documents électroniques pour une conservation à long terme — Partie 2: Utilisation de l'ISO 32000-1 (PDF/A-2)
General Information
Standards Content (Sample)
INTERNATIONAL ISO
STANDARD 19005-2
First edition
2011-07-01
Document management — Electronic
document file format for long-term
preservation —
Part 2:
Use of ISO 32000-1 (PDF/A-2)
Gestion de documents — Format de fichier des documents
électroniques pour une conservation à long terme —
Partie 2: Utilisation de l'ISO 32000-1 (PDF/A-2)
Reference number
©
ISO 2011
© ISO 2011
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2011 – All rights reserved
Contents Page
Foreword . iv
Introduction . v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 2
4 Notation . 4
5 Conformance levels . 4
5.1 General . 4
5.2 Level A conformance . 5
5.3 Level B conformance . 5
5.4 Level U conformance . 5
5.5 Conforming readers . 5
6 Technical requirements . 6
6.1 File structure . 6
6.2 Graphics . 8
6.3 Annotations . 17
6.4 Interactive forms . 18
6.5 Action . 19
6.6 Metadata . 20
6.7 Logical structure . 25
6.8 Embedded files . 27
6.9 Optional content . 27
6.10 Use of alternate presentations and transitions . 28
6.11 Document requirements . 28
Annex A (normative) Method for determining transparency on a page . 29
Annex B (normative) Requirements for digital signatures in PDF/A . 31
Annex C (informative) Best practices for PDF/A. 32
Annex D (informative) Incorporation of XFA datasets into a PDF/A-2 conforming file . 34
Bibliography . 35
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the
International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 19005-2 was prepared by Technical Committee ISO/TC 171, Document management applications,
Subcommittee SC 2, Application issues in cooperation with ISO/TC 130, Graphic technology, ISO/TC 42,
Photography, and ISO/TC 46, Information and documentation, Subcommittee SC 11, Archives/records
management, in a joint working group.
ISO 19005 consists of the following parts, under the general title Document management — Electronic
document file format for long-term preservation:
Part 1: Use of PDF 1.4 (PDF/A-1)
Part 2: Use of ISO 32000-1 (PDF/A-2)
The following parts are under preparation:
Part 3: Use of ISO 32000-1 with support for embedded files (PDF/A-3)
iv © ISO 2011 – All rights reserved
Introduction
PDF is a digital format for representing page-based documents. PDF files can be created natively in PDF form,
converted from other electronic formats or digitized from paper, microform, or other hard copy format.
Businesses, governments, libraries, archives and other institutions and individuals around the world use PDF
to represent considerable bodies of important information. Much of this information needs to be kept for
substantial lengths of time; some needs to be kept permanently. These PDF files need to remain useable and
accessible across multiple generations of technology. However, the inclusive, feature-rich nature of the format
requires that constraints be placed on its use to make it suitable for the long-term preservation of electronic
documents. The future use of, and access to, these objects depends upon maintaining their visual
appearance as well as their higher-order properties, such as the logical organization of pages, sections, and
paragraphs, machine recoverable text stream in natural reading order, and a variety of administrative,
preservation and descriptive metadata.
ISO 19005 has been created as a multi-part document, of which this is Part 2. This allows future parts to be
created without rendering ISO 19005, or applications based on it, obsolete.
The primary purpose of ISO 19005 is to define a file format based on PDF, known as PDF/A, which provides a
mechanism for representing electronic documents in a manner that preserves their static visual appearance
over time, independent of the tools and systems used for creating, storing or rendering the files.
A secondary purpose of ISO 19005 is to define a framework for representing the logical structure and other
semantic information of electronic documents within conforming files.
Another purpose of ISO 19005 is to provide a framework for recording the context and history of electronic
documents in metadata within conforming files.
These goals are accomplished by identifying the set of PDF components that can be used, and restrictions on
the form of their use, within conforming PDF/A files.
By itself, PDF/A does not necessarily ensure that the visual appearance of the content accurately reflects any
original source material used to create the conforming file, e.g. the process used to create a conforming file
might substitute fonts, reflow text, downsample images or use lossy compression. Organizations that need to
ensure that a conforming file is an accurate representation of original source material might need to impose
additional requirements, such as the best practices in Annex C, on the processes that generate the
conforming file beyond those imposed by this part of ISO 19005. In addition, it is important for those
organizations to implement policies and practices regarding the inspection of conforming files for correct visual
appearance.
PDF/A does not directly address the topic of authenticity, either for the underlying content to be visually
represented or for the PDF/A file itself. Such authenticity is generally considered to be important for legal,
regulatory and governance purposes and is beyond the scope of this International Standard.
This part of ISO 19005 is one component of an organization's electronic archival environment for long-term
retention of documents. Successful implementation of this part of ISO 19005 for archival purposes depends
upon the following:
the retention requirements of an organization's archival environment, records management policies and
procedures, as specified in ISO 15489-1;
any additional requirements and conditions necessary to ensure the persistence of electronic documents
and their characteristics over time, including, but not limited to, those defined in ISO 14721,
ISO/TR 15801, and ISO/TR 18492;
the quality assurance processes necessary to verify conformance with applicable requirements and
conditions, e.g. an inspection regime to verify the quality and integrity of converted source data.
This part of ISO 19005 is intended to lead to the development of various applications that read, render, write
and validate conforming files. Different applications will incorporate various capabilities to prepare, interpret
and process conforming files based on needs as perceived by the suppliers of those applications. However, it
is important to note that a conforming application needs to be able to read and process appropriately all files
complying with a specified conformance level.
This part of ISO 19005 extends the capabilities of ISO 19005-1. It is based on PDF version 1.7 (as defined in
ISO 32000-1) rather than PDF version 1.4 (which is used as the basis of ISO 19005-1). These added
capabilities are made possible through compliance with ISO 32000-1 and include
improvements to tagged PDF (for enhanced accessibility),
Compressed Object and XRef streams (for smaller file sizes),
PDF/A-compliant file attachments, portable collections and PDF packages,
transparency, and
JPEG 2000 compression.
This part of ISO 19005 (in conjunction with its normative references) provides sufficient information to interpret
any conforming PDF/A-2 file.
NPES and AIIM (accredited standards developing organizations) maintain an ongoing series of application
notes for guiding developers and users of ISO 19005. These application notes are available at
and
A/ISO19005AppNotes.pdf>. Both NPES and AIIM also retain copies of the specific non-ISO normative
references of this part of ISO 19005 which are publicly available electronic documents.
vi © ISO 2011 – All rights reserved
INTERNATIONAL STANDARD ISO 19005-2:2011(E)
Document management — Electronic document file format for
long-term preservation —
Part 2:
Use of ISO 32000-1 (PDF/A-2)
1 Scope
This part of ISO 19005 specifies the use of the Portable Document Format (PDF) 1.7, as formalized in
ISO 32000-1, for preserving the static visual representation of page-based electronic documents over time.
This part of ISO 19005 is not applicable to
specific processes for converting paper or electronic documents to the PDF/A format,
specific technical design, user interface, implementation, or operational details of rendering,
specific physical methods of storing these documents, such as media and storage conditions, or
required computer hardware and/or operating systems.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced
document (including any amendments) applies.
1)
ISO/IEC 646, Information technology — ISO 7-bit coded character set for information interchange
2)
ISO/IEC 10646, Information technology — Universal Coded Character Set (UCS)
ISO 15076-1, Image technology colour management — Architecture, profile format and data structure —
Part 1: Based on ICC.1:2010
ISO/IEC 15444-2:2004, Information technology — JPEG 2000 image coding system: Extensions
ISO 15930-7:2010, Graphic technology — Prepress digital data exchange using PDF — Part 7: Complete
exchange of printing data (PDF/X-4) and partial exchange of printing data with external profile reference
(PDF/X-4p) using PDF 1.6
ISO 19005-1, Document management — Electronic document file format for long-term preservation — Part 1:
Use of PDF 1.4 (PDF/A-1)
1) The character encoding defined in ISO/IEC 646 is equivalent to ANSI X3.4 (ASCII) and ECMA-6.
2) The character code values defined in ISO/IEC 10646 are equivalent to those of Unicode.
ISO 24517-1, Document management — Engineering document format using PDF — Part 1: Use of PDF 1.6
(PDF/E-1)
ISO 32000-1:2008, Document management — Portable document format — Part 1: PDF 1.7
Extensible Markup Language (XML) 1.0 (Third Edition), W3C Recommendation, 4 February 2004. Available
from
ICC.1:1998-09, File Format for Color Profiles, International Color Consortium. Available
from
ICC.1:2001-12, File Format for Color Profiles (Version 4.0.0), International Color Consortium. Available from
ICC.1:2003-09, File Format for Color Profiles (Version 4.1.0), International Color Consortium. Available from
RDF/XML Syntax Specification (Revised), W3C Recommendation, 10 February 2004. Available
from
RFC 2315, PKCS#7: Cryptographic Message Syntax Version 1.5. Available from http://www.rfc-editor.org
RFC 3280, Internet X.509 Public Key Infrastructure Certificate and Certificate Revocation List (CRL) Profile.
Available from http://www.rfc-editor.org
Adobe Glyph List, 20 September 2002, Adobe Systems Incorporated. Available from
Adobe Supplement to ISO 32000-1, BaseVersion 1.7, ExtensionLevel 5, Adobe Systems Incorporated.
Available from
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
3.1
conformance level
identified set of restrictions and requirements to which files and readers are required to comply
3.2
electronic document
electronic representation of a page-oriented aggregation of text, images and graphic data, and metadata
useful to identifying and understanding that data, that can be reproduced on paper or other substrates, as well
as rendered electronically on display devices, without significant loss of its information content
3.3
end-of-file marker
five-character sequence (%%EOF) marking the end of a PDF file
3.4
EOL marker
end-of-line marker
one- or two-character sequence marking the end of a line, consisting of a CARRIAGE RETURN character
(0Dh) or a LINE FEED character (0Ah) or a CARRIAGE RETURN followed immediately by a LINE FEED
2 © ISO 2011 – All rights reserved
3.5
extension schema
conforming XMP schema that is not defined in the XMP Specification, nor in ISO 19005-1 or ISO 19005-2
3.6
font
identified collection of graphics that may be glyphs or other graphic elements
[ISO 32000-1]
3.7
font program
software program written in a special-purpose language, such as the Type 1, TrueType, or OpenType font
format, that is understood by a specialized font interpreter
[ISO 32000-1]
3.8
interactive reader
reader that requires or allows human interaction with the content and other objects contained in the document
during the software's processing phase
NOTE A file viewing tool is an example of an interactive reader; a raster image processor is an example of a reader
that is not interactive.
3.9
Level A conformance
conformance level encompassing all requirements of this part of ISO 19005
3.10
Level B conformance
conformance level encompassing the requirements of this part of ISO 19005 regarding the visual appearance
of electronic documents but not those regarding their structural and semantic properties nor the requirement
that all text have Unicode equivalents
3.11
Level U conformance
conformance level encompassing the requirements of this part of ISO 19005 regarding the visual appearance
of electronic documents, together with the requirement that all text in the document have Unicode equivalents
3.12
long term
period of time long enough for there to be concern about the impacts on the information being held in a
repository of changing technologies, including support for new media and data formats, and of a changing
user community, and which may extend into the indefinite future
3.13
PDF
Portable Document Format
file format defined in ISO 32000-1:2008
3.14
reader
software application that is able to read and process PDF/A files
3.15
writer
software application that is able to write PDF/A files
3.16
XMP packet
structured wrapper for serialized XMP metadata that can be embedded in PDF as well as other file formats
4 Notation
PDF operators, PDF keywords, the names of keys in PDF dictionaries, and other predefined names are
written in bold sans serif font; operands of PDF operators or values of dictionary keys are written in italic sans
serif font. Some names can also be used as values, depending on the context, and so the styling of the
content will be context specific.
EXAMPLE 1 The Default value for the TR2 key.
Token characters used to delimit objects and describe the structure of PDF files, as defined in
ISO 32000-1:2008, 7.2.1, may be identified by their ISO/IEC 646 character name written in upper case in bold
sans serif font followed by a parenthetic two digit hexadecimal character value with the suffix “h”.
EXAMPLE 2 CARRIAGE RETURN (0Dh).
Text string characters, as defined by ISO 32000-1:2008, 7.9.2, may be identified by their ISO/IEC 10646
character name written in uppercase in bold sans serif font followed by a parenthetic four digit hexadecimal
character code value with the prefix “U+”.
EXAMPLE 3 EN SPACE (U+2002).
The following terms, referring to ISO 19005, or parts thereof, are recommended when the full ISO name is not
being used:
“PDF/A” – a synonym for the ISO 19005 series of standards;
“PDF/A-1” – a synonym for ISO 19005-1;
“PDF/A-1a” – a synonym for ISO 19005-1 Level A conformance;
“PDF/A-1b” – a synonym for ISO 19005-1 Level B conformance.
“PDF/A-2” – a synonym for ISO 19005-2;
“PDF/A-2a” – a synonym for ISO 19005-2 Level A conformance;
“PDF/A-2b” – a synonym for ISO 19005-2 Level B conformance;
“PDF/A-2u” – a synonym for ISO 19005-2 Level U conformance.
5 Conformance levels
5.1 General
This part of ISO 19005 defines a file format for representing electronic documents known as “PDF/A-2”.
Conforming PDF/A-2 files shall adhere to all requirements of ISO 32000-1 as modified by this part of
ISO 19005. A conforming file may include any valid ISO 32000-1 feature that is not explicitly forbidden by this
part of ISO 19005. Features described in PDF specifications prior to Version 1.7 which are not explicitly
described in ISO 32000-1 should not be used.
NOTE 1 A conforming file is not obligated to use any PDF feature other than those explicitly required by ISO 32000-1
or this part of ISO 19005.
4 © ISO 2011 – All rights reserved
As described in 6.1.2, the version number of a file may be any value from 1.0 to 1.7, and the value shall not be
used in determining whether a file is in conformance with this part of ISO 19005.
NOTE 2 The proper mechanism by which a file can presumptively identify itself as being a PDF/A-2 file of a given
conformance level is described in 6.6.4.
5.2 Level A conformance
Level A conforming files shall adhere to all of the requirements of this part of ISO 19005. A file meeting this
conformance level is said to be a “conforming PDF/A-2a file”.
5.3 Level B conformance
In recognition of the varying preservation needs of the diverse user communities making use of PDF files, this
part of ISO 19005 defines a Level B conformance level. Level B conforming files shall adhere to all of the
requirements of this part of ISO 19005 except those of 6.2.11.7 and 6.7. A file meeting this conformance level
is said to be a “conforming PDF/A-2b file”.
NOTE 1 The Level B conformance requirements are intended to be the minimum necessary to ensure that the
rendered visual appearance of a conforming file is preservable over the long term. However, Level B conforming files
might not have sufficiently rich internal information to allow for the preservation of the document's logical structure and
content text stream in natural reading order, which is provided by Level A conformance. The requirements for Level A
conformance place greater responsibilities on writers of conforming files and those preparing such files, but these
requirements allow for a higher level of document preservation service and confidence over time. Additionally, Level A
conformance facilitates the accessibility of conforming files for physically impaired users.
NOTE 2 A Level B conforming file can include features from 6.2.11.7 and 6.7 but still be identified as Level B.
5.4 Level U conformance
In recognition of the varying preservation needs of the diverse user communities making use of PDF files, this
part of ISO 19005 defines a Level U conformance level. Level U conforming files shall adhere to all of the
requirements of this part of ISO 19005, except those of 6.7. A file meeting this conformance level is said to be
a “conforming PDF/A-2u file”.
NOTE 1 The Level U conformance requirements are intended to be those necessary to ensure that not only is the
rendered visual appearance of a conforming file preservable over the long term, but that any text contained in the
document can be reliably extracted as a series of Unicode codepoints. However, Level U conforming files might not have
sufficiently rich internal information to allow for the preservation of the document's logical structure and content text stream
in natural reading order, which is provided by Level A conformance. The requirements for Level A conformance place
greater responsibilities on writers of conforming files and those preparing such files, but these requirements allow for a
higher level of document preservation service and confidence over time. Additionally, Level A conformance facilitates the
accessibility of conforming files for physically impaired users.
NOTE 2 A Level U conforming file can include features from 6.7 but still be identified as Level U.
NOTE 3 Level U is new to this part of ISO 19005 and therefore does not have an equivalent in ISO 19005-1.
5.5 Conforming readers
A conforming reader shall comply with all requirements regarding reader functional behaviour specified in this
part of ISO 19005. The requirements of this part of ISO 19005 with respect to reader behaviour are stated in
terms of general functional requirements applicable to all conforming readers. This part of ISO 19005 does not
prescribe any specific technical design, user interface or implementation details of conforming readers.
The rendering and other processing of conforming files shall be performed as defined in ISO 32000-1, subject
to the additional restrictions specified by this part of ISO 19005. Features described in PDF specifications that
are not explicitly described in ISO 32000-1 shall be ignored by conforming readers.
Conforming PDF/A-2 readers shall read and process appropriately all PDF/A-2 files. In addition, conforming
PDF/A-2 readers shall read and process appropriately all PDF/A-1 files as defined by ISO 19005-1.
6 Technical requirements
6.1 File structure
6.1.1 General
Overall file format issues and the base elements that form the general structure of a conforming file are
addressed in 6.1.2 to 6.1.12.
Any data contained in a conforming file that is not described in ISO 32000-1 or in this part of ISO 19005
should be ignored by a conforming reader and shall not be used to render content on a page.
6.1.2 File header
The file header shall begin at byte zero and shall consist of “%PDF-1.n” followed by a single EOL marker,
where ‘n’ is a single digit number between 0 (30h) and 7 (37h).
The aforementioned EOL marker shall be immediately followed by a % (25h) character followed by at least
four bytes, each of whose encoded byte values shall have a decimal value greater than 127.
NOTE The presence of encoded byte values greater than decimal 127 near the beginning of a file is used by various
software tools and protocols to classify the file as containing 8-bit binary data that needs to be preserved during
processing.
6.1.3 File trailer
The file trailer dictionary shall contain the ID keyword whose value shall be File Identifiers as defined in
ISO 32000-1:2008, 14.4.
NOTE 1 No data can follow the last end-of-file marker except a single optional end-of-line marker as described in
ISO 32000-1:2008, 7.5.5.
The keyword Encrypt shall not be present in the trailer dictionary.
NOTE 2 The explicit prohibition of the Encrypt keyword has the implicit effect of disallowing encryption and password-
protected access permissions.
6.1.4 Cross-reference table
The xref keyword and the cross-reference subsection header shall be separated by a single EOL marker.
Any indirect object whose offset is not referenced in any cross-reference table, nor in any cross-reference
stream, shall be exempt from all requirements of this part of ISO 19005 and may be ignored by a conforming
reader. If a conforming reader does not ignore such indirect objects, they shall never influence the way
content is rendered.
6.1.5 Document information dictionary
A document information dictionary may be present in a conforming file and a PDF/A-2 compliant reader shall
ignore it.
NOTE Metadata can be included in a document through the use of XMP metadata streams as specified in 6.6.3.
6.1.6 String objects
The number of hexadecimal digits in a hexadecimal string shall always be even.
NOTE This avoids the need for the provision in ISO 32000-1 about the absence of the final hexadecimal digit.
6 © ISO 2011 – All rights reserved
6.1.7 Stream objects
6.1.7.1 General
The stream keyword shall be followed either by a CARRIAGE RETURN (0Dh) and LINE FEED (0Ah)
character sequence or by a single LINE FEED (0Ah) character. The endstream keyword shall be preceded
by an EOL marker.
The value of the Length key specified in the stream dictionary shall match the number of bytes in the file
following the LINE FEED (0Ah) character after the stream keyword and preceding the EOL marker before the
endstream keyword.
A stream dictionary shall not contain the F, FFilter, or FDecodeParams keys.
NOTE 1 These keys are used to point to data external to the file. The explicit prohibition of these keys has the implicit
effect of disallowing external content that can create external dependencies and complicate preservation efforts.
NOTE 2 Since an inline image dictionary is not a stream object, this provision allows the presence of the F key in an
inline image dictionary as the abbreviation for Filter.
6.1.7.2 Filters
All standard stream filters listed in ISO 32000-1:2008, 7.4, Table 6 may be used, with the exception of
LZWDecode. In addition, the Crypt filter shall not be used unless the value of the Name key in the decode
parameters dictionary is Identity. Filters that are not listed in ISO 32000-1:2008, 7.4, Table 6 shall not be
used.
NOTE The Crypt filter is used to apply encryption and access control to the file.
6.1.8 Name objects
Font names, names of colourants in Separation and DeviceN colour spaces, and structure type names, after
expansion of character sequences escaped with a NUMBER SIGN (23h), if any, shall be valid UTF-8
character sequences.
These requirements make normative the recommendations set out in ISO 32000-1:2008, 7.3.5.
All other name objects should adhere to these same restrictions.
6.1.9 Indirect objects
The object number and generation number shall be separated by a single white-space character. The
generation number and obj keyword shall be separated by a single white-space character.
The object number and endobj keyword shall each be preceded by an EOL marker. The obj and endobj
keywords shall each be followed by an EOL marker.
6.1.10 Inline image dictionaries
The value of the F key in the Inline Image dictionary shall not be LZW, LZWDecode, Crypt, a value not listed
in ISO 32000-1:2008, Table 6, or an array containing any such value.
6.1.11 Linearized PDF
Linearization shall be permitted but any linearization information present within a file should be ignored by
conforming readers.
NOTE As defined in ISO 32000-1:2008, Annex F, a PDF is not linearized if the value of the L key in the linearization
dictionary does not match the actual length of the PDF file. This implies that an incremental update to a linearized PDF will
render it non-linearized.
6.1.12 Permissions
No keys other than UR3 and DocMDP shall be present in a permissions dictionary (ISO 32000-1:2008, 12.8.4,
Table 258). If DocMDP is present, then the Signature References dictionary (ISO 32000-1:2008, 12.8.1,
Table 253) shall not contain the keys DigestLocation, DigestMethod, and DigestValue.
NOTE These restrictions are present to ensure that functionality such as obsolete versions of the “User Rights”
dictionary do not appear in a document conforming to this part of ISO 19005.
6.1.13 Implementation limits
A conforming file shall not contain any integer greater than 2147483647.
A conforming file shall not contain any integer less than 2147483648.
A conforming file shall not contain any real number outside the range of ±3.403 x 10 .
–38
A conforming file shall not contain any real number closer to zero than ±1.175 x 10 .
A conforming file shall not contain any string longer than 32767 bytes.
A conforming file shall not contain any name longer than 127 bytes.
A conforming file shall not contain more than 8388607 indirect objects.
A conforming file shall not nest q/Q pairs by more than 28 nesting levels.
A conforming file shall not contain a DeviceN colour space with more than 32 colourants.
A conforming file shall not contain a CID value greater than 65535.
NOTE 1 These values are derived from ISO 32000-1:2008, Table C.1.
The size of any of the page boundaries described in ISO 32000-1:2008, 14.11.2 shall not be less than 3 units
in either direction, nor shall it be greater than 14 400 units in either direction.
This requirement makes normative a recommendation from ISO 32000-1:2008, C.2.
NOTE 2 By complying with these limits, a conforming file is compatible with the widest possible range of readers.
6.2 Graphics
6.2.1 General
Restrictions that shall be placed on both conforming files and readers with respect to the graphical elements
described in ISO 32000-1:2008, 7.8 are described in 6.2.2 to 6.2.11. A conforming reader shall render these
graphical elements onto their respective PDF pages according to the rendering requirements of ISO 32000-1
as modified by this part of ISO 19005.
A conforming interactive reader may put additional user interface elements around, above or below the
graphical elements of the page. These user interface elements may be a presentation of other PDF objects
(such as bookmarks or page thumbnails) or they may represent non-PDF objects. In all cases, the user
interface elements and their contents shall not be required to conform to the requirements of 6.2.2 to 6.2.11.
8 © ISO 2011 – All rights reserved
6.2.2 Content streams
Content streams shall not contain any operators not defined in ISO 32000-1 even if such operators are
bracketed by the BX/EX compatibility operators.
NOTE 1 In earlier versions of PDF, a PostScript operator PS was defined. As this operator is not defined in
ISO 32000-1, its use is implicitly prohibited by this clause.
NOTE 2 Content streams, as defined in ISO 32000-1:2008, 7.8.2, can be used for page descriptions, Form XObjects,
Type 1 Patterns, and Type 3 fonts, as well as for the appearances of annotations.
The use of the rendering intent operator (‘ri’) shall conform to the requirements of 6.2.6.
The use of the flatness operator (‘i’) shall conform to the requirements of 6.2.7.
A content stream that references other objects, such as images and fonts that are necessary to fully render or
process the stream, shall have an explicitly associated Resources dictionary as described in
ISO 32000-1:2008, 7.8.3. Any named resource present in the resources dictionary, but whose name is not
referenced from the associated content stream, is not used for rendering and therefore shall be exempt from
all requirements of this part of ISO 19005.
6.2.3 Output intent
A conforming file may specify the colour characteristics of the device on which it is intended to be rendered by
using a PDF/A OutputIntent. A PDF/A OutputIntent shall be identified as an OutputIntent dictionary, as
defined by ISO 32000-1:2008, 14.11.5, that is included in the file’s OutputIntents array. It shall have
GTS_PDFA1 as the value of its S key and a valid ICC profile stream as the value of its DestOutputProfile
key.
NOTE 1 PDF/A requires that an OutputIntent be present when uncalibrated colour spaces are used (see 6.2.4.3 for
more details). It has this requirement in order to ensure reliable rendering of colour through the indirect use of the
OutputIntent profile provided.
NOTE 2 The value for GTS_PDFA1 was maintained for this part of ISO 19005 to enable greater compatibility with
ISO 19005-1.
In addition, the DestOutputProfileRef key, as defined in ISO 15930-7:2010, Annex A, shall not be present in
any PDF/X OutputIntent.
NOTE 3 Disallowing the DestOutputProfileRef key maintains the intent of this part of ISO 19005 of ensuring self-
contained documents with no external references. However, it does mean that a single PDF is unable to be compliant
with both PDF/A-2 and PDF/X-4p.
If a file's OutputIntents array contains more than one entry, as might be the case where a file is compliant
with this part of ISO 19005 and at the same time with PDF/X-4 or PDF/E-1, then all entries that contain a
DestOutputProfile key shall have as the value of that key the same indirect object, which shall be a valid ICC
profile stream.
The profile stream that is the value of the DestOutputProfile key shall either be an output profile (Device
Class = “prtr”) or a monitor profile (Device Class = “mntr”). The profiles shall have a colour space of either
“GRAY”, “RGB”, or “CMYK”. If present in the DestOutputProfile stream object, the Alternate key shall be
ignored by a PDF/A-2 conforming reader.
6.2.4 Colour spaces
6.2.4.1 General
All colours shall be specified in a device-independent manner, either directly by the use of device-independent
colour spaces, or indirectly by the means of the DestOutputProfile in the PDF/A OutputIntent. A conforming
file may use any colour space specified in ISO 32000-1, except as restricted in 6.2.4.2 to 6.2.4.5.
NOTE Specifying colour in a device independent manner as described within 6.2.4 enables predictable colour
rendering based on a colorimetric definition and without reliance on heuristic assumptions or on information external to the
conforming file. It also provides a mechanism whereby a colorimetric definition can be associated with device-dependent
colour data.
6.2.4.2 ICCBased colour spaces
The profile that forms the stream of an ICCBased colour space shall conform to ICC.1:1998-09,
ICC.1:2001-12, ICC.1:2003-09 or ISO 15076-1.
NOTE 1 ISO 32000-1 allows the use of all versions of ICC profiles up to ICC.1:2003-09. For practical reasons based
on the behaviour of profile creation software, this part of ISO 19005 also allows the use of ISO 15076-1, which is believed
to be technically identical in all respects relevant to its use here, other than the value of the profile version number.
A conforming reader shall render ICCBased colour spaces as specified by ISO 32000-1 and the ICC
specification, and shall not use the Alternate colour space specified in an ICC profile stream dictionary.
Overprint mode (as set by the OPM value in an ExtGState dictionary) shall not be one (1) when an ICCBased
CMYK colour space is used and when overprinting for stroke or fill or both is set to true.
NOTE 2 This prohibition avoids unpredictable overprinting behaviour when overprint mode is 1 if implicit colour
conversion is applied as described in ISO 32000-1:2008, 8.6.7.
6.2.4.3 Uncalibrated/Device colour spaces
DeviceRGB shall only be used if a device independent DefaultRGB colour space has been set when the
DeviceRGB colour space is used, or if the file has a PDF/A OutputIntent that contains an RGB destination
profile.
DeviceCMYK shall only be used if a device independent DefaultCMYK colour space has been set or if a
DeviceN-based DefaultCMYK colour space has been set when the DeviceCMYK colour space is used or the
file has a PDF/A OutputIntent that contains a CMYK destination profile.
DeviceGray shall only be used if a device independent DefaultGray colour space has been set when the
DeviceGray colour space is used, or if a PDF/A OutputIntent is present.
NOTE 1 As described in ISO 32000-1:2008, 8.6.5.6, colours that are specified in a device colour space (DeviceGray,
DeviceRGB, or DeviceCMYK) are device dependent. By setting default colour spaces, a conforming writer can request
that such colours be systematically transformed (remapped) into device independent CIE-based colour spaces.
NOTE 2 A DeviceN-based DefaultCMYK colour space is subject to all provisions in 6.2.4.4, thus making it device
independent.
When rendering colours specified in DeviceRGB or DeviceCMYK, and no matching device independent
default colour space has been set, a conforming reader shall use the profile in the file’s PDF/A OutputIntent
dictionary as the source colour space.
When rendering colours specified in DeviceGray and no device independent DefaultGray colour space has
been set, a conforming reader shall render the DeviceGray colour as follows:
If the PDF/A OutputIntent contains a ‘GRAY’ destination profile, that profile shall be used as the source
colour space when rendering the colour.
10 © ISO 2011 – All rights reserved
If the PDF/A OutputIntent contains an ‘RGB’ destination profile, then the conforming reader shall convert
the DeviceGray colour to RGB by the method described in ISO 32000-1:2008, 10.3.2, and shall use the
RGB destination profile as the source colour space when rendering the colour.
If the PDF/A OutputIntent contains a ‘CMYK’ destination profile, then the conforming reader shall convert
the DeviceGray colour to CMYK by the method described in ISO 32000-1:2008, 10.3.3, and shall use the
CMYK destination profile as the source colour space when rendering the colour.
6.2.4.4 Separation and DeviceN colour spaces
If the named colourants in the colour space are all from the list Cyan, Magenta, Yellow, and Black, and if the
file has a PDF/A OutputIntent, and if that OutputIntent contains a CMYK destination profile, then a
conforming reader shall treat the colourants as components of the colour space specified by the destination
profile in the PDF/A OutputIntent dictionary, as defined in 6.2.3.
NOTE 1 All other aspects of rendering Separation colour spaces are described in ISO 32000-1:2008, 8.6.6.4.
NOTE 2 All other aspects of rendering DeviceN and NChannel colour spaces are described in ISO 32000-1:2008,
8.6.6.5.
The alternate space of a Separation or DeviceN colour space shall obey all restrictions on colour spaces
specified in 6.2.4.2 and 6.2.4.3.
For any spot colour used in a DeviceN or NChannel colour space, an entry in the Colorants dictionary shall
be present. Any Separation colour space which appears in a Colorant dictionary shall obey the same
restrictions as any other Separation colour space.
NOTE 3 Although the Colorant key is defined in ISO 32000-1 as optional in a DeviceN colour space attributes
dictionary, this requirement makes it mandatory for this part of ISO 19005.
All Separation arrays within a single PDF/A-2 file (including those in Colorants dictionaries) that have the
same name shall have the same tintTransform and alternateSpace. In evaluating equivalence, the PDF
objects shall be compared, rather than the computational result of the use of those PDF objects. Compression
and whether or not an object is direct or indirect shall be ignored.
NOTE 4 A PDF/A-2 writer might need to synchronize multiple alternateSpace and tintTransform entries when crea
...
МЕЖДУНАРОДНЫЙ ISO
СТАНДАРТ 19005-2
Первое издание
2011-07-01
Управление документами. Формат
файлов электронных документов для
долговременного сохранения.
Часть 2.
Использование ISO 32000-1 (PDF/A-2)
Document management – Electronic document file format for long-term
preservation –
Part 2: Use of ISO 32000-1 (PDF/A-2)
Ответственность за подготовку русской версии несѐт GOST R
(Российская Федерация) в соответствии со статьѐй 18.1 Устава ISO
Ссылочный номер
ISO 19004-2:2011(R)
©
ISO 2011
ДОКУМЕНТ ЗАЩИЩЕН АВТОРСКИМ ПРАВОМ
© ISO 2011
Все права сохраняются. Если не задано иначе, никакую часть настоящей публикации нельзя копировать или использовать в
какой-либо форме, или каким-либо электронным или механическим способом, включая фотокопии и микрофильмы, без
предварительного письменного согласия офиса ISO, находящемуся по указанному ниже адресу, или членов ISO в стране
регистрации пребывания
ISO copyright office
Case postale 56 CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Опубликовано в Швейцарии
ii © ISO 2011 – Все права сохраняются
Содержание Страница
Предисловие. iv
Введение . v
1 Область применения . 1
2 Нормативные ссылки . 1
3 Термины и определения . 2
4 Запись . 4
5 Уровни согласования . 5
5.1 Общие положения . 5
5.2 Согласование на уровне A. 5
5.3 Согласование на уровне B. 5
5.4 Согласование на уровне U. 6
5.5 Согласованные считывающие устройства . 6
6 Технические требования . 7
6.1 Структура файла . 7
6.2 Графические средства . 10
6.3 Аннотации . 20
6.4 Интерактивные формы . 21
6.5 Действие . 22
6.6 Метаданные . 22
6.7 Логическая структура . 28
6.8 Вложенные файлы . 30
6.9 Необязательное содержание . 31
6.10 Использование альтернативных презентаций и переходов . 32
6.11 Требования к документу . 32
Приложение A (нормативное) Метод для определения прозрачности на странице . 33
Приложение B (нормативное) Требования для цифровых подписей в PDF/A . 35
Приложение C (информативное) Наилучшие осуществления на практике для PDF/A . 36
Приложение D (информативное) Включение наборов данных XFA в согласованный файл
PDF/A-2 . 38
Библиография . 39
Предисловие
Международная организация по стандартизации (ISO) является всемирной федерацией национальных
организаций по стандартизации (комитетов-членов ISO). Разработка международных стандартов
обычно осуществляется техническими комитетами ISO. Каждый комитет-член, заинтересованный в
деятельности, для которой был создан технический комитет, имеет право быть представленным в этом
комитете. Международные правительственные и неправительственные организации, имеющие связи с
ISO, также принимают участие в работах. Что касается стандартизации в области электротехники, то
ISO работает в тесном сотрудничестве с Международной электротехнической комиссией (IEC).
Проекты международных стандартов разрабатываются в соответствии с правилами Директив ISO/IEC,
часть 2.
Основной задачей технических комитетов является подготовка международных стандартов. Проекты
международных стандартов, принятые техническими комитетами, рассылаются комитетам-членам на
голосование. Их опубликование в качестве международных стандартов требует одобрения не менее
75% комитетов-членов, принимающих участие в голосовании.
Следует иметь в виду, что некоторые элементы настоящего международного стандарта могут быть
объектом патентных прав. Международная организация по стандартизации не может нести
ответственность за идентификацию какого-либо одного или всех патентных прав.
ISO 19005-2 подготовил Технический комитет ISO/TC 171 Прикладные программы управления
документооборотом, подкомитет SC 2, Вопросы приложения, совместно с ISO/NC 130, Графическая
технология, ISO/TC 42, Фотография, и ISO/TC 46, Информация и документация, подкомитет SC 11,
Управление архивами/документооборотом, в общей рабочей группе
ISO 19005 состоит из следующих частей под общим заголовком Управление документами . Формат
файлов электронных документов для долговременного сохранения.
Часть 1. Использование PDF 1.4 (PDF/A-1)
Часть 2. Использование ISO 32000-1 (PDF/A-2)
Следующая часть подготавливается:
Часть 3. Использование ISO 32000-1 с поддержкой для вложенных файлов (PDF/A-3)
iv © ISO 2011 – Все права сохраняются
Введение
PDF является цифровым форматом для представления документов. Файлы PDF могут быть созданы в
собственном формате PDF, преобразованы из других электронных форматов или оцифрованы из
бумажного носителя информации. Бизнес, правительственные органы, библиотеки, архивы, другие
институты и отдельные люди по всему миру используют PDF, чтобы представлять значительные
объемы важной информации. Многое из этой информации необходимо держать в течение
продолжительных периодов времени, а некоторая информация нуждается в постоянном сохранении.
Эти PDF- файлы нужно оставлять для использования и доступа на протяжении многочисленных
поколений технологии. Однако исключительная, полнофункциональная природа формата требует
введения ограничений на его использование, чтобы сделать формат подходящим для
долговременного сохранения электронных документов. Будущее использование и доступ к этим
объектам зависит от поддержания их зрительного внешнего вида, а также свойств высокого порядка,
например, логической организации страниц, разделов и параграфов, машинно-восстанавливаемого
текстового потока в естественный читаемый порядок и административных, предохранительных и
описательных метаданных.
ISO 19005 был создан как документ, состоящий из нескольких частей, в котором настоящий стандарт
является второй частью. Это позволяет создавать будущие части без визуализации ISO 19005 или
выводить из употребления прикладные программы на его основе.
Первичное назначение ISO 19005 заключается в том, чтобы определить формат файла на основе PDF,
известном как PDF/A, который дает механизм для представления электронных документов в манере,
предохраняющей их статический визуальный внешний вид на протяжении времени, независимо от
инструментов и систем, используемых для создания, хранения или визуализации файлов.
Вторичное назначение ISO 19005 – это определить каркас для представления логической структуры и
другой семантической информации электронных документов в пределах согласованных файлов.
Другая цель ISO 19005 – предоставить структуру для записи контекста и истории электронных
документов в метаданные в пределах согласованных файлов.
Эти назначения и цели достигаются путем идентификации набора PDF – компонентов, которые могут
быть использованы, и ограничений на форму их использования в пределах согласованных файлов
PDF/A.
Сам по себе, PDF/A не обязательно гарантирует, что визуальный внешний вид содержания правильно
отражает любой материал первоначального источника, который был использован, чтобы создать
согласованный файл. Например, процесс, использованный для создания согласованного файла,
может заменять шрифты, переформатировать текст, снижать скорость выборки изображений или
использовать сжатие информации с потерями. Организации, которым нужна гарантия, что
согласованный файл является правильным представлением материала первоначального источника,
могут хотеть наложить дополнительные требования. К ним, например, можно отнести наилучшие
практические решения в Приложении C, для процессов, которые генерируют согласованный файл,
помимо тех файлов, которые предусмотрены настоящей частью ISO 19005. В дополнение, весьма
важно для упомянутых организаций, применять линии поведения и практические решения в отношении
инспекции согласованных файлов для правильного визуального внешнего вида.
PDF/A не обращается прямо к теме аутентичности либо для базового содержания, которое должно
быть визуально представлено, либо для самого файла PDF/A. Такая аутентичность обычно считается
важной для законных, регулирующих и управляющий целей и выходят за область применения
настоящего международного стандарта.
Настоящая часть ISO 19005 является одним компонентом электронной архивной окружающей среды
организации для долгосрочного удерживания документов. Успешное применение настоящей части ISO
19005 для архивных целей зависит от следующего:
требований к сохранению архивной окружающей среды организации, политики и методов
управления документами, как задано в ISO 15489-1;
любых дополнительных требований и условий, необходимых для обеспечения стойкости
электронных документов и их характеристик со временем, включая без дальнейшего ограничения
те требования и условия, которые определены в ISO 14721, ISO/TR 15801 и ISO/TR 18492;
процессов обеспечения качества, которые необходимы для проверки соответствия с
приемлемыми требованиями и условиями, например, режим инспекции, чтобы проверить качество
и целостность преобразованных данных источника.
Настоящая часть ISO 19005 предназначается для того, чтобы вести к разработке разных прикладных
программ, которые считывают, визуализируют, записывают и определяют достоверность
согласованных файлов. Разные приложения будут включать разнообразные возможности для
подготовки, интерпретации и обработки согласованных файлов на основе тех потребностей, как они
воспринимаются поставщиками упомянутых прикладных программ. Однако важно заметить, что
согласованное приложение нуждается в способности читать и обрабатывать подходящим образом все
файлы, адекватные с заданным уровнем согласования.
Настоящая часть ISO 19005 расширяет возможности ISO 19005-1. Она базируется на PDF версии 1.7
(как определено в ISO 32000-1), а не на PDF версии 1.4 (которая используется в качестве базиса
ISO 19005-1). Эти дополнительные возможности обеспечивают сквозное соответствие с ISO 32000-1 и
включают
улучшения в помеченном тегами PDF (для усиления доступности),
сжатый объект и потоки XRef (для файлов меньших размеров),
PDF/A-податливые файловые приставки, переносимые коллекции и PDF пакеты,
прозрачность и
компрессию JPEG 2000.
Настоящая часть ISO 19005 (в соединении с ее нормативными ссылками) обеспечивает достаточную
информацию, чтобы интерпретировать любой согласованный файл PDF/A-2.
Организации NPES and AIIM (аккредитованная организация по разработке стандартов) поддерживают
текущую последовательность примечаний прикладных программ для ориентирования разработчиков и
пользователей ISO 19005. Эти примечания являются доступными на
и
A/ISO19005AppNotes.pdf>. Обе организации, NPES и AIIM, также сохраняют копии специфических
нормативных ссылок, не относящихся к ISO, на эту часть ISO 19005, которые являются
общедоступными электронными документами.
vi © ISO 2011 – Все права сохраняются
МЕЖДУНАРОДНЫЙ СТАНДАРТ ISO 19005:2011(R)
Управление документами. Формат файлов электронных
документов для долговременного сохранения.
Часть 2.
Использование ISO 32000-1 (PDF/A-2)
1 Область применения
Настоящая часть ISO 19005 задает использование Формата переносимого документа (Portable
Document Format - PDF) версии 1.7, в качестве формализованного в ISO 32000-1, для сохранения в
течение длительного времени статического визуального представления электронных документов на
постраничной основе.
Настоящая часть ISO 19005 не применяется к
специальным процессам для преобразования документов на бумажном носителе или электронных
документов в формат PDF/A,
специальному техническому проекту, интерфейсу пользователя, реализации или операционным
подробностям визуализации,
специальным физическим методам хранения этих документов, например, режим среды передачи
данных и запоминания, или
необходимой вычислительной технике и/или операционным системам.
2 Нормативные ссылки
Следующие ссылочные документы являются обязательными для применения настоящего документа.
Для устаревших ссылок применяется только цитируемое издание. Для недатированных ссылок
применяется самое последнее издание ссылочного документа (включая поправки).
ISO/IEC 646, Информационные технологии. 7-битный набор кодированных символов для
1)
информационного обмена
2)
ISO/IEC 10646, Информационные технологии. Универсальный набор кодированных символов (UCS)
ISO 15076-1, Регулирование цвета в технологии изображений. Архитектура, формат профиля и
структура данных. Часть 1. На основе международного консорциума по средствам обработки
цветных изображений (ICC.1:2010)
ISO/IEC 15444-2:2004, Информационные технологии. Система кодирования изображений JPEG 2000:
Расширения
ISO 15930-7:2010, Графическая технология. Обмен цифровыми данным при подготовке к печати с
использованием PDF. Часть 7. Полный (PDF/X-4) и частичный обмен печатными данными с
обращением к внешнему профилю (PDF/X-4p, используя PDF 1.6.
1) Кодирование символов, определенное в ISO/IEC 646, является эквивалентом ANSI X3.4 (ASCII) и ECMA-6.
2) Значения кодов символов, определенные в ISO/IEC 10646, эквивалентны значениям уникода (16-битного
стандарта кодирования символов).
ISO 19005-1, Управление документами. Формат файла электронного документа для
долговременного сохранения. Часть 1. Использование PDF 1.4 (PDF/A-1)
ISO 24517-1, Управление документами. Формат инженерно-технических документов с
использованием PDF. Часть 1. Использование PDF 1.6 (PDF/E-1)
ISO 32000-1:2008, Управление документами. Формат переносимого документа. Часть 1. PDF 1.7
Расширяемая спецификация языка (язык XML) 1.0 (Третье издание), Рекомендация W3C, 4 февраля
2004. Документ доступен из
ICC.1:1998-09, Формат файла для профилей цвета, Международный консорциум по средствам
обработки цветных изображений. Документ доступен из
ICC.1:2001-12, Формат файла для профилей цвета (Версия 4.0.0), Международный консорциум по
средствам обработки цветных изображений. Документ доступен из
ICC.1:2003-09, Формат файла для профилей цвета (Версия 4.1.0), Международный консорциум по
средствам обработки цветных изображений. Документ доступен из
Пересмотренная спецификация синтаксиса RDF/XML. Рекомендация W3C, 10 февраля 2004.
Документ доступен из
RFC 2315, PKCS#7: Синтаксис криптографических сообщений, версия 1.5. Документ доступен из
http://www.rfc-editor.org
RFC 3280, Сертификат инфраструктуры открытого ключа Интернет X.509 и профиль списка
отмены сертификатов (CRL). Документ доступен из http://www.rfc-editor.org
Список глифов фирмы Adobe, 20 сентября 2002, Adobe Systems Incorporated. Документ доступен из
Дополнение фирмы Adobe к ISO 32000-1, Основная версия 1.7, Уровень расширения 5, Adobe Systems
Incorporated. Документ доступен
3 Термины и определения
В настоящем документе применяются следующие термины и определения.
3.1
уровень согласования
conformance level
идентифицированный набор ограничений и требований, которые файлы и считывающие устройства
должны исполнять
3.2
электронный документ
electronic document
электронное представление постранично ориентированного агрегирования текста, изображений,
графических данных и метаданных, полезных для идентификации и понимания тех данных, которые
могут быть воспроизведены на бумаге или других подложках, а также визуализированы электронным
образом на устройствах отображения без значимых потерь их информационного содержания
3.3
маркер конца файла
end-of-file marker
последовательность пяти символов, (%%EOF), обозначающая конец PDF – файла.
2 © ISO 2011 – Все права сохраняются
3.4
маркер EOL
маркер конца строки
EOL marker
end-of-line marker
последовательность одного или двух символов, обозначающая конец строки, состоящая из символа
ВОЗВРАТ КАРЕТКИ (CARRIAGE RETURN) (0Dh) или символа ПЕРЕВОД СТРОКИ (LINE FEED) (0Ah)
или ВОЗВРАТ КАРЕТКИ (CARRIAGE RETURN), за которым сразу следует ПЕРЕВОД СТРОКИ (LINE
FEED)
3.5
схема расширения
extension schema
согласованная схема XMP (протокола управления консорциума X/Open), которая не определяется ни в
спецификации XMP, ни в ISO 19005-1 или ISO 19005-2
3.6
шрифт
font
идентифицированная коллекция графических средств, которые могут быть рельефными
изображениями (глифами) или другими графическими элементами
[ISO 32000-1]
3.7
шрифтовая программа
font program
программное обеспечение, написанное на языке специального назначения, например, Type 1,
TrueType, или формат шрифта OpenType, которое понимает специализированный интерпретатор
шрифта
[ISO 32000-1]
3.8
интерактивное считывающее устройство
nteractive reader
считывающее устройство, которое требует или разрешает взаимодействие человека с содержанием
или другими объектами, находящимися в документе, во время фазы обработки программного
обеспечения
ПРИМЕЧАНИЕ Средство просмотра файла является примером интерактивного считывающего устройства;
устройство для растрового сканирования изображения и записи битовой карты является примером считывающего
устройства, которое не является интерактивным.
3.9
согласование уровня A
Level A conformance
уровень согласования, выполняющий все требования настоящей части ISO 19005
3.10
согласование уровня B
Level B conformance
уровень согласования, выполняющий все требования настоящей части ISO 19005, касающиеся
визуального внешнего вида электронных документов, кроме требования, которое касается структурных
и семантических свойств, и требования, по которому весь текст имеет эквиваленты уникода
3.11
согласование уровня U
Level U conformance
уровень согласования, выполняющий требования настоящей части ISO 19005, касающиеся
визуального внешнего вида электронных документов, вместе с требованием, по которому весь текст в
документе имеет эквиваленты уникода
3.12
длительный срок
long term
период времени, достаточно длительный для беспокойства о воздействиях на информацию,
удерживаемую в хранилище меняющихся технологий, включая поддержку для форматов новых
носителей и данных, изменения сообщества пользователей, и который может быть растянут в
неопределенное будущее
3.13
Формат переносимого документа
PDF
Portable Document Format
формат файла, определенного в ISO 32000-1:2008
3.14
считывающее устройство
reader
приложение программного обеспечения, которое способно читать и обрабатывать файлы PDF/A
3.15
записывающее устройство
writer
приложение программного обеспечения, которое способно записывать файлы PDF/A
3.16
пакет XMP (протокола управления консорциума X/Open)
XMP packet
структурированный упаковщик для преобразованных в последовательную форму метаданных XMP,
которые могут быть вложены в PDF, а также другие форматы файлов
4 Запись
Операторы PDF, ключевые слова PDF, названия ключей в словарях PDF и другие предпочтительные
названия записаны полужирным, без засечек шрифтом; компоненты операций PDF или значения
словарных ключей записаны курсивным, без засечек шрифтом. Некоторые имена могут быть также
использованы как значения в зависимости от контекста, и таким образом стиль содержания будет
зависимым от контекста.
ПРИМЕР 1 Значение по умолчанию (Default) для ключа TR2.
Символы маркера, использованные для того, чтобы определять границы объектов и характеризовать
структуру файлов PDF, как определено в ISO 32000-1:2008, 7.2.1, могут быть идентифицированы по их
имени символа ISO/IEC 646. Это имя символа записывается в верхнем регистре полужирным, без
засечек шрифтом и за ним следует значение заключенного в скобки, двузначного шестнадцатеричного
кода символа с суффиксом ―h‖.
ПРИМЕР 2 ВОЗВРАТ КАРЕТКИ (CARRIAGE RETURN) (0Dh).
Символы текстовой строки, как определено в ISO 32000-1:2008, 7.9.2, могут быть идентифицированы
по их имени символа ISO/IEC 10646, записанному в верхнем регистре полужирным, без засечек
шрифтом, за которым следует значение заключенного в скобки, четырехзначного шестнадцатеричного
кода символа с префиксом ―U+‖.
ПРИМЕР 3 Узкий [нормальный] пробел (EN SPACE) (U+2002).
4 © ISO 2011 – Все права сохраняются
Следующие выражения, ссылающиеся на ISO 19005 или его части, рекомендуются, когда не
используется полное имя ISO:
―PDF/A‖ – синоним для ряда стандартов ISO 19005;
―PDF/A-1‖ – синоним для ISO 19005-1;
―PDF/A-1a‖ – синоним для согласования уровня A ISO 19005-1;
―PDF/A-1b‖ – синоним для согласования уровня B ISO 19005-1;.
―PDF/A-2‖ – синоним для ISO 19005-2;
―PDF/A-2a‖ – синоним для согласования уровня A ISO 19005-2;
―PDF/A-2b‖ – синоним для согласования уровня B ISO 19005-2;
―PDF/A-2u‖ – синоним для согласования уровня U ISO 19005-2.
5 Уровни согласования
5.1 Общие положения
Настоящая часть ISO 19005 определяет формат файла для представления электронных документов,
известных как ―PDF/A-2‖. Согласованные файлы PDF/A-2 должны оставаться верными всем
требованиям ISO 32000-1, которые видоизменены настоящей частью ISO 19005. Согласованный файл
может включать любую действительную особенность ISO 32000-1, которая явно не запрещается
настоящей частью ISO 19005. Не следует использовать особенности, изложенные в технических
условиях PDF до версии 1.7 , которые явно не характеризуются в ISO 32000-1.
ПРИМЕЧАНИЕ 1 Согласованный файл не обязан использовать любую особенность PDF, которая является
другой, чем те особенности, явно требуемые ISO 32000-1 или этой частью ISO 19005.
Как изложено в 6.1.2, номер версии файла может быть любым значением от 1.0 до 1.7, и
определенное значение не должно быть использовано для того, чтобы установить, согласован ли
файл с настоящей частью ISO 19005.
ПРИМЕЧАНИЕ 2 Описание присущего механизма, с помощью которого файл может гипотетически
идентифицировать себя в качестве файла PDF/A-2 заданного уровня согласования, дается в 6.6.4.
5.2 Согласование на уровне A
Файлы, согласованные на уровне A, должны оставаться верными всем требованиям настоящей части
ISO 19005. О файле, отвечающем этому уровню согласования, говорят, что он считается
―согласованным файлом PDF/A-2a‖.
5.3 Согласование на уровне B
В осознании разных предохранительных потребностей разнообразных сообществ пользователей,
использующих PDF – файлы, настоящая часть ISO 19005 определяет согласование на уровне B.
Файлы, согласованные на уровне B, , должны оставаться верными всем требованиям настоящей части
ISO 19005, за исключением требований в 6.2.11.7 и 6.7. О файле, отвечающем этому уровню
согласования, говорят, что он считается ―согласованным файлом PDF/A-2b‖.
ПРИМЕЧАНИЕ 1 Требования согласования уровня B предполагаются минимально необходимыми для гарантии,
что тонированный визуальный внешний вид согласованного файла является сохраняемым в течение длительного
срока. Однако согласованные файлы уровня B могут не иметь достаточно обогащенную внутреннюю информацию,
чтобы предусматривать сохранение логической структуры документа и поток текста содержания в порядке
естественного чтения, который обеспечивается согласованием на уровне A. Требования для соответствия уровня
A предъявляют большие обязательства к читателям согласованных файлов, а также к тем людям, кто готовит
такие файлы. Но эти требования предусматривают более высокий уровень службы хранения документов и
доверия со временем. Дополнительно, согласование уровня A облегчает доступность согласованных файлов для
пользователей с физическими недостатками.
ПРИМЕЧАНИЕ 2 Согласованный файл уровня B может включать особенности из 6.2.11.7 и 6.7, но все еще будет
идентифицирован как файл на уровне B.
5.4 Согласование на уровне U
В осознании разных предохранительных потребностей разнообразных сообществ пользователей,
использующих PDF–файлы, настоящая часть ISO 19005 определяет согласование на уровне U. Файлы,
согласованные на уровне U, должны оставаться верными всем требованиям настоящей части
ISO 19005, за исключением требований в 6.7. О файле, отвечающем этому уровню согласования,
говорят, что он считается ―согласованным файлом PDF/A-2u‖.
ПРИМЕЧАНИЕ 1 Требования согласования уровня U предполагаются такие, которые необходимы для гарантии,
что тонированный визуальный внешний вид согласованного файла является сохраняемым в течение длительного
срока, но что любой текст, содержащийся в документе, может быть легко извлечен как последовательность
кодовых точек уникода. Однако согласованные файлы уровня U могут не иметь достаточно обогащенную
внутреннюю информацию, чтобы предусматривать сохранение логической структуры документа и поток текста
содержания в порядке естественного чтения, который обеспечивается согласованием на уровне A. Требования
для соответствия уровня A предъявляют большие обязательства к читателям согласованных файлов, а также к
тем людям, кто готовит такие файлы, но эти требования предусматривают более высокий уровень службы
хранения документов и доверия со временем. Дополнительно, согласование уровня A облегчает доступность
согласованных файлов для пользователей с физическими недостатками.
ПРИМЕЧАНИЕ 2 Согласованные файлы уровня U могут включать особенности из 6.7, но все еще будут
идентифицированы как файл уровня U.
ПРИМЕЧАНИЕ 3 Уровень U является новым в этой части ISO 19005 и поэтому не имеет эквивалента в
ISO 19005-1.
5.5 Согласованные считывающие устройства
Согласованное считывающее устройство должно соответствовать всем требованиям, касающимся
функционального поведения считывателя, которое задано в этой части ISO 19005. Требования этой
части ISO 19005 в отношении поведения считывателя заявлены в терминах общих функциональных
требований, применимых ко всем согласованным считывающим устройствам. Настоящая часть
ISO 19005 не предписывает какой-либо специфический технический замысел, интерфейс
пользователя или подробности реализации согласованных считывающих устройств.
Визуализация и другая обработка согласованных файлов должна быть выполнена, как определено в
ISO 32000-1, при условии дополнительных ограничений, заданных настоящей частью ISO 19005.
Особенности, изложенные в технических условиях PDF, которые явно не характеризуются в
ISO 32000-1, должны быть игнорированы согласованными считывающими устройствами.
Согласованные считывающие устройства PDF/A-2 должны читать и обрабатывать все файлы PDF/A-2.
Кроме того, согласованные считыватели PDF/A-2 должны читать и обрабатывать подходящим образом
все файла PDF/A-1, как определено в ISO 19005-1.
6 © ISO 2011 – Все права сохраняются
6 Технические требования
6.1 Структура файла
6.1.1 Общие положения
Всесторонние вопросы формата файла и основные элементы, которые образуют общую структуру
согласованного файла, рассматриваются в 6.1.2 – 6.1.12.
Любые данные, содержащиеся в согласованном файле, описание которых не дается в ISO 32000-1 или
в настоящей части ISO 19005, согласованному считывателю следует игнорировать и они не должны
быть использованы, чтобы визуализировать содержание страницы.
6.1.2 Заголовок файла
Заголовок файла должен начинаться с байтового нуля и должен состоять из ―%PDF-1.n‖, за которым
следует единичный маркер EOL (конец строки) в случае, когда ‗n‘ является одним однозначным числом
между 0 (30h) и 7 (37h).
За упомянутым выше маркером EOL должен сразу следовать символ % (25h), а за ним – по меньшей
мере, четыре байта. Каждое из значений этих кодированных байтов должно иметь десятичное
значение больше чем 127.
ПРИМЕЧАНИЕ Присутствие значений кодированных байтов больше чем десятичное число 127 вблизи начала
файла используется разными средствами программного обеспечения и протоколами, чтобы классифицировать
файл как содержащий 8-битные двоичные данные, которые нужно предохранять в течение обработки.
6.1.3 Завершитель файла
Словарь завершителя файла должен содержать ключевое слово ID, чье значение должно быть File
Identifiers (Идентификаторы файла), как определено в ISO 32000-1:2008, 14.4.
ПРИМЕЧАНИЕ 1 Никакие данные не могут следовать за последним маркером конца строки (end-of-file marker),
кроме единичного необязательного маркера конца строки согласно описанию в ISO 32000-1:2008, 7.5.5.
Ключевое слово Encrypt (Шифровать) не должно присутствовать в словаре завершителя.
ПРИМЕЧАНИЕ 2 Явный запрет ключа Encrypt оказывает неявное влияние на запрет шифрования и разрешения
доступа, защищенного паролем.
6.1.4 Таблица перекрестных ссылок
Ключевое слово xref и заголовок подраздела перекрестных ссылок должны быть отделены друг от
друга единичным маркером EOL.
Любой косвенный объект, чье смещение не указывается ссылкой ни в какой-либо таблице
перекрестных ссылок, ни каком-либо потоке перекрестных ссылок, должен быть исключен из всех
требований настоящей части ISO 19005 и он может быть игнорирован согласованным считывающим
устройством. Если считыватель не игнорирует такие косвенные объекты, то они никогда не должны
влиять на способ визуализации содержания.
6.1.5 Словарь с документальной информацией
Словарь с информацией о документах может присутствовать в согласованном файле и считывающее
устройство, соответствующее PDF/A, должно его игнорировать.
ПРИМЕЧАНИЕ Метаданные могут быть включены в документ через использование потоков метаданных
протокола XMP, как задано в 6.6.3.
6.1.6 Объекты строки
Число шестнадцатеричных цифр в шестнадцатеричной строке должно быть всегда четное.
ПРИМЕЧАНИЕ Это устраняет необходимость условия в ISO 32000-1 об отсутствии конечного
шестнадцатеричного однозначного числа.
6.1.7 Объекты потока
6.1.7.1 Общие положения
За ключевым словом поток (stream) должна следовать последовательность символов либо ВОЗВРАТ
КАРЕТКИ (CARRIAGE RETURN) (0Dh) и ПЕРЕВОД СТРОКИ (LINE FEED) (0Ah), либо единичный
символ (ПЕРЕВОД СТРОКИ) LINE FEED (0Ah). Ключевое слово конец потока (endstream) должно
упреждаться маркером EOL.
Значение ключа Длина (Length), заданное в словаре потока, должно совпадать с числом байтов в
файле вслед за символом перевода строки LINE FEED (0Ah) после ключевого слова поток (stream) и
предшествуя маркеру конца строки EOL перед ключевым словом конца потока endstream
Словарь потока не должен содержать ключи F, FFilter или FDecodeParams.
ПРИМЕЧАНИЕ 1 Эти ключи используются, чтобы указывать на данные, внешние к файлу. Неявный запрет этих
ключей оказывает явное влияние на запрет внешнего содержания, которое может создавать внешние зависимости
и усложнять усилия предохранения.
ПРИМЕЧАНИЕ 2 Так как словарь внутристрочного изображения не является объектом потока, то это условие
допускает присутствие ключа F в словаре внутристрочного изображения в качестве сокращения для фильтра
(Filter).
6.1.7.2 Фильтры
Все стандартные фильтры потока, перечисленные в ISO 32000-1:2008, 7.4, Таблица 6, могут быть
использованы за исключением LZWDecode. Дополнительно, фильтр Crypt не должен быть
использован, если значение ключа Имя (Name) в словаре декодирующих параметров не есть Identity.
Фильтры, которые не перечисляются в ISO 32000-1:2008, 7.4, Таблица 6, не должны применяться.
ПРИМЕЧАНИЕ Фильтр Crypt используется для применения шифрования и управления доступом к
определенному файлу.
6.1.8 Объекты имен
Имена шрифтов, имена красителей в цветовых пространствах Separation (разделение) и DeviceN
(устройство N) и имена типов структуры, после расширения последовательностей символов,
переключенных со знаком числа NUMBER SIGN (23h), при наличии, должны быть действительными
последовательностями символов UTF-8 (8-битный формат преобразования уникода).
Эти требования делают нормативными рекомендации, четко изложенные ISO 32000-1:2008, 7.3.5.
Рекомендуется, чтобы все другие объекты имен придерживались этих тех же самых ограничений
6.1.9 Косвенные объекты
Номер объекта и номер поколения должны быть отделены единичным разделителем. Номер
поколения и ключевое слово obj должны быть отделены единичным разделителем.
Номер объекта и ключевое слову endobj должно быть каждое упреждено маркером EOL. За каждым
ключом obj и endobj должен следовать маркер конца строки EOL.
8 © ISO 2011 – Все права сохраняются
6.1.10 Словари внутристрочного изображения
Значение ключа F в словаре внутристрочного изображения не должно быть LZW, LZWDecode, Crypt,
значением, не перечисленным в ISO 32000-1:2008, Таблица 6, или матрицей, содержащей любое такое
значение.
6.1.11 Линеаризованный PDF
Линеаризация должна быть разрешена, но любую информацию о линеаризации, присутствующую в
пределах файла, согласованным считывателям рекомендуется игнорировать.
ПРИМЕЧАНИЕ Как определено в ISO 32000-1:2008, Приложение F, PDF не является линеаризованным, если
значение ключа L в словаре линеаризации не совпадает с действительной длиной файла PDF. Это предполагает,
что пошаговое обновление в линеаризованном PDF будет представлять его не линеаризованным.
6.1.12 Полномочия
Никакие другие ключи кроме UR3 и DocMDP не должны присутствовать в словаре полномочий
(ISO 32000-1:2008, 12.8.4, Таблица 258). Если DocMDP присутствует, тогда словарь сигнатурных
ссылок Signature References (ISO 32000-1:2008, 12.8.1, Таблица 253) не должен содержать ключи
DigestLocation, DigestMethod и DigestValue.
ПРИМЕЧАНИЕ Эти ограничения присутствуют для гарантии, что функциональность, например, устаревшие
версии словаря прав пользователей ―User Rights‖, не появляется в документе, согласованном с этой частью
ISO 19005.
6.1.13 Пределы реализации
Согласованный файл не должен содержать любое целое число больше чем 2147483647.
Согласованный файл не должен содержать любое целое число меньше чем 2147483648.
Согласованный файл не должен содержать вещественное число вне диапазона ±3.403 x 10 .
–38
Согласованный файл не должен содержать любое вещественное число ближе к нулю, чем ±1.175 x 10 .
Согласованный файл не должен содержать любую строку длиннее 32767 байтов.
Согласованный файл не должен содержать любое имя длиннее 127 байтов.
Согласованный файл не должен содержать больше чем 8388607 косвенных объектов.
Согласованный файл не должен вкладывать пары (q/Q pairs) на более чем 28 уровнях вложенности.
Согласованный файл не должен содержать цветовое пространство DeviceN с более чем 32 красителями.
Согласованный файл не должен содержать значение CID (идентификатор клиента) больше чем 65535.
ПРИМЕЧАНИЕ 1 Эти значения извлечены из ISO 32000-1:2008, Таблица C.1.
Размер любой из страничных границ, описанных в ISO 32000-1:2008, 14.11.2, не должен быть меньше
чем 3 единицы измерения в любом из двух направлений, также он не должен быть больше чем 14 400
единиц измерения в любом из двух направлений.
Это требование делает нормативной рекомендацию из ISO 32000-1:2008, C.2.
ПРИМЕЧАНИЕ 2 За счет согласования с этими пределами, согласованный файл является совместимым с
самым широким возможным рядом считывающих устройств.
6.2 Графические средства
6.2.1 Общие положения
Ограничения, которые должны быть наложены на согласованные файлы и считывающие устройства в
отношении графических элементов, характеризуемых в ISO 32000-1:2008, 7.8, излагаются в 6.2.2 –
6.2.11. Согласованный считыватель должен визуализировать эти графические элементы в их
соответствующие страницы PDF согласно требованиям визуализации ISO 32000-1, как они
видоизменены в настоящей части ISO 19005.
Согласованный интерактивный считыватель может положить дополнительные элементы
пользовательского интерфейса вокруг, над или под графическими элементами страницы. Эти
элементы пользовательского интерфейса могут быть представлением других объектов PDF
(например, закладками или набросками страниц) или они могут представлять объекты не PDF. Во всех
случаях, к элементам пользовательского интерфейса и их содержаниям не должно предъявляться
требование соответствовать требованиям 6.2.2 – 6.2.11.
6.2.2 Потоки содержимого
Потоки содержимого не должны содержать какие-либо операторы, не определенные в ISO 32000-1,
даже если такие операторы заключены в скобках операторами совместимости BX/EX.
ПРИМЕЧАНИЕ 1 В более ранних версиях PDF был определен PostScript - оператор PS. Так как этот оператор не
определяется в ISO 32000-1, то его использование неявно запрещается этим параграфом.
ПРИМЕЧАНИЕ 2 Потоки содержимого, как определено в ISO 32000-1:2008, 7.8.2, могут быть использованы для
описания страниц, Form XObjects, Type 1 Patterns и шрифтов Type 3, а также для внешних видов аннотаций.
Использование визуализации оператора замысла (‗ri‘) должно соответствовать требованиям 6.2.6.
Использование оператора плоскостности (‗i‘) должно соответствовать требованиям 6.2.7.
Поток содержимого, который снабжает ссылками другие объекты, например, изображения и шрифты,
которые необходимы, чтобы полностью визуализировать или обработать поток, должны иметь словарь
явно ассоциированных ресурсов (Resources) согласно описанию в ISO 32000-1:2008, 7.8.3. Любой
поименованный ресурс присутствует в словаре ресурсов, но их имя не снабжается ссылками из
ассоциированного потока содержимого, не используется для визуализации и поэтому должно быть
исключено из всех требований настоящей части ISO 19005.
6.2.3 Замысел печатного процесса
Согласованный файл может задавать цветные характеристики устройства, на котором замышляется
их визуализировать, используя профиль печатного процесса PDF/A OutputIntent. A PDF/A OutputIntent
должен быть идентифицирован как словарь OutputIntent согласно определению в ISO 32000-1:2008,
14.11.5, который включается в матрицу профилей печатных процессов (OutputIntents) файла. Он
должен иметь GTS_PDFA1 в качестве значения его ключа S и поток действительного профиля ICC в
качестве значения его ключа DestOutputProfile.
ПРИМЕЧАНИЕ 1 PDF/A требует присутствия замысла печатного процесса OutputIntent при использовании
некалиброванных цветовых пространств (подробности смотрите в 6.2.4.3). Он имеет это требование, чтобы
гарантировать надежную визуализацию цвета через косвенное использование предоставленного профиля
печатного процесса OutputIntent.
ПРИМЕЧАНИЕ 2 Значение для GTS_PDFA1 было поддержано для этой части ISO 19005, чтобы разрешить
большую совместимость с ISO 19005-1.
Дополнительно, ключ DestOutputProfileRef, как определено в ISO 15930-7:2010, Приложение A, не
должен присутствовать в любом профиле печати PDF/X OutputIntent.
10 © ISO 2011 – Все права сохраняются
ПРИМЕЧАНИЕ 3 Отказ от ключа DestOutputProfileRef поддерживает замысел этой части ISO 19005 по
обеспечению независимых документов без внешних ссылок. Однако это не означает, что одиночный PDF не
является способным, чтобы быть согласованным как с PDF/A-2, так и PDF/X-4p.
Если матрица OutputIntents файла содержит больше одного ввода, как может быть в случае, когда
файл согласуется с этой частью ISO 19005 и в то же время с PDF/X-4 или PDF/E-1. Тогда все вводы,
содержащие ключ DestOutputProfile, должны иметь в качестве значения упомянутого ключа тот же
самый косвенный объект, который должен быть действительным потоком профиля ICC
(Международного консорциума по обработке цветных изображений).
Поток профиля, который является значением ключа DestOutputProfile, должен быть либо профилем
печатного процесса (Класс устройства = ―prtr‖), либо профилем монитора (Класс устройства = ―mntr‖).
Эти профили должны иметь цветовое пространство либо ―GRAY‖, ―RGB‖, либо ―CMYK‖. Если ключ
Alternate присутствует в объекте потока DestOutputProfile, то он не должен приниматься во внимание
согласованным считывателем PDF/A-2.
6.2.4 Цветовые пространства
6.2.4.1 Общие положения
Все цвета должны быть заданы в независимой от устройства манере, либо прямо путем
использования независимых от устройства цветовых пространств, либо косвенно посредством
профиля DestOutputProfile в печатном процессе PDF/A OutputIntent. Согласованный файл может
использовать цветовое пространство, заданное в ISO 32000-1, кроме ограничений, указанных в 6.2.4.2
– 6.2.4.5.
ПРИМЕЧАНИЕ Когда цвет задается в независимой от устройства манере согласно описанию в пределах 6.2.4,
то имеется возможность визуализации прогнозируемого цвета на основе калориметрического определения и без
надежды на эвристические допущения или на информацию, внешнюю по отношению к согласованному файлу.
Этим также предоставляется механизм, посредством чего калориметрическое определение
...










Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.
Loading comments...