ISO 19005-2:2011
(Main)Document management — Electronic document file format for long-term preservation — Part 2: Use of ISO 32000-1 (PDF/A-2)
Document management — Electronic document file format for long-term preservation — Part 2: Use of ISO 32000-1 (PDF/A-2)
ISO 19005-2:2011 specifies the use of the Portable Document Format (PDF) 1.7, as formalized in ISO 32000-1, for preserving the static visual representation of page-based electronic documents over time. ISO 19005-2:2011 is not applicable to specific processes for converting paper or electronic documents to the PDF/A format, specific technical design, user interface, implementation, or operational details of rendering, specific physical methods of storing these documents, such as media and storage conditions, required computer hardware and/or operating systems.
Gestion de documents — Format de fichier des documents électroniques pour une conservation à long terme — Partie 2: Utilisation de l'ISO 32000-1 (PDF/A-2)
General Information
Standards Content (Sample)
МЕЖДУНАРОДНЫЙ ISO
СТАНДАРТ 19005-2
Первое издание
2011-07-01
Управление документами. Формат
файлов электронных документов для
долговременного сохранения.
Часть 2.
Использование ISO 32000-1 (PDF/A-2)
Document management – Electronic document file format for long-term
preservation –
Part 2: Use of ISO 32000-1 (PDF/A-2)
Ответственность за подготовку русской версии несѐт GOST R
(Российская Федерация) в соответствии со статьѐй 18.1 Устава ISO
Ссылочный номер
ISO 19004-2:2011(R)
©
ISO 2011
---------------------- Page: 1 ----------------------
ISO 19005-2:2011(R)
ДОКУМЕНТ ЗАЩИЩЕН АВТОРСКИМ ПРАВОМ
© ISO 2011
Все права сохраняются. Если не задано иначе, никакую часть настоящей публикации нельзя копировать или использовать в
какой-либо форме, или каким-либо электронным или механическим способом, включая фотокопии и микрофильмы, без
предварительного письменного согласия офиса ISO, находящемуся по указанному ниже адресу, или членов ISO в стране
регистрации пребывания
ISO copyright office
Case postale 56 CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Опубликовано в Швейцарии
ii © ISO 2011 – Все права сохраняются
---------------------- Page: 2 ----------------------
ISO 19005-2:2011(R)
Содержание Страница
Предисловие. iv
Введение . v
1 Область применения . 1
2 Нормативные ссылки . 1
3 Термины и определения . 2
4 Запись . 4
5 Уровни согласования . 5
5.1 Общие положения . 5
5.2 Согласование на уровне A. 5
5.3 Согласование на уровне B. 5
5.4 Согласование на уровне U. 6
5.5 Согласованные считывающие устройства . 6
6 Технические требования . 7
6.1 Структура файла . 7
6.2 Графические средства . 10
6.3 Аннотации . 20
6.4 Интерактивные формы . 21
6.5 Действие . 22
6.6 Метаданные . 22
6.7 Логическая структура . 28
6.8 Вложенные файлы . 30
6.9 Необязательное содержание . 31
6.10 Использование альтернативных презентаций и переходов . 32
6.11 Требования к документу . 32
Приложение A (нормативное) Метод для определения прозрачности на странице . 33
Приложение B (нормативное) Требования для цифровых подписей в PDF/A . 35
Приложение C (информативное) Наилучшие осуществления на практике для PDF/A . 36
Приложение D (информативное) Включение наборов данных XFA в согласованный файл
PDF/A-2 . 38
Библиография . 39
© ISO 2011 – Все права сохраняются iii
---------------------- Page: 3 ----------------------
ISO 19005-2:2011(R)
Предисловие
Международная организация по стандартизации (ISO) является всемирной федерацией национальных
организаций по стандартизации (комитетов-членов ISO). Разработка международных стандартов
обычно осуществляется техническими комитетами ISO. Каждый комитет-член, заинтересованный в
деятельности, для которой был создан технический комитет, имеет право быть представленным в этом
комитете. Международные правительственные и неправительственные организации, имеющие связи с
ISO, также принимают участие в работах. Что касается стандартизации в области электротехники, то
ISO работает в тесном сотрудничестве с Международной электротехнической комиссией (IEC).
Проекты международных стандартов разрабатываются в соответствии с правилами Директив ISO/IEC,
часть 2.
Основной задачей технических комитетов является подготовка международных стандартов. Проекты
международных стандартов, принятые техническими комитетами, рассылаются комитетам-членам на
голосование. Их опубликование в качестве международных стандартов требует одобрения не менее
75% комитетов-членов, принимающих участие в голосовании.
Следует иметь в виду, что некоторые элементы настоящего международного стандарта могут быть
объектом патентных прав. Международная организация по стандартизации не может нести
ответственность за идентификацию какого-либо одного или всех патентных прав.
ISO 19005-2 подготовил Технический комитет ISO/TC 171 Прикладные программы управления
документооборотом, подкомитет SC 2, Вопросы приложения, совместно с ISO/NC 130, Графическая
технология, ISO/TC 42, Фотография, и ISO/TC 46, Информация и документация, подкомитет SC 11,
Управление архивами/документооборотом, в общей рабочей группе
ISO 19005 состоит из следующих частей под общим заголовком Управление документами . Формат
файлов электронных документов для долговременного сохранения.
Часть 1. Использование PDF 1.4 (PDF/A-1)
Часть 2. Использование ISO 32000-1 (PDF/A-2)
Следующая часть подготавливается:
Часть 3. Использование ISO 32000-1 с поддержкой для вложенных файлов (PDF/A-3)
iv © ISO 2011 – Все права сохраняются
---------------------- Page: 4 ----------------------
ISO 19005-2:2011(R)
Введение
PDF является цифровым форматом для представления документов. Файлы PDF могут быть созданы в
собственном формате PDF, преобразованы из других электронных форматов или оцифрованы из
бумажного носителя информации. Бизнес, правительственные органы, библиотеки, архивы, другие
институты и отдельные люди по всему миру используют PDF, чтобы представлять значительные
объемы важной информации. Многое из этой информации необходимо держать в течение
продолжительных периодов времени, а некоторая информация нуждается в постоянном сохранении.
Эти PDF- файлы нужно оставлять для использования и доступа на протяжении многочисленных
поколений технологии. Однако исключительная, полнофункциональная природа формата требует
введения ограничений на его использование, чтобы сделать формат подходящим для
долговременного сохранения электронных документов. Будущее использование и доступ к этим
объектам зависит от поддержания их зрительного внешнего вида, а также свойств высокого порядка,
например, логической организации страниц, разделов и параграфов, машинно-восстанавливаемого
текстового потока в естественный читаемый порядок и административных, предохранительных и
описательных метаданных.
ISO 19005 был создан как документ, состоящий из нескольких частей, в котором настоящий стандарт
является второй частью. Это позволяет создавать будущие части без визуализации ISO 19005 или
выводить из употребления прикладные программы на его основе.
Первичное назначение ISO 19005 заключается в том, чтобы определить формат файла на основе PDF,
известном как PDF/A, который дает механизм для представления электронных документов в манере,
предохраняющей их статический визуальный внешний вид на протяжении времени, независимо от
инструментов и систем, используемых для создания, хранения или визуализации файлов.
Вторичное назначение ISO 19005 – это определить каркас для представления логической структуры и
другой семантической информации электронных документов в пределах согласованных файлов.
Другая цель ISO 19005 – предоставить структуру для записи контекста и истории электронных
документов в метаданные в пределах согласованных файлов.
Эти назначения и цели достигаются путем идентификации набора PDF – компонентов, которые могут
быть использованы, и ограничений на форму их использования в пределах согласованных файлов
PDF/A.
Сам по себе, PDF/A не обязательно гарантирует, что визуальный внешний вид содержания правильно
отражает любой материал первоначального источника, который был использован, чтобы создать
согласованный файл. Например, процесс, использованный для создания согласованного файла,
может заменять шрифты, переформатировать текст, снижать скорость выборки изображений или
использовать сжатие информации с потерями. Организации, которым нужна гарантия, что
согласованный файл является правильным представлением материала первоначального источника,
могут хотеть наложить дополнительные требования. К ним, например, можно отнести наилучшие
практические решения в Приложении C, для процессов, которые генерируют согласованный файл,
помимо тех файлов, которые предусмотрены настоящей частью ISO 19005. В дополнение, весьма
важно для упомянутых организаций, применять линии поведения и практические решения в отношении
инспекции согласованных файлов для правильного визуального внешнего вида.
PDF/A не обращается прямо к теме аутентичности либо для базового содержания, которое должно
быть визуально представлено, либо для самого файла PDF/A. Такая аутентичность обычно считается
важной для законных, регулирующих и управляющий целей и выходят за область применения
настоящего международного стандарта.
Настоящая часть ISO 19005 является одним компонентом электронной архивной окружающей среды
организации для долгосрочного удерживания документов. Успешное применение настоящей части ISO
19005 для архивных целей зависит от следующего:
© ISO 2011 – Все права сохраняются v
---------------------- Page: 5 ----------------------
ISO 19005-2:2011(R)
требований к сохранению архивной окружающей среды организации, политики и методов
управления документами, как задано в ISO 15489-1;
любых дополнительных требований и условий, необходимых для обеспечения стойкости
электронных документов и их характеристик со временем, включая без дальнейшего ограничения
те требования и условия, которые определены в ISO 14721, ISO/TR 15801 и ISO/TR 18492;
процессов обеспечения качества, которые необходимы для проверки соответствия с
приемлемыми требованиями и условиями, например, режим инспекции, чтобы проверить качество
и целостность преобразованных данных источника.
Настоящая часть ISO 19005 предназначается для того, чтобы вести к разработке разных прикладных
программ, которые считывают, визуализируют, записывают и определяют достоверность
согласованных файлов. Разные приложения будут включать разнообразные возможности для
подготовки, интерпретации и обработки согласованных файлов на основе тех потребностей, как они
воспринимаются поставщиками упомянутых прикладных программ. Однако важно заметить, что
согласованное приложение нуждается в способности читать и обрабатывать подходящим образом все
файлы, адекватные с заданным уровнем согласования.
Настоящая часть ISO 19005 расширяет возможности ISO 19005-1. Она базируется на PDF версии 1.7
(как определено в ISO 32000-1), а не на PDF версии 1.4 (которая используется в качестве базиса
ISO 19005-1). Эти дополнительные возможности обеспечивают сквозное соответствие с ISO 32000-1 и
включают
улучшения в помеченном тегами PDF (для усиления доступности),
сжатый объект и потоки XRef (для файлов меньших размеров),
PDF/A-податливые файловые приставки, переносимые коллекции и PDF пакеты,
прозрачность и
компрессию JPEG 2000.
Настоящая часть ISO 19005 (в соединении с ее нормативными ссылками) обеспечивает достаточную
информацию, чтобы интерпретировать любой согласованный файл PDF/A-2.
Организации NPES and AIIM (аккредитованная организация по разработке стандартов) поддерживают
текущую последовательность примечаний прикладных программ для ориентирования разработчиков и
пользователей ISO 19005. Эти примечания являются доступными на
и
A/ISO19005AppNotes.pdf>. Обе организации, NPES и AIIM, также сохраняют копии специфических
нормативных ссылок, не относящихся к ISO, на эту часть ISO 19005, которые являются
общедоступными электронными документами.
vi © ISO 2011 – Все права сохраняются
---------------------- Page: 6 ----------------------
МЕЖДУНАРОДНЫЙ СТАНДАРТ ISO 19005:2011(R)
Управление документами. Формат файлов электронных
документов для долговременного сохранения.
Часть 2.
Использование ISO 32000-1 (PDF/A-2)
1 Область применения
Настоящая часть ISO 19005 задает использование Формата переносимого документа (Portable
Document Format - PDF) версии 1.7, в качестве формализованного в ISO 32000-1, для сохранения в
течение длительного времени статического визуального представления электронных документов на
постраничной основе.
Настоящая часть ISO 19005 не применяется к
специальным процессам для преобразования документов на бумажном носителе или электронных
документов в формат PDF/A,
специальному техническому проекту, интерфейсу пользователя, реализации или операционным
подробностям визуализации,
специальным физическим методам хранения этих документов, например, режим среды передачи
данных и запоминания, или
необходимой вычислительной технике и/или операционным системам.
2 Нормативные ссылки
Следующие ссылочные документы являются обязательными для применения настоящего документа.
Для устаревших ссылок применяется только цитируемое издание. Для недатированных ссылок
применяется самое последнее издание ссылочного документа (включая поправки).
ISO/IEC 646, Информационные технологии. 7-битный набор кодированных символов для
1)
информационного обмена
2)
ISO/IEC 10646, Информационные технологии. Универсальный набор кодированных символов (UCS)
ISO 15076-1, Регулирование цвета в технологии изображений. Архитектура, формат профиля и
структура данных. Часть 1. На основе международного консорциума по средствам обработки
цветных изображений (ICC.1:2010)
ISO/IEC 15444-2:2004, Информационные технологии. Система кодирования изображений JPEG 2000:
Расширения
ISO 15930-7:2010, Графическая технология. Обмен цифровыми данным при подготовке к печати с
использованием PDF. Часть 7. Полный (PDF/X-4) и частичный обмен печатными данными с
обращением к внешнему профилю (PDF/X-4p, используя PDF 1.6.
1) Кодирование символов, определенное в ISO/IEC 646, является эквивалентом ANSI X3.4 (ASCII) и ECMA-6.
2) Значения кодов символов, определенные в ISO/IEC 10646, эквивалентны значениям уникода (16-битного
стандарта кодирования символов).
© ISO 2011 – Все права сохраняются 1
---------------------- Page: 7 ----------------------
ISO 19005-2:2011(R)
ISO 19005-1, Управление документами. Формат файла электронного документа для
долговременного сохранения. Часть 1. Использование PDF 1.4 (PDF/A-1)
ISO 24517-1, Управление документами. Формат инженерно-технических документов с
использованием PDF. Часть 1. Использование PDF 1.6 (PDF/E-1)
ISO 32000-1:2008, Управление документами. Формат переносимого документа. Часть 1. PDF 1.7
Расширяемая спецификация языка (язык XML) 1.0 (Третье издание), Рекомендация W3C, 4 февраля
2004. Документ доступен из
ICC.1:1998-09, Формат файла для профилей цвета, Международный консорциум по средствам
обработки цветных изображений. Документ доступен из
ICC.1:2001-12, Формат файла для профилей цвета (Версия 4.0.0), Международный консорциум по
средствам обработки цветных изображений. Документ доступен из
ICC.1:2003-09, Формат файла для профилей цвета (Версия 4.1.0), Международный консорциум по
средствам обработки цветных изображений. Документ доступен из
Пересмотренная спецификация синтаксиса RDF/XML. Рекомендация W3C, 10 февраля 2004.
Документ доступен из
RFC 2315, PKCS#7: Синтаксис криптографических сообщений, версия 1.5. Документ доступен из
http://www.rfc-editor.org
RFC 3280, Сертификат инфраструктуры открытого ключа Интернет X.509 и профиль списка
отмены сертификатов (CRL). Документ доступен из http://www.rfc-editor.org
Список глифов фирмы Adobe, 20 сентября 2002, Adobe Systems Incorporated. Документ доступен из
Дополнение фирмы Adobe к ISO 32000-1, Основная версия 1.7, Уровень расширения 5, Adobe Systems
Incorporated. Документ доступен
3 Термины и определения
В настоящем документе применяются следующие термины и определения.
3.1
уровень согласования
conformance level
идентифицированный набор ограничений и требований, которые файлы и считывающие устройства
должны исполнять
3.2
электронный документ
electronic document
электронное представление постранично ориентированного агрегирования текста, изображений,
графических данных и метаданных, полезных для идентификации и понимания тех данных, которые
могут быть воспроизведены на бумаге или других подложках, а также визуализированы электронным
образом на устройствах отображения без значимых потерь их информационного содержания
3.3
маркер конца файла
end-of-file marker
последовательность пяти символов, (%%EOF), обозначающая конец PDF – файла.
2 © ISO 2011 – Все права сохраняются
---------------------- Page: 8 ----------------------
ISO 19005-2:2011(R)
3.4
маркер EOL
маркер конца строки
EOL marker
end-of-line marker
последовательность одного или двух символов, обозначающая конец строки, состоящая из символа
ВОЗВРАТ КАРЕТКИ (CARRIAGE RETURN) (0Dh) или символа ПЕРЕВОД СТРОКИ (LINE FEED) (0Ah)
или ВОЗВРАТ КАРЕТКИ (CARRIAGE RETURN), за которым сразу следует ПЕРЕВОД СТРОКИ (LINE
FEED)
3.5
схема расширения
extension schema
согласованная схема XMP (протокола управления консорциума X/Open), которая не определяется ни в
спецификации XMP, ни в ISO 19005-1 или ISO 19005-2
3.6
шрифт
font
идентифицированная коллекция графических средств, которые могут быть рельефными
изображениями (глифами) или другими графическими элементами
[ISO 32000-1]
3.7
шрифтовая программа
font program
программное обеспечение, написанное на языке специального назначения, например, Type 1,
TrueType, или формат шрифта OpenType, которое понимает специализированный интерпретатор
шрифта
[ISO 32000-1]
3.8
интерактивное считывающее устройство
nteractive reader
считывающее устройство, которое требует или разрешает взаимодействие человека с содержанием
или другими объектами, находящимися в документе, во время фазы обработки программного
обеспечения
ПРИМЕЧАНИЕ Средство просмотра файла является примером интерактивного считывающего устройства;
устройство для растрового сканирования изображения и записи битовой карты является примером считывающего
устройства, которое не является интерактивным.
3.9
согласование уровня A
Level A conformance
уровень согласования, выполняющий все требования настоящей части ISO 19005
3.10
согласование уровня B
Level B conformance
уровень согласования, выполняющий все требования настоящей части ISO 19005, касающиеся
визуального внешнего вида электронных документов, кроме требования, которое касается структурных
и семантических свойств, и требования, по которому весь текст имеет эквиваленты уникода
© ISO 2011 – Все права сохраняются 3
---------------------- Page: 9 ----------------------
ISO 19005-2:2011(R)
3.11
согласование уровня U
Level U conformance
уровень согласования, выполняющий требования настоящей части ISO 19005, касающиеся
визуального внешнего вида электронных документов, вместе с требованием, по которому весь текст в
документе имеет эквиваленты уникода
3.12
длительный срок
long term
период времени, достаточно длительный для беспокойства о воздействиях на информацию,
удерживаемую в хранилище меняющихся технологий, включая поддержку для форматов новых
носителей и данных, изменения сообщества пользователей, и который может быть растянут в
неопределенное будущее
3.13
Формат переносимого документа
PDF
Portable Document Format
формат файла, определенного в ISO 32000-1:2008
3.14
считывающее устройство
reader
приложение программного обеспечения, которое способно читать и обрабатывать файлы PDF/A
3.15
записывающее устройство
writer
приложение программного обеспечения, которое способно записывать файлы PDF/A
3.16
пакет XMP (протокола управления консорциума X/Open)
XMP packet
структурированный упаковщик для преобразованных в последовательную форму метаданных XMP,
которые могут быть вложены в PDF, а также другие форматы файлов
4 Запись
Операторы PDF, ключевые слова PDF, названия ключей в словарях PDF и другие предпочтительные
названия записаны полужирным, без засечек шрифтом; компоненты операций PDF или значения
словарных ключей записаны курсивным, без засечек шрифтом. Некоторые имена могут быть также
использованы как значения в зависимости от контекста, и таким образом стиль содержания будет
зависимым от контекста.
ПРИМЕР 1 Значение по умолчанию (Default) для ключа TR2.
Символы маркера, использованные для того, чтобы определять границы объектов и характеризовать
структуру файлов PDF, как определено в ISO 32000-1:2008, 7.2.1, могут быть идентифицированы по их
имени символа ISO/IEC 646. Это имя символа записывается в верхнем регистре полужирным, без
засечек шрифтом и за ним следует значение заключенного в скобки, двузначного шестнадцатеричного
кода символа с суффиксом ―h‖.
ПРИМЕР 2 ВОЗВРАТ КАРЕТКИ (CARRIAGE RETURN) (0Dh).
Символы текстовой строки, как определено в ISO 32000-1:2008, 7.9.2, могут быть идентифицированы
по их имени символа ISO/IEC 10646, записанному в верхнем регистре полужирным, без засечек
шрифтом, за которым следует значение заключенного в скобки, четырехзначного шестнадцатеричного
кода символа с префиксом ―U+‖.
ПРИМЕР 3 Узкий [нормальный] пробел (EN SPACE) (U+2002).
4 © ISO 2011 – Все права сохраняются
---------------------- Page: 10 ----------------------
ISO 19005-2:2011(R)
Следующие выражения, ссылающиеся на ISO 19005 или его части, рекомендуются, когда не
используется полное имя ISO:
―PDF/A‖ – синоним для ряда стандартов ISO 19005;
―PDF/A-1‖ – синоним для ISO 19005-1;
―PDF/A-1a‖ – синоним для согласования уровня A ISO 19005-1;
―PDF/A-1b‖ – синоним для согласования уровня B ISO 19005-1;.
―PDF/A-2‖ – синоним для ISO 19005-2;
―PDF/A-2a‖ – синоним для согласования уровня A ISO 19005-2;
―PDF/A-2b‖ – синоним для согласования уровня B ISO 19005-2;
―PDF/A-2u‖ – синоним для согласования уровня U ISO 19005-2.
5 Уровни согласования
5.1 Общие положения
Настоящая часть ISO 19005 определяет формат файла для представления электронных документов,
известных как ―PDF/A-2‖. Согласованные файлы PDF/A-2 должны оставаться верными всем
требованиям ISO 32000-1, которые видоизменены настоящей частью ISO 19005. Согласованный файл
может включать любую действительную особенность ISO 32000-1, которая явно не запрещается
настоящей частью ISO 19005. Не следует использовать особенности, изложенные в технических
условиях PDF до версии 1.7 , которые явно не характеризуются в ISO 32000-1.
ПРИМЕЧАНИЕ 1 Согласованный файл не обязан использовать любую особенность PDF, которая является
другой, чем те особенности, явно требуемые ISO 32000-1 или этой частью ISO 19005.
Как изложено в 6.1.2, номер версии файла может быть любым значением от 1.0 до 1.7, и
определенное значение не должно быть использовано для того, чтобы установить, согласован ли
файл с настоящей частью ISO 19005.
ПРИМЕЧАНИЕ 2 Описание присущего механизма, с помощью которого файл может гипотетически
идентифицировать себя в качестве файла PDF/A-2 заданного уровня согласования, дается в 6.6.4.
5.2 Согласование на уровне A
Файлы, согласованные на уровне A, должны оставаться верными всем требованиям настоящей части
ISO 19005. О файле, отвечающем этому уровню согласования, говорят, что он считается
―согласованным файлом PDF/A-2a‖.
5.3 Согласование на уровне B
В осознании разных предохранительных потребностей разнообразных сообществ пользователей,
использующих PDF – файлы, настоящая часть ISO 19005 определяет согласование на уровне B.
Файлы, согласованные на уровне B, , должны оставаться верными всем требованиям настоящей части
ISO 19005, за исключением требований в 6.2.11.7 и 6.7. О файле, отвечающем этому уровню
согласования, говорят, что он считается ―согласованным файлом PDF/A-2b‖.
ПРИМЕЧАНИЕ 1 Требования согласования уровня B предполагаются минимально необходимыми для гарантии,
что тонированный визуальный внешний вид согласованного файла является сохраняемым в течение длительного
срока. Однако согласованные файлы уровня B могут не иметь достаточно обогащенную внутреннюю информацию,
© ISO 2011 – Все права сохраняются 5
---------------------- Page: 11 ----------------------
ISO 19005-2:2011(R)
чтобы предусматривать сохранение логической структуры документа и поток текста содержания в порядке
естественного чтения, который обеспечивается согласованием на уровне A. Требования для соответствия уровня
A предъявляют большие обязательства к читателям согласованных файлов, а также к тем людям, кто готовит
такие файлы. Но эти требования предусматривают более высокий уровень службы хранения документов и
доверия со временем. Дополнительно, согласование уровня A облегчает доступность согласованных файлов для
пользователей с физическими недостатками.
ПРИМЕЧАНИЕ 2 Согласованный файл уровня B может включать особенности из 6.2.11.7 и 6.7, но все еще будет
идентифицирован как файл на уровне B.
5.4 Согласование на уровне U
В осознании разных предохранительных потребностей разнообразных сообществ пользователей,
использующих PDF–файлы, настоящая часть ISO 19005 определяет согласование на уровне U. Файлы,
согласованные на уровне U, должны оставаться верными всем требованиям настоящей части
ISO 19005, за исключением требований в 6.7. О файле, отвечающем этому уровню согласования,
говорят, что он считается ―согласованным файлом PDF/A-2u‖.
ПРИМЕЧАНИЕ 1 Требования согласования уровня U предполагаются такие, которые необходимы для гарантии,
что тонированный визуальный внешний вид согласованного файла является сохраняемым в течение длительного
срока, но что любой текст, содержащийся в документе, может быть легко извлечен как последовательность
кодовых точек уникода. Однако согласованные файлы уровня U могут не иметь достаточно обогащенную
внутреннюю информацию, чтобы предусматривать сохранение логической структуры документа и поток текста
содержания в порядке естественного чтения, который обеспечивается согласованием на уровне A. Требования
для соответствия уровня A предъявляют большие обязательства к читателям согласованных файлов, а также к
тем людям, кто готовит такие файлы, но эти требования предусматривают более высокий уровень службы
хранения документов и доверия со временем. Дополнительно, согласование уровня A облегчает доступность
согласованных файлов для пользователей с физическими недостатками.
ПРИМЕЧАНИЕ 2 Согласованные файлы уровня U могут включать особенности из 6.7, но все еще будут
идентифицированы как файл уровня U.
ПРИМЕЧАНИЕ 3 Уровень U является новым в этой части ISO 19005 и поэтому не имеет эквивалента в
ISO 19005-1.
5.5 Согласованные считывающие устройства
Согласованное считывающее устройство должно соответствовать всем требованиям, касающимся
функционального поведения считывателя, которое задано в этой части ISO 19005. Требования этой
части ISO 19005 в отношении поведения считывателя заявлены в терминах общих функциональных
требований, применимых ко всем согласованным с
...
INTERNATIONAL ISO
STANDARD 19005-2
First edition
2011-07-01
Document management — Electronic
document file format for long-term
preservation —
Part 2:
Use of ISO 32000-1 (PDF/A-2)
Gestion de documents — Format de fichier des documents
électroniques pour une conservation à long terme —
Partie 2: Utilisation de l'ISO 32000-1 (PDF/A-2)
Reference number
ISO 19005-2:2011(E)
©
ISO 2011
---------------------- Page: 1 ----------------------
ISO 19005-2:2011(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2011
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2011 – All rights reserved
---------------------- Page: 2 ----------------------
ISO 19005-2:2011(E)
Contents Page
Foreword . iv
Introduction . v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 2
4 Notation . 4
5 Conformance levels . 4
5.1 General . 4
5.2 Level A conformance . 5
5.3 Level B conformance . 5
5.4 Level U conformance . 5
5.5 Conforming readers . 5
6 Technical requirements . 6
6.1 File structure . 6
6.2 Graphics . 8
6.3 Annotations . 17
6.4 Interactive forms . 18
6.5 Action . 19
6.6 Metadata . 20
6.7 Logical structure . 25
6.8 Embedded files . 27
6.9 Optional content . 27
6.10 Use of alternate presentations and transitions . 28
6.11 Document requirements . 28
Annex A (normative) Method for determining transparency on a page . 29
Annex B (normative) Requirements for digital signatures in PDF/A . 31
Annex C (informative) Best practices for PDF/A. 32
Annex D (informative) Incorporation of XFA datasets into a PDF/A-2 conforming file . 34
Bibliography . 35
© ISO 2011 – All rights reserved iii
---------------------- Page: 3 ----------------------
ISO 19005-2:2011(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the
International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 19005-2 was prepared by Technical Committee ISO/TC 171, Document management applications,
Subcommittee SC 2, Application issues in cooperation with ISO/TC 130, Graphic technology, ISO/TC 42,
Photography, and ISO/TC 46, Information and documentation, Subcommittee SC 11, Archives/records
management, in a joint working group.
ISO 19005 consists of the following parts, under the general title Document management — Electronic
document file format for long-term preservation:
Part 1: Use of PDF 1.4 (PDF/A-1)
Part 2: Use of ISO 32000-1 (PDF/A-2)
The following parts are under preparation:
Part 3: Use of ISO 32000-1 with support for embedded files (PDF/A-3)
iv © ISO 2011 – All rights reserved
---------------------- Page: 4 ----------------------
ISO 19005-2:2011(E)
Introduction
PDF is a digital format for representing page-based documents. PDF files can be created natively in PDF form,
converted from other electronic formats or digitized from paper, microform, or other hard copy format.
Businesses, governments, libraries, archives and other institutions and individuals around the world use PDF
to represent considerable bodies of important information. Much of this information needs to be kept for
substantial lengths of time; some needs to be kept permanently. These PDF files need to remain useable and
accessible across multiple generations of technology. However, the inclusive, feature-rich nature of the format
requires that constraints be placed on its use to make it suitable for the long-term preservation of electronic
documents. The future use of, and access to, these objects depends upon maintaining their visual
appearance as well as their higher-order properties, such as the logical organization of pages, sections, and
paragraphs, machine recoverable text stream in natural reading order, and a variety of administrative,
preservation and descriptive metadata.
ISO 19005 has been created as a multi-part document, of which this is Part 2. This allows future parts to be
created without rendering ISO 19005, or applications based on it, obsolete.
The primary purpose of ISO 19005 is to define a file format based on PDF, known as PDF/A, which provides a
mechanism for representing electronic documents in a manner that preserves their static visual appearance
over time, independent of the tools and systems used for creating, storing or rendering the files.
A secondary purpose of ISO 19005 is to define a framework for representing the logical structure and other
semantic information of electronic documents within conforming files.
Another purpose of ISO 19005 is to provide a framework for recording the context and history of electronic
documents in metadata within conforming files.
These goals are accomplished by identifying the set of PDF components that can be used, and restrictions on
the form of their use, within conforming PDF/A files.
By itself, PDF/A does not necessarily ensure that the visual appearance of the content accurately reflects any
original source material used to create the conforming file, e.g. the process used to create a conforming file
might substitute fonts, reflow text, downsample images or use lossy compression. Organizations that need to
ensure that a conforming file is an accurate representation of original source material might need to impose
additional requirements, such as the best practices in Annex C, on the processes that generate the
conforming file beyond those imposed by this part of ISO 19005. In addition, it is important for those
organizations to implement policies and practices regarding the inspection of conforming files for correct visual
appearance.
PDF/A does not directly address the topic of authenticity, either for the underlying content to be visually
represented or for the PDF/A file itself. Such authenticity is generally considered to be important for legal,
regulatory and governance purposes and is beyond the scope of this International Standard.
This part of ISO 19005 is one component of an organization's electronic archival environment for long-term
retention of documents. Successful implementation of this part of ISO 19005 for archival purposes depends
upon the following:
the retention requirements of an organization's archival environment, records management policies and
procedures, as specified in ISO 15489-1;
any additional requirements and conditions necessary to ensure the persistence of electronic documents
and their characteristics over time, including, but not limited to, those defined in ISO 14721,
ISO/TR 15801, and ISO/TR 18492;
© ISO 2011 – All rights reserved v
---------------------- Page: 5 ----------------------
ISO 19005-2:2011(E)
the quality assurance processes necessary to verify conformance with applicable requirements and
conditions, e.g. an inspection regime to verify the quality and integrity of converted source data.
This part of ISO 19005 is intended to lead to the development of various applications that read, render, write
and validate conforming files. Different applications will incorporate various capabilities to prepare, interpret
and process conforming files based on needs as perceived by the suppliers of those applications. However, it
is important to note that a conforming application needs to be able to read and process appropriately all files
complying with a specified conformance level.
This part of ISO 19005 extends the capabilities of ISO 19005-1. It is based on PDF version 1.7 (as defined in
ISO 32000-1) rather than PDF version 1.4 (which is used as the basis of ISO 19005-1). These added
capabilities are made possible through compliance with ISO 32000-1 and include
improvements to tagged PDF (for enhanced accessibility),
Compressed Object and XRef streams (for smaller file sizes),
PDF/A-compliant file attachments, portable collections and PDF packages,
transparency, and
JPEG 2000 compression.
This part of ISO 19005 (in conjunction with its normative references) provides sufficient information to interpret
any conforming PDF/A-2 file.
NPES and AIIM (accredited standards developing organizations) maintain an ongoing series of application
notes for guiding developers and users of ISO 19005. These application notes are available at
and
A/ISO19005AppNotes.pdf>. Both NPES and AIIM also retain copies of the specific non-ISO normative
references of this part of ISO 19005 which are publicly available electronic documents.
vi © ISO 2011 – All rights reserved
---------------------- Page: 6 ----------------------
INTERNATIONAL STANDARD ISO 19005-2:2011(E)
Document management — Electronic document file format for
long-term preservation —
Part 2:
Use of ISO 32000-1 (PDF/A-2)
1 Scope
This part of ISO 19005 specifies the use of the Portable Document Format (PDF) 1.7, as formalized in
ISO 32000-1, for preserving the static visual representation of page-based electronic documents over time.
This part of ISO 19005 is not applicable to
specific processes for converting paper or electronic documents to the PDF/A format,
specific technical design, user interface, implementation, or operational details of rendering,
specific physical methods of storing these documents, such as media and storage conditions, or
required computer hardware and/or operating systems.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced
document (including any amendments) applies.
1)
ISO/IEC 646, Information technology — ISO 7-bit coded character set for information interchange
2)
ISO/IEC 10646, Information technology — Universal Coded Character Set (UCS)
ISO 15076-1, Image technology colour management — Architecture, profile format and data structure —
Part 1: Based on ICC.1:2010
ISO/IEC 15444-2:2004, Information technology — JPEG 2000 image coding system: Extensions
ISO 15930-7:2010, Graphic technology — Prepress digital data exchange using PDF — Part 7: Complete
exchange of printing data (PDF/X-4) and partial exchange of printing data with external profile reference
(PDF/X-4p) using PDF 1.6
ISO 19005-1, Document management — Electronic document file format for long-term preservation — Part 1:
Use of PDF 1.4 (PDF/A-1)
1) The character encoding defined in ISO/IEC 646 is equivalent to ANSI X3.4 (ASCII) and ECMA-6.
2) The character code values defined in ISO/IEC 10646 are equivalent to those of Unicode.
© ISO 2011 – All rights reserved 1
---------------------- Page: 7 ----------------------
ISO 19005-2:2011(E)
ISO 24517-1, Document management — Engineering document format using PDF — Part 1: Use of PDF 1.6
(PDF/E-1)
ISO 32000-1:2008, Document management — Portable document format — Part 1: PDF 1.7
Extensible Markup Language (XML) 1.0 (Third Edition), W3C Recommendation, 4 February 2004. Available
from
ICC.1:1998-09, File Format for Color Profiles, International Color Consortium. Available
from
ICC.1:2001-12, File Format for Color Profiles (Version 4.0.0), International Color Consortium. Available from
ICC.1:2003-09, File Format for Color Profiles (Version 4.1.0), International Color Consortium. Available from
RDF/XML Syntax Specification (Revised), W3C Recommendation, 10 February 2004. Available
from
RFC 2315, PKCS#7: Cryptographic Message Syntax Version 1.5. Available from http://www.rfc-editor.org
RFC 3280, Internet X.509 Public Key Infrastructure Certificate and Certificate Revocation List (CRL) Profile.
Available from http://www.rfc-editor.org
Adobe Glyph List, 20 September 2002, Adobe Systems Incorporated. Available from
Adobe Supplement to ISO 32000-1, BaseVersion 1.7, ExtensionLevel 5, Adobe Systems Incorporated.
Available from
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
3.1
conformance level
identified set of restrictions and requirements to which files and readers are required to comply
3.2
electronic document
electronic representation of a page-oriented aggregation of text, images and graphic data, and metadata
useful to identifying and understanding that data, that can be reproduced on paper or other substrates, as well
as rendered electronically on display devices, without significant loss of its information content
3.3
end-of-file marker
five-character sequence (%%EOF) marking the end of a PDF file
3.4
EOL marker
end-of-line marker
one- or two-character sequence marking the end of a line, consisting of a CARRIAGE RETURN character
(0Dh) or a LINE FEED character (0Ah) or a CARRIAGE RETURN followed immediately by a LINE FEED
2 © ISO 2011 – All rights reserved
---------------------- Page: 8 ----------------------
ISO 19005-2:2011(E)
3.5
extension schema
conforming XMP schema that is not defined in the XMP Specification, nor in ISO 19005-1 or ISO 19005-2
3.6
font
identified collection of graphics that may be glyphs or other graphic elements
[ISO 32000-1]
3.7
font program
software program written in a special-purpose language, such as the Type 1, TrueType, or OpenType font
format, that is understood by a specialized font interpreter
[ISO 32000-1]
3.8
interactive reader
reader that requires or allows human interaction with the content and other objects contained in the document
during the software's processing phase
NOTE A file viewing tool is an example of an interactive reader; a raster image processor is an example of a reader
that is not interactive.
3.9
Level A conformance
conformance level encompassing all requirements of this part of ISO 19005
3.10
Level B conformance
conformance level encompassing the requirements of this part of ISO 19005 regarding the visual appearance
of electronic documents but not those regarding their structural and semantic properties nor the requirement
that all text have Unicode equivalents
3.11
Level U conformance
conformance level encompassing the requirements of this part of ISO 19005 regarding the visual appearance
of electronic documents, together with the requirement that all text in the document have Unicode equivalents
3.12
long term
period of time long enough for there to be concern about the impacts on the information being held in a
repository of changing technologies, including support for new media and data formats, and of a changing
user community, and which may extend into the indefinite future
3.13
PDF
Portable Document Format
file format defined in ISO 32000-1:2008
3.14
reader
software application that is able to read and process PDF/A files
3.15
writer
software application that is able to write PDF/A files
© ISO 2011 – All rights reserved 3
---------------------- Page: 9 ----------------------
ISO 19005-2:2011(E)
3.16
XMP packet
structured wrapper for serialized XMP metadata that can be embedded in PDF as well as other file formats
4 Notation
PDF operators, PDF keywords, the names of keys in PDF dictionaries, and other predefined names are
written in bold sans serif font; operands of PDF operators or values of dictionary keys are written in italic sans
serif font. Some names can also be used as values, depending on the context, and so the styling of the
content will be context specific.
EXAMPLE 1 The Default value for the TR2 key.
Token characters used to delimit objects and describe the structure of PDF files, as defined in
ISO 32000-1:2008, 7.2.1, may be identified by their ISO/IEC 646 character name written in upper case in bold
sans serif font followed by a parenthetic two digit hexadecimal character value with the suffix “h”.
EXAMPLE 2 CARRIAGE RETURN (0Dh).
Text string characters, as defined by ISO 32000-1:2008, 7.9.2, may be identified by their ISO/IEC 10646
character name written in uppercase in bold sans serif font followed by a parenthetic four digit hexadecimal
character code value with the prefix “U+”.
EXAMPLE 3 EN SPACE (U+2002).
The following terms, referring to ISO 19005, or parts thereof, are recommended when the full ISO name is not
being used:
“PDF/A” – a synonym for the ISO 19005 series of standards;
“PDF/A-1” – a synonym for ISO 19005-1;
“PDF/A-1a” – a synonym for ISO 19005-1 Level A conformance;
“PDF/A-1b” – a synonym for ISO 19005-1 Level B conformance.
“PDF/A-2” – a synonym for ISO 19005-2;
“PDF/A-2a” – a synonym for ISO 19005-2 Level A conformance;
“PDF/A-2b” – a synonym for ISO 19005-2 Level B conformance;
“PDF/A-2u” – a synonym for ISO 19005-2 Level U conformance.
5 Conformance levels
5.1 General
This part of ISO 19005 defines a file format for representing electronic documents known as “PDF/A-2”.
Conforming PDF/A-2 files shall adhere to all requirements of ISO 32000-1 as modified by this part of
ISO 19005. A conforming file may include any valid ISO 32000-1 feature that is not explicitly forbidden by this
part of ISO 19005. Features described in PDF specifications prior to Version 1.7 which are not explicitly
described in ISO 32000-1 should not be used.
NOTE 1 A conforming file is not obligated to use any PDF feature other than those explicitly required by ISO 32000-1
or this part of ISO 19005.
4 © ISO 2011 – All rights reserved
---------------------- Page: 10 ----------------------
ISO 19005-2:2011(E)
As described in 6.1.2, the version number of a file may be any value from 1.0 to 1.7, and the value shall not be
used in determining whether a file is in conformance with this part of ISO 19005.
NOTE 2 The proper mechanism by which a file can presumptively identify itself as being a PDF/A-2 file of a given
conformance level is described in 6.6.4.
5.2 Level A conformance
Level A conforming files shall adhere to all of the requirements of this part of ISO 19005. A file meeting this
conformance level is said to be a “conforming PDF/A-2a file”.
5.3 Level B conformance
In recognition of the varying preservation needs of the diverse user communities making use of PDF files, this
part of ISO 19005 defines a Level B conformance level. Level B conforming files shall adhere to all of the
requirements of this part of ISO 19005 except those of 6.2.11.7 and 6.7. A file meeting this conformance level
is said to be a “conforming PDF/A-2b file”.
NOTE 1 The Level B conformance requirements are intended to be the minimum necessary to ensure that the
rendered visual appearance of a conforming file is preservable over the long term. However, Level B conforming files
might not have sufficiently rich internal information to allow for the preservation of the document's logical structure and
content text stream in natural reading order, which is provided by Level A conformance. The requirements for Level A
conformance place greater responsibilities on writers of conforming files and those preparing such files, but these
requirements allow for a higher level of document preservation service and confidence over time. Additionally, Level A
conformance facilitates the accessibility of conforming files for physically impaired users.
NOTE 2 A Level B conforming file can include features from 6.2.11.7 and 6.7 but still be identified as Level B.
5.4 Level U conformance
In recognition of the varying preservation needs of the diverse user communities making use of PDF files, this
part of ISO 19005 defines a Level U conformance level. Level U conforming files shall adhere to all of the
requirements of this part of ISO 19005, except those of 6.7. A file meeting this conformance level is said to be
a “conforming PDF/A-2u file”.
NOTE 1 The Level U conformance requirements are intended to be those necessary to ensure that not only is the
rendered visual appearance of a conforming file preservable over the long term, but that any text contained in the
document can be reliably extracted as a series of Unicode codepoints. However, Level U conforming files might not have
sufficiently rich internal information to allow for the preservation of the document's logical structure and content text stream
in natural reading order, which is provided by Level A conformance. The requirements for Level A conformance place
greater responsibilities on writers of conforming files and those preparing such files, but these requirements allow for a
higher level of document preservation service and confidence over time. Additionally, Level A conformance facilitates the
accessibility of conforming files for physically impaired users.
NOTE 2 A Level U conforming file can include features from 6.7 but still be identified as Level U.
NOTE 3 Level U is new to this part of ISO 19005 and therefore does not have an equivalent in ISO 19005-1.
5.5 Conforming readers
A conforming reader shall comply with all requirements regarding reader functional behaviour specified in this
part of ISO 19005. The requirements of this part of ISO 19005 with respect to reader behaviour are stated in
terms of general functional requirements applicable to all conforming readers. This part of ISO 19005 does not
prescribe any specific technical design, user interface or implementation details of conforming readers.
The rendering and other processing of conforming files shall be performed as defined in ISO 32000-1, subject
to the additional restrictions specified by this part of ISO 19005. Features described in PDF specifications that
are not explicitly described in ISO 32000-1 shall be ignored by conforming readers.
Conforming PDF/A-2 readers shall read and process appropriately all PDF/A-2 files. In addition, conforming
PDF/A-2 readers shall read and process appropriately all PDF/A-1 files as defined by ISO 19005-1.
© ISO 2011 – All rights reserved 5
---------------------- Page: 11 ----------------------
ISO 19005-2:2011(E)
6 Technical requirements
6.1 File structure
6.1.1 General
Overall file format issues and the base elements that form the general structure of a conforming file are
addressed in 6.1.2 to 6.1.12.
Any data contained in a conforming file that is not described in ISO 32000-1 or in this part of ISO 19005
should be ignored by a conforming reader and shall not be used to render content on a page.
6.1.2 File header
The file header shall begin at byte zero and shall consist of “%PDF-1.n” followed by a single EOL marker,
where ‘n’ is a single digit number between 0 (30h) and 7 (37h).
The aforementioned EOL marker shall be immediately followed by a % (25h) character followed by at least
four bytes, each of whose encoded byte values shall have a decimal value greater than 127.
NOTE The presence of encoded byte values greater than decimal 127 near the beginning of a file is used by various
software tools and protocols to classify the file as containing 8-bit binary data that needs to be preserved during
processing.
6.1.3 File trailer
The file trailer dictionary shall contain the ID keyword whose value shall be File Identifiers as defined in
ISO 32000-1:2008, 14.4.
NOTE 1 No data can follow the last end-of-file marker except a single optional end-of-line marker as described in
ISO 32000-1:2008, 7.5.5.
The keyword Encrypt shall not be present in the trailer dictionary.
NOTE 2 The explicit prohibition of the Encrypt keyword has the implicit effect of disallowing encryption and password-
protected access permissions.
6.1.4 Cross-reference table
The xref keyword and the cross-reference subsection header shall be separated by a single EOL marker.
Any indirect object whose offset is not referenced in any cross-reference table, nor in any cross-reference
stream, shall be exempt from all requirements of this part of ISO 19005 and may be ignored by a conforming
reader. If a conforming reader does not ignore such indirect objects, they shall never influence the way
content is rendered.
6.1.5 Document information dictionary
A document information dictionary may be present in a conforming file and a PDF/A-2 compliant reader shall
ignore it.
NOTE Metadata can be included in a document through the use of XMP metadata streams as specified in 6.6.3.
6.1.6 String objects
The number of hexadecimal digits in a hexadecimal string shall always be even.
NOTE This avoids the need for the provision in ISO 32000-1 about the absence of the final hexadecimal digit.
6 © ISO 2011 – All rights reserved
---------------
...
Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.