PDF

Portable Document Format
Desarrollador
Adobe Systems
Información general
Extensión de archivo .pdf
Tipo de MIME

application/pdf
application/x-bzpdf

application/x-gzpdf
Type code 'PDF ' (incluye un espacio)
Uniform Type Identifier com.adobe.pdf
Número mágico %PDF
Tipo de formato
Estándar(es) ISO/IEC 32000-1:2008
Formato abierto  
[editar datos en Wikidata]

PDF (sigla del inglés Portable Document Format, «formato de documento portátil») es un formato de almacenamiento para documentos digitales independiente de plataformas de software o hardware. Este formato es de tipo compuesto (imagen vectorial, mapa de bits y texto).

Fue inicialmente desarrollado por la empresa Adobe Systems, oficialmente lanzado como un estándar abierto el 1 de julio de 2008 y publicado por la Organización Internacional de Estandarización (ISO) como ISO 32000-1.

Características del PDF

Reseña histórica

Los archivos PDF, junto con las aplicaciones que podían ver y crear este tipo de documentos, comenzaron a desarrollarse a partir de 1991, y su adopción comercial y general era muy reducida.

Su software se distribuía como software de licencia comercial. En esa época el visor de documentos PDF estaba disponible de forma gratuita (freeware), pero no de forma libre.

El cofundador de Adobe, John Warnock, introdujo el concepto de «documento de formato portátil» (PDF) en 1992 como parte de su concepto oficina sin papeles.[3] Acrobat, el software para crear o procesar el formato de archivos PDF, fue lanzado comercialmente el siguiente año (1993). La mayoría de los archivos PDF se pueden ver e imprimir en prácticamente cualquier computadora o dispositivo móvil.

Versiones del formato PDF

El formato de archivos PDF ha cambiado varias veces, relacionadas con las nuevas versiones de Acrobat que ha ido lanzando Adobe.

Ha habido nueve versiones de PDF:

Año Versión de PDF Versión de Adobe Acrobat
1993 PDF 1.0 Acrobat 1.0
1994 PDF 1.1 Acrobat 2.0
1996 PDF 1.2 Acrobat 3.0
1999 PDF 1.3 Acrobat 4.0
2001 PDF 1.4 Acrobat 5.0
2003 PDF 1.5 Acrobat 6.0
2005 PDF 1.6 Acrobat 7.0
2006 PDF 1.7 Acrobat 8.0 / ISO 32000
2008 PDF 1.7, Adobe Extension Level 3 Acrobat 9.0
2009 PDF 1.7, Adobe Extension Level 5 Acrobat 9.1

Archivos PDF

Los archivos PDF se utilizan para almacenar documentos, interactivos y regulares, así como mapas, gráficos, catálogos, presentaciones y libros electrónicos.

Las versiones tempranas de los documentos PDF no tenían hipervínculos externos; por este motivo, su adopción en Internet era considerablemente reducida y no tenía mucha popularidad. En esos tiempos, eran comunes las conexiones a Internet a través de módems telefónicos, y el tamaño de los documentos PDF era mucho más grande que otros tipos de documentos, como por ejemplo: el texto simple (sin formato); por lo tanto, la banda ancha fue un factor clave para su aceptación en Internet. Además, ya existían otros tipos de documentos que le hacían fuerte competencia al tipo de documentos PDF, como por ejemplo, los documentos PostScript (.ps), los cuales, en esos tiempos, eran considerablemente comunes.

Con el tiempo, los documentos PDF fueron adquiriendo popularidad de varias formas diferentes, como publicidad. Este tipo de documentos empezó a popularizarse considerablemente, hasta convertirse en un estándar de facto.[cita requerida] Este tipo de documento es visto como una “página digital” que está lista para imprimirse exactamente como se muestra en la pantalla, sin problemas de márgenes a la hora de imprimir, tal como sucede en otros documentos digitales.

En los años recientes de su popularidad, han salido varias aplicaciones lectoras de este tipo de archivos. Su popularidad ha abierto la posibilidad de crear documentos PDF con programas de software libre, como lo hace por ejemplo, OpenOffice.org. Otras aplicaciones, son incluso capaces de editarlos, sin necesidad de usar la típica aplicación para crear y editar documentos PDF de Adobe.

Hay cuatro tipos de archivos PDF.

Archivos de solo imágenes

Un archivo de sólo imágenes se presenta como una imagen de mapa de bits o una instantánea. Debido a que es una instantánea, cualquier texto no se puede buscar. Sin embargo, este formato es útil cuando las versiones digitales deben ser absolutamente fieles a las originales, como en los casos de facturas o documentos legales.

Documentos sin etiquetas

Los documentos sin etiquetar se han creado sin etiquetas PDF. Las etiquetas PDF son similares a las etiquetas utilizadas en el código HTML para hacer la búsqueda Web más accesible. El texto en documentos sin etiqueta es a menudo difícil de leer. Cuando sucede esto, aparecerá un cuadro de diálogo, dando al usuario la opción de añadir etiquetas.

Documentos etiquetados

Los documentos etiquetados son fáciles de encontrar a través de una búsqueda web. Son fáciles de leer, optimizados para ser vistos en una pantalla pequeña y capaces de ser copiados.

Formularios electrónicos

Los formularios PDF electrónicos ofrecen al usuario la posibilidad de guardar los datos introducidos con en el teclado o copiados de un archivo existente. Los formularios terminados pueden ser protegidos con contraseña y guardados. Los formularios también pueden ser publicados en Internet o enviados a través de correo electrónico.

Formato de archivo PDF

Independientemente de cómo se hayan creado los archivos PDF, todos ellos comparten la misma estructura interna compuesta de cuatro partes:

  1. Cabecera: información sobre la especificación del estándar PDF que se ha seguido, en donde se indica, por ejemplo, la versión.
  2. Cuerpo: descripción de los elementos usados en las páginas del documento.
  3. Tabla de referencias cruzadas: información de los elementos usados en las páginas del archivo.
  4. Coda: indica dónde encontrar la tabla de referencias cruzadas.

Notar que cuando un archivo PDF es modificado y se añade nuevo contenido, este tendrá nuevas secciones de cuerpo, tabla de referencias cruzadas y coda, pero al guardar este documento se puede optimizarlo para que las secciones duplicadas se fusionen en una sola y se reorganice el archivo.

Representación de color en PDF

El formato PDF está indicado para la impresión de documentos, ya que especifica toda la información necesaria que lo definen. Es interesante especificar cómo se hace la representación de colores del fichero en PDF.

En el formato PDF se especifican espacios de color, esto es la descripción de cómo hay que interpretar los colores del documento.

Un color se define mediante uno o varios componentes numéricos y la interpretación de estos se hará según el espacio de color especificado.

Los espacios de color pueden ser:

Dependientes del dispositivo

Es la forma más simple e imprecisa de reproducir colores, usada por aparatos que no disponen de gestores de color. Cada punto es descrito por un color que está compuesto de ciertas cantidades de colorantes.

Para PDF existen tres espacios de colores distintos dependientes del dispositivo:

ModoColorDescripción
CMYKVerde puro(66 %, 0 %, 100 %, 0 %)
RGBVerde puro (0,255,0)
GrisVerde puro Negro=20%

Al usar la definición de color dependiente, aunque tenga unos mismos valores del color, la reproducción de ellos variará según el dispositivo que lo reproduzca.

Independientes del dispositivo

Estos espacios de color están basados en la Comisión Internacional de la Iluminación (CIE), organización internacional que estudia la luz y el color. Su objetivo es describir con detalle cómo ve el ser humano e intenta reproducirlos de la misma forma, independientemente del dispositivo que lo reproduzca.

A estos colores también se les llama “calibrados”. Los colores son descritos mediante matrices numéricas y se modifican mediante transformaciones de valores usando las ideas de colores neutros más claros y más oscuros.

Para PDF existen cuatro espacios de colores distintos independientes del dispositivo:

Espaciales

Se utilizan métodos especiales de reproducción del color.

Compresión en PDF

Los archivos PDF se pueden comprimir y cada elemento del mismo es comprimido mediante uno u otro algoritmo.

Los textos y órdenes PostScript se pueden comprimir usando el algoritmo Lempel Ziv Welch (LZW) y las imágenes mediante JPEG, ZIP o RLE.

JPEG

JPEG (Joint Photographic Experts Group), en modo con pérdidas o sin pérdidas usado para imágenes en escala de grises o cuatricromías. Si se recomprime causa pérdida acumulativa de información.

ZIP

ZIP (Formato de compresión ZIP) realizada mediante el algoritmo LZW, sin pérdidas, en donde reemplaza secuencias repetidas por marcadores. Indicado para imágenes en color y escala de grises.

RLE

RLE (Run-length encoding) sistema sin pérdidas usado para imágenes de línea (gráfico rasterizado).

Referencias

Véase también

Enlaces externos

This article is issued from Wikipedia - version of the Saturday, February 06, 2016. The text is available under the Creative Commons Attribution/Share Alike but additional terms may apply for the media files.