PDF Pro Guía
InicioGuíasExtraer imágenes de PDF

Cómo extraer imágenes de un PDF — usando el extractor de imágenes de PDF Pro.

2 min de lectura 🎯 Fácil 🛠 Extractor de imágenes de PDF Pro

Esta guía es para el marketer que recupera la foto principal de un manual de marca antiguo, el ingeniero que saca diagramas de la hoja de datos de un proveedor y para cualquiera que necesite el recurso de imagen real ya dentro de un PDF — no una captura borrosa de él. Cinco pasos para recuperar los bytes originales que el autor incrustó, a la resolución original.

Lo que necesitarás

Los cinco pasos

1

Abre el extractor en navegador

Entra en el extractor de imágenes de PDF Pro. La página carga un parser PDF en WebAssembly y se ejecuta enteramente en tu pestaña — sin ida y vuelta al servidor, sin registro, sin cola. Como la extracción lee el flujo de objetos del PDF directamente, la operación es rápida: un documento de 200 páginas se procesa en segundos, no en minutos.

2

Suelta el PDF en la página

Arrastra el archivo. El extractor recorre el árbol de objetos del PDF, encuentra cada XObject de subtipo Image y lee el flujo comprimido subyacente — típicamente DCTDecode (JPEG), FlateDecode (tipo PNG), JBIG2 o JPEG2000. Cada imagen se lista con su número de página, dimensiones originales, espacio de color y tamaño aproximado.

Si un "logo" que esperabas ver no aparece, casi seguro es vectorial — dibujado con operadores de trazado de PDF en lugar de incrustado como raster. Los logos vectoriales no se pueden extraer como píxeles a calidad original; hay que volver a renderizarlos (usa el conversor PNG a alto DPI en ese caso).

3

Filtra y selecciona lo que de verdad quieres

Un folleto típico tiene decenas de imágenes incrustadas diminutas — glifos de viñeta, texturas de cabecera, patrones que se repiten. Pon un filtro de dimensión mínima (300×300 es un valor por defecto razonable) para ocultar el ruido y mostrar solo los recursos que realmente quieras. Luego haz clic para seleccionar imágenes concretas o usa "seleccionar todas las visibles" tras filtrar.

4

Elige preservar el original o normalizar

Dos modos de salida. Preservar original escribe cada imagen con sus bytes nativos intactos — un JPEG sale como .jpg con los coeficientes DCT originales sin tocar, un flujo PNG sale como .png. Es la opción correcta cuando el recurso es el objetivo: máxima fidelidad, cero recodificación. Normalizar a PNG convierte todo a PNG sin pérdida, útil cuando necesitas tipos de archivo consistentes o la fuente usa una codificación exótica (JBIG2, JPEG CMYK) que algunas herramientas posteriores no manejan.

5

Descarga las imágenes

Haz clic en cualquier miniatura para una descarga individual o pulsa "Descargar todo" para obtener un zip. Los nombres siguen el patrón nombreoriginal-p007-img02.jpg para que puedas rastrear cada recurso a su página y posición ordinal. Abre uno en tu visor; si usaste preservar el original, el bloque de metadatos (EXIF de cámara, perfil ICC, marca de tiempo) también está intacto. Toda la operación ocurrió en tu navegador — no hay copia del PDF ni de sus recursos en ningún servidor.

Descargar 8 imágenes (zip)

Errores y trampas habituales

Solución de problemas

El extractor dice "0 imágenes encontradas" pero el PDF claramente tiene gráficos.

Los gráficos son vectoriales, no raster. PDF puede renderizar formas, ilustraciones y muchos "logos" como datos de trazado — no hay recurso de píxeles incrustado que extraer. Vuelve a renderizar la página (o un recorte) usando el conversor PNG a 600 DPI para capturar el arte vectorial como mapa de bits de alta calidad.

Una imagen extraída está dividida en muchas baldosas en lugar de en una sola foto.

Algunas herramientas de creación de PDF (exportaciones antiguas de InDesign, escáneres) embaldosan imágenes grandes en tiras de 256×256. El extractor listará cada baldosa como una imagen separada. La solución: usa el modo rasterizar la página, que te da el visual ensamblado al coste de una pasada de recodificación.

Los JPEGs extraídos se ven correctos en el PDF pero con colores erróneos al abrirlos.

Casi siempre un desajuste CMYK vs sRGB. El PDF incrustó un JPEG CMYK y tu visor lo está interpretando como sRGB. Vuelve a extraer con normalizar a PNG activado — el conversor aplicará la transformación de color correcta a la salida.

Veo la misma imagen listada cinco veces en el PDF.

O bien la misma imagen está colocada en cinco páginas (muy común — cabeceras, marcas de agua), o el PDF ha duplicado el flujo de imagen en lugar de referenciarlo una sola vez. Activa "deduplicar flujos idénticos" antes de descargar y el inventario colapsa a una entrada por recurso único.

El PDF está protegido por contraseña. ¿Puedo extraer igualmente?

Sí, si conoces la contraseña. El extractor la pide al cargar y descifra el flujo de objetos en tu navegador; la contraseña se guarda solo en memoria y se descarta al cerrar la pestaña. Si no la conoces, el extractor — como toda herramienta honesta — no te ayudará a saltártela.

¿Listo para extraer?

Abre el extractor de imágenes en navegador y pasa tu PDF por los cinco pasos de arriba.

Abrir la herramienta →