* Imagenes de instalación de las versiones estables para Mageia y OpenMandriva.

OpenMandriva: Mageia (Mageia 9) 20/Agosto/2023 - Anuncio, Descargas.

Blogdrake recomienda descargar las imágenes de instalación (iso) vía torrent para evitar corrupción de datos, aprovechar mejor su ancho de banda y mejorar la difusión de las distribuciones.

¿Como extraigo el contenido de un PDF con Pdftk?

Hola,

No entiendo qué estoy haciendo mal, intento extraer las imagenes de un pdf no protegido, incluso siguiendo el ejemplo que trae 'pdftk report.pdf unpack_files output ~/atts/' sin resultado.    He creado una carpeta 'prueba' en el directorio actual y ejecutado 'pdftk foo.pdf unpack_files output prueba' y otras variantes sin resultado. Saludos.

Opciones de visualización de comentarios

Seleccione la forma que desee de mostrar los comentarios y haga clic en «Guardar opciones» para activar los cambios.


Gravatar de franciscodrake

# 103280 Hay un pequeño inconveniente

Los pdf son archivos tipo imagen, creo que esto ya lo sabes. El problema está en la manera como se generan, si se hizo una copia (un escaneo de una hoja) tu programa no va a reconocer ningún texto y el vaciado será en blanco pues lo que encuentra es una imagen grande. Si se trata de un texto vaciado en un pdf, como cuando generas uno a partir de un documento de OpenOffice entonces el vaciado se completa pues encuentra un montón de imágenes que corresponden a letras. 

Yo soy muy curioso e intenté escanear una hoja de texto para usar pdftk pero mis intentos fueron en vano, cuando lo hice con archivos generados por el procesador de textos el vaciado si funcionó. Luego de algún tiempo me enteré del detalle de como se generan y lo inútil de mis intentos.

Un BOFH aprendiz de todos.
Usa el IRC de Blogdrake coopera con otros usuarios en vivo.



Gravatar de tavillo1980

# 103286 Una pequeña corrección

Un PDF no es imagen. Es un "paquete".

http://es.wikipedia.org/wiki/PDF

Yo trabajo con ellos a diario por mi negocio. Los PDF contienen imágenes, texto (incluídas las tipografías si se quiere o convertido a curvas), audio / video, perfiles de color (como los ICC). Muy útil para la imprenta.

Si es un PDF generado a partir de una aplicación de escaneo, es probable que el contenido sea una imagen. Pero si el PDF es un volcado de una aplicación de diseño, por ejemplo, el contenido puede contener todo lo que dije anteriormente.

De todas maneras, si el PDF al abrirlo muestra algo, quiere decir que algo se debe poder extraer. Con esto me refiero a que si el contenido es una imagen solamente, pues entonces se debe poder extraer esa imagen.

T@villo

Aprender es como caminar: sin importar los años que hayan pasado, nunca estarás exento de tropezar.
Linux User # 463360



Gravatar de inot

# 103281 ¿ Usando el buscador ?

http://blogdrake.net/blog/inot/como-convertir-pdf-archivos-de-imagen-con-imagemagick

http://blogdrake.net/blog/inot/alternativa-adobe-acrobat-pdfedit-esta-en-los-repositorios

Con ese último se puede editar y extraer lo que quieras de pdf's


Al que está sentado en el trono, y al Cordero, sea la alabanza, la honra, la gloria
y el dominio por los siglos de los siglos.

Linux user #463168



Gravatar de alfema

# 103301 PDFedit

Hola inot,

   Una herramienta interesante pero no resulta muy útil para lo que quiero, puede extraer las imagenes pero una a una y además no hace extracción sino que genera una nueva imagen en el formato que queramos, con lo cual si generamos un "jpeg" de otro perdemos calidad.

   Seguiré investigando.

Saludos.

Saludos.



Gravatar de franciscodrake

# 103290 Tienes toda la razón

El buen Tabillo no se equivoca, como siempre yo trato de simplificar tanto que olvidé que son paquetes y no archivos de imagen, por semejante burrada me disculpo, pero en el fondo en lo correcto al decir que no vaciará texto donde hay imagen.

Un BOFH aprendiz de todos.
Usa el IRC de Blogdrake coopera con otros usuarios en vivo.



Gravatar de alfema

# 103297 Concretando sobre estos PDF,

Concretando sobre estos PDF, decir que son tebeos en formato PDF, he tomado uno al azar y el contenido son imagenes en formato JPEG, así que se deberían extraer dichas imagenes.

Haré la prueba con las herramientas que me indicáis, pero me quedará la duda de porque 'pdftk' no ha funcionado.

Saludos.

Opciones de visualización de comentarios

Seleccione la forma que desee de mostrar los comentarios y haga clic en «Guardar opciones» para activar los cambios.