Imagenes de instalación de las versiones estables para Mageia y OpenMandriva.

OpenMandriva:

(Lx 6.0) 25/Abril/2025 - Anuncio, Descargas .
ROME 24.12 - 11/Diciembre/2024 - Anuncio, Descargas

Mageia (Mageia 9) 20/Agosto/2023 - Anuncio, Descargas.

Blogdrake recomienda descargar las imágenes de instalación (iso) vía torrent para evitar corrupción de datos, aprovechar mejor su ancho de banda y mejorar la difusión de las distribuciones.

¿Como extraigo el contenido de un PDF con Pdftk?

Enviado por alfema el 16 Mayo, 2010 - 12:22

Hola,

No entiendo qué estoy haciendo mal, intento extraer las imagenes de un pdf no protegido, incluso siguiendo el ejemplo que trae 'pdftk report.pdf unpack_files output ~/atts/' sin resultado. He creado una carpeta 'prueba' en el directorio actual y ejecutado 'pdftk foo.pdf unpack_files output prueba' y otras variantes sin resultado. Saludos.

» Enlace permanente»

Entra a tu cuenta o crea una para poder comentar.

franciscodrake
BOFH

# 103280 Hay un pequeño inconveniente

Escrito el 16 Mayo, 2010 - 16:19

Los pdf son archivos tipo imagen, creo que esto ya lo sabes. El problema está en la manera como se generan, si se hizo una copia (un escaneo de una hoja) tu programa no va a reconocer ningún texto y el vaciado será en blanco pues lo que encuentra es una imagen grande. Si se trata de un texto vaciado en un pdf, como cuando generas uno a partir de un documento de OpenOffice entonces el vaciado se completa pues encuentra un montón de imágenes que corresponden a letras.

Yo soy muy curioso e intenté escanear una hoja de texto para usar pdftk pero mis intentos fueron en vano, cuando lo hice con archivos generados por el procesador de textos el vaciado si funcionó. Luego de algún tiempo me enteré del detalle de como se generan y lo inútil de mis intentos.

—

Un BOFH aprendiz de todos.
Usa el IRC de Blogdrake coopera con otros usuarios en vivo.

Entra a tu cuenta o crea una para poder comentar.

tavillo1980
BOFH

# 103286 Una pequeña corrección

Escrito el 17 Mayo, 2010 - 01:56

Un PDF no es imagen. Es un "paquete".

http://es.wikipedia.org/wiki/PDF

Yo trabajo con ellos a diario por mi negocio. Los PDF contienen imágenes, texto (incluídas las tipografías si se quiere o convertido a curvas), audio / video, perfiles de color (como los ICC). Muy útil para la imprenta.

Si es un PDF generado a partir de una aplicación de escaneo, es probable que el contenido sea una imagen. Pero si el PDF es un volcado de una aplicación de diseño, por ejemplo, el contenido puede contener todo lo que dije anteriormente.

De todas maneras, si el PDF al abrirlo muestra algo, quiere decir que algo se debe poder extraer. Con esto me refiero a que si el contenido es una imagen solamente, pues entonces se debe poder extraer esa imagen.

—

T@villo

Aprender es como caminar: sin importar los años que hayan pasado, nunca estarás exento de tropezar.
Linux User # 463360

Entra a tu cuenta o crea una para poder comentar.

inot
BOFH

# 103281 ¿ Usando el buscador ?

Escrito el 16 Mayo, 2010 - 16:59

http://blogdrake.net/blog/inot/como-convertir-pdf-archivos-de-imagen-con-imagemagick

http://blogdrake.net/blog/inot/alternativa-adobe-acrobat-pdfedit-esta-en-los-repositorios

Con ese último se puede editar y extraer lo que quieras de pdf's

—

Al que está sentado en el trono, y al Cordero, sea la alabanza, la honra, la gloria
y el dominio por los siglos de los siglos.
Linux user #463168

Entra a tu cuenta o crea una para poder comentar.

alfema
Usuario

# 103301 PDFedit

Escrito el 18 Mayo, 2010 - 08:41

Hola inot,

Una herramienta interesante pero no resulta muy útil para lo que quiero, puede extraer las imagenes pero una a una y además no hace extracción sino que genera una nueva imagen en el formato que queramos, con lo cual si generamos un "jpeg" de otro perdemos calidad.

Seguiré investigando.

Saludos.

—

Saludos.

Entra a tu cuenta o crea una para poder comentar.

franciscodrake
BOFH

# 103290 Tienes toda la razón

Escrito el 17 Mayo, 2010 - 08:30

El buen Tabillo no se equivoca, como siempre yo trato de simplificar tanto que olvidé que son paquetes y no archivos de imagen, por semejante burrada me disculpo, pero en el fondo en lo correcto al decir que no vaciará texto donde hay imagen.

—

Un BOFH aprendiz de todos.
Usa el IRC de Blogdrake coopera con otros usuarios en vivo.

Entra a tu cuenta o crea una para poder comentar.

alfema
Usuario

# 103297 Concretando sobre estos PDF,

Escrito el 17 Mayo, 2010 - 22:06

Concretando sobre estos PDF, decir que son tebeos en formato PDF, he tomado uno al azar y el contenido son imagenes en formato JPEG, así que se deberían extraer dichas imagenes.

Haré la prueba con las herramientas que me indicáis, pero me quedará la duda de porque 'pdftk' no ha funcionado.

—

Saludos.

Entra a tu cuenta o crea una para poder comentar.

BuscaDrake 4

Navegación

Bienvenido a BlogDRAKE

Discusiones activas

Envíos recientes de blog

Nuevas discusiones

Blogs Oficiales

Planeta BlogDRAKE

Otros Blogs

Bilo y Nano

Actualizaciones de seguridad

NO a las Patentes de Software

Licencia

Feed

¿Como extraigo el contenido de un PDF con Pdftk?

Opciones de visualización de comentarios

# 103280 Hay un pequeño inconveniente

# 103286 Una pequeña corrección

# 103281 ¿ Usando el buscador ?

# 103301 PDFedit

# 103290 Tienes toda la razón

# 103297 Concretando sobre estos PDF,

Opciones de visualización de comentarios