Hay muchas herramientas en Linux para convertir una archivo PDF a texto plano desde la linea de comandos, la herramienta que voy a mencionar aquí se llama “pdftotext” y viene instalada por defecto en la mayoría de distribuciones, si en tu caso no la tienes instalada prueba instalarla con el siguiente comando.

sudo apt-get install poppler-utils

El paquete “poppler-utils” contiene entre otras herramientas a “pdftotext”, ahora que ya lo tienes instalado para convertir un archivo utilizamos el siguiente comando.

pdftotext archivopdf.pdf archivotxt.txt

El comando “pdftotext” tiene muchas opciones, por ejemplo puedes convertir un archivo pdf a texto conservando el diseño (encabezado, pie de pagina, etc.) usando el parámetro “-layout” como se muestra en el ejemplo siguiente.

pdftotext -layout archivopdf.pdf archivotxt.txt

También puedes convertir un archivo pdf protegido con password a texto usando el parámetro “-opw” como se muestra en el ejemplo siguiente.

pdftotext -opw “password” archivopdf.pdf archivotxt.txt

Para mas información lee su manual de uso con el comando “man pdftotext”.

Categorías: Linux

1 Comentario

Omar Rodriguez · 25 octubre, 2016 en 8:22 pm

necesito una mano urgente, tengo un profesor que dejo como tarea convertir un archivo texto en pdf por linea de comando en linux, quisiera una ayuda

Los comentarios están cerrados.

A %d blogueros les gusta esto: