Convertir un archivo PDF en archivo de texto desde una terminal

Hay muchas herramientas en Linux para convertir una archivo PDF a texto plano desde la linea de comandos, la herramienta que voy a mencionar aquí se llama «pdftotext» y viene instalada por defecto en la mayoría de distribuciones, si en tu caso no la tienes instalada prueba instalarla con el siguiente comando.

sudo apt-get install poppler-utils

El paquete «poppler-utils» contiene entre otras herramientas a «pdftotext», ahora que ya lo tienes instalado para convertir un archivo utilizamos el siguiente comando.

pdftotext archivopdf.pdf archivotxt.txt

El comando «pdftotext» tiene muchas opciones, por ejemplo puedes convertir un archivo pdf a texto conservando el diseño (encabezado, pie de pagina, etc.) usando el parámetro «-layout» como se muestra en el ejemplo siguiente.

pdftotext -layout archivopdf.pdf archivotxt.txt

También puedes convertir un archivo pdf protegido con password a texto usando el parámetro «-opw» como se muestra en el ejemplo siguiente.

pdftotext -opw «password» archivopdf.pdf archivotxt.txt

Para mas información lee su manual de uso con el comando «man pdftotext».

1 comentario en «Convertir un archivo PDF en archivo de texto desde una terminal»

Deja un comentario