Mon. Feb 26th, 2024

Convierte cualquier PDF a audiolibro usando Python

By admin Jan 30, 2024

Me encontré con un increíble fragmento de código Python que convierte libros electrónicos PDF en audiolibros con un código mínimo.

El fragmento de código utiliza dos paquetes de Python:

  1. PyPDF2: una biblioteca de PDF pura de Python gratuita y de código abierto capaz de dividir, fusionar, recortar y transformar las páginas de archivos PDF. También puede agregar datos personalizados, opciones de visualización y contraseñas a archivos PDF. PyPDF2 también puede recuperar texto y metadatos de archivos PDF.
  2. PyTTSx3, que es una biblioteca de conversión de texto a voz en Python. A diferencia de las bibliotecas alternativas, funciona sin conexión y es compatible con Python 2 y 3.

El código es bastante sencillo y demuestra lo simple y genial que es Python.

Primero instale los paquetes requeridos

pip install PyPDF2
pip install pyttsx3

Ahora cree su archivo de script Python y agregue:

import PyPDF2
import pyttsx3
# Read the pdf by specifying the path in your computer
pdfReader = PyPDF2.PdfFileReader(open('clcoding.pdf', 'rb'))
# Get the handle to speaker
speaker = pyttsx3.init()
# split the pages and read one by one
for page_num in range(pdfReader.numPages):
text = pdfReader.getPage(page_num). extractText()
speaker.say(text) #clcoding.com
speaker.runAndWait()
# stop the speaker after completion
speaker.stop()
# save the audiobook at specified path
engine.save_to_file(text, 'E:\audio.mp3')
engine.runAndWait()

Encontre un tutorial bastante cercanol de 2020 que explica más, por Aman Kharwal.

Recursos

Etiquetas

Programación en Python Desarrollo de tutoriales Tts de código abierto

By admin

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *