Me encontré con un increíble fragmento de código Python que convierte libros electrónicos PDF en audiolibros con un código mínimo.
El fragmento de código utiliza dos paquetes de Python:
- PyPDF2: una biblioteca de PDF pura de Python gratuita y de código abierto capaz de dividir, fusionar, recortar y transformar las páginas de archivos PDF. También puede agregar datos personalizados, opciones de visualización y contraseñas a archivos PDF. PyPDF2 también puede recuperar texto y metadatos de archivos PDF.
- PyTTSx3, que es una biblioteca de conversión de texto a voz en Python. A diferencia de las bibliotecas alternativas, funciona sin conexión y es compatible con Python 2 y 3.
El código es bastante sencillo y demuestra lo simple y genial que es Python.
Primero instale los paquetes requeridos
pip install PyPDF2
pip install pyttsx3
Ahora cree su archivo de script Python y agregue:
import PyPDF2
import pyttsx3
# Read the pdf by specifying the path in your computer
pdfReader = PyPDF2.PdfFileReader(open('clcoding.pdf', 'rb'))
# Get the handle to speaker
speaker = pyttsx3.init()
# split the pages and read one by one
for page_num in range(pdfReader.numPages):
text = pdfReader.getPage(page_num). extractText()
speaker.say(text) #clcoding.com
speaker.runAndWait()
# stop the speaker after completion
speaker.stop()
# save the audiobook at specified path
engine.save_to_file(text, 'E:\audio.mp3')
engine.runAndWait()
Encontre un tutorial bastante cercanol de 2020 que explica más, por Aman Kharwal.
Recursos
Etiquetas
Programación en Python Desarrollo de tutoriales Tts de código abierto