Tue. Mar 5th, 2024

Descubre las ventajas de eSpeak, un potente software TTS de código abierto para convertir texto a voz

By admin Jan 31, 2024

eSpeak es un sintetizador de voz compacto de software de código abierto para inglés y otros idiomas, para Linux y Windows.

Es un motor confiable de texto a voz para inglés y muchos otros idiomas. Tamaño compacto con pronunciación clara pero artificial. Disponible como programa de línea de comandos con muchas opciones, una biblioteca compartida para Linux y una versión Windows SAPI5.

eSpeak utiliza un método de “síntesis de formantes”. Esto permite ofrecer muchos idiomas en un tamaño pequeño. El habla es clara y se puede utilizar a altas velocidades, pero no es tan natural ni tan fluida como la de los sintetizadores más grandes que se basan en grabaciones de voz humana.

eSpeak está disponible como:

  • Un programa de línea de comandos (Linux y Windows) para leer texto desde un archivo o desde stdin.
  • Una versión de biblioteca compartida para uso de otros programas. (En Windows esto es una DLL).
  • Una versión SAPI5 para Windows, por lo que se puede utilizar con lectores de pantalla y otros programas que admitan la interfaz SAPI5 de Windows.
  • eSpeak se ha portado a otras plataformas, incluidas Android, Mac OSX y Solaris.

Características

  • Incluye diferentes Voces, cuyas características pueden ser alteradas.
  • Puede producir salida de voz como un archivo WAV.
  • Se admite SSML (lenguaje de marcado de síntesis de voz) (no completo) y también HTML.
  • Tamaño compacto. El programa y sus datos, incluidos muchos idiomas, ocupan aproximadamente 2 Mbytes.
  • Se puede utilizar como interfaz para voces difono MBROLA, consulte mbrola.html. eSpeak convierte texto en fonemas con información de tono y longitud.
  • Puede traducir texto a códigos de fonemas, por lo que podría adaptarse como interfaz para otro motor de síntesis de voz.
  • Potencial para otros idiomas. Varios están incluidos en distintas etapas de progreso. Se agradece la ayuda de hablantes nativos de estos u otros idiomas.
  • Hay herramientas de desarrollo disponibles para producir y ajustar datos de fonemas.
  • Escrito en c.

Utilizo eSpeak con regularidad para escuchar blogs y sitios de noticias. Prefiero el sonido a través de un sistema estéreo doméstico en lugar de los pequeños altavoces de computadora, que pueden sonar bastante ásperos.

Idiomas soportados

eSpeak realiza síntesis de texto a voz para los siguientes idiomas, algunos mejores que otros.

afrikáans, albanés, aragonés, armenio, búlgaro, cantonés, catalán, croata, checo, danés, holandés, inglés, esperanto, estonio, farsi, finlandés, francés, georgiano, alemán, griego, hindi, húngaro, islandés, indonesio, irlandés, italiano, kannada, kurdo, letón, lituano, lojban, macedonio, malayo, malayalam, mandarín, nepalí, noruego, polaco, portugués, punjabí, rumano, ruso, serbio, eslovaco, español, suajili, sueco, tamil, turco, vietnamita, Galés.

hablar es un programa GUI utilizado para preparar y compilar datos de fonemas. Ya está disponible para descargar. Actualmente, la documentación es escasa, pero si desea utilizarla para agregar o mejorar la compatibilidad con idiomas, hágamelo saber.

Recursos

Etiquetas

Productividad Tts de código abierto Linux Windows Arch Linux Linux Mint macos

By admin

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *