Tue. Dec 24th, 2024

Top 10 Open Source Voice Assistant Projects for Developers

By admin Jan 31, 2024

Los asistentes de voz o asistentes de voz personales son programas que utilizan procesamiento del lenguaje natural (NLP) y síntesis de voz para realizar determinadas tareas según las órdenes del usuario. Actualmente, han sido una parte importante de nuestros teléfonos inteligentes y computadoras durante los últimos años. Si eres usuario de iPhone, seguramente estás usando Siri, o si eres usuario de Android, conoces a tu Asistente de Google.

Los principales actores han lanzado asistentes de voz en los últimos años, como Apple, Microsoft, Amazon, Google y Facebook. Ahora tenemos proyectos de código abierto que dan a las personas la opción de crear sus propios asistentes personales e implementarlos en sus hogares inteligentes.

¿Cuál es la diferencia entre asistente de voz y asistente inteligente?

El asistente inteligente es un programa creado para ayudar al usuario a realizar tareas. A menudo utiliza procesamiento de lenguaje natural e inteligencia artificial. Sin embargo, el asistente de voz es un asistente inteligente en sí mismo, pero está orientado a la tecnología, ya que utiliza reconocimiento de voz, síntesis de voz junto con procesamiento del lenguaje natural (PLN).

¿Cómo funciona el asistente de voz?

El asistente de voz responde a una determinada palabra clave como “OK Google”, “Hola Siri”, “Alexa” y “Hola Cortana”, activa el asistente para esperar más instrucciones o tareas.

Los asistentes de voz son una producción de la integración de la IA en nuestra rutina diaria. Son lo suficientemente inteligentes como para reconocer las voces de sus usuarios y algunos están diseñados para realizar tareas complejas basadas en algoritmos de aprendizaje automático.

¿Qué asistente de voz puede hacer?

  • Tomando notas
  • Crea un calendario
  • Reserva de citas
  • llamando a un telefono
  • buscando en internet
  • Creando recordatorios
  • Hacer resevaciones
  • Buscar una ubicación
  • Notas de lectura, libros y artículos.

Las tecnologías de código abierto brindan opciones flexibles a los creadores, nuevas empresas y desarrolladores para crear sus propios productos de consumo. Eso permite a los desarrolladores experimentar, ampliar la usabilidad a otro campo y crear productos orientados al sector.

1-Microft

microf es un asistente de voz de código abierto creado para máquinas Linux, se puede instalar en computadoras de escritorio Linux y Raspberry Pi. Mycroft está orientado a la privacidad y no recopila ni monetiza sus datos.

Mycroft marca 1

Mycroft AI ha sido lanzado Mycroft marca 1 que es un dispositivo habilitado para Mycroft dirigido a desarrolladores como un prototipo avanzado, Mycroft Mark II se lanzará este mes (diciembre de 2018), que es un altavoz listo para el consumo para usuarios finales.

Mycroft Mark II

Mycroft ha proporcionado a los desarrolladores documentación para construir sus productos usando Mycroft en un dispositivo basado en Linux, por lo que los desarrolladores no se limitan a Raspberry Pi sino a cualquier máquina y computadora de placa única preparadas para Linux.

Actualmente, Mycroft no tiene soporte para Windows y Mac OSX, me suscribí a su lista de correo para recibir notificaciones sobre el soporte para Mac OSX y Windows desde hace más de un año. Con suerte, pronto se admitirán otros sistemas operativos.

  • Plataformas: Linux, Raspberry Pi
  • Compatible con desarrolladores: sí
  • Estado de desarrollo: activo, basado en la comunidad.

2- Caliope

calíope es un asistente personal controlado por voz, modular y de código abierto, diseñado específicamente para la automatización del hogar. Fue creado para ejecutarse en teléfonos Linux, Raspberry Pi y Android.

Kalliope está diseñado para desarrolladores con documentación, API y herramientas potentes y ricas para desarrolladores.

Cliente Android Kalliope – src

Ecosistema del mercado de Kalliope.Como Kalliope se basa en una arquitectura modular, tiene un mercado para señales que desencadenan la respuesta, neuronas que son complementos para realizar acciones específicas. El mercado de neuronas tiene neuronas centrales y neuronas comunitarias creadas por desarrolladores comunitarios.

Demostración del asistente de voz Kalliope

Más herramientas para desarrolladores:

  • API REST de Kalliope
  • Carcasa interactiva del asistente de voz Kalliope
  • Interfaz de usuario web de Kalliope
  • Aplicación para Android Kalliope

Plataformas: Linux/Raspberry Pi y Android

3- Estefanía

Estefanía es una plataforma de código abierto creada específicamente para aplicaciones controladas por voz, así como para automatizar tareas diarias imitando gran parte del trabajo de un asistente virtual.

El asistente de voz Stephanie se lanzó bajo licencia MIT, con documentación completa destinada a que el usuario final y los desarrolladores lo instalen, configuren y utilicen. Los desarrolladores pueden ampliarlo fácilmente creando sus propios módulos.

Documentación de Stephanie – src

El código de Stephanie ha sido mirado unas 700 veces y bifurcado unas 100 veces.

Plataforma: Linux, Windows y Mac OSXAmigo desarrollador: síEstado de desarrollo: estableComunidad: SlackLicencia: MIT

4-Asistente abierto

Asistente abierto es un asistente personal de código abierto. Responde a comandos de voz en un rico diálogo conversacional como en el video de demostración. Ha estado en la fase de creación de prototipos durante mucho tiempo, pero se las arregla para estar bajo la vigilancia de los desarrolladores y se ha bifurcado muchas veces.

Open Assistant es fácil de instalar, sin embargo, carece de documentación para desarrolladores. Teniendo en cuenta que solo hay un desarrollador principal, el proyecto aún está en desarrollo activo.

Plataformas: Windows, Linux y macOS

5- Fuego de dragón

Fuego de Dragon es un asistente virtual creado específicamente para distribuciones Ubuntu-Linux. Proporciona un cliente de Android que se puede instalar en Google Play Store.

Usos del fuego de dragón Mozilla DeepSpeech para entender sus comandos de voz y Sistema de síntesis de discursos en festivales para manejar tareas de conversión de texto a voz. Video de Dragonfire en acción. Publicado 2015

  • Plataforma: Linux (KDE neon, sistema operativo elemental, Ubuntu)
  • Soporte de idiomas: inglés

6- Jaspe

Jaspe es una plataforma de código abierto para crear asistentes de voz y ampliar la aplicación con funciones de asistente de voz. Sin embargo
, hasta ahora está orientado a Raspberry Pi.

Jasper se lanzó bajo licencia MIT. Proporciona documentación completa y una API amigable para los desarrolladores para crear aplicaciones.

Jaspe presentación y demostración – YouTube

Plataforma: Raspberry Pi y Linux

7-Jarvis

jarvis Es un asistente de código abierto que se puede instalar y ejecutar a través de la terminal de Linux, Mac OSX y Windows. Tiene una estructura modular. Tiene funciones de asistente de voz. Aunque el proyecto todavía está en desarrollo activo. Es principalmente para desarrolladores y usuarios avanzados en el estado actual.

Asistente de Jarvis en acción

Plataformas: Linux, Mac OSX y Windows

8-Linto

linto es un asistente de voz de código abierto, creado para empresas. Se centra en la automatización de las tareas de la reunión. Linto tiene un dispositivo de código abierto que tiene como objetivo proporcionar una plataforma personalizable para desarrolladores, fabricantes de parlantes inteligentes y reemplazar el hardware de los teléfonos de escritorio.

El equipo de Linto ha lanzado todas sus herramientas como código abierto en GitHub. Sin embargo, todavía no hay ninguna documentación central publicada.

9-Jovo

Jovo es otra plataforma de código abierto para crear aplicaciones habilitadas para voz además de Amazon Alexa y Google Assistant. Con una base de código, el desarrollador puede crear su aplicación e implementarla con facilidad.

Jovo ha proporcionado a los desarrolladores todo lo que necesitan como herramientas de código abierto. Existe un plan de pago empresarial que incluye funciones y complementos personalizados para facilitar la producción de la aplicación con un conjunto de herramientas de desarrollo.

Plataforma: Asistente de Google y Amazon Alexa

10-Hola Atenea

Hola, Atenea Es un marco de asistente de voz modular de código abierto y gratuito. Fue creado para desarrolladores. Sin embargo, el sitio web de Hey Athena no funciona, por lo que la documentación y el código no se han actualizado durante aproximadamente un año, aunque el código del proyecto está disponible para los desarrolladores.

Descripción del proyecto: un marco

Nota: Este artículo es un artículo de Evergreen. Recibirá actualizaciones continuas de las aplicaciones enumeradas. Puede guardarlo y volver a él como un recurso actualizado.

Etiquetas

Desarrollo de código abierto Evergreen List Linux macos hacking Artículos Inteligencia artificial Asistente de IA Asistente virtual Asistente de voz asistente personal

By admin

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *