Thu. Nov 14th, 2024

Centro de operaciones de código abierto para la calidad de datos (CDQO)

By admin Jan 29, 2024

DQO es una poderosa herramienta de monitoreo de la calidad de los datos compatible con DataOps que está diseñada para ayudarlo a monitorear y mantener la calidad de sus datos. Con DQO, obtiene acceso a una amplia gama de controles de calidad de datos personalizables y paneles de control de calidad de datos que facilitan el seguimiento de sus datos e identifican cualquier problema que pueda surgir.

Uno de los beneficios clave de DQO es que viene con alrededor de 100 controles de calidad de datos predefinidos que puede utilizar desde el primer momento. Estas comprobaciones cubren una amplia gama de métricas de calidad de los datos, incluida la integridad, la precisión, la coherencia y la puntualidad. Esto significa que puede comenzar a monitorear la calidad de sus datos de inmediato, sin tener que dedicar mucho tiempo a configurar su configuración de monitoreo.

Además de sus comprobaciones predefinidas, DQO también ofrece una gama de opciones de personalización que le permiten adaptar el seguimiento de la calidad de sus datos a sus necesidades específicas. Puede crear fácilmente sus propias comprobaciones personalizadas utilizando la interfaz intuitiva de DQO y también puede personalizar sus paneles de calidad de datos para mostrar las métricas que sean más importantes para usted.

En general, DQO es una herramienta esencial para cualquier organización que quiera garantizar la calidad de sus datos. Ya sea que esté manejando grandes volúmenes de datos o solo unos pocos conjuntos de datos clave, DQO facilita el monitoreo y el mantenimiento de la calidad de sus datos, para que pueda confiar en la precisión y confiabilidad de sus datos.

Características

  • Interfaz gráfica intuitiva y acceso vía CLI
  • Compatibilidad con varias fuentes de datos diferentes: BigQuery, Snowflake, PostgreSQL, Redshift, SQL Server y MySQL
  • ~450 comprobaciones integradas de tablas y columnas con fácil personalización
  • Comprobaciones a nivel de tabla y columna que le permiten escribir sus propias consultas SQL
  • Pruebas de partición de fecha diaria y mensual
  • Segmentación de datos por hasta 9 flujos de datos diferentes.
  • Programación incorporada
  • Cálculo de KPI de calidad de datos que se pueden mostrar en múltiples paneles de calidad de datos integrados
  • Análisis de incidentes

Plataformas

  • ventanas
  • Mac OS
  • linux

Requisitos

Para utilizar DQO necesitas:

  • Python versión 3.8 o superior (para más detalles consulte documentación de Python y sitios de descarga).
  • Posibilidad de instalar paquetes de Python con pip.
  • Instalé el software JDK (versión 17) y configuré la variable de entorno JAVA_HOME.

Instalar

Para instalar DQO a través del administrador de pip simplemente ejecute

ventanas

py -m pip install dqops

MacOS/Linux

pip3 install dqops

Si prefieres trabajar con el código fuente, simplemente clona nuestro repositorio de GitHub. https://github.com/dqops/dqo y correr

Ejecute la aplicación dqo para finalizar la instalación.

ventanas

dqo

MacOS/Linux

./dqo

Cree la carpeta de inicio de usuario de DQO.

Después de la instalación, se le preguntará si desea inicializar la carpeta de inicio de usuario de DQO en la ubicación predeterminada. Escriba Y para crear la carpeta. La carpeta de inicio de usuario almacena localmente datos como lecturas de sensores y resultados de verificación, así como configuraciones de fuentes de datos. Puede obtener más información sobre el almacenamiento de datos aquí..

Inicie sesión en DQO Cloud.

Para utilizar las funciones de DQO, como almacenar definiciones y resultados de calidad de datos en la nube o paneles de control de calidad de datos, debe crear una cuenta en la nube de DQO.

Después de crear una carpeta de inicio de usuario, se le preguntará si desea iniciar sesión en la nube DQO. Después de escribir Y, serás redirigido a https://cloud.dqo.ai/registrationdonde puede crear una nueva cuenta, utilizar el inicio de sesión único (SSO) de Google o iniciar sesión si ya tiene una cuenta.

Durante el primer registro, se generará un código de identificación único (clave API) que la aplicación DQO recuperará automáticamente. La clave API ahora está almacenada en el archivo de configuración.

  1. Abra la consola de interfaz de usuario de DQO en su navegador presionando CTRL y haciendo clic en el enlace que se muestra en la línea de comando (por ejemplo http://localhost:8888) o copiando el enlace.

Licencia

  • Licencia Apache-2.0

Recursos

Etiquetas

análisis de datos Minería de datos ciencia de datos base de datos ingeniería de datos Código abierto Autohospedado Desarrollo web basado en web Big Data Java Multiplataforma Arch Linux Linux Linux Mint Windows macos

By admin

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *