Sat. Dec 28th, 2024

Amazon AWS launches a public COVID-19 data lake

By admin Jan 30, 2024

Estuve hablando casualmente con un querido amigo de AWS (Amazon Web Service), como lo hacemos a menudo, y mencionó casualmente que lanzaron un increíble lago de datos para COVID-19 que puede ayudar a los investigadores y organizaciones a mantenerse actualizados.

Existen docenas de monitores de COVID-19 (brote de virus de la corona), pero hay conjuntos de datos limitados sobre su propagación e impacto, además del impacto en los países y, por supuesto, un lago de datos actualizados. Así que aquí viene el lago de datos AWS COVID-19.

AWS COVID-19 Data Lake es un repositorio de datos centralizado para conjuntos de datos de COVID-19 (The Noval Corona Virus) relacionados con su propagación. Ya está alojado en la nube de AWS y listo para que investigadores de todo el mundo lo utilicen libremente. Además, está actualizado.

¿De dónde vienen los datos?

Hemos sembrado nuestro lago de datos curado con datos de seguimiento de casos de COVID-19 de Johns Hopkins y The New York Times, disponibilidad de camas de hospital de Definitive Healthcare y más de 45 000 artículos de investigación sobre COVID-19 y coronavirus relacionados del Instituto Allen de IA. Ampliaremos periódicamente este conjunto de datos a medida que otras fuentes confiables pongan sus datos a disposición del público.

El impacto de tal esfuerzo para los investigadores y las organizaciones es enorme, porque no estarán ocupados recopilando, reuniendo y validando los resultados antes de ponerlos en uso. AWS COVID-19 Data Lake les ahorra tiempo e incluso les proporciona las herramientas para ponerlo en uso activo.

¿Qué se necesita para utilizar el lago de datos AWS COVID-19?

Sin embargo, para utilizar el lago de datos, debe tener lo siguiente:

  • Acceso a la cuenta activa de AWS
  • Permisos para crear una pila de AWS CloudFormation
  • Permisos para crear recursos de AWS Glue (bases de datos y tablas del catálogo)

Estoy realmente impresionado con el producto, el esfuerzo y la facilidad de uso. Sin embargo, será útil para los usuarios experimentados de AWS manejar el lago de datos y las herramientas.

Si tiene acceso a AWS con una cuenta activa, puede explorar el catálogo de datos de COVID-19 actualizado activamente en su cuenta:

Lago de datos de Amazon AWS COVID-19

Monitoreo en tiempo real con AWS COVID-19 Data Lake

Si está interesado en lo que se puede hacer con estos conjuntos de datos, aquí hay una captura de pantalla de los resultados de los datos tardíos en acción:

Estadísticas actuales de COVID-19

Casos activos por país

Confirmado y Activo por Fecha

Aquí hay un enlace para el muestra.

Conclusión

Es un gran esfuerzo, pero la mayoría de los investigadores y desarrolladores no tienen una cuenta de AWS (Amazon Web Service) y tampoco conocen los servicios requeridos. Sin embargo, esperamos ver algunos productos basados ​​en este rico lago de datos.

Foto por Fotos de EVG de Pexels

Etiquetas

Análisis de datos de ciencia de datos de desarrollo de noticias.

By admin

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *