¿Qué es Presto?

Presto es un motor open-source distribuido de queries SQL para ejecutar queries analíticas sobre datasources de grandes volúmenes.

Presto permite consultar datasources como Hive, Cassandra, bases de datos relacionales,… también permite combinar datos de diversas fuentes.

Facebook usa Presto para queries interactivas sobre diversos data stores incluyendo su data warehouse de 300 PB (unos 1000 empleados de Facebook usan diariamente Presto para ejecutar más de 30.000 queries).

Presto es un sistema distribuido que corre en un cluster de máquinas, incluyendo un coordinador y múltiples workers. Las queries se envían desde un cliente hacia el coordinador, que parsea, analiza y planea el plan de ejecución de la query y tras esto distribuye el procesamiento hacia los workers:

Ofrece estos conectores:

Leer más

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: