¿Qué es Apache Drill?

(Gracias Jesús)

Apache Drill es un Motor de Consultas SQL para almacenamiento sin esquema en Hadoop, No SQL y Cloud.

Drill soporta una gran variedad de bases de datos NoSQL y sistemas de archivos, incluyendo HBase, MongoDB, MapR-DB, HDFS, MapR-FS, Amazon S3, Azure Blob Storage, almacenamiento en Google, Swift, NAS y archivos locales.

Además con una consulta pueden unirse datos de diversos almacenes (por ejemplo query Mongo con query sobre HDFS).

Drill integra un optimizador que reestructura el plan de consultas para aprovechar las capacidades de procesamiento interno del almacén de datos.

Otra característica muy interesante es que con Drill puedes seguir usando las herramientas de BI/Analytics que ya usas (Tableau, Qlik, MicroStrategy, Spotfire, SAS y Excel) para interactuar con los almacenes de datos no relacionales a través de los conectores JDBC y ODBC de Drill. Además Drill ofrece un API REST.

Los Datasets virtuales de Drill permiten mapear consultas complejas no relacionales en estructuras BI que pueden explorarse y visualizarse:

Drill ofrece una Arquitectura simétrica que permite usarlo en una única máquina o en un cluster.

Como ejemplo veamos el plugin MongoDB Storage: https://drill.apache.org/docs/mongodb-storage-plugin/

Especialmente interesante es el interface ODBC que nos permite conectar con todas las fuentes descritas.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: