¿Qué es Kudu?

(Dedicado a Sebas y Julián)

Trabajar con datos en tiempo real es un funcionalidad cada más típica en Hadoop.

Hasta ahora podíamos usar Impala para analítica interactiva y Spark para procesamiento batch y en streaming.

A pesar de estos avances en la capa de almacenamiento normalmente teníamos que elegir:

· Analítica online sin capacidad de manejar modificaciones en tiempo real ( HDFS con Apache Parquet)

· Acceso aleatorio en tiempo real con coste en el rendimiento en el escaneado (Apache HBase).

De esta forma para aplicaciones analíticas en tiempo real que requieren rendimiento en la parte analítica y actualización online de datos se necesitan Arquitecturas Híbridas (como Sofia2)

Y aquí aparece Kudu, ya que ofrece una solución a esta complejidad y variedad.

Kudu es un nuevo motor de almacenamiento nativo en Hadoop diseñado para un alto rendimiento en Analítica online sobre datos actualizándose. Kudu tiene licencia Apache y está desarrollado por Cloudera.

Me ha resultado especialmente interesante esta comparativa:

Actualmente Kudu está en beta, podéis leer más en este Technical Paper: Kudu: Storage for Fast Analytics on Fast Data

Podríamos decir que Kudu es como HDFS y HBase en uno

Anuncios

Un comentario en “¿Qué es Kudu?

  1. Muy interesante este nuevo “bicho” sobre el escenario 😉 Yo ahora estoy muy centrado en Cassandra y no para de sorprenderme. Con el soporte a Spark y cuando terminen de meter los campos de tipo json con soporte a búsquedas en los mismos, no encontraré motivos para no usar Cassandra en detrimento de cualquier arquitectura basada en hdfs. Su sencillez arquitectónica es algo a considerar muy en serio. Pero claro, en mi caso, esto es sólo teoría 😉

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s