Humor: Cuando el parche funciona a la primera

Publicado en Humor. Leave a Comment »

Los 28 mejores juegos de la época MS-DOS para jugar ahora y gratis en el navegador

Humor: Cuando el jefe viene a buscarme el viernes al mediodía

Publicado en Humor. Leave a Comment »

Humor: El jefe persiguiéndote el viernes para que le ayudes con una oferta el fin de semana

Publicado en Humor. Leave a Comment »

Big Data Landscape 3.0

Humor: Justo ese momento en el que te das cuenta de que has hecho el DELETE sobre la BD de producción

Publicado en Humor. Leave a Comment »

Sobre Spark, Impala, Tez y Hive

De esta entrevista con David Gruzman, el creador de ImpalaToGo se pueden extraer varios consejos sobre cuando aplicar estas tecnologías (evidentemente discutibles 🙂 )

· Spark es la opción más adecuada para procesamiento de datos interactivos y análisis a medida de data sets de tamaño moderado (que quedan en RAM).

· Impala es el único motor open-source SQL en la familia Hadoop. Es el más adecuado para consultas SQL sobre grandes volúmenes. Es también adecuado para consultas interactivas (online) con gran velocidad sobre grandes volúmenes

· Tez es adecuado como base para trabajar sobre Hive y Pig ya que optimiza el procesamiento de datos

· Hive es la plataforma más madura y la más lenta. Sigue siendo una buena opción para tareas ETL muy costosas donde la confiabilidad es importante.

A %d blogueros les gusta esto: