¿Qué es Apache Geode?

Mañana hablaremos de Ignite, pero para abrir boca…hoy nos toca Apache Geode:

Apache Geode es una base de datos en memoria, distribuida y open-source.

En realidad Apache Geode es la versión open-source de Pivotal Gemfire como podéis ver en estas noticias, aunque todavía no he conseguido encontrar las diferencias entre ambas versiones.

El proyecto de Apache aún tiene poca información y documentación (aunque podéis ir al de Pivotal 🙂 ) y habrá que esperar a ver cómo evoluciona en un mundo complicado con muchas opciones y alternativas.

Casos de Uso con Hadoop y MongoDB

Un poco de Java

Continuando con el post de ayer:

MongoDB Connector for Hadoop: MongoDB y Hadoop uniendo fuerzas!

Conforme a este documento hoy veremos algunos casos de uso típicos en los que MongoDB y Hadoop pueden formar un stack Big data típico.

En estos MongoDB actúa como el datastore en tiempo-real/operacional t Hadoop como el datastore offline para procesamiento y análisis.

Agregación Batch

En muchos escenarios la funcionalidad de agregación incluida en MongoDB es suficiente para analizar los datos, cuando es necesario un análisis más complejo Hadoop nos provee un framework muy potente para análisis complejos:

En este escenario los datos se extraen de MongoDB y se procesan en Hadoop con uno o más jbos MapReduce.

La salida de estos Jobs puede ser de nuevo escrita en MongoDB para consultas posteriores.

Data Warehouse

En un escenario típico de producción los datos del sistema pueden estar en diferentes datastores cada uno con su lenguaje…

Ver la entrada original 87 palabras más