Recomendaciones para el despliegue de Hadoop

En este White Paper de Intel se dan una serie de recomendaciones para el despliegue de Hadoop.

Aunque ya tiene dos años sigue vigente en las generalidades y recomendaciones, que concluyen en esta configuración:

En el White Paper se dan recomendaciones como:

· Elección de Servidores: se recomiendan procesadores dual-socket como Intel Xeon

· Elección de disco duro: no se recomienda RAID 0, ya que Hadoop orquesta la redundancia de datos

· Tamaño de memoria: a partir de 12 Gb

· Red: hasta 2 puertos Gigabit

· Sistema operativo: Linux con versión de core superior a 2.6 (reduce el consumo de memoria)

· Sistema de archivos: ext3 o xfs sin noatime

·

Libro Hadoop in Practice

Por fin un libro sobre Hadoop bien enfocado!!!

Hadoop in Practice va presentando Hadoop en formato ejemplo, exponiendo un problema y su solución.

Si revisáis su tabla de contenidos veréis su enfoque:

· Metiendo y sacando datos de Hadoop

· Serialización de datos

· Patrones MapReduce

· HDFS

· Problemas de rendimiento

· Algoritmos

· Integrando R y Hadoop (este te va a gustar Luis :D)

· Análisis predictivo con Mahout

· Hive

· Pig

· Crunch

· Testing

Además podéis descargaros de forma gratuita su primer capítulo, que es más que suficiente para hacerse una idea precisa sobre lo que ofrece Hadoop.

Publicado en BigData, Hadoop. 1 Comment »
A %d blogueros les gusta esto: