El otro día en el interesante evento sobre Smart Cities de Rabanales21, gracias a Mercedes Torres y Pedro Gutiérrez conocí Kaggle…y no quería dejar de dedicarle un minipost (por eso de tenerlo localizado si tengo que usarlo alguna vez :D).

Para describir Kaggle hay que introducir (para los novatos como yo) el proceso tradicional de Data Mining.

El Data Mining comprende un conjunto de técnicas y algoritmos para extraer conocimiento a partir de datos (ahora mismo de grandes volúmenes de datos).

Tradicionalmente el Data Mining se emplea en muchas áreas para mejorar los procesos de las empresas, las compañías suelen tener equipos de especialistas Data Mining que ayudan a resolver el problema mediante el análisis de datos y la generación de unos resultados.

(Por suerte) esta visión del Data Mining está evolucionando y por eso Kaggle es una plataforma tan conocida en este ámbito.

En esencia Kaggle es una plataforma online para realizar competiciones de Data Mining, proporciona un repositorio para que las compañías publiquen sus datos y desde ahí comienza un concurso abierto para que los expertos en Data Mining de todo el mundo descarguen esos datos y propongan soluciones a los problemas de la compañía en cuestión. La mejor solución se hace con un premio que puede llegar a varios millones de dólares.

Gracias a estas competiciones, se han resuelto problemas relacionados con el descubrimiento de nuevos entes en el universo, la predicción de la probabilidad de accidente de los asegurados de una compañía de seguros, etc.

Además Kaggle constituye un importante punto de encuentro entre los expertos en diferentes áreas, y podéis encontrar ejemplos y scripts como estos:

En el blog podéis encontrar interesantes tutoriales: http://blog.kaggle.com

Anuncios