Hadoop

Monitorer un Cluster Hadoop2 avec Ganglia via Metrics2

Ganglia ? Ganglia est un outil de monitoring distribué, scalable, léger et simple à mettre en place. Ganglia est composé de plusieurs démons : Ganglia Monitoring Daemon (gmond) Il est installé …

Big Data : comment modéliser ses données pour pouvoir distribuer les traitements ? (3/3)

A travers ce dernier billet du dossier « Modélisation & Big Data » nous allons aborder la notion de Row-key permettant la distribution des traitements. Vous pouvez également retrouver les précédents articles portant sur la modélisation avec Hbase et sur la dénormalisation.

Big Data : comment modéliser ses données par la dénormalisation ? (2/3)

Nous avons introduit dans le précédent article la modélisation des données Big Data  via les bases de données NoSQL et notamment l’arrivée du système Hadoop / Hbase permettant d’aller plus …

Big Data : comment modéliser ses données avec Hadoop-Hbase ? (1/3)

Les bases de données SQL classiques telles qu’Oracle, DB2, SQL serveur doivent être utilisées pour ce qu’elles savent faire c’est-à-dire : gérer un modèle transactionnel cohérent et intègre. Leurs conceptions sont adaptées pour les systèmes applicatifs qui nécessitent un fort niveau de cohérence et une garantie de l’intégrité inter tables. Par conséquent, elles ne le sont pas pour des requêtes lourdes sur de très gros volumes de données.