Le blog Big Data

L’ère de la verticalisation et des Clouds hybrides pour les offres Big Data

Tout le monde parle du Big Data comme de la troisième révolution industrielle, mais fort est de constater que les entreprises sont dans un brouillard épais aux regards des annonces faites par tous les éditeurs.

L’engouement autours de Big Data

En effet, l’engouement est tel que de nombreux acteurs se targuent à présent de faire du Big Data.

Les éditeurs de bases de données, les fournisseurs de baies de disques, les acteurs du Cloud sont tous en marche forcée pour essayer d’être de la fête. En réalité on en est loin, les offres verticalisées dans des domaines métiers bien identifiés ne font pas légion. Quelques applications dans le marketing et l’analyse des réseaux sociaux émergent mais ne couvrent qu’une infime partie de la problématique Big Data des entreprises.

On peut effectivement parler des Big Data car la multitude des sources internes et externes qui arrivent dans les entreprises vont révolutionner la Data-gourvernance. D’ici 5 ans nous n’aurons plus de silos hermétiques et cloisonnés que sont les Datawarehouses ou autre Datamart. Il faudra voir les données de l’entreprise comme un Hub (concentrateur) où chaque application métier viendra récupérer des données en provenance de l’ERP, des bases de données métiers, des Datawarehouses, des réseaux sociaux, de l’open data, des capteurs des chaines de production, des logs des serveurs, etc.

Pour se faire l’architecture Big Data de l’entreprise devra être suffisamment agile pour croître à la demande en termes de volume de stockage, de puissance de traitement et de conteneur d’applications métiers facilement déployable.

Les défis des technologies Big Data

Techniquement, ce « mouton à 5 pattes » devra gérer les couches basses de l’infrastructure pour déployer des serveurs et du stockage à la demande, il devra déployer de façon sécurisée et cloisonnée les services pour les clients (Stockage, Module BI, Datamining, Moteur de recherche). Nous parlerons dans ce cas de multitenancy.

Enfin, il devra être en capacité d’accepter de nouvelles fonctionnalités métiers verticales, comme par exemple un module de calcul de risques pour une assurance, un module de détection de fraudes pour une administration ou encore un système de traitements de logs pour une chaîne d’assemblage ou de production industrielle.

Il est clair que ce genre de produit doit allier des briques d’infrastructures et des briques de hauts niveaux. La difficulté étant de rentrer dans une logique de Cloud Hybride qui va synthétiser le monde des serveurs Virtuels et celui des clusters de calculs.

Des acteurs émergents du marché commencent à proposer des offres telles que CloudKeeper (Ingensi). Leurs offres répondent à ces besoins en créant un environnement haute performance avec des briques issues du Cloud et du Web (Openstack, Crowbar, Hadoop et des briques BI temps réel ou des moteurs d’indexation comme Impala et Elasticsearch).

Restera maintenant à convaincre, dans les DSI, que cette révolution apportera la connaissance de la substantifique moelle de nos données et tout cela avec une grande agilité. C’est ce qui manque cruellement à nos SI d’aujourd’hui, englués dans un formalisme trop cartésien de la donnée.

Christophe Cerqueira

Christophe Cerqueira

      Laisser un commentaire