Le blog Big Data

Analyse et optimisation : la donnée au coeur du métier

pexels-photo-159888

L’analyse des données est un enjeux majeur et prend de plus en plus d’ampleur. Pour arriver à extraire des informations pertinentes il est primordiale d’avoir une plateforme optimisée et réactive. Jetons un œil à ce qui à retenu notre attention en mars à ce sujet !

Analyse de données avec Python 3

Une introduction au Time-Series en Python 3 avec Panda : Time Series Visualization with Python 3

Via un Notebook Jupyter, on apprend en 5 étapes, comment utiliser la donnée et créer une visualisation appropriée et pertinente :

  1. Installation
  2. Chargement
  3. Indexation
  4. Traitement
  5. Visualiston

Impala Cookbook

Manipuler des données c’est bien, mais la plateforme est elle optimisée pour cela ?

On retrouve dans ce cookbook plusieurs axes de réflexion sur les améliorations des plateformes Big Data Hadoop utilisant Impala.

Voici quelques exemples :

  • – Problématique de performance
  • – Dimensionnement
  • – Multi tenant
  • – Data Optimisation de requête

Retrouvez ce fameux Cookbook sur le blog Cloudera.

 

Big Data Hebdo

C’est frais, c’est geek et c’est intéressant. De 13 minutes à plus d’une heure, voici des podcasts Big Data qui ne manques pas d’air !

Un avis technique sur les outils que l’on utilise au quotidien, et ceux de demain. A écouter ou réécouter : Big Data Hebdo

Restez au courant des parutions via twitter : @bigdatahebdo

 

Intéressé ?

Si des problématiques d’optimisation de plateforme ou d’analyse de données vous intéressent, contactez nous pour en discuter !

Soit sur Twitter via @ingensi ou directement sur notre site

Hadrien

Hadrien

KEEP CALM & DataOps now

      Laisser un commentaire