Wikitrends, l’application Big Data

Le pôle R&D Big data d’INGENSI a développé WikiTrends, une application Big Data propulsée par CloudKeeper et exploitant les logs fournis par Wikipédia (21 To de données).

En se basant sur les statistiques d’un des sites les plus visités au monde (500 millions de visiteurs/mois) et hébergeant plus de 30 millions de pages proposées dans 287 langues, Wikitrends a pour but de démontrer qu’il est possible de récupérer, stocker, traiter et restituer plusieurs dizaines de téraoctets de données en temps réel, via une interface accessible à tous.

Visitez WikiTrends


Objectifs de l’application

  • Exploiter une source de données externe à l’entreprise (Wikipédia)
  • Collecter puis traiter en temps réel plusieurs milliards d’informations
  • Analyser l’ensemble de ces données pour la production de reporting

Fonctionnement de l’application

  • Application hébergée dans les infrastructures cloud Big data INGENSI
  • Collecte et stockage toutes les heures des statistiques des mots clés les plus regardés sur Wikipédia
  • Traitements des données et création d’un reporting

Résultats

  • Affichage du top 25 des expressions les plus recherchées sur Wikipédia par jour, heure et langue
  • Affichage de l’évolution du nombre de visites sur Wikipedia
  • Possibilité d’effectuer des requêtes sur des mots clés précis
Comparaison de plusieurs données

Valeur ajoutée pour l'entreprise

  • Dispose des tendances de recherches en temps réel sur le web
  • Suivi de l’évolution des recherches sur son nom de marque ou son produit à l’occasion d’une communication d’envergure.
  • Exploitation d’une source supplémentaire de données
  • Amélioration des prises de décisions stratégiques

Tableau de bord WikiTrends développé avec le logiciel Tableau Software

Top 50