On nous parle de Big Data dans nos cours mais qu'est ce que c'est exactement ? (Question de Roxane, de Mons)
Lorsque nous utilisons les réseaux sociaux, nous laissons de nombreuses informations derrière nous. Qu’il s’agisse d’informations factuelles (nom, prénoms, e-mail, sexe…) lors d’une inscription ou d’informations sur nos goûts, nos envies, nos besoins… Ces informations sont autant de données qui sont stockées dans des espaces numériques afin de servir à différentes fins : commerciales, administratives, sécuritaires, informatives, … Chacune des informations qui transitent par un réseau informatique – réseaux sociaux, cartes de fidélité, inscription à un club de sport, passage à l’hôpital, paiement à la caisse d’un supermarché, abonnement de bus… - est stockée dans des bases de données. Ce système de collecte d’information s’appelle le data (ndlr donnée en anglais) et existe depuis de nombreuses années.
Le data à une vocation analytique à l’origine. Pour échafauder des théories, proposer des études (scientifiques, marketing ou autres), faire des prévisions (météo, guidage, financières…) ou établir des plans, il faut d’abord rassembler des données avant de les étudier, de les comparer et de tirer des conclusions. L’explosion populaire de la bulle internet d’abord et l’avènement des réseaux sociaux ensuite ont donné, ces 20 dernières années, une impulsion sans précédent à la collecte de données. Une impulsion dans laquelle s’est évidemment engouffré l’intérêt commercial. Cette masse de données collectées et amplifiées par le social média porte le nom de big data (mégadonnées en français).
Désormais, le big data repose sur deux types de traitements des nombreuses données : le transactionnel et l'analytique (ou décisionnel).
- Les traitements transactionnels consistent à enregistrer (modifier, consulter) des données sur les clients, les produits, les commandes... En bref, la base des systèmes d'information des entreprises.
- L'informatique décisionnelle ou analytique consiste à utiliser ces informations pour améliorer les performances et les processus des entreprises. En général, les décideurs disposent ainsi de rapports concernant les ventes par produit, par région, par commerciaux...
Selon le Centre National de la Recherche Scientifique (CNRS), le volume des mégadonnées traitées annuellement est passé de 1,2 zettaoctets en 2010 à 2,8 zettaoctets en 2013. Il devrait être de l’ordre de 40 zettaoctets en 2020 (40x1021 ou 40.000.000.000.000.000.000.000 octets). A titre de comparaison, un ordinateur portable classique d’une marque à la pomme très connue peut stocker 500 gigaoctets de données (500x109 ou 500.000.000.000 octets) soit 1/80 milliardième des mégadonnées annuelles mondiales… Toujours pour avoir un comparatif, il s’est vendu quelques 275 millions d’ordinateurs dans le monde en 2017 !