Le coin des experts

Premier contact avec le Big Data

Qu’est-ce que le Big Data ? Quelles sont les données collec­tées et comment sont-elles utili­sées par les entre­prises ou les pouvoir publics ?

Par Charles-Antoine Schwe­rer – Le 7 mars 2017


Qu’est-ce que le big data ? On en parle partout et tout le temps, mais savez-vous ce que cela signi­fie exac­te­ment ? A partir d’une défi­ni­tion du Big Data, vous allez voir comment sont collec­tées et utili­sées les données et quels sont les enjeux et les perpec­tives de cette tech­no­lo­gie.



Extrait de la vidéo de forma­tion FinTech

Avez-vous remarqué qu’à chaque achat en ligne, un billet d’avion sur Opodo, un billet sur Allo­ciné ou des chaus­sures sur Sarenza, s’af­fichent à droite de votre écran une publi­cité pendant quelques semaines. Ces publi­ci­tés s’ap­puient sur l’utili­sa­tion de données et illus­trent la nais­sance d’un phéno­mène consi­dé­rable : le Big Data. Ce mot vous l’en­ten­dez partout et tout le temps mais savez-vous ce qu’il signi­fie ?


Qu’est-ce que le big data ?

Les datas ce sont des données : un bout d’in­for­ma­tion sur une pratique, une action, une habi­tude. Ce qui change aujour­d’hui, c’est la quan­tité de données produites et notre capa­cité à les analy­ser pour les utili­ser effi­ca­ce­ment. Ce proces­sus est composé de 3 étapes :

  • la collecte de données
  • le trai­te­ment de ces infor­ma­tions brutes
  • la moné­ti­sa­tion des résul­tats

La collecte des données : première étape du big data


Etape 1 : la collecte des données

Depuis la nuit des temps, les entre­prises et les pouvoirs publics collectent des infor­ma­tions. En 1666, Colbert lance ainsi le recen­se­ment nomi­na­tif de la nouvelle France, aujour­d’hui connue sous le nom de Canada, pour accu­mu­ler des données sur ce terri­toire mal exploité. La nouveauté du Big Data, c’est la diver­sité et l’am­pleur des données collec­tées.

Le Big Data recouvre :

  • des données person­nelles via les e-mails, les réseaux sociaux, la géolo­ca­li­sa­tion ;
  • des données collec­tives avec l’Open Data public, comme par exemple le niveau de pollu­tion par quar­tier ;
  • des données compor­te­men­tales grâce au suivi de notre consom­ma­tion en ligne.

Résul­tat de la muta­tion numé­rique, 90% des données exis­tantes dans le monde ont été collec­tées il y a moins de deux ans, grâce aux smart­phones et aux tablettes. Tous les acteurs parti­cipent à la collecte : les star­tups, les géants du numé­rique, les entre­prises tradi­tion­nelles, les pouvoirs publics.


Etape 2 : le trai­te­ment des données

Une donnée brute ne signi­fie rien et toute la connais­sance provient du trai­te­ment de cette donnée. Via les recherches des utili­sa­teurs, Google accu­mule nos ques­tions de santé, les symp­tômes de nos mala­dies. Un service nommé Google Flu Trend propo­sait ainsi de trai­ter ces données pour prévoir les épidé­mies de grippe. Les données étaient de qualité mais le trai­te­ment était inef­fi­cace. L’algo­rithme de Google avait sures­timé la mala­die. L’offre de service de Google Flu Trend a ainsi été arrê­tée.

Ce moment clef du big data est le fait d’un nouveau métier : le data scien­tist. Il se situe à la confluence du codage infor­ma­tique et du marke­ting stra­té­gique. Il créé des modèles pour analy­ser les données et en tirer des infor­ma­tions utiles. Résul­tat, des entre­prises comme Google, Face­book ou la française Critéo vivent du trai­te­ment de données. Ils ciblent par exemple des publi­ci­tés sur inter­net. Mais il faut savoir que foule de data scien­tists travaillent égale­ment dans les entre­prises tradi­tion­nelles.

Big Data et monétisation des données


Etape 3 : la moné­ti­sa­tion des données

Tradi­tion­nel­le­ment, la moné­ti­sa­tion de données passent soit par l’opti­mi­sa­tion d’un marché exis­tant, soit par la créa­tion de nouveaux services. Par exemple Uber a opti­misé la réser­va­tion de chauf­feur grâce à la géolo­ca­li­sa­tion. Le GPS Waze a déve­loppé un nouveau service de trajet alter­na­tif grâce aux données des utili­sa­teurs.

Comme nous l’avons dit, la nouveauté du Big Data c’est l’am­pleur et la diver­sité des données exploi­tées. Voici deux exemples pour comprendre la moné­ti­sa­tion : la commer­cia­li­sa­tion immo­bi­lière et la préven­tion de la crimi­na­lité.


Le commer­cia­li­sa­tion immo­bi­lière

Cet exemple illustre l’op­ti­mi­sa­tion d’un service exis­tant. Le Big Data et ses algo­rithmes concur­rencent direc­te­ment les agents immo­bi­liers pour opti­mi­ser la vente de biens. Ce qui fait la valeur ajou­tée d’un agent immo­bi­lier, c’est sa qualité de trai­te­ment de l’in­for­ma­tion pour esti­mer le prix d’un bien.

Aujour­d’hui dans de nombreuses villes améri­caines, vous pouvez obte­nir rue par rue la pollu­tion, la crimi­na­lité, le prix du mètre carré, les embou­teillages, la qualité des restau­rants et tout un tas d’autres infor­ma­tions. En croi­sant ces données collec­tives avec des données person­nelles, sur le salaire moyen des habi­tants, la réus­site scolaire des enfants, le pour­cen­tage d’ar­tistes dans le quar­tier, un algo­rithme peut préci­sé­ment évaluer la valeur d’un bien immo­bi­lier.

Puisque les capa­ci­tés d’ana­lyse d’un ordi­na­teur sont en moyenne supé­rieures à celles d’un agent immo­bi­lier, le Big Data concur­rence et opti­mise le marché de l’agence immo­bi­lière.


Créer des nouveaux marchés

L’un des nouveaux marchés créés par le Big Data est celui de la préven­tion. On peut aujour­d’hui créer des modèles de prédic­tion en croi­sant des masses de données et des histo­riques d’achats, d’ac­ci­dents, d’in­frac­tions.

Un exemple aux USA encore, l’en­tre­prise Pred­pol applique cette logique à la crimi­na­lité. Les histo­riques d’in­frac­tions sont croi­sés avec les évène­ments spor­tifs, la météo, la date, le trafic et tout un tas d’in­for­ma­tions urbaines pour prédire les zones à fort risque crimi­nel. La police se concentre ainsi sur ces lieux et Pred­pol reven­dique une baisse de 15% de la crimi­na­lité dans les quar­tiers test.

Le Big Data fait ainsi émer­ger de nouveaux marchés de la prédic­tion qui vont révo­lu­tion­ner la santé, l’as­su­rance et les poli­tiques publiques.

Opportunités et enjeux du big data


Oppor­tu­ni­tés et enjeux du Big data

L’ex­plo­sion des capa­ci­tés de calcul et des données produites par les objets connec­tés ouvrent de multiples hori­zons au big data :

  • la santé avec le déco­dage du génome et l’ana­lyse du cerveau
  • l’éner­gie avec les réseaux intel­li­gents
  • les poli­tiques publiques avec la préven­tion

Tous les segments sont concer­nés et deux ques­tions appa­raissent :

  • qui possède des données sur mon busi­ness et peut me concur­ren­cer ?
  • qui puis-je concur­ren­cer avec les données que je possède ?

Grâce aux capteurs embarqués dans les voitures, les construc­teurs auto­mo­biles connaissent le type de conduite (agres­sive, lente, sûre, …) et peuvent déve­lop­per des assu­rances type « Pay as you drive » où les primes varient selon la dange­ro­sité du conduc­teur.

La deuxième ques­tion centrale ne concerne pas les entre­prises mais le poli­tiques publiques et la démo­cra­tie. Cette ques­tion est simple­ment : à qui appar­tiennent les données ? Appar­tient-elles à l’in­di­vidu qui les produit ou à l’en­tre­prise qui les collecte ?

Vous souhai­tez que vos colla­bo­ra­teurs en apprennent plus sur le Big Data ?

Décou­vrez le programme de notre session de forma­tion « MOOC FinTech »

En savoir plus

Envie d’en voir un peu plus ?

Restez infor­mé·e grâce à notre news­let­ter