Premier contact avec le Big Data
Qu’est-ce que le Big Data ? Quelles sont les données collectées et comment sont-elles utilisées par les entreprises ou les pouvoir publics ?
Par Charles-Antoine Schwerer – Le 7 mars 2017
Qu’est-ce que le big data ? On en parle partout et tout le temps, mais savez-vous ce que cela signifie exactement ? A partir d’une définition du Big Data, vous allez voir comment sont collectées et utilisées les données et quels sont les enjeux et les perpectives de cette technologie.
Extrait de la vidéo de formation FinTech
Avez-vous remarqué qu’à chaque achat en ligne, un billet d’avion sur Opodo, un billet sur Allociné ou des chaussures sur Sarenza, s’affichent à droite de votre écran une publicité pendant quelques semaines. Ces publicités s’appuient sur l’utilisation de données et illustrent la naissance d’un phénomène considérable : le Big Data. Ce mot vous l’entendez partout et tout le temps mais savez-vous ce qu’il signifie ?
Qu’est-ce que le big data ?
Les datas ce sont des données : un bout d’information sur une pratique, une action, une habitude. Ce qui change aujourd’hui, c’est la quantité de données produites et notre capacité à les analyser pour les utiliser efficacement. Ce processus est composé de 3 étapes :
- la collecte de données
- le traitement de ces informations brutes
- la monétisation des résultats
Etape 1 : la collecte des données
Depuis la nuit des temps, les entreprises et les pouvoirs publics collectent des informations. En 1666, Colbert lance ainsi le recensement nominatif de la nouvelle France, aujourd’hui connue sous le nom de Canada, pour accumuler des données sur ce territoire mal exploité. La nouveauté du Big Data, c’est la diversité et l’ampleur des données collectées.
Le Big Data recouvre :
- des données personnelles via les e-mails, les réseaux sociaux, la géolocalisation ;
- des données collectives avec l’Open Data public, comme par exemple le niveau de pollution par quartier ;
- des données comportementales grâce au suivi de notre consommation en ligne.
Résultat de la mutation numérique, 90% des données existantes dans le monde ont été collectées il y a moins de deux ans, grâce aux smartphones et aux tablettes. Tous les acteurs participent à la collecte : les startups, les géants du numérique, les entreprises traditionnelles, les pouvoirs publics.
Etape 2 : le traitement des données
Une donnée brute ne signifie rien et toute la connaissance provient du traitement de cette donnée. Via les recherches des utilisateurs, Google accumule nos questions de santé, les symptômes de nos maladies. Un service nommé Google Flu Trend proposait ainsi de traiter ces données pour prévoir les épidémies de grippe. Les données étaient de qualité mais le traitement était inefficace. L’algorithme de Google avait surestimé la maladie. L’offre de service de Google Flu Trend a ainsi été arrêtée.
Ce moment clef du big data est le fait d’un nouveau métier : le data scientist. Il se situe à la confluence du codage informatique et du marketing stratégique. Il créé des modèles pour analyser les données et en tirer des informations utiles. Résultat, des entreprises comme Google, Facebook ou la française Critéo vivent du traitement de données. Ils ciblent par exemple des publicités sur internet. Mais il faut savoir que foule de data scientists travaillent également dans les entreprises traditionnelles.
Etape 3 : la monétisation des données
Traditionnellement, la monétisation de données passent soit par l’optimisation d’un marché existant, soit par la création de nouveaux services. Par exemple Uber a optimisé la réservation de chauffeur grâce à la géolocalisation. Le GPS Waze a développé un nouveau service de trajet alternatif grâce aux données des utilisateurs.
Comme nous l’avons dit, la nouveauté du Big Data c’est l’ampleur et la diversité des données exploitées. Voici deux exemples pour comprendre la monétisation : la commercialisation immobilière et la prévention de la criminalité.
Le commercialisation immobilière
Cet exemple illustre l’optimisation d’un service existant. Le Big Data et ses algorithmes concurrencent directement les agents immobiliers pour optimiser la vente de biens. Ce qui fait la valeur ajoutée d’un agent immobilier, c’est sa qualité de traitement de l’information pour estimer le prix d’un bien.
Aujourd’hui dans de nombreuses villes américaines, vous pouvez obtenir rue par rue la pollution, la criminalité, le prix du mètre carré, les embouteillages, la qualité des restaurants et tout un tas d’autres informations. En croisant ces données collectives avec des données personnelles, sur le salaire moyen des habitants, la réussite scolaire des enfants, le pourcentage d’artistes dans le quartier, un algorithme peut précisément évaluer la valeur d’un bien immobilier.
Puisque les capacités d’analyse d’un ordinateur sont en moyenne supérieures à celles d’un agent immobilier, le Big Data concurrence et optimise le marché de l’agence immobilière.
Créer des nouveaux marchés
L’un des nouveaux marchés créés par le Big Data est celui de la prévention. On peut aujourd’hui créer des modèles de prédiction en croisant des masses de données et des historiques d’achats, d’accidents, d’infractions.
Un exemple aux USA encore, l’entreprise Predpol applique cette logique à la criminalité. Les historiques d’infractions sont croisés avec les évènements sportifs, la météo, la date, le trafic et tout un tas d’informations urbaines pour prédire les zones à fort risque criminel. La police se concentre ainsi sur ces lieux et Predpol revendique une baisse de 15% de la criminalité dans les quartiers test.
Le Big Data fait ainsi émerger de nouveaux marchés de la prédiction qui vont révolutionner la santé, l’assurance et les politiques publiques.
Opportunités et enjeux du Big data
L’explosion des capacités de calcul et des données produites par les objets connectés ouvrent de multiples horizons au big data :
- la santé avec le décodage du génome et l’analyse du cerveau
- l’énergie avec les réseaux intelligents
- les politiques publiques avec la prévention
Tous les segments sont concernés et deux questions apparaissent :
- qui possède des données sur mon business et peut me concurrencer ?
- qui puis-je concurrencer avec les données que je possède ?
Grâce aux capteurs embarqués dans les voitures, les constructeurs automobiles connaissent le type de conduite (agressive, lente, sûre, …) et peuvent développer des assurances type « Pay as you drive » où les primes varient selon la dangerosité du conducteur.
La deuxième question centrale ne concerne pas les entreprises mais le politiques publiques et la démocratie. Cette question est simplement : à qui appartiennent les données ? Appartient-elles à l’individu qui les produit ou à l’entreprise qui les collecte ?
Vous souhaitez que vos collaborateurs en apprennent plus sur le Big Data ?
Découvrez le programme de notre session de formation « MOOC FinTech »
En savoir plusEnvie d’en voir un peu plus ?
-
Le coin des experts
Comment réussir votre projet de formation en IA grâce à un cahier des charges structuré
Découvrez les éléments clés d’un cahier des charges pour un projet de formation en IA, ainsi qu’un modèle gratuit pour structurer votre démarche.
-
Le coin des experts
5 façons d’utiliser l’intelligence artificielle dans le processus de recrutement
En automatisant les tâches répétitives, l’IA facilite chaque étape du processus de votre recrutement afin de garantir une meilleure expérience candidat.
-
Le coin des experts
Gestion de projet : recueillir le besoin
Pour recueillir le besoin dans le cadre d’un projet, il est nécessaire de rédiger un cahier des charges fonctionnel. Mais cela n’est pas si simple…