Le coin des experts

Inter­view : comment Critéo utilise les données pour person­na­li­ser les annonces ?

Comment fonc­tionne la person­na­li­sa­tion des annonces sur le web ? Quelles sont les données utili­sées et quels résul­tats peut-on espé­rer ?

Par Pierre Monclos – Le 24 janvier 2017


La person­na­li­sa­tion des annonces est au coeur des stra­té­gies de marke­ting digi­tal. Quelles sont les données utili­sées lors du ciblage et quels résul­tats peuvent appor­ter les bannières person­na­li­sées en terme de conver­sion et de vente ?



Extrait de la vidéo de forma­tion Digi­tal Marke­ting

François Costa est Direc­teur Géné­ral Adjoint de CRITEO France, une société spécia­li­sée dans le marke­ting à la perfor­mance créée il y a 11 ans. L’objec­tif de Critéo est de géné­rer des ventes pour les annon­ceurs en pous­sant des bannières person­na­li­sées à un milliard d’in­ter­nautes, chaque mois dans le monde.

Publicités ciblées et bannières personnalisées

Quelles données sont utili­sées dans la person­na­li­sa­tion des annonces ?

Le modèle publi­ci­taire de Critéo est centré sur l’uti­li­sa­teur. C’est un algo­rithme qui a besoin d’être nourri par des données de masse, autre­ment dit de la Big Data. L’objec­tif est que le moteur propulsé par Critéo apprenne dans une logique de machine lear­ning. Pour cela, Critéo s’ap­puie sur 6 sources de données diffé­rentes :

  • la donnée utili­sa­teur : quel médium utilise l’in­ter­naute pour surfer sur le site des annon­ceurs. Est-ce qu’il a utilisé un mobile, un ordi­na­teur, une tablette ? Est-ce qu’il a utilisé un navi­ga­teur et si oui, lequel ? IOS, Android, Safari ?
  • la deuxième source de données concerne le compor­te­ment d’achat du consom­ma­teur. On va donc regar­der le temps qu’il a passé sur le site d’un e-commerçant. On va regar­der le nombre de pages vues, le nombre de produits consul­tés, le type d’ac­tion qu’il a effec­tué.
  • la troi­sième source de données qui inté­resse Critéo est la donnée de cata­logue produit. Elle va ainsi permettre de pous­ser les produits des clients dans leurs bannières.
  • ensuite vient la donnée des éditeurs. Ce sont en fait les sites avec lesquels Critéo est en parte­na­riat pour pous­ser ses publi­ci­tés. Ce sont des portails ou des sites de presse par exemple. Les données recueillies vont permettre de savoir quelle page a vu un visi­teur, à quel type de publi­cité il a été soumis et où se situait la publi­cité sur la page consul­tée.
  • la cinquième source vient direc­te­ment des données Critéo. Elles permettent de comprendre comment a réagi l’uti­li­sa­teur aux campagnes. A combien de bannières il a été exposé ? A-t-il cliqué sur ces bannières ? Est-ce qu’il a converti ? Cela va permettre de déter­mi­ner quelle est la fatigue de l’uti­li­sa­teur aux campagnes Critéo.
  • enfin la donnée univer­sal match permet d’iden­ti­fier les diffé­rents écrans que va utili­ser un même utili­sa­teur pour surfer sur inter­net. Et cela pour être capable de comprendre qu’un inter­naute a commencé sa visite via son smart­phone, puis qu’il a conti­nué via son ordi­na­teur de bureau et qu’il a fini par ache­ter via sa tablette. Il faut bien comprendre que ces 3 écrans ne sont pas 3 personnes diffé­rentes, mais bien un seul et unique indi­vidu.

Exploitation des données pour personnaliser l'annonce

Quels résul­tats sont récu­pé­rés ?

Les six sources de données présen­tées ci-dessus permettent d’ali­men­ter le moteur Critéo qui va ensuite faire un travail de person­na­li­sa­tion de la publi­cité. Ce moteur est consti­tué de 3 briques : la valeur, la person­na­li­sa­tion et le mode d’adresse.

Première brique : déter­mi­ner la valeur de l’in­ter­naute

La première brique va cher­cher à déter­mi­ner quelle est la valeur d’un inter­naute pour un annon­ceur. Pour cela le moteur s’ap­puie sur la deuxième source de données. Il va cher­cher à voir le nombre de pages vues, le type de produit, si un produit a été mis au panier.

On va essayer de déter­mi­ner quel a été le niveau d’en­ga­ge­ment d’un inter­naute vis-à-vis d’un site de e-commerce. Cela permet de prédire le niveau de clics effec­tués par l’in­ter­naute si on lui pousse une bannière de cet annon­ceur. Mais égale­ment sa conver­sion et son panier moyen. Autre­ment dit quelle somme cet inter­naute est prêt à dépen­ser sur le site de l’an­non­ceur.

Une fois ces données déter­mi­nées on va faire entrer les annon­ceurs en compé­ti­tion, pour que celui qui est prêt à payer un certain prix et pour lequel l’in­ter­naute aura le plus de valeur puisse affi­cher sa bannière à celui-ci.

Deuxième brique : person­na­li­sa­tion des annonces

Mettons qu’un inter­naute navigue sur un site de e-commerce vendant des chaus­sures et consulte une paire de chaus­sures rouges. On va lui pous­ser une bannière qui a ces chaus­sures rouges. Mais on va complé­ter cette présen­ta­tion de produit par des recom­man­da­tions. Alors comment cela se passe :

  • premiè­re­ment, on va lui pous­ser des produits qui ont été vus par les autres inter­nautes qui ont égale­ment regardé la paire de chaus­sures rouges ;
  • deuxiè­me­ment, on va aussi ajou­ter les best-of. C’est à dire les meilleures ventes de ce site e-commerce.

Cela permet d’avoir une bannière qui contient le produit qui a effec­ti­ve­ment été vu par l’in­ter­naute. Mais égale­ment des produits qui pour­raient lui plaire, pour avoir une person­na­li­sa­tion sur ce qu’il a fait et ce qu’il pour­rait faire. Cette phase est fonda­men­tale puisque 70% des tran­sac­tions géné­rées portent sur des produits qui n’ont pas été vus à l’ori­gine. Autre­ment dit sur des produits qui ont été recom­man­dés.

Troi­sième brique : comment s’adres­ser à l’in­ter­naute

Le concept de cette troi­sième phase est très simple. Chaque inter­naute peut réagir diffé­rem­ment à un message, à une image, à une bannière. Pour cela on va isoler l’en­semble des éléments qui composent une bannière :

  • les diffé­rents formats,
  • les diffé­rentes photos,
  • les diffé­rentes images de recom­man­da­tions de produits,
  • les diffé­rents messages,
  • les diffé­rents éléments d’appel à l’ac­tion,
  • les diffé­rentes couleurs de fond…

On est ensuite capable de recons­ti­tuer à la volée et auto­ma­tique­ment jusqu’à 40000 bannières pour un produit donné sur le marché français. Ensuite, les bannières vont être soumises à un système d’opti­mi­sa­tion dyna­mique qui va permettre de pous­ser les bannières qui auront la plus forte proba­bi­lité de clics et de conver­sion pour un inter­naute donné, dans un contexte donné. Cet élément est vrai­ment impor­tant car il permet de « skeli­bi­li­ser » le modèle mais aussi d’être capable de géné­rer 11% de ventes supplé­men­taires sur les campagnes Critéo.

Publicité et comportement de l'utilisateur

Pour conclure

Dès l’ori­gine avant même de trou­ver son busi­ness modèle, Critéo a fait en sorte de travailler sur des modèles algo­rith­miques qui permet­taient de propo­ser des discours person­na­li­sés en fonc­tion de la donnée des inter­nautes. Pas de la donnée iden­ti­fiante car les inter­nautes restent anonymes, mais de la donnée compor­te­men­tale. C’est à dire être capable d’avoir le discours le plus appro­prié en fonc­tion du compor­te­ment d’achat. C’était vrai­ment un véri­table élément diffé­ren­ciant qui struc­ture la stra­té­gie actuelle et future de Critéo.

Vous souhai­tez vos colla­bo­ra­teurs au marke­ting online ?

Décou­vrez le programme de notre session de forma­tion « Digi­tal Marke­ting »

En savoir plus

Envie d’en voir un peu plus ?

Restez infor­mé·e grâce à notre news­let­ter