Publicité et internet

Analyses de Kevin Mellet

Chercheur au département de sciences sociales d’Orange Lab

Bio et vidéo

Kevin Mellet est chercheur au département de sciences sociales d’Orange Labs et chercheur associé au CSI (Mines ParisTech). Ses recherches s’appuient sur la sociologie économique et les science & technology studies pour étudier la formation et le fonctionnement des marchés numériques. Il s’intéresse tout particulièrement à la publicité et au marketing en ligne ainsi qu’à l’économie des données personnelles.

En synthèse

Le monde du marketing en ligne (data marketing) et des technologies appliquées à la publicité (adtech) est difficile à décrire en raison de sa sophistication et de son opacité, due à diverses raisons1. Dans une perspective des Science and technology studies,2 suivre l’évolution du cookie, le trackeur numéro 1, est un moyen de raconter l’histoire et les mécanismes de la publicité en ligne depuis le milieu des années 1990.

Sans les cookies, l’internaute se voit afficher, par la régie interne de l’éditeur3, une publicité en relation directe avec le contenu éditorial de la page visitée : une publicité de Décathlon sur une page sport de LeMonde.fr.

Puis a émergé  le cookie, dans sa fonction de « cookie first party ». Lors de la visite d’une de ses pages, LeMonde.fr dépose un cookie (un « script ») sur le navigateur de l’internaute, ce qui lui permettra de le suivre de page en page, et de le reconnaître quand il reviendra. La régie de LeMonde.fr pourra ainsi savoir que l’internaute qui vient visiter une page « finance » a également visité des pages « sport » du site, et donc pourra vendre à Décathlon l’espace publicitaire situé sur la page « finance ». Cela permet une gestion plus efficace des espaces, notamment de ceux situés sur des pages ayant peu de valeur publicitaire.

La première grande transformation arrive à la fin des années 1990 à travers les « cookies-tiers », avec des opérateurs dit adnetworks (réseaux publicitaires) comme Weborama.4 Ces derniers ont proposé à de nombreux éditeurs de déposer des cookies chez eux afin de suivre les parcours de leurs internautes. Ils peuvent ainsi croiser les informations sur les parcours d’internautes identifiés sur des dizaines de milliers de sites à la fois, et construire une véritable connaissance statistique de ces derniers en faisant des inférences socio-démographiques5. Ces analyses étaient alors retournées aux éditeurs qui disposaient ainsi d’une meilleure connaissance de leur audience et pouvaient organiser un ciblage publicitaire avancé6.

A partir des années 2010, le système programmatique révolutionne l’achat publicitaire. Il permet aux éditeurs et aux divers sites web, pour commercialiser leurs espaces, de mettre en concurrence un grand nombre d’adnetworks et d’opérateurs divers dans des adexchanges (places de marché publicitaires). Sur les adexchanges, les acheteurs d’espaces publicitaires participent à des enchères automatisées, réalisées en quelques dizaines de millisecondes, et enchérissent en fonction des informations de cookies dont ils disposent. Les acteurs ayant une capacité de tracking étendue disposent ainsi d’une position privilégiée, que leur connaissance soit construite par la mesure d’audience (Weborama), par des widgets de partage social (AddThis7) ou par la mise en place de techniques de vente publicitaire particulières, comme le retargeting (Critéo)8.

“croiser les informations sur les parcours d’internautes identifiés sur des dizaines de milliers de sites à la fois, et construire une véritable connaissance statistique de ces derniers en faisant des inférences socio-démographiques”

La dernière innovation, développée à partir de 2015 est la Data Management Plateform (DMP). Les DMP sont des bases de données construites (en général directement par les annonceurs) à partir de plusieurs types de données, propres ou tierces9. Ces données vont ensuite être rassemblées sous la forme de cookies, ce qui va permettre d’autres types de ciblage, dits de « custom audience »,10 parfois complétés par des outils d’extension algorithmique d’audience, dits « lookalike », visant à identifier des profils similaires supposés de haute valeur11. La logique de la « cookification » qui opère à ces différentes étapes consiste en une forme d’extension du tracking en ligne et de l’appariement de différents types de base de données. Cela fait du cookie une infrastructure marchande, devenu un mécanisme central du tracking dans l’univers de la publicité en ligne, en particulier en Europe.

Le marché aux Etats Unis relève d’une histoire différente car les données nominatives y font aussi l’objet d’un commerce libre, et sont échangées depuis de nombreuses années à des fins de marketing direct12. Or le cookie collecte en effet des données personnelles mais pseudonymes, c’est à dire non rattachées à des identifiants personnels (nom, adresse, adresse mail ou numéro de téléphone), ces dernières faisant en Europe l’objet d’un contrôle et autocontrôle plus fort qu’aux Etats Unis (bien que des cas tels que Facebook soient plus complexes…). Le marché européen est très ouvert, et l’industrie publicitaire gloutonne en données personnelles, mais tout cela reste presque exclusivement fondé sur les cookies et les données pseudonymes.13

Le cookie est cependant un opérateur contesté, d’abord par la concurrence d’acteurs comme Facebook ou Amazon qui utilisent certes massivement des cookies, mais développent aussi leur système publicitaire avec des « identifiants propriétaires » (dès qu’on se logue, on passe sur des systèmes d’identifications propriétaires). Il faut également prendre en compte l’univers de la navigation sur mobile, où les cookies sont peu présents, mais remplacés par des identifiants publicitaires pour la publicité (IDFA, par exemple) pour saisir l’évolution actuelle. Enfin, les effets du règlement RGPD14 sur l’écosystème publicitaire restent à déterminer.

Il est, pour conclure, important de connaître davantage ces univers complexes car ils sont un peu le back office de nos vies numériques, et la démarche critique ne doit pas empêcher de comprendre la rationalité des acteurs, leurs logiques et leurs incertitudes.15

Notes

1 En raison en particulier d’un environnement complexe, très concurrentiel et qui évolue rapidement, de la présence de grands acteurs comme Criteo, Google ou Facebook qui ont un avantage concurrentiel basé sur des technologies propriétaires dont ils refusent de parler, ou encore des enjeux de fraude qui sont aussi présents. La complexité du secteur apparaît dans une représentation commune de la chaîne de valeur du marché de la publicité en ligne (en l’occurrence du « display », c’est à dire les bannières qui s’affichent en haut ou sur les cotés des écrans restituée dans la présentation (voir slide ou lien vers la « Lumascape » de la publicité display : https://lumapartners.com/content/lumascapes/display-ad-tech-lumascape/

2 Les Science and technology studies (STS) consistent à suivre les objets et innovations techniques, les dispositifs et leur circulation, et les agencements marchands ou socio-techniques qu’ils produisent.

3 La régie interne est généralement articulée avec les mesures d’audience traditionnelles d’entreprises spécialisées comme Netrating ou Mediamétrie.

4 Ces adnetworks, qui ont émergé à la fin des années 1990, étaient des acteurs de la mesure d’audience, comme c’est le cas de Weborama ou Quantcast aux Etats Unis.

5 Par exemple, les adnetworks élaboraient des inférences socio-démographiques du type « ces internautes visitent beaucoup de pages sport, ce sont probablement des hommes », et pouvaient indiquer aux éditeurs partenaires « vos internautes visitent plutôt telles choses donc sont plutôt comme ça.. ».

6 Y compris les plus petits sites internet ayant peu de moyens, car les adnetwork assuraient alors souvent la régie, en commercialisant leurs espaces publicitaires.

7 Les widgets sont utilisés par les éditeurs pour partager leurs contenus sur les réseaux sociaux, ils se représentent généralement comme des icônes situés en bas d’un article. On peut leur attacher un petit pixel/un tag qui va permettre de construire un cookie. A partir de ces widgets, jouant également le rôle de cookie, disséminés sur de nombreux sites d’éditeurs, AddThis va pouvoir construire une connaissance très étendue des internautes.

8 Le retargeting consiste à recibler des internautes en affichant des publicités contenant des produits dont l’internaute a consulté la fiche sur des sites de vente en ligne. Par exemple, Criteo sait que tel internaute a visité la semaine dernière une page Decathlon, donc il va pouvoir la retargetter via ces systèmes d’adexchange, en temps réels. Par rapport aux acteurs faisant des inférences socio-démographiques comme Weborama («  a vu des pages sports », inférence « homme 12-25 ans) et Bluekai («  a vu des pages rugby »), c’est Criteo qui va gagner car son information a plus de valeur.

9 Les données propres de l’annonceur sont par exemples celles issues de la navigation sur leur propre site et de leurs données clients ou CRM (pour Customer relationship management) : transactionnelles, historique d’achat, etc. Les donnes tierces sont par exemple celles précisément apportées par des fournisseurs de données (data provider) comme Bluekai, filiale de Oracle, tout comme AddThis.

10 Plutôt que de cibler sur la base d’inférences statistiques opérées à partir des navigations web de l’internaute, on va pouvoir le cibler sur la base du fait que l’internaute est ou pas un client Decathlon. Une telle information revêt une grande valeur par exemple lors du lancement d’une campagne d’acquisition de nouveaux clients, qui va être lancée à des centaines de milliers d’internautes. Dans ce cadre, pour l’entreprise, l’enjeu deviendra aussi d’éviter d’acheter des espaces pour toucher des internautes qui sont déjà clients.

11 Par exemple, Decathlon peux repérer dans sa base de données, les clients qui ont un profil attractif (clients premium qui achètent beaucoup) et demander à des acteurs comme Bluekai ou Facebook de faire tourner des algorithmes pour savoir s’il est possible de cibler d’autres personnes ayant des profils similaires (pratique du « look alike »).

12 Aux Etats-Unis, des databrokers (Axiome, Experian, Epsilon, etc.) se sont développés dans les années 1970 autour d’une industrie du scoring (important dans le secteur de l’assurance ou de l’emploi). Ils ont construit des bases de données qu’ils ont ensuite étendues à d’autres services, marketing en particulier. Ces base de données (d’historiques d’achat mais aussi de données publiques sur le passé judiciaire, ou sur le dossier santé géré par le secteur privé, etc.) sont nominatives, donc pour chaque américain (et des personnes issues d’autres pays) elles contiennent des données très précises (bien que parfois fausses, et il existe un débat aussi sur ce point…) faisant l’objet d’un commerce totalement libre. Ce phénomène est l’objet de travaux de recherche dans le domaine de la santé notamment, dont les données sont utilisées à des fins de marketing direct. Dans le contexte mondial, les databrokers européens sont de petits acteurs qui n’ont pas beaucoup de poids sur le marché.

13 Il y a même en Europe des points de jonction avec le modèle américain, comme « la carte de fidélité ». Par exemple, chez Carrefour, on vous donne une carte de fidélité, mais vous ne pourrez l’utiliser que si vous vous connectez à un ordinateur pour l’activer, ce qui permettra de déposer un cookie, de « cookifier cette carte de fidélité ». Il y a néanmoins des gardes- fou juridiques, et des acteurs spécialisés dans le on-boarding (par exemple, Liveramp) qui consiste à rendre anonyme les base de données clients pour opérer ces outillages. C’est un acquis, qui reste insuffisant.

14 Règlement européen sur les données personnelles, entrée en application le 25 mai 2018 modifie notamment la façon dont le consentement au tracking est acquis auprès des internautes.

15 Le marketing se nourrit de promesses à la Minority report, du « consommateur 360 », mais dans la réalité il s’agit souvent de formes de ciblage assez rustres et maladroites dont l’efficacité se mesure en termes d’augmentation marginale des clics et des ventes. Parois, les acteurs partent avec l’idée de toucher des millions de personnes, mais en fait se retrouvent avec des bassins qui ne contiennent que quelques dizaines de milliers de profils, qui sont très coûteux à acheter, puis implémenter etc.

Même enjeu, autres analyses
NIKOS SMYRNAIOS
Maître de conférences en sciences de l’information à l’Université de Toulouse

Accéder aux vidéos & synthèses
KEVIN MELLET

Chercheur au département de sciences sociales d’Orange Labs

Accéder aux vidéos & synthèses
VALÉRIE PATRIN-LECLÈRE
Chercheuse au GRIPIC et enseignante au CELSA Sorbonne Université, dont elle dirige la Chaire

Accéder aux vidéos & synthèses

ARTHUR MESSAUD
Juriste à La Quadrature Du Net

Accéder aux vidéos & synthèses