Le baromètre 2019
MRNews-Callson
< Retour au dossier

DOSSIER : Ecouter le consommateur sur le web : pourquoi, comment ?

La richesse des bases de données au service du bon décodage des conversations

Virginie Barbieri

Co-fondatrice
et directrice générale

 

Vous êtes un tout nouvel acteur dans l’univers des études et du conseil marketing, spécialisé dans l’écoute du web. Quelles sont les spécificités de votre approche dans ce domaine ?

Pour utiliser un repère sans doute bien connu des lecteurs de Market Research News, Semantiweb n’est pas un acteur de plus dans le domaine de l’e-réputation ! Notre vocation principale est d’essayer de donner un décodage intelligent de ce que disent les internautes sur le web, et non de fournir de l’alerting sur de la citation de marque.

Notre activité s’inscrit dans ce que l’on appelle le plus souvent le Social Media Intelligence, avec des spécificités fortement liées à notre expérience sur www.same-story.com, dont le fait par exemple que nous nous intéressons principalement aux conversations échangées sur les forums internet.

Pour nous, c’est là qu’il y a le plus d’informations intéressantes, à la fois en volume et en valeur. On trouve à peu près 1 milliards de « posts », répartis sur environ 5000 forums en France. Ce qui est colossal. Le contenu produit y est particulièrement riche pour les marques puisque les internautes s’expriment sur ces espaces de manière régulière, anonyme et spontanée sur leur vie de tous les jours et donc sur leur manière de consommer. Voilà la vraie valeur !

Pas de Facebook, pas de twitter ?

Non, sauf cas très particuliers, comme les fan-pages sur Facebook. D’abord parce qu’il n’y a pas ou peu de production de contenus originaux sur ces médias, où l’activité des internautes consiste essentiellement à trier et à relayer de l’information. D’autre part, les internautes y communiquent à visage découvert (pas d’anonymat) et donc essayent de se montrer sur leur meilleur jour en se mettant en scène de manière « valorisante » . C’est la raison pour laquelle on comptabilise beaucoup de fans de marques statutaires (notamment luxe), et beaucoup moins de fans de produits de consommation quotidienne !

Nous étudions également les contenus produits sur les blogs, mais avec une certaine distance car une bonne partie d’entre eux sont de plus en plus commerciaux. Ils sont utilisés par les marques pour de l’échantillonnage, du test produit, ce qui peut donc induire des biais dans les contenus produits dans ces espaces.

Vous évoquiez votre expérience Same Story. En quoi a-t-elle nourri votre approche ?

Il y a 3 ans, nous avons effectivement lancé www.same-story.com, qui je m’empresse de le préciser, n’a rien à voir avec l’univers des études de marché.  Ce site a pour vocation de simplifier la recherche des internautes sur une problématique de vie personnelle en agrégeant tous les récits d’histoires vécues des principaux forums français, et en donnant des clés de lecture sur l’auteur du récit.

Pendant 3 ans, nous avons ainsi qualifié les profils des internautes qui s’expriment sur les forums en fonction des informations collectées par nos robots sémantiques : la situation personnelle (sexe, âge,…), la situation maritale, la situation familiale (le nombre et l’âge des enfants), l’univers d’habitation,.. . Et nous avons ainsi créé une base de données qualifiée de forumeurs sur l’univers personnel.

Puis, nous nous sommes aperçus que dans ces conversations des forums , il n’y avait pas que des histoires « personnelles ». Il était aussi question de marques, de produits, de services et surtout de manière de consommer .

Cela pouvait ainsi donc intéresser les marques pour saisir un certain nombre de tendances, et c’est ainsi qu’est né Semantiweb.

Ces informations sont venues s’intégrer dans votre base de données ?

Exactement. Nous avons progressivement généré et renseigné les univers de consommation des internautes : les équipements, les catégories de produits consommés, les enseignes fréquentées… Cela nous a permis de construire des clustering en fonction de la consommation, de l’univers des voyages, des télécommunications, et plus secondairement de l’univers de consommation culturelle.

Cette base est aujourd’hui constituée d’un million et demi de pseudos, ce qui est bien sûr assez conséquent, avec un principe d’étanchéité selon les forums.

Quel est le principe des analyses que vous proposez ?

Lorsque nous sommes sollicités par une marque sur une problématique, nous constituons d’abord un échantillon d’analyse. On isole un ensemble de conversations dont on s’assure qu’elles ont bien trait à la problématique grâce à une charte d’extraction, qui spécifie des mots clés, des expressions régulières ou synonymiques (Paris-Marseille pour dire TGV par exemple), et des exclusions. A l’issue de ce travail de nettoyage, nous utilisons des filtres sémantiques, qui permettent de dégager des angles conversationnels notamment par les co-occurrences de mots clés.

Notre logiciel va ainsi repérer et quantifier ces différents groupes, qui sont en fait des thèmes de conversations, et nous dire, par exemple, quel est le niveau de présence des aspects tarifaires associés à une marque ou à un produit. Des aller-retours sont parfois nécessaires pour que la vision soit la plus propre possible, avec des thèmes clairs et relativement étanches.

On sait ainsi clairement comment et dans quel contexte les internautes s’expriment sur un produit ?

Oui, mais on peut aller bien au-delà. La base de pseudos Sémantiweb nous permet aussi de disposer de référentiels précieux. Elle nous permet de dire quels sont les profils qui s’expriment sur quels sujets, et de voir jusqu’à quel point ils sont sur ou sous-représentés par rapport à une population générale.

Par exemple, qui sont les personnes qui parlent du petit déjeuner et sous quel angle.  Sachant que l’on peut encore enrichir cette vision en définissant ainsi des typologies d’internautes, qui sont soit spécifiques au sujet (par exemple, tous les personnes qui sont en situation de 1ère fois utilisation ou consommation) soit transverses aux catégories de produits ou de services (par exemple les papas ou les mamans solos, ou les cyberacheteurs…

Votre base vous permet donc de relativiser le poids des différents thèmes de conversation …

Exactement. On voit par exemple que la thématique Prix est présente dans 20% des conversations associées à l’univers du transport. Si j’analyse les conversations associées à un produit plus précis, et que ce poids du Prix n’est pas de 20, mais de 30 ou de 50%, j’obtiens bien un éclairage précieux. Pour prendre un exemple complètement différent, dans l’univers du food, on peut s’étonner de découvrir un poids important du thème « régime», si l’on sait comparer ce poids pour différents produits ou marques, l’éclairage est alors plus intéressant. Cela permet de relativiser, et permet ainsi d’éviter de faire des erreurs d’appréciation importantes.

Quelles sont les problématiques pour lesquelles cette forme d’écoute du web vous semble la plus pertinente ?

On obtient des « fonds de marque » très éclairants, qui mettent à plat tout ce qui se dit sur une marque donnée sur 4 ou 5 ans, avec la possibilité de le mettre en perspective avec d’autres marques. Qui parle, de quoi, avec quel vocabulaire, dans quel contexte. Cela donne aussi des matériaux très opérationnels, en mettant par exemple en évidence des questions que se pose le public et auxquelles il vaudrait mieux apporter des réponses dans le site de la marque.

L’autre éclairage le plus puissant est relatif à l’analyse des tendances, avec la possibilité de mettre en perspective un produit avec une grande tendance de consommation (le bio ou bien le home made par exemple). Est-ce que mon produit est plus ou moins associé aux conversations relatives au bio, ou aux économies que font les gens lorsque leur pouvoir d’achat baisse ? Et comment est-ce que cela évolue ? Dans le cas du bio par exemple, cette tendance est présente depuis déjà longtemps dans l’alimentaire, mais on peut identifier à quelles catégories cela se propage, et à quelle vitesse.

Quels avantages voyez vous dans cette approche, par rapport aux outils d’études « classiques » ?

La spontanéité des échanges et l’approche non structurée sont fondamentales. Elles permettent notamment de mettre en lumière des pratiques que les gens ne signaleraient sans doute pas ou peu via les outils d’études traditionnels. Par exemple le fait que certaines femmes utilisent en crème de visage des produits qui sont plutôt destinés à être utilisés pour le corps, parce que le différentiel de prix ne leur a pas échappé. Au fond, les gens peuvent exprimer sur le web des éléments qui peuvent paraître parfaitement secondaires, qui seront passés sous silence dans des cadres d’études traditionnelles et qui peuvent être capitales pour les annonceurs. On obtient ainsi des éclairages nouveaux sur les leviers et les motivations d’achat d’un produit, ou au contraire sur des raisons de non-achat, ou de « dé-consommation ».

Ce type d’écoute présente aussi un gros avantage pratique : on peut remonter dans le temps ! Nous avons le cas d’un annonceur qui constatait une baisse des ventes d’un de ses produits, sans avoir une bonne compréhension de ce phénomène. L’éclairage du web a permis de reconstruire a posteriori ce qui s’est dit sur le produit en question, quelle est la structure des conversations qui lui sont associées et la façon dont elle a évolué. Le même principe s’applique à la connaissance des marques. Si l’item X fait défaut dans un baromètre d’études classique, il n’y a plus rien à faire qu’à l’intégrer pour le coup d’après. Alors que l’analyse des conversations permet d’avoir la rétrospective.

Au global, notre valeur ajoutée est dans la structuration des contenus et surtout dans la mise en perspective. L’analyse est aussi bien sûr clé, et nos 15 ans d’expérience marketing chez l’annonceur nous sont très précieuses.

Voyez-vous des conseils importants à donner aux annonceurs dans l’usage de ces approches ?

Très clairement, il s’agit bien d’une méthodologie et d’une écoute complémentaire par rapport à ce qui existe aujourd’hui en termes d’outils d’e-réputation, d’études quali ou quanti. Il ne s’agit absolument pas d’un « annule et remplace ».

Cela veut dire aussi qu’il faut savoir utiliser ces matériaux en tenant compte en particulier du type de populations couvertes avec ces approches. On entend pas mal de contre-vérités sur le profil des personnes qui s’expriment sur le web, et la diversité est bien plus importante qu’on ne le croit. Néanmoins si presque tout le monde utilise aujourd'hui le web, tout le monde ne s’y exprime pas.

Il y a donc bien une certaine spécificité dont il faut tenir compte. Néanmoins la compréhension de la voix du web est essentielle pour les annonceurs et l’éclairage de Sémantiweb est aujourd’hui unique !