Lizeo Group
Le Blog Data by Lizeo Group
Associée à une information produit non détaillée, la donnée prix va rapidement montrer ses limites lorsque vous allez chercher à comparer des références issues de gammes, sites ou pays différents. La solution : vous référer à une base de donnée produit exhaustive et de qualité. Quelle méthode suivre ? Qu’est-ce que le matching ? Comment construire une base de référence exhaustive ? Explications.

Démarrer une analyse de pricing : une méthode en 3 étapes

  • Pour suivre efficacement les prix pratiqués sur votre marché, vous devez avant toute chose définir un périmètre de marques et de sources de données (ou e-shops dans le cas du web scraping).
  • Vous devrez ensuite déterminer dans le détail quels produits concurrents vous souhaitez surveiller en priorité. À ce stade, il est important de s’assurer que les sources de données disponibles soient suffisamment homogènes et granulaires pour vous garantir une comparaison précise avec vos références.
  • Assurez-vous enfin que les noms et descriptions techniques des produits concurrents soient unifiés entre vos différentes sources de données (matching produit). C’est sur cette dernière étape que doit intervenir votre référentiel produit enrichi et validé par les experts métiers.

Matching de la donnée : l’étape clé de la valorisation de la donnée

Pour pouvoir décrypter les informations concurrentielles récoltées, il est indispensable de se baser sur un référentiel produit propre. Afin d’obtenir la vision marché la plus représentative possible, vous allez devoir collecter et unifier de la Data issue de différentes sources, qu’elles soient en ligne ou offline. Problème : la nomenclature, la description et les caractéristiques d’un même produit varient généralement d’une source à l’autre, au point de rendre l’analyse imprécise, voire impossible (doublons de produits, trous dans les données, etc.).
Face à cette difficulté inhérente à la diversité des points de collecte, il est impératif d’intégrer une phase de matching de la donnée en amont de toute analyse. Concrètement, cette étape va vous permettre de relier le prix collecté d’une référence vue sur une source (site A ou price list A), avec le prix de cette même référence sur une autre source (site B ou price list B). La référence devra par ailleurs être identifiée dans la base de produits certifiée pour garantir la pertinence des prix qui lui sont désormais rattachés.
Le fonctionnement est simple : chaque information produit recueillie lors de votre collecte des prix doit être automatiquement triée en trois catégories.
  • Inconnue : la donnée peut renvoyer à un produit inexistant ou à une nouveauté à créer à partir d’une source sûre. On effectuera alors une recherche de documents officiels attestant l'existence ou non du produit pour compléter le référentiel et matcher rétroactivement le produit.
  • Connue : la donnée prix doit être associée avec le produit correspondant.
  • Fausse : la donnée doit être blacklistée. C’est le cas, par exemple, lorsqu’une information technique concernant un produit disponible dans une source est trivialement fausse.
L’automatisation de ce tri permet de nettoyer la donnée en excluant les informations erronées et les doublons avec, à la clé, un réel gain de temps. Résultat : les données « matchées » sont stockées dans une base de données propre en associant une seule ligne d’informations par produit.

Le référentiel produit : atout n° 1 pour un bon matching

Vos produits sont complexes ? Ils comprennent de nombreux caractéristiques techniques ? La constitution et l’utilisation d’une base de données référence va simplifier vos opérations de matching.
Pour garantir la qualité et l'exhaustivité de cette base de données produit, un processus d'enrichissement continu supervisé par des experts métiers est nécessaire.
Chaque élément du référentiel devra être tracé et créé à partir de sources officielles uniquement (catalogue commercial, sites du constructeur, etc.). La qualification détaillée de chaque produit assistée par le machine learning devra être validée par des experts du domaine.
À noter toutefois, que pour effectuer un matching, rapprochement ou rattachement efficace, vous aurez besoin d’une vue d’ensemble des offres produits de votre marché. Le niveau de précision de ce catalogue sera déterminant quant à la précision et à la profondeur des analyses prix qui seront effectuées par la suite. Il ne vous restera plus qu’à établir et à sélectionner les critères discriminants sur votre marché pour rendre vos analyses comparatives les plus pertinentes possibles grâce à vos équipes.

Les points clés d’un référentiel produit fiable

  • Traçabilité : chaque création de produit ou d'attribut doit provenir d'une source officielle qui sera archivée.
  • Représentativité : le niveau de qualification et de clusterisation des produits concurrents doit être défini par les experts métiers et doit refléter une vision neutre du marché
  • Exhaustivité : plus le référentiel est complet et plus le périmètre des analyses sera étoffé. Cela passe par un équilibre entre qualification automatique et enrichissement manuel
À l’ère du Big Data, il est essentiel d’intégrer à votre processus de traitement de la donnée une phase de préparation de cette dernière. Ne brûlez pas les étapes. Avant de passer à l’analyse des prix des concurrents, le cleaning et le matching sont indispensables. Vous souhaitez en savoir plus sur la construction d'une base de données produit de référence et sur les bonnes pratiques du matching ?
Haut