Recherche & Développement

Apprentissage automatique et data science au cœur de notre R&D

L'IA chez Lizeo

Depuis sa création en 2009, Lizeo a beaucoup investi dans la recherche et le développement appliqué aux données massives que nous collectons et exploitons chaque jour. 

Nous avons donc naturellement développé de nombreux algorithmes d’apprentissage automatique. La plupart sont l’implémentation concrète de publications scientifiques que nous défendons dans différentes conférences nationales et internationales suite à des travaux internes ou des thèses.

En ce qui concerne le sujet de l’Intelligence Artificielle, chez Lizeo, nous préférons le terme « Machine Learning ». Ainsi, nous développons des solutions « IA » depuis plus de 10 ans tant au niveau d’approches supervisées (c’est-à-dire nécessitant une base d’apprentissage étiquetée, c’est-à-dire fournissant pour chaque donnée en entrée un résultat attendu en sortie) que d’approches non supervisés (où l’algorithme tente d’extraire des schémas sous-jacents aux données non étiquetées).

Au niveau des algorithmes non supervisés, nous pouvons citer comme exemples :

La découverte de thématiques dans un ensemble de documents

Pour cela, nous nous sommes appuyés sur les travaux initiaux du « Topic modeling » pour le faire évoluer vers une approche spécifique « Embedded Hierarchical Dirichlet Process (EHDP) – Palencia-Olivar et al. 2021 ».

La détection de prix aberrants dans une collection de séries chronologiques de prix

Nous voulions sortir des approches classiques qui supprimeraient les points globalement aberrants (zones en rouge) et pas forcément les points aberrants vis-à-vis des autres points (courbe bleue). En effet, le fait que la majorité des prix d’un même produit augmente n’est pas forcément une erreur, alors que si certains prix deviennent localement incohérents alors cela peut être le vrai problème. C’est pourquoi, nous avons mis au point le LADOP (Local Anomaly Detection based On Poison Model) qui a été publié dans la revue «IEEE Transactions on Neural Networks and Learning Systems» en 2021.

Au niveau des algorithmes supervisés, nous pouvons citer comme exemples :

La mise en correspondance de produits collectés sur des sites et une base référentielle

Introduction to Data Matching

Un processus de mise en correspondance (matching) prend en entrée par une paire de flux de données nommés classiquement « referential » et « to match » à mettre en correspondance. Le résultat attendu est un flux contenant une liste de paires (tomatch.id, referential.id) avec des scores et la sélection potentielle (Vrai ou Faux) selon les valeurs des scores.

Pour cela nous avons développé notre propre algorithme de mise en correspondance généralisée que nous utilisons sur différents flux de données produits sur des sites internet.

L’analyse automatique des sujets et sentiments extraits des avis d’internautes

Cette approche nécessite donc une phase d’apprentissage s’appuyant sur une base qualifiée de textes avec des thèmes et tonalités associés pour créer les modèles pour la qualification.

La phase d’inférence utilise simplement les modèles appris précédemment pour qualifier un nouveau texte.

Évidemment, l’explosion actuelle des très grands modèles de langages (comme ChatGPT par exemple) ne nous laisse pas indifférents. Nous les évaluons et les intégrons comme des briques complémentaires mais toujours avec une vision scientifique et donc critique.

Par exemple, pour la qualification automatique d’avis nous avons comparé dans plusieurs domaines les versions successives de ChatGPT, et les résultats sont parfois très étonnants. Il est donc primordial de tester systématiquement les modèles et de rester attentif à leurs évolutions.

Machine Learning & Data Science au coeur de notre R&D

Pour vous aider à extraire la valeur ajoutée des données disponibles pour votre marché, nous sommes constamment à la pointe de la recherche dans les domaines du Big Data, de la data science, du machine learning, de l’intelligence artificielle et du deep learning. 
 

ANTICIPER LES ÉVOLUTIONS DU MARCHÉ POUR AJUSTER VOTRE STRATÉGIE

 
Notre équipe de data scientists a construit une bibliothèque de modèles et d’algorithmes pour pouvoir modéliser et analyser les tendances :
 
  • Des prix et des volumes du marché,
  • Des comportements d’achat et des profils de clients,
  • Des cycles de vie des produits.
 
Ces briques technologiques sont intégrées aux solutions Lizeo®.price, Lizeo®.product et Lizeo®.insights.
 

DÉTECTER ET ANALYSER LES ATTENTES DES CONSOMMATEURS

 
Nos technologies avancées d’intelligence artificielle et d’analyse sémantique permettent une analyse approfondie de l’ensemble des expressions de la voix du consommateur pour extraire :
 
  • L’entité nommée (marques, produits, distributeurs, etc.),
  • Les sujets,
  • Les sentiments (positifs, négatifs).