Recherche & Développement

Apprentissage automatique et science des données au cœur de notre R&D

L'IA chez Lizeo

Depuis sa création, Lizeo a beaucoup investi dans la recherche et le développement appliqué aux données massives que nous collectons chaque jour. 

Nous avons donc naturellement développé de nombreux algorithmes d’apprentissage automatique. La plupart sont l’implémentation concrète de publications scientifiques que nous défendons dans différentes conférences nationales et internationales suite à des travaux internes ou des thèses.

En ce qui concerne le sujet de l’Intelligence Artificielle, chez Lizeo, nous préférons le terme « Machine Learning ». Ainsi, nous développons des solutions « IA » depuis plus de 10 ans tant au niveau d’approches supervisées (c’est-à-dire nécessitant une base d’apprentissage étiquetée, c’est-à-dire fournissant pour chaque donnée en entrée un résultat attendu en sortie) que d’approches non supervisés (où l’algorithme tente d’extraire des schémas sous-jacents aux données non étiquetées).

Au niveau des algorithmes non supervisés, nous pouvons citer comme exemples :

La découverte de thématiques dans un ensemble de documents

Schéma de la méthode Lizeo concernant le Topic Modelling

Pour cela, nous nous sommes appuyés sur les travaux initiaux du « Topic modeling » pour le faire évoluer vers une approche spécifique « Embedded Hierarchical Dirichlet Process (EHDP) – Palencia-Olivar et al. 2021 ».

La détection de prix aberrants dans une collection de séries chronologiques de prix

Graphique Lizeo de détection des prix aberrants

Nous voulions sortir des approches classiques qui supprimeraient les points globalement aberrants (Zone en trait pointillé) et pas forcément les points aberrants vis-à-vis des autres points (Zone en trait plein). En effet, le fait que la majorité des prix d’un même produit augmente n’est pas forcément une erreur, alors que si certains prix deviennent localement incohérents alors cela peut être le vrai problème. C’est pourquoi, nous avons mis au point le LADOP qui a été publié dans la revue «IEEE Transactions on Neural Networks and Learning Systems» en 2021.

Au niveau des algorithmes supervisés, nous pouvons citer comme exemples :

La mise en correspondance de produits aspirés sur des sites et une base référentielle

Schéma de mise en correspondance des données

Un processus de mise en correspondance (matching) prend en entrée par une paire de flux de données nommés classiquement « referential » et « tomatch » à mettre en correspondance. Le résultat attendu est un flux contenant une liste de paires (tomatch.id, referential.id) avec des scores et la sélection potentielle (Vrai ou Faux) selon les valeurs des scores.

Pour cela nous avons développé notre propre algorithme de mise en correspondance généralisée que nous utilisons sur différents flux de données structurées comme des petites annonces ou des flux de données de véhicules collectés sur des sites internet.

La qualification automatique d’avis d’internautes

Cette approche nécessite donc une phase d’apprentissage s’appuyant sur une base qualifiée de textes avec des thèmes et tonalités associés pour créer les modèles pour la qualification.

La phase d’inférence utilise simplement les modèles appris précédemment pour qualifier un nouveau texte.

Évidemment, l’explosion actuelle des très grands modèles de langages (comme ChatGPT par exemple) ne nous laisse pas indifférents. Nous les évaluons et les intégrons comme des briques complémentaires mais toujours avec une vision scientifique et donc critique.

Par exemple, pour la qualification automatique d’avis nous avons comparé dans divers domaines les différentes versions de GPT, et les résultats sont parfois très étonnants. Ainsi, dans le domaine des pneumatiques, les résultats du dernier modèle d’OpenAI sont deux fois plus faibles que le modèle précédent. Il est primordial donc de systématiquement tester et de rester attentif aux évolutions des modèles.

Machine Learning & Data Science au coeur de notre R&D

Pour vous aider à extraire la valeur ajoutée des données disponibles pour votre marché, nous sommes constamment à la pointe de la recherche dans les domaines du Big Data, data science, du machine learning, de l’intelligence artificielle et du deep learning. 
 

ANTICIPER LES ÉVOLUTIONS DU MARCHÉ POUR AJUSTER VOTRE STRATÉGIE

 
Notre équipe de data scientists a construit une bibliothèque de modèles et d’algorithmes pour pouvoir modéliser et prédire :
 
  • Les prix et les volumes du marché,
  • Les comportements d’achat et les profils de clients,
  • Les cycles de vie des produits.
 
Ces briques technologiques sont intégrées aux solutions Lizeo®.price, Lizeo®.product et Lizeo®.insights.
 

DÉTECTER ET ANALYSER LES ATTENTES DES CONSOMMATEURS

 
Nos technologies avancées d’intelligence artificielle et d’analyse sémantique permettent une analyse approfondie des fils de conversation des consommateurs pour extraire :
 
  • L’entité nommée (marques, produits, détaillants, etc.),
  • Les sujets,
  • Les sentiments (positifs, négatifs).