Recherche & Développement
L'IA chez Lizeo
Depuis sa création, Lizeo a beaucoup investi dans la recherche et le développement appliqué aux données massives que nous collectons chaque jour.
Nous avons donc naturellement développé de nombreux algorithmes d’apprentissage automatique. La plupart sont l’implémentation concrète de publications scientifiques que nous défendons dans différentes conférences nationales et internationales suite à des travaux internes ou des thèses.
- Une thèse sur la détection d’anomalies soutenue en mars 2018,
- Une thèse sur l’apprentissage multi-label pour l'annotation automatique en mars 2021,
- Un autre doctorant a soutenu en février 2023 sur la modélisation des thématiques,
- 24 publications scientifiques depuis 2014 dans SFC, EGC, Cap, IJCNN, KDD, ICML, MDAI et IEEE TNNLSE.
En ce qui concerne le sujet de l’Intelligence Artificielle, chez Lizeo, nous préférons le terme « Machine Learning ». Ainsi, nous développons des solutions « IA » depuis plus de 10 ans tant au niveau d’approches supervisées (c’est-à-dire nécessitant une base d’apprentissage étiquetée, c’est-à-dire fournissant pour chaque donnée en entrée un résultat attendu en sortie) que d’approches non supervisés (où l’algorithme tente d’extraire des schémas sous-jacents aux données non étiquetées).
Au niveau des algorithmes non supervisés, nous pouvons citer comme exemples :
La découverte de thématiques dans un ensemble de documents

Pour cela, nous nous sommes appuyés sur les travaux initiaux du « Topic modeling » pour le faire évoluer vers une approche spécifique « Embedded Hierarchical Dirichlet Process (EHDP) – Palencia-Olivar et al. 2021 ».
La détection de prix aberrants dans une collection de séries chronologiques de prix

Nous voulions sortir des approches classiques qui supprimeraient les points globalement aberrants (Zone en trait pointillé) et pas forcément les points aberrants vis-à-vis des autres points (Zone en trait plein). En effet, le fait que la majorité des prix d’un même produit augmente n’est pas forcément une erreur, alors que si certains prix deviennent localement incohérents alors cela peut être le vrai problème. C’est pourquoi, nous avons mis au point le LADOP qui a été publié dans la revue «IEEE Transactions on Neural Networks and Learning Systems» en 2021.
Au niveau des algorithmes supervisés, nous pouvons citer comme exemples :
La mise en correspondance de produits aspirés sur des sites et une base référentielle

Un processus de mise en correspondance (matching) prend en entrée par une paire de flux de données nommés classiquement « referential » et « tomatch » à mettre en correspondance. Le résultat attendu est un flux contenant une liste de paires (tomatch.id, referential.id) avec des scores et la sélection potentielle (Vrai ou Faux) selon les valeurs des scores.

Pour cela nous avons développé notre propre algorithme de mise en correspondance généralisée que nous utilisons sur différents flux de données structurées comme des petites annonces ou des flux de données de véhicules collectés sur des sites internet.
La qualification automatique d’avis d’internautes
Cette approche nécessite donc une phase d’apprentissage s’appuyant sur une base qualifiée de textes avec des thèmes et tonalités associés pour créer les modèles pour la qualification.

La phase d’inférence utilise simplement les modèles appris précédemment pour qualifier un nouveau texte.
Évidemment, l’explosion actuelle des très grands modèles de langages (comme ChatGPT par exemple) ne nous laisse pas indifférents. Nous les évaluons et les intégrons comme des briques complémentaires mais toujours avec une vision scientifique et donc critique.
Par exemple, pour la qualification automatique d’avis nous avons comparé dans divers domaines les différentes versions de GPT, et les résultats sont parfois très étonnants. Ainsi, dans le domaine des pneumatiques, les résultats du dernier modèle d’OpenAI sont deux fois plus faibles que le modèle précédent. Il est primordial donc de systématiquement tester et de rester attentif aux évolutions des modèles.
Machine Learning & Data Science au coeur de notre R&D
ANTICIPER LES ÉVOLUTIONS DU MARCHÉ POUR AJUSTER VOTRE STRATÉGIE
- Les prix et les volumes du marché,
- Les comportements d’achat et les profils de clients,
- Les cycles de vie des produits.
DÉTECTER ET ANALYSER LES ATTENTES DES CONSOMMATEURS
- L’entité nommée (marques, produits, détaillants, etc.),
- Les sujets,
- Les sentiments (positifs, négatifs).