IA COGNITO – EP08 – L’Analyse Prédictive

Troisième volet de notre série IA et applications. Dans l’épisode d’aujourd’hui, nous allons nous intéresser à la prédiction du futur.

Non, nous n’accueillons pas Mme Irma en guest star sur IA Cognito. En lieu et place, nous nous concentrons sur un domaine applicatif de l’intelligence artificielle : l’analyse prédictive. Pas de boule de cristal donc mais de la science !

Définition du domaine

Qui n’a jamais rêvé de pouvoir prédire le futur ? Il faut avouer que cela serait tout de même bien pratique.

Bien loin de la voyance, il s’agit pourtant de la promesse portée par l’analyse prédictive – un domaine d’application de l’intelligence artificielle qui a le vent en poupe !

Le concept est assez simple : analyser et apprendre sur des faits présents et passés pour faire des hypothèses et des prédictions sur des événements futurs. En gros, se servir du passé pour anticiper le futur, ce que nous, humains, faisons constamment et la plupart de temps par simple analogie.

L’analyse prédictive regroupe de nombreuses techniques alliant statistiques, data mining et théorie des jeux, rien que ça !

Ces différentes techniques permettent de créer des modèles prédictifs pour trouver ce qu’on appelle des patterns dans les données. Le but de ces modèles est de trouver des corrélations entre des variables et des événements. Par la suite, le modèle cherchera à retrouver des patterns connus dans de nouvelles données pour prédire la probabilité qu’un événement survienne.

L’analyse prédictive engage un triptyque immuable : des données, une modélisation statistique de ces données et des hypothèses. Les données servent de base d’apprentissage, le modèle est ce que nous appellerons concrètement l’IA et les hypothèses sont les résultats produits par cette IA.

Pour bien comprendre ce qu’est l’analyse prédictive, il convient de la positionner correctement et de distinguer 3 niveaux d’analyses distincts :

  • L’analyse descriptive, c’est une simple analyse d’un événement ou phénomène qui est en train de se passer. Nous allons simplement décrire ce qui se passe.
  • L’analyse prédictive, elle, consiste à prédire et anticiper un phénomène avec un certain niveau de probabilité.
  • L’analyse prescriptive permet d’aller encore plus loin. Outre le fait de prédire un événement, elle permet d’expliquer pourquoi il va arriver et recommande des actions à mener pour répondre à ce phénomène. Cela se rapproche de modèles permettant de prendre des décisions.

Nous voyons donc que l’Analyse Prédictive marque une belle avancée mais comment fonctionne-t-elle concrètement ?

Typologie de données et méthodes algorithmiques

L’analyse prédictive nécessite de mobiliser des données actuelles et historiques. L’objectif est alors de trouver une relation entre des variables explicatives et des variables dont on connaît déjà une partie des valeurs. Cette définition très générale implique que les données que l’on peut mobiliser sont très variées et avant tout dépendantes des applications choisies.

Pour simplifier, on peut considérer que la méthode algorithmique au cœur de l’analyse prédictive est celle de la régression. Plus simplement, cela veut dire que l’on se base sur un certain nombre de données connues pour trouver la relation entre plusieurs variables.

Comme pour une grande partie des méthodes d’intelligence artificielle, les fondements mathématiques et théoriques de l’analyse prédictive sont donc basés sur des méthodes statistiques. C’est ce qui explique, comme nous le verrons plus tard, que les problématiques d’analyse prédictive sont très bien adaptées à des méthodes d’apprentissage automatique.

Maintenant que nous avons une vue d’ensemble de la problématique algorithmique, et sans chercher à tendre vers l’exhaustivité, il peut être intéressant de citer quelques-unes des approches dont on peut le plus souvent entendre parler.

Database Icon

La première est la régression linéaire. Comme son nom l’indique, cela veut dire que l’on peut trouver une relation linéaire entre les différentes variables. Plus graphiquement, ça signifie que l’on peut tracer une droite entre tous nos points de données. Et qu’il est donc facile, à partir de cette droite, de prédire des valeurs inconnues.

Un autre type de régression est la régression logistique. Dans ce cas, on cherche à trouver une distribution de probabilité permettant de quantifier la probabilité d’un événement. Ceci peut par exemple nous permettre de traiter l’analyse prédictive comme un problème de classification. C’est-à-dire que, à partir d’un certain nombre de variables explicatives, on veut connaître la probabilité des différentes valeurs possibles d’une variable qu’on appelle alors catégorielle.

Enfin, une dernière approche que l’on peut citer est celle qui concerne les séries chronologiques, que l’on appelle couramment les time series en anglais. La différence est que l’on s’intéresse donc à des données organisées de manière chronologique qui peuvent alors être constituées de cycles et de tendances qui sont difficilement prises en compte par des modèles de régression plus classiques. Il est donc nécessaire d’utiliser des modèles capables de reconnaître ces tendances et de les utiliser pour faire ses prédictions.

Ces problématiques que nous venons de citer concernent des catégories générales pour lesquelles il existe de nombreuses méthodes, notamment mathématiques, pour les résoudre. Dans le cadre de ce podcast, nous sommes principalement intéressés par les méthodes d’IA plus récentes et plus particulièrement l’apprentissage automatique. Par conséquent, il nous paraît intéressant de mentionner quelles méthodes sont le plus couramment utilisées dans le domaine.

Pour les problèmes de régression, on utilise principalement des méthodes classiques telles que les Random Forest ou les machines à vecteurs de support dont nous avons déjà parlé précédemment. Bien évidemment, dès que les données sont plus complexes, il est fréquent d’utiliser à la place des modèles de deep learning. Ceux-ci ont notamment l’intérêt de pouvoir augmenter le nombre de variables explicatives et de prendre plus facilement en compte des données externes complexes.

Dans le cadre des séries chronologiques, une méthode bien connue du domaine est celle de la moyenne glissante auto-régressive, ou ARIMA. Et pour des méthodes plus récentes, il est là encore de plus en plus fréquent de s’appuyer sur du deep learning lorsque les données sont en quantité suffisante.

Applications concrètes et en production

Maintenant que nous savons comment ces technologies fonctionnent, penchons nous sur leurs applications marchés, et leurs différents cas d’usage !

Numérique

Commençons par explorer le premier, celui du numérique. Il faut bien admettre qu’il regorge d’applications pour l’analyse prédictive ! Et ce, pour une raison bien simple : l’utilisation de services numériques génère énormément de données historisées. Partant de là, il s’agit d’une vraie mine d’or.

De nombreuses plateformes offrant des services, du contenu ou des produits utilisent aujourd’hui l’analyse prédictive pour proposer la bonne offre, au bon moment et au bon utilisateur. Prenons comme exemple Amazon. Lors de votre navigation, on vous recommande sans cesse des articles qui pourraient vous plaire, ou d’autres achetés par des utilisateurs similaires.

Certains moteurs de recherche et plateformes semblent même nous espionner tant ils sont précis dans leurs recommandations. Vous est-il déjà arrivé que l’on vous propose le contenu, le sujet ou bien le produit que vous étiez sur le point de chercher ? Pour cela, l’analyse prédictive se base à la fois sur votre historique et sur d’autres variables comme la similitude de profils.

Et côté recommandations personnalisées, Netflix s’impose comme un des maîtres de son domaine. En effet, jusqu’à 95% des titres proposés sur la page d’accueil de la plateforme sont des recommandations basées sur les habitudes de lecture de l’utilisateur. Afin de trouver des séries ou films à votre goût, la plateforme s’appuie sur de multiples facteurs comme votre historique de visionnage, les choix des utilisateurs ayant des goûts similaires aux vôtres ou encore les informations liées à chaque titre (son genre, ses acteurs, sa date de sortie…). Pour aller encore plus loin dans la personnalisation, Netflix s’appuie également sur le moment de la journée, les appareils utilisés ou encore la durée de visionnage.

Industrie

Passons désormais au milieu industriel, où l’analyse prédictive a là aussi plusieurs rôles à jouer. Tout d’abord, au niveau des moyens de production. En effet, si les données historiques sont exploitables et bien historisées, il est possible de mettre en place des solutions de maintenance prédictive. L’objectif étant de détecter des dérives et des anomalies du système de production susceptibles de conduire à une panne afin d’anticiper les opérations de maintenance.

Au niveau de la production, l’analyse prédictive aide à mieux dimensionner le volume de production grâce à une prédiction plus précise des ventes. Dans la même idée, elle peut anticiper les fluctuations des prix des matières premières, que les causes soient dues à la saisonnalité de la demande où à d’autres variables externes.

Santé

Penchons-nous à présent sur un tout autre marché, celui de la santé.

Ici, l’analyse prédictive permet entre autres de calculer la probabilité de contracter une maladie donnée. Par la suite, et selon la même logique, il serait possible de prédire l’évolution de cette pathologie dans le temps. Tout cela dépendant évidemment des données de santé disponible, ainsi que des données externes, et notamment environnementales.

La prédiction est aussi intéressante pour estimer l’efficacité d’un traitement. Puisque certains traitements ne fonctionnent que dans des conditions particulières, l’IA simplifie l’analyse de ces conditions afin d’aboutir à une prédiction d’efficacité du traitement. C’est cette approche qui a d’ailleurs été utilisée dans le cadre de l’immunothérapie.

Picto représentant le marché de la santé

Enfin, l’analyse prédictive, couplée à d’autres méthodes d’IA, permet d’évaluer de nouvelles molécules prometteuses. Certaines d’entre elles pourraient même devenir de futurs médicaments.

Énergie et environnement

Derniers marchés que l’on abordera dans cet épisode : ceux de l’énergie et de l’environnement.

La consommation d’énergie ne cesse d’augmenter depuis plusieurs décennies et cela pose un véritable problème. Cette énergie est produite la plupart du temps en exploitant des ressources fossiles. De plus, la demande ne cessant d’augmenter, des goulots d’étranglements se créent et la production ne peut donc plus suivre la demande.

Toutefois, l’analyse prédictive peut nous aider à optimiser notre consommation. En effet, en étant capable de prédire la production et la consommation d’énergie, il est possible de promouvoir l’effacement énergétique. Il s’agit là de décaler certaines activités énergivores afin de limiter les pics de consommation.

Picto représentant le marche de l'environnement

Au niveau purement environnemental, l’analyse prédictive anticipe certains phénomènes et fiabilise les prévisions. C’est le cas par exemple des phénomènes météorologiques ou des catastrophes naturelles, comme les séismes.

Enfin, l’analyse prédictive rend les villes plus intelligentes et flexibles. Ces dernières peuvent ainsi s’adapter aux besoins des citoyens en anticipant certains phénomènes. On peut naturellement penser aux transports en communs qu’il est possible de dimensionner en fonction de l’affluence réelle. Ainsi, fini les transports bondés !

Il en va de même avec le ramassage des ordures. En apprenant les habitudes des citoyens et en les croisant avec des phénomènes externes comme de grands événements culturels, les tournées de collectes sont tout de suite plus efficaces.

Dernières avancées scientifiques et tendances

D’un point de vue technique, le domaine de l’analyse prédictive a – comme beaucoup d’autres domaines de l’IA – incorporé des méthodes de deep learning pour en résoudre les tâches les plus complexes. Ce sont donc des modèles de plus en plus gros qui sont utilisés pour résoudre des problèmes d’analyse prédictive lorsque des modèles plus classiques ne suffiraient pas.

Notamment, comme dit précédemment, le deep learning a l’avantage de pouvoir incorporer un plus grand nombre de variables aux modalités très différentes. Si il est évidemment toujours nécessaire de réfléchir aux facteurs et variables qui peuvent réellement influencer la prédiction, les modèles de deep learning permettent ici de laisser plus facilement l’IA déterminer elle-même l’influence de chaque paramètre.

Dans les avancées les plus récentes, une partie des modèles de deep learning utilisés en analyse prédictive utilisent maintenant des Transformers. En effet, ces modèles d’IA, qui ont déjà largement fait leur preuve en NLP, s’avèrent pouvoir être utilisés très efficacement en analyse prédictive et notamment pour les time series. Pour cette dernière approche, on peut par exemple citer les Temporal Fusion Transformers, ou TFT. Si vous êtes intéressés par les Transformers, nous vous invitons à écouter notre podcast sur le NLP. C’est en effet dans ce domaine que ces réseaux, aujourd’hui aussi utilisés en vision par ordinateur, ont été introduits.

Si les avancées en matière d’Analyse Prédictive sont aussi nombreuses que prometteuses, ce domaine soulève néanmoins des questions d’ordre éthique. En effet, prenons l’exemple d’une technologie permettant de prédire les probabilités de contracter un cancer. Si cette technologie prédit que vous avez 90% de chance d’avoir un cancer dans les 5 prochaines années, voudriez-vous le savoir ? Ce qui est certain, c’est que certaines entités seraient tout à fait intéressées par le fait d’avoir cette information comme les sociétés d’assurances par exemple. Au niveau de la justice aussi, et comme le met en scène Minority Report, pourrions-nous être jugé sur les bases de prédiction ? Cette question a des conséquences tout à fait réelles avec par exemple le logiciel américain COMPAS. Celui-ci est utilisé par le système judiciaire pour prédire la probabilité de récidive. Or, comme nous l’avions déjà mentionné dans notre article sur IA & éthique, celui-ci n’est pas plus performant que l’avis de personnes aléatoires.

Néanmoins, il semble que nous ayons plus à gagner qu’à perdre en utilisant ces technologies, qui nous permettent de mieux anticiper certains phénomènes face auxquels la réaction n’est pas la meilleure des postures. Nous pourrions penser à la tension énergétique actuelle par exemple ou bien à la médecine préventive, puisque comme on le dit si bien « mieux vaut prévenir que guérir”.

Mathieu Poissard
No Comments

Post a Comment

Neovision © 2024