Les grands prérequis de l’intelligence artificielle : comment passer le cap ?
Les grands prérequis de l’IA : comment passer le cap ?
L’Intelligence Artificielle peut s’appliquer de bien des façons et répondre à des usages aussi divers que variés. Or, si les applications sont abondantes, toutes ne feront pas sens pour votre activité.
Un diagnostic complet de votre société et de vos processus permet de mettre en lumière certaines problématiques, ou pain points (des situations bloquantes et « douloureuses » pour la société).
Prioriser les projets pour ne garder que le plus impactant
Suite à ce diagnostic, et pour une même société, les problématiques peuvent être diverses : améliorer la qualité de la production, améliorer la connaissance client, optimiser les processus de contrôle qualité, optimiser la logistique, créer un nouveau service annexe… Toutefois, toutes ces situations n’ont pas le même impact.
L’impact, c’est justement ce qu’il faut calculer ou, à défaut, estimer pour chaque projet identifié. Cet impact, c’est ce que nous appelons communément le ROI (Return On Investment ou Retour Sur Investissement en français). Naturellement, nous pensons très rapidement à l’aspect financier, mais le ROI se compose d’une vaste palette de dimensions (n’hésitez pas à lire notre article sur le ROI et ses multiples facettes).
Or pour qu’un projet IA génère un retour sur investissement, la technologie créée doit avant tout être utile. Cette dernière doit trouver une application concrète et répondre à un problème spécifique.
Une fois correctement définis, les projets doivent être hiérarchisés et priorisés, en fonction du ROI qui leur est associé. Ainsi, vous pourrez vous concentrer sur le projet le plus pertinent.
Pour résumer, suite à l’identification de plusieurs projets prometteurs lors du diagnostic de votre société, vous pourrez cibler le bon problème, définir le bon projet IA et ainsi générer le ROI attendu.
Il est important de cibler un projet pour concentrer vos efforts et éviter de vous éparpiller. En concentrant les ressources sur un projet IA, ce dernier aura de grandes chances de déboucher rapidement sur une technologie utile. Et qui dit utile dit ROI.
Encore faut-il choisir le meilleur projet et que ce dernier soit à la fois réaliste et faisable.
Le problème est-il résoluble ?
Vous savez maintenant quel projet prend du sens pour votre société. Toutefois, et même si cela s’avère primordial, il ne s’agit que de la première étape. Vous devez maintenant questionner la faisabilité de ce projet.
Quelle est la qualité de vos données ? L’état de l’art permet-il d’apporter une solution à votre problématique ? Les solutions algorithmiques s’appliquent-elles à votre problématique et à la typologie de vos données ? Tant de questions restent à élucider.
La qualité des données, une question multidimensionnelle
A l’ère du numérique, la quasi-totalité des entreprises génèrent, captent et stockent des données. Néanmoins, il existe de grandes variabilités quant à ces données : leur volume, leur qualité, leur source, leur typologie (image, texte, son, statistiques, etc.)
Les données qui serviront de base à votre IA, vous pouvez les produire ou capter vous même pour créer une base de données interne et unique mais vous pouvez également vous appuyer sur des jeux de données externes. Les données externes peuvent servir de base pour votre projet ou alors compléter votre jeu de données interne.
Une fois que vous avez identifié et capté les données dont vous avez besoin, viennent de nouvelles questions relatives à votre base de données.
La représentativité
La représentativité des données est une dimension essentielle dans le développement d’une intelligence artificielle efficace et performante.
Pour faire simple, un jeu de données représentatif permet de représenter au mieux la réalité terrain et donc les cas de figure que l’IA aura analysé. Les données utilisées pour l’apprentissage devront être similaires aux données que l’IA aura à traiter une fois mise en production.
La représentativité des données est donc un enjeu majeur et un facteur clé de succès essentiel dans le développement d’une IA. Si cet aspect est négligé, en découlerait une perte de performances inéluctable pour la technologie.
L’exhaustivité
Outre la représentativité, les données doivent répondre à une autre obligation : l’exhaustivité.
L’exhaustivité d’un jeu de données signifie que l’ensemble des données permet de représenter tous les cas de figures que l’IA aura analysé. Si l’exhaustivité absolue ressemble à un objectif utopique, une bonne définition du périmètre fonctionnel de la technologie permet de définir une exhaustivité relative.
L’annotation
Enfin, nous en arrivons à la préparation de la base de données. Ces dernières sont disponibles, représentatives et le plus exhaustives possible. Néanmoins, vos données brutes ne sont pas encore exploitables en l’état.
Effectivement, les données utilisées pour la phase d’apprentissage doivent être étiquetées, ou annotées. Mais qu’est ce que cela signifie ? L’annotation permet, en quelque sorte, de décrire et qualifier les données. Par exemple, si vous souhaitez créer une technologie de reconnaissance de chats et de chiens, vous devrez constituer une base de de photos de chats et de chiens. Pour chaque photo, vous devrez indiquer où se trouve l’animal sur la photo – en l’encadrant dans une boîte englobante ou bounding box – et spécifier s’il s’agit d’un chat ou d’un chien. L’annotation est une méta-donnée qui va venir enrichir et qualifier la donnée de base. Les données exploitées par la technologie seront donc des photos avec des étiquettes nominatives « chat » ou « chien » et le jeu de données sera donc réparti en deux classes. Celles que nous voulons identifier avec la technologie.
Cette étape d’annotation est cruciale, puisque si cette dernière n’est pas correctement exécutée, l’apprentissage de l’algorithme sera biaisé puisqu’il fondera son apprentissage sur des informations erronées.
Existe-il une solution algorithmique et s’applique-t-elle à mes données ?
Les données ont été analysées, nettoyées, structurées et annotées, c’est pas mal mais pas encore parfait !
Pourquoi ? Parce que vous n’avez toujours pas répondu à la question de la faisabilité. Pour cela, il est important de pouvoir s’appuyer sur un expert IA à l’état de l’art, ou à défaut de vous lancer vous même dans un état de l’art relatif à la technologie que vous souhaitez créer (et on vous souhaite bon courage…).
Les papiers de recherche fourmillent et portent sur des sujets aussi intéressants que variés. Leur qualité varie également et il sera difficile pour un néophyte de faire la part des choses.
Ensuite, certaines recherches s’appliquent plus ou moins directement à la problématique que vous visez. Prenons un exemple. La détection et la reconnaissance de piétons est aujourd’hui un sujet plutôt maîtrisé et il existe de nombreuses solutions algorithmiques y répondant. Toutefois, ces solutions fonctionnent sur des images visibles – entendez par là des photos couleurs classiques – mais ces dernières ne fonctionneront pas sur des images infrarouges par exemple.
Nous voilà bien embêtés, oui mais non. En s’appuyant sur les bons experts, il est possible d’adapter certains algorithmes pour les rendre performants sur vos données spécifiques. Si nous vous passerons les détails, il s’agit d’un gros travail, demandant de nombreux tests, des validations mais aussi et de rares compétences.
Dimensionner le projet
Maintenant que le projet a été analysé et que la question de sa faisabilité ne se pose plus, il convient de bien le dimensionner. Pour se faire, il faut délimiter la zone d’action de la technologie et définir les ressources nécessaires à son développement.
Définir le périmètre fonctionnel
Définir le périmètre fonctionnel d’une technologie revient à expliciter l’étendue de ses fonctionnalités et de définir le cadre d’utilisation dans lequel l’intelligence artificielle devra se montrer performante.
Par exemple, pour une technologie de reconnaissance de défauts, le périmètre fonctionnel pourrait être composé d’une liste de défauts à reconnaître. Tous les défauts sortant de ce périmètre ne seraient donc pas reconnus.
Plus le périmètre est large plus la problématique sera complexe à traiter et la base de données imposante.
Un planning et un budget pour se projeter et valider l’intérêt
Du périmètre fonctionnel découle deux autres facteurs essentiels : le planning et le budget. Plus le périmètre sera large, plus la conception et le développement de la solution sera coûteux.
En concevant précisément la solution dont vous avez besoin, vous pourrez plus facilement vous projeter et valider l’intérêt de vous lancer dans le développement de la technologie. Le dimensionnement prend en compte deux critères : un planning et un budget.
Concernant le planning et donc le temps nécessaire à allouer au projet, le plus simple est de définir un planning global reprenant les grandes étapes à passer pour atteindre votre objectif. Pour établir ce planning, une estimation fine des différentes tâches et de la charge de travail respective devra être réalisée. Et pour cela, mieux vaut s’appuyer sur un spécialiste émérite pour éviter toute mauvaise surprise.
Enfin, en concevant votre solution, et en vous basant sur les estimations de charge de travail, vous pourrez estimer l’allocation budgétaire nécessaire au développement de la technologie.
Ce dimensionnement fait partie intégrante de l’accompagnement proposé par Neovision. En effet, suite à nos nombreuses expériences, cette étape s’avère capitale pour la suite à donner à votre projet. Un mauvais dimensionnement ouvrant souvent la porte à de mauvaises surprises (sans être à l’abri d’une bonne surprise bien sûr).
Vous l’aurez donc compris, si le diagnostic permet de faire émerger de nombreux projets pertinents, vous devrez en sélectionner un pour mettre toutes les chances de votre côté et ainsi développer une technologie aussi utile que performante.
Cette phase de design permet de concevoir la solution technologique. En concevant la solution, vous vous assurez de la faisabilité technique tout en vous projetant sur les dimensions du projet puisque vous devrez estimer la charge de travail relative à ce projet.
Une fois ces pré-requis validés, vous savez si vous devez vous lancer corps et âme dans ce projet ou non. Et en cas de réponse négative, gardez à l’esprit que cette conclusion n’est pas intemporelle. L’intelligence artificielle progresse à vitesse grand V et la vérité d’aujourd’hui n’est pas toujours celle du lendemain.