Retour sur 2024 – L’Intelligence Artificielle vue par Neovision

Rétrospective 2024 – Une année riche en IA !

L’année 2024 a été marquée de nombreuses évolutions dans le domaine de l’IA : entre la progression des modèles, l’introduction de nouvelles réglementations et les avancées sectorielles, elle a laissé une empreinte qui nous suivra en 2025.

 

Pour saisir les tendances clés de cette année, nous avons interrogé les experts IA de Neovision. Les développeurs, commerciaux et ingénieurs R&D prennent la parole !

Révolution discrète, l’IA s’affine et se partage

L’IA allégée prend du poids

Face à la complexité et aux coûts des Large Language Models (LLM), les Small Language Models (SLM), des petits LLMs, ont gagné en popularité. Ces modèles ont fleuri partout, y compris chez Meta, Google, OpenAI et Microsoft, et sont désormais de plus en plus prometteurs avec des capacités multimodales étendues. Leur personnalisation accrue, améliorations constantes et leurs besoins en ressources réduits les rendent accessibles à des entreprises de toutes tailles. 

 Gaël et Louis

Open bar de l’IA ?

Les modèles multimodaux, comme les VLM (Vision Language Models) et les LMM (Large Multimodal Models), continuent de progresser, avec une disponibilité en open source qui s’améliore de plus en plus, ouvrant la voie à une adoption plus large.

 

Les modèles Open Source progressent et rattrapent les modèles propriétaires en termes de performance, du moins sur certaines tâches spécifiques. Au départ, seuls les modèles propriétaires étaient utilisés pour l’IA générative, mais avec l’essor des modèles open source, il est désormais possible d’accéder aux poids du modèle, permettant ainsi de maîtriser toute la pipeline d’inférence (confidentialité des données). Il existe même un modèle français open source, un LLM nommé Mistral, qui donne accès non seulement aux poids du modèle, mais aussi aux données d’entraînement, offrant ainsi une plus grande transparence.

Loïc et Louis

Réfléchir avant d’interagir

L’IA se creuse les neurones

La méthode de réduction des hallucinations par « réflexion » pour les LLMs devient l’état de l’art actuel. Plusieurs modèles de LLMs récents démontrent des améliorations de performance à l’aide d’un mécanisme de réflexion, dont ChatGPT-o1 et DeepSeek-R1. C’est une méthode de plus en plus populaire qui permet au LLM de prendre du temps pour établir un raisonnement avant de répondre à la question posée par l’utilisateur.

Des agents en action

Les agents sont à la tendance. Ce sont des systèmes d’IA qui étendent les compétences d’un LLM en lui permettant d’interagir avec divers outils. Le LLM peut décider de faire appel à un ou plusieurs de ces outils pour mener à bien sa tâche : naviguer le web, poster un document en base de données, récupérer du contenu sur un Drive interne, etc. Ces systèmes d’IA permettent des interactions complexes et des compétences plus élevées qu’un LLM simple. Les systèmes agentiques sont de plus en plus déployés, par exemple AgentForce de SaleForces.

 

 

Louis

Régulation mondiale : quand la loi rencontre l’IA

2024 marque un tournant dans la régulation et la législation de l’IA. Les gouvernements et les entreprises s’engagent à encadrer l’IA de manière plus responsable, avec des régulations qui se mettent en place dans le monde entier, y compris en Chine. L’objectif est d’assurer une utilisation éthique, transparente et responsable de l’IA, ce qui permet de réduire les biais et discriminations tout en garantissant la protection de la vie privée. 

 

 

Un exemple significatif de cette évolution est l’AI Act de l’Union Européenne (mis en place en février 2025), qui vise à établir des règles strictes pour encadrer les applications de l’IA en Europe et assurer leur conformité aux principes éthiques et sécuritaires.

 

 

Stacie

Au carrefour des créations, une redéfinition des formats

Les assistants vocaux

GPT-4o voice et Gemini Live sont deux assistants vocaux respectivement lancés en mai et août 2024. Ils permettent aux utilisateurs d’interagir avec le modèle via des conversations vocales naturelles, sans passer par l’écriture d’une requête textuelle qui était jusqu’à lors nécessaire. Ce sont une véritable révolution dans le monde de l’assistance vocale, marquant un immense progrès par rapport aux systèmes précédents (comme Siri). Ces modèles comprennent l’oral aussi bien que l’écrit et leur temps de réponse est équivalent à celui d’un humain, permettant une véritable conversation.

 

Loris

La création vidéo

2024 est aussi l’année des IA de génération vidéo. OpenAI a annoncé son modèle SORA en février, pour le rendre publique en décembre. En parallèle, Google a présenté en septembre son modèle Veo puis annoncé en décembre Veo 2. SORA et Veo sont tous deux capables de générer des courts clips vidéos d’un réalisme époustouflant, surclassant de très loin tous les autres modèles d’avant 2024. Veo 2 pousse encore plus loin les performances, offrant une meilleure résolution (1080p pour SORA et Veo, contre 4K pour Veo 2).

 

Loris

La prise de notes

NotebookLM connaît un développement et une adoption croissante en tant qu’outil IA dédié à l’organisation et à l’exploitation des documents. Ce qui le rend particulièrement impressionnant, c’est sa capacité à synthétiser des documents sous différentes formes, y compris sous forme de podcast.

 

Cette fonctionnalité représente une avancée significative dans la manière dont nous consommons l’information. L’IA est désormais capable de reproduire nos formats favoris et s’adapte ainsi aux différents modes de consommation se l’information (lecture, audio, image, interviews), rendant ainsi l’information plus accessible et attrayante peu importe la génération. 

 

Par exemple : comment s’approprier l’AI Act ? Pour mieux comprendre un texte complexe comme l’AI Act qui peut être difficile à lire et à comprendre, il suffit de télécharger le document sur NotebookLM et d’écouter le podcast de 15 minutes qui présente le contenu sous forme de conversation, c’est bien plus interactif et attractif !

 

Lucas C

Des avancées sectorielles

L’IA dans l’œil du climat

Tout le monde parle d’IA générative en 2024, mais une avancée notable de Google DeepMind mérite d’être mise en avant : leur modèle GenCast pour la prédiction météorologique. Jusqu’à présent, les modèles “classiques” de météo n’avaient pas été surpassés par des modèles d’IA. Cependant, GenCast marque une avancée significative, offrant une météo plus précise et un meilleur dispositif d’alerte pour les événements climatiques rares, comme les vents violents ou les vagues de chaleur extrême. Ce modèle est également open-source, Google ayant partagé les paramètres et le code du modèle, ce qui permet à d’autres de l’adopter et de l’améliorer.

Alexandre Z

Révéler les mystères du vivant

Demis Hassabis et John Jumper de Google DeepMind ont reçu le prix Nobel de chimie pour le développement d’AlphaFold (1, 2 et 3), une IA révolutionnaire capable de prédire la structure tridimensionnelle des protéines à partir de leur séquence d’acides aminés. En plus d’être meilleurs que les précédents (1 et 2), AlphaFold 3 ne se limite plus aux protéines et permet de modéliser les interactions avec l’ADN, l’ARN et les petites molécules. Ce modèle est une application impressionnante de l’apprentissage par renforcement, qui était jusqu’alors principalement utilisé dans des domaines comme les jeux (Go, échecs, etc.). La détermination expérimentale des structures protéiques peut prendre des mois, voire des années, mais AlphaFold 3 accomplit cette tâche en quelques secondes. Connaître le repliement des protéines permet de comprendre leur fonction biologique, concevoir des médicaments ciblés et diagnostiquer des maladies liées à des anomalies structurelles. AlphaFold a permis de prédire la structure de toutes les 200 millions de protéines actuellement connues, ainsi que la création de nouvelles protéines.

 

Au-delà d’AlphaFold, DeepMind est allé un pas plus loin dans les avancées médicales de l’IA en dévoilant AlphaProteo. AlphaProteo s’est appuyé sur des données issues de la banque de données sur les protéines (Protein Data Bank) et sur des structures prédites par AlphaFold pour apprendre les différentes manières dont les protéines interagissent entre elles. Lorsqu’on lui fournit la structure d’une molécule cible et des sites de liaison préférentiels, le système génère une protéine candidate conçue pour se lier à ces emplacements spécifiques. Ce nouveau modèle facilite la conception de nouvelles protéines, ouvrant la voie à de nombreuses avancées dans le domaine de la santé.

Loris

Un nouveau maître du jeu ?

DeepMind Genie est un modèle d’IA conçu par DeepMind pour générer des jeux vidéo. Genie 1, sortie en février 2024, permet de créer des jeux en 2D à partir de textes ou d’images. Genie 2, sortie en décembre, peut, à partir d’une simple image, générer des mondes en 3D cohérents offrant de l’interaction avec des objets, de l’animation de personnages complexes et de la modélisation physique réaliste. Genie 2 a des applications dans le monde du jeu vidéo, mais également en simulation, notamment pour entraîner les systèmes d’IA agentiques appelés à évoluer dans le monde réel.

Loris

2024 a été une année riche pour l’intelligence artificielle, posant les bases d’une transformation qui marquera 2025, une année pleine de promesses. 

Nos équipes disposent de nouveaux jouets, outils et technologies avancées avec lesquelles elles peuvent s’amuser, innover et affiner toujours plus notre accompagnement. 

L’IA ne se résume plus seulement à un champ d’innovation, mais se transforme en un véritable écosystème où elle pourrait devenir le moteur de notre évolution collective.

Florine Suk
No Comments

Post a Comment

Neovision © 2025