Les IA génératives sur les bancs de l’école

Formation
romain-bovyn.jpg
Romain Bovyn
Président
Depuis la rentrée 2023, Erwan et Romain ont repris le chemin de l’université… mais de l’autre côté du pupitre ! Au total, 4 promotions Masters à l’IGR-IAE de Rennes — comptabilité, marketing, contrôle de gestion et ressources humaines — ont pu explorer les opportunités des intelligences artificielles dans leur métier, et les tester pour de vrai.

Pour ces 4 promos, la mise en jambe a été sensiblement la même : échanger sur leur perception de l’intelligence artificielle, leurs usages actuels et les impacts envisagés sur leur vie professionnelle imminente. En définitive, on pourrait synthétiser les différents retours des étudiants par cette image :

Une bonne entrée en matière pour tordre le cou aux idées reçues, prendre du recul et toucher du doigt ce que pourrait être le marché du travail demain. Au-delà de la théorie, la centaine d’étudiants qui ont participé à nos cours ont pu mettre les mains dans le cambouis, et comprendre comment se servir de ces outils fabuleux que sont les IA génératives.

Déléguer (vraiment) des tâches aux IA génératives

C’est LA clé, que nous avons expérimentée ensemble sous toutes ses coutures lors d’ateliers dédiés aux IA génératives, notamment via Midjourney pour les images et le fameux ChatGPT pour les textes.

La clé donc, c’est de déléguer. C’est-à-dire de faire faire à la machine, et de prendre le temps de la briefer comme on le ferait avec un humain. Or, les usages actuels sont essentiellement utilitaires, un peu comme lorsque nous écrivons une requête sur un moteur de recherche : on entre une succession de mots qu’on rectifie jusqu’à s’approcher du résultat escompté. Erreur ! Car tout l’enjeu est de bien définir la consigne pour que la machine comprenne ce qui est attendu d’elle, et livre des textes ou des images pertinent(e)s.

La preuve par l’exemple : du prompt au résultat

Pendant ces ateliers, les étudiants ont testé et/ou réalisé des générateurs d’offres d’emplois et d’annonces de recrutement, des simulateurs d’entretiens individuels, des chatbots pour réviser leurs cours, pour acheter un produit sur le bon site e-commerce, trouver des films, générer des posts sur les réseaux sociaux, etc.

L’une de ces expérimentations a mené à la création d’un générateur de QCM à destination des élèves et des étudiants. Le prompt (soit la consigne travaillée en amont) est le suivant :

# RÔLE

Tu es un expert en pédagogie, et tu dois aider un enseignant à générer un QCM de 10 questions à destination d'étudiants d'un niveau scolaire indiqué par le contenu de la balise XML suivante : <niveauScolaire>{{niveauScolaire}}</niveauScolaire>

# SUJET

Le sujet du QCM est contenu dans la balise XML suivante :

<sujet>{{sujet}}</sujet>

 # MÉTHODE

Pour créer le QCM tu dois procéder étape par étape :

1- Tu dois générer une liste de 10 questions. Elles doivent traiter la thématique en mêlant des questions générales, d'autres plus précises, sans tomber dans l'anecdote.

2- Tu génères ensuite 4 réponses notées "A,B,C et D" pour chaque question. Dans la liste, tu dois générer au moins une question avec plusieurs bonnes réponses parmi les choix A,B,C et D.

Outre la ou les bonnes réponses, tu génères les mauvaises réponses afin qu'elles semblent vraisemblables.

Tu feras varier la bonne réponse parmi les choix des questions.

Tu gardes le secret sur la bonne réponse lors de la génération d’une question.

3- Tu génères la liste des réponses seulement à la fin des questions.

Cette consigne est donc :

  • Précise ;
  • Étoffée ;
  • Répétitive, pour bien border les réponses ;
  • Directive (ce que l’IA peut faire ou ne pas faire) ;
  • Structurée, pour indiquer à l’IA quel est son rôle et les étapes à respecter.

En réponse à une question du type « le sujet de l’examen est la reproduction des mammifère pour des élèves d’école primaire », l’IA propose 10 questions à choix multiple, dont en voici un extrait :

Qu'est-ce qu'un mammifère ?

A. Un animal qui pond des œufs.
B. Un animal qui vit uniquement dans l'eau.
C. Un animal qui allaite ses petits.
D. Un animal qui a des plumes.

Pourquoi est-il important que les bébés mammifères boivent du lait maternel ?
(Plusieurs réponses possibles)

A) Pour obtenir des vitamines et des minéraux nécessaires pour grandir
B) Pour apprendre plus vite
C) Pour être protégé contre certaines maladies
D) Pour rester propre et bien soigné

Que font beaucoup de mammifères pour leurs petits avant qu'ils ne deviennent indépendants?

A) Ils leur apprennent à trouver de la nourriture
B) Ils leur chantent des chansons
C) Ils les emmènent en voyage autour du monde
D) Ils leur apprennent à voler

Pour arriver à ce résultat, chaque prompt préparé, dont celui-ci, a été challengé par deux équipes d’étudiants (une red team, une blue team) qui avaient pour mission de s’affronter pour faire sortir l’IA du cadre prédéfini pour la blue team, et trouver des parades pour la red team — ce qu’on appelle des injections de prompt dans notre jargon métier. L’objectif : identifier les trous dans la raquette de la consigne, et l’enrichir.

En toile de fond, nous avons travaillé sur des jeux de données internes (ici sur la destination Brocéliande) pour que l’IA aille chercher la matière dans des contenus spécifiquement structurés pour le chatbot. Un premier aperçu de l’indispensable phase amont de préparation des données.

En bref ?

Sensibiliser, acculturer, transmettre : c’est notre dada. Des ateliers à l’Eclozr aux formations que nous animons, des cadres dirigeants aux étudiants qui seront demain dans ces entreprises, nous avons à cœur d’éclairer sur ces technologies pour que chacun puisse discerner leurs usages, actuels ou à venir. Et s’en saisir !

DATAtourisme x DGE
Web sémantique
Tourisme
DATAtourisme est l’une de nos plus belles références. Car ce projet initié par la Direction Générale des Entreprises (DGE) était ambitieux, et nécessitait des compétences techniques spécifiques que nous avions déployées en interne, dès les prémisses de Conjecto. La plateforme à concevoir devait à la fois homogénéiser un volume important de données très hétérogènes, tout en répondant à des besoins d'utilisateurs variés — diffuseurs et producteurs de données notamment. Par ailleurs, les exigences techniques étaient fortes, tant du côté des performances, que de l’ergonomie et de la sécurité. Un défi technique que nous avons aimé relever, alors que Conjecto soufflait tout juste sa quatrième bougie, en 2016. DATAtourisme est aussi une collaboration qui s’est inscrite dans la durée, au fil des évolutions techniques de la plateforme, et des échanges avec nos clients — des interlocuteurs dont vous pourrez lire les témoignages ici même.
CRAFT x BDI
Web sémantique
En tant qu’agence de développement économique en Bretagne, BDI — Bretagne Développement Innovation — œuvre à promouvoir le dynamisme des acteurs de tous horizons en région, et à favoriser les synergies. C’est dans cet objectif que Craft a été conçu : une plateforme de mutualisation des données de toutes ces parties prenantes en Bretagne, qu’elles soient issues de la recherche, de l’industrie, du public ou du privé. Craft en est à sa cinquième version, entièrement repensée dans son architecture, dans les technologies déployées et dans ses fonctionnalités. Aujourd’hui, Craft est un outil innovant d’information, de visualisation et de production de connaissances. Retour sur ce projet de refonte, pour lequel nous avons été missionnés en 2020.
Prévost Laboratory Concept
Web sémantique
Dataviz
Scrapping
Prévost Laboratory Concept est un laboratoire breton spécialisé dans la fabrication à façon de produits cosmétiques, de compléments alimentaires liquides et de soins pour animaux. Ses atouts : sa capacité à répondre aux besoins particuliers de ces secteurs d’activités, quels que soient le type de conditionnement et la taille des lots. Une souplesse qui nécessite un suivi pointilleux des process de bout en bout, tant pour la gestion que pour la traçabilité des produits. 25 ans après sa création, l’entreprise grandit et doit optimiser ses outils de travail — notamment dans la gestion de la production. C’est dans ce contexte que nous avons rencontré Prévost Laboratory Concept, pour concevoir une solution sur-mesure et évolutive, baptisée JECTO.
Simatlantic x OFB
Joindre l’utile à l’agréable, la pédagogie à la technique : c’est en somme le challenge que nous avons relevé pour l’OFB, qui dispose aujourd’hui d’un outil de cartographies interactives, à la fois intuitif et accessible à tous.
CNODD x DREAL
La plateforme du CNODD est un projet innovant, aux carrefours de la mise en réseau, des technologies de d’acquisition de l’information (scrapping/crawling) et de classification. Site internet : https://www.cnodd.fr/
PACAuto x DREAL
Conception d’un outil qui génère des documents de Porter À Connaissance (PAC) de manière entièrement automatisée. La plateforme permet de configurer, au sein d’une trame paramétrable, la mise en forme de données issues de sources externes variées. Cette trame permet de proposer des documents ScoT, PLU, PLUi, etc... générés automatiquement à la demande.
Sygefor
Sygefor est un logiciel de gestion de formations pour les organisations publiques. Financé par le Ministère de l’Enseignement, ce projet a été réalisé pour l’ARU (le réseau des Unités Régionales de Formation à l’Information Scientifique et Technique). Il a été déployé par de nombreux établissements publics depuis (CNRS, Université de Bordeaux…).
Savéol
Derrière cette marque bretonne, connue dans tout l’hexagone, se cache une complexité de gestion et d’exploitation des données pour gagner en performance. Un challenge que nous avons aimé relever avec Savéol, pour leur offrir une solution sur mesure et un accompagnement sans couture.
Copyright © 2024 Conjecto