Il y a un peu plus d'un an, vous avez lancé le projet Innosuisse ChaLL en collaboration avec l'Université de Zurich et la Haute école des sciences appliquées de Zurich (ZHAW). De quoi s'agit-il?
Le projet ChaLL consiste en un chatbot qui permet aux enfants en âge de scolarité primaire de s'entraîner à parler dans une langue étrangère. Nous testons cela avec l'anglais. Actuellement, de nombreux outils sont disponibles sur le marché, mais tous ne sont pas optimisés pour les jeunes élèves qui ont grandi avec le suisse allemand comme langue maternelle. De plus, les offres existantes ne correspondent pas à l'état actuel de la recherche didactique sur l'apprentissage des langues étrangères au degré primaire.
Pour ce projet, nous nous sommes donc associés à des collègues issus des domaines de l'informatique et de la linguistique informatique et avons déposé une demande auprès d'Innosuisse. Notre objectif est de montrer que nos réflexions didactiques et pédagogiques peuvent être mises en œuvre dans un chatbot interactif.
Quel a été le processus?
En collaboration avec les équipes de l'Université de Zurich et de la ZHAW, nous avons collecté en Suisse plus de 100 heures de matériel audio dans lequel des enfants en âge de scolarité primaire parlent anglais. Nous avons transcrit les données, les avons anonymisées et annotées.
« En collaboration avec les équipes de l'Université de Zurich et de la ZHAW, nous avons collecté en Suisse plus de 100 heures de matériel audio dans lequel des enfants en âge de scolarité primaire parlent anglais. »
Nous apprenons maintenant aux ordinateurs à comprendre les enfants. Car à cet âge, la langue étrangère est souvent fragmentaire. Les enfants mélangent l'anglais avec l'allemand, le suisse allemand et peut-être d'autres langues encore. L'expression orale est généralement incorrecte sur le plan grammatical. Les enfants ont des difficultés de prononciation. Nous testons donc différentes approches de détection des erreurs ou de feedback automatisé et les intégrons dans le système. Nous développons en outre des scénarios d'apprentissage didactiques et bien pensés que nous intégrons dans le chatbot. L'apprentissage avec cet outil doit être amusant tout en améliorant considérablement les compétences en anglais des enfants.
La collecte des données s'est-elle déroulée comme prévu?
Lorsque nous avons dit à d'autres personnes que nous voulions collecter plus de cent heures de matériel audio sans pouvoir simplement récupérer les données n'importe où, elles ne nous en ont pas crues capables. En effet, la collecte à grande échelle de données audio utilisables auprès d'élèves de l'école primaire est très complexe. Nous avons d'abord dû convaincre les autorités cantonales et communales. Ensuite, il était important de trouver des directions d'école intéressées par le projet. Les enseignantes et enseignants devaient également être prêts à nous soutenir. Il était également important que les parents acceptent que nous enregistrions leurs enfants lorsqu'ils parlaient anglais et que nous utilisions les données pour le projet. Et les enfants devaient bien sûr aussi avoir envie de participer. Or, à ce moment-là, pas une seule minute de matériel audio n'avait été collectée. Nous avons expérimenté différentes configurations afin d'obtenir le plus rapidement possible de grandes quantités de données. Finalement, après une phase assez intensive, nous avons réussi à rassembler le matériel audio.
Selon vous, quelles sont les compétences importantes pour développer un bon modèle d'intelligence artificelle (IA) dans le contexte scolaire?
Le développement de modèles d'IA dans le contexte scolaire requiert bien plus de compétences que l'utilisation de modèles linguistiques et de l'apprentissage automatique pour développer de nouvelles technologies éducatives. Je parle ici en tant que membre d'une haute école pédagogique et je suis peut-être un peu partial. Mais pour l'instant, et cela a toujours été le cas historiquement pour les nouvelles technologies éducatives, il me semble que de très nombreux outils inondent le marché. Ils ne résolvent aucun problème réel, ne tiennent pas leurs promesses et ne s'orientent pas sur l'état de la recherche didactique. Leurs développeuses et développeurs ne connaissent pas vraiment les réalités des salles de classe.
« De mon point de vue, tout développement d'IA dans le contexte scolaire devrait partir de connaissances didactiques et répondre à un véritable besoin pédagogique. »
De mon point de vue, tout développement de l'IA dans le contexte scolaire devrait partir de connaissances didactiques et répondre à un véritable besoin pédagogique. La première question devrait toujours être de savoir si l'outil correspond vraiment à ce que nous souhaitons pour l'avenir de l'éducation. Certes, l'automatisation et les grandes quantités de données offrent de nombreuses nouvelles possibilités. Mais celles-ci doivent aussi être utilisées à bon escient. Si c'est le point de départ, je vois de nombreuses possibilités intéressantes pour l'utilisation de ce que l'on appelle l'intelligence artificielle dans le contexte scolaire.
A quoi faut-il faire particulièrement attention dans le contexte scolaire?
La protection des données doit être garantie. Des compétences juridiques, administratives et techniques sont nécessaires à cet égard. Mais il doit également être possible de mettre les données à la disposition d'autres personnes qui souhaitent améliorer l'apprentissage scolaire. Aujourd'hui, de grandes entreprises qui ne connaissent pas le plan d'études «Lehrplan 21» et qui n'ont pas à cœur l'éducation publique en Suisse, siphonnent d'énormes quantités de données dans les salles de classe ou lors des devoirs. Parallèlement, il est très difficile pour des équipes de projet comme la nôtre, mais aussi pour des petites et moyennes entreprises avant leur entrée sur le marché, d'obtenir des données de qualité suffisante et appropriées pour entraîner leurs modèles et optimiser leurs outils dans des contextes scolaires. Des compétences en matière de gouvernance de l'éducation, de relations avec les autorités et les autres parties prenantes sont alors nécessaires.
« Pour des équipes de projet comme la nôtre, mais aussi pour les petites et moyennes entreprises avant leur entrée sur le marché, il est très difficile d'obtenir des données de qualité suffisante et appropriées. »
Au sein des projets, ceux qui apportent une expertise pédagogique et didactique doivent alors collaborer avec des personnes très compétentes dans le domaine des sciences techniques. Aucun enfant ne veut apprendre avec des outils numériques qui ne fonctionnent pas bien, qu'ils n'apprécient pas et ne sont pas compréhensibles. De plus, le corps enseignant et les parents devraient pouvoir avoir confiance dans le fait que les routines mises en œuvre sont utilisées pour le bien des élèves. Dans notre projet, la coordination étroite avec les collègues de l'informatique et de la linguistique informatique est essentielle. Chaque réflexion didactique, chaque expérience pédagogique doit être prise en compte aussi bien dans la salle des machines qu'à la surface des environnements d'apprentissage numériques.
Que deviennent les données collectées à la fin du projet?
Les données linguistiques et les transcriptions annotées peuvent être utilisées pour des projets ultérieurs. Elles ne peuvent toutefois pas être vendues ou publiées. Lors de la collecte des données, nous avons veillé à ce que les contenus soient inoffensifs. Néanmoins, il s'agit de données sensibles concernant des mineurs – et encore en âge de fréquenter l'école primaire. Nous empruntons ici une voie de compromis qui permet la poursuite de l'utilisation des données tout en garantissant la protection des enfants.
Malgré tout, l'ensemble est quelque peu insatisfaisant. La collecte des données a demandé beaucoup d'efforts. À l'avenir, il serait souhaitable que de tels projets nécessitent moins de clarifications préalables et qu'il existe des solutions acceptables. Ainsi, des PME suisses et des équipes universitaires comme la nôtre pourraient développer, en collaboration avec les écoles, des produits qui correspondent au plan d'études et à l'état de la recherche et qui font plaisir aux enfants. Sinon, nous continuerons à trouver dans les écoles publiques ce que d'autres nous proposent. Sans que nous ayons notre mot à dire.
Interlocuteur
Le prochain colloque d'Educa du 18 septembre 2024 portera sur les coulisses des systèmes d'intelligence artificielle. Outre les apports d'expertes et experts, l'influence des données sur les systèmes d'IA sera vécue en petits groupes et de manière pratique. Le projet ChaLL de la HEP Zurich sera également représenté dans un atelier.