Les défis liés à l'utilisation multiple proviennent d'une part des données elles-mêmes. Celles-ci sont souvent introuvables pour des utilisatrices et utilisateurs potentiels, car ceux-ci ne savent même pas que ces données existent. Ou les données sont inaccessibles, par exemple parce qu'il s'agit de données d'application privées. De plus, les données provenant de sources externes sont souvent incompatibles avec ses propres systèmes  ou ne peuvent pas être reliées à ses propres données personnelles. Les autres défis proviennent du fait que l'utilisation multiple de données personnelles doit satisfaire aux exigences de la protection des données.

Les mesures possibles pour améliorer l'utilisation multiple doivent donc poser des exigences claires quant à la nature des données. Ces données doivent en outre être accessibles et pouvoir être utilisées. Enfin, des mesures techniques et organisationnelles peuvent contribuer à faciliter l'utilisation multiple.

Mettre en œuvre les principes FAIR

Les principes FAIR  –  acronyme anglais pour données trouvables, accessibles, interopérables et utilisables plusieurs fois  –  s'adressent précisément à ces exigences concernant la nature des données. Il est possible d'améliorer la recherche de données en documentant les flux et les stocks de données dans des registres des activités de traitement publics ou sur des plateformes de métadonnées. Seules les métadonnées sont publiées. Les données personnelles restent chez la ou le propriétaire des données et peuvent maintenant être demandées puisqu'elles peuvent être trouvées. S'il s'agit de données factuelles, elles peuvent également être publiées directement en tant qu' «open data». Le principe interne de l'administration «open by default»  est ainsi respecté.

Pour rendre les données interopérables et accessibles – deux autres exigences des principes FAIR – des mesures de standardisation sont nécessaires à différents niveaux:

  • Niveau organisationnel: les processus commerciaux, de traitement et d'échange de données doivent être uniformisés dans des concepts d'échange de données. Cela permet d'uniformiser les processus commerciaux de différentes actrices et différents acteurs.
  • Niveau sémantique: un vocabulaire commun et des schémas uniformes doivent être créés. Ainsi, la personne réceptrice reçoit la même chose que ce qui a été envoyé par l’expéditrice ou l'expéditeur.
  • Niveau technique: les aspects techniques de l'échange de données (par exemple les spécifications des interfaces et les protocoles de transmission) doivent être standardisés. L'accessibilité aux données est ainsi rendue possible.
  • Niveau juridique: les bases juridiques pour l'utilisation des données (traitement et échange) entre les unités administratives doivent être clarifiées. Cela permet de garantir une base juridique suffisante pour les échanges de données.

Pour que les principes FAIR soient mis en œuvre de manière uniforme au sein des cantons, des dispositions légales analogues à la «loi fédérale sur l’utilisation de moyens électroniques pour l’exécution des tâches des autorités» sont envisageables. Afin que de telles lois cantonales uniformisent également l'échange de données entre les cantons dans l'optique de l'interopérabilité, les prescriptions légales devraient être harmonisées au niveau intercantonal.

Simplifier l'utilisation des données

Au niveau juridique, ce n'est pas seulement l'interopérabilité qui est réglementée, mais aussi – en particulier pour les données personnelles – l'utilisation des données. Dans le contexte de la formation, ce sont généralement les dispositions cantonales issues des législations sur la formation et la protection des données qui sont déterminantes.

Des défis particuliers en matière de protection des données se posent lors de la réutilisation des données  –  une sous-forme de l'utilisation multiple, où le traitement des données personnelles pour une autre finalité que celle d'origine est au premier plan. Des avis de droit ou des projets pilotes dans des programmes «sandbox» devraient permettre de clarifier la marge de manœuvre juridique pour la réutilisation ou les adaptations juridiques nécessaires pour la rendre possible.

L'utilisation multiple de données personnelles peut également être rendue possible par l'anonymisation (voir également l'encadré). Les administrations de l'éducation devraient proposer davantage de méthodes d'utilisation spécifiquement développées à cet effet. Des services tels que la plateforme Lomas de l'OFS permettent de mettre des données individuelles à la disposition de tiers à des fins d'évaluation. Ces tiers n'ont pas besoin d'accéder aux données non anonymisées, mais ils obtiennent les résultats souhaités qui ne permettent pas de tirer des conclusions sur les données individuelles initiales et qui sont donc anonymisés.

Utilisation multiple par traitement non personnel

Les lois sur la protection des données connaissent souvent le «traitement non personnel de données personnelles» à des fins telles que la «recherche», la «planification» et les «statistiques». Cela permet de traiter des données personnelles en ne publiant les résultats que de manière à ce qu'aucune personne ne soit identifiable et en rendant les données personnelles anonymes dès que le but du traitement le permet.

Améliorer l'accès aux données

Une plus grande utilisation multiple des données permet au système éducatif d'acquérir davantage de connaissances pour prendre des décisions basées sur des preuves et pour réaliser des évaluations de programmes. Pour cela, les données existantes dans l'administration ainsi que les données d'application doivent être rendues accessibles à la recherche de manière simple et sur une large base.

En ce qui concerne les données administratives, les administrations disposent toutefois d'une marge d'appréciation pour déterminer si les données doivent être rendues accessibles à la recherche. Cette marge d'appréciation est gérée différemment selon les administrations. Deux mesures sont envisageables pour améliorer l'accès aux données administratives:

  • Exemples de bonnes pratiques: pour l'accès aux données de la recherche en éducation, les questions techniques, organisationnelles et de protection des données qui doivent être résolues dans chaque cas sont consignées dans des exemples de bonnes pratiques. Rendus accessibles de manière coordonnée, ces informations peuvent décharger les administrations sur le plan administratif lors de demandes de données et uniformiser l'accès aux données pour la recherche.
  • Droit d'accès aux données: les données doivent être rendues accessibles par la loi à des fins de recherche. Grâce à ce changement de paradigme, l'accès aux données peut être dissocié de la marge d'appréciation de l'administration. Désormais, l'administration devrait justifier une restriction de l'accès aux données au lieu de décider de l'octroi de l'accès aux données.

Afin de rendre les données d'application accessibles à l'avenir pour des analyses d'impact scientifiquement fondées, des clarifications juridiques sont nécessaires. Il convient d'examiner si une base juridique existe ou doit être créée afin que la communication et le traitement de données d'application par des tiers (par ex. la recherche en éducation) pour des analyses d'impact dans le cadre du mandat de formation soient légitimes. En outre, les données d'application devraient être accessibles sous une forme standardisée et lisible par machine afin de rendre leur utilisation praticable.

Espaces de données sectoriels comme lieu d'utilisation multiple

Enfin, l'utilisation multiple des données est étroitement liée aux efforts de création d'espaces de données sectoriels. En effet, ceux-ci devraient constituer à l'avenir la construction technique et organisationnelle pour l'utilisation multiple de données. L'approche décentralisée des espaces de données a en outre l'avantage de refléter les structures fédérales du système éducatif. Si le système éducatif souhaite promouvoir systématiquement l'utilisation multiple des données, il est important de participer aux développements relatifs aux espaces de données – des «communautés de pratique» à la création d'un espace de données de l'éducation, en passant par les premiers prototypes.

Le futur espace de données de l'éducation n'est pas créé de manière descendante, mais entre autres par la simplification de l'utilisation et de l'accès aux données décrite ci-dessus ainsi que par la mise en œuvre conséquente des principes FAIR. Une mise en œuvre correcte de ces principes a également des effets positifs sur la qualité et la disponibilité des données pour l'utilisation primaire et donc sur les ressources nécessaires au traitement des données (moins d'échanges manuels de données et des coûts d'entretien des données plus faibles). L'utilisation des données dans le système éducatif est ainsi globalement gagnante.

 

Liens complémentaires