Guide de préparation d’un plan de gestion des données

Le CRSH, le Conseil de recherches en sciences naturelles et en génie (CRSNG) et les Instituts de recherche en santé du Canada (IRSC) ont lancé, en 2021, la Politique des trois organismes sur la gestion des données de recherche. Cette politique a été conçue pour appuyer l’excellence en gestion de données dans le milieu canadien de la recherche. Comme cela est précisé dans la politique, un plan de gestion de données devra désormais être joint à la demande pour certaines occasions de financement. La page sur la gestion des données de recherche de science.gc.ca décrit les occasions de financement du CRSH, du CRSNG et des IRSC qui exigent un tel plan.

Le CRSH est prêt à recevoir, à l’adresse researchdata-donneesderecherche@sshrc-crsh.gc.ca, toute suggestion pour améliorer le présent guide.

Gestion des données de recherche

La gestion des données de recherche favorise une conduite efficace et responsable de la recherche, notamment par la collecte, la documentation, le stockage, le partage et la préservation des données de recherche au cours du cycle de vie d’un projet et au-delà.

Les données de recherche peuvent servir de :

  • sources principales pour appuyer des études et des enquêtes techniques et scientifiques, des travaux d’érudition ou des activités artistiques;
  • données probantes dans le processus de recherche;
  • preuves généralement considérées par la communauté de recherche comme nécessaires pour valider les conclusions et les résultats de recherche.

Tout contenu, numérique ou non, peut servir de données de recherche.

Les données de recherche peuvent être expérimentales, observationnelles, opérationnelles, issues de tiers ou du secteur public, de surveillance, traitées ou transformées.

Principes de la gestion de données

Les titulaires de subvention ne sont pas tenus de diffuser les données de recherche de leurs projets. Le CRSH adhère toutefois au principe selon lequel les données recueillies grâce aux fonds publics doivent être gérées de manière responsable et sûre, et doivent pouvoir être réutilisées par d’autres dans le respect des obligations éthiques, juridiques et commerciales. Les données doivent, dans la mesure du possible, être gérées selon les principes FAIR (de l’anglais findable, accessible, interoperable and reusable qui signifient repérables, accessibles, interopérables et réutilisables). Ces principes fournissent des lignes directrices visant à améliorer la repérabilité, l’accessibilité, l’interopérabilité et la réutilisation des actifs numériques.

  • Repérabilité : les données et les documents supplémentaires sont décrits avec des métadonnées suffisamment riches, et on leur attribue un identifiant unique et durable.
  • Accessibilité : les métadonnées et les données sont compréhensibles aussi bien par les êtres humains que par les machines. Les données sont déposées dans un dépôt de confiance.
  • Interopérabilité : les métadonnées présentent un langage soutenu, accessible, partagé et largement applicable pour représenter les connaissances.
  • Réutilisation : les données et les collections sont assorties de licences d’utilisation claires et fournissent des renseignements exacts sur leur provenance.

Lorsqu’elles et ils mènent des recherches en collaboration avec des populations spécifiques, les chercheuses et chercheurs devraient consulter les personnes et les groupes concernés pour élaborer conjointement des principes de gestion des données et être particulièrement attentifs aux données sensibles et (ou) à haut risque, en adhérant au principe comme quoi il ne faut pas nuire à autrui. Les chercheuses et chercheurs qui travaillent avec des données sensibles et (ou) à haut risque doivent en outre procéder à des évaluations des risques liés aux processus de collecte et de gestion des données afin de garantir la confidentialité et la sécurité des données, y compris après la période de subvention.

Les données provenant de recherches effectuées « par et avec » les communautés des Premières Nations, des Inuit ou des Métis doivent être gérées conformément aux principes de gestion de données élaborés et approuvés par celles-ci. Il s’agit de tenir compte, entre autres, de la souveraineté des données autochtones ainsi que des questions de collecte, de propriété, de protection, d’utilisation et de partage de données.

Les principes de propriété, de contrôle, d’accès et de possession des Premières Nations (PCAP®) et les principes CARE pour la gouvernance des données autochtones (acronyme signifiant Collective Benefit, Authority for Control, Responsibility and Ethics en anglais) peuvent être consultés, au besoin. Ces deux ensembles de principes sur la gouvernance des données des Premières Nations peuvent être utiles, mais ne correspondent pas nécessairement aux besoins et aux valeurs de chaque communauté, collectif et organisme des Premières Nations, des Inuit et des Métis. Le CRSH reconnaît l’importance d’adopter une approche tenant compte de leurs particularités pour faire en sorte que les droits, les intérêts et les situations propres aux Premières Nations, aux Inuit et aux Métis soient reconnus, affirmés et appliqués.

Plans de gestion des données

Les plans de gestion des données sont des documents évolutifs qui décrivent comment seront gérées les données de recherche dans le cadre d’un projet. Leur contenu, leur forme et leur ampleur varient en fonction de la nature du projet de recherche. Ces plans peuvent être élaborés dans le but de guider un seul projet de recherche ou s’appliquer à une initiative ou à un programme de recherche multi-projets à plus long terme. Le plan de gestion des données soumis au stade de la demande pourrait, en fonction de la complexité et de la durée du projet, être présenté sous la forme d’une esquisse de haut niveau, puis être développé tout au long de la durée du projet.

Dans un contexte de recherche menée « par et avec » les communautés, les collectifs et les organismes des Premières Nations, des Inuit et des Métis, les plans de gestion des données doivent tenir compte du principe de la souveraineté des données autochtones et offrir des options pour revoir la manière dont les données sont gérées.

Au cours de toutes les étapes d’un projet de recherche (conception, planification, exécution, clôture), les plans de gestion des données peuvent être développés ou approfondis à différentes fins ou encore être modifiés pour refléter certains changements.

Avantages des plans de gestion des données

La gestion des données de recherche est de plus en plus reconnue comme une part essentielle de l’excellence en recherche et plusieurs organismes subventionnaires à travers le monde ont mis en place des exigences en la matière, dont des plans de gestion des données. La préparation de tels plans contribuera à l’excellence canadienne dans le milieu de la recherche et permettra aux chercheuses et chercheurs de mieux se positionner pour prendre part à des collaborations et des partenariats internationaux puisqu’ils offrent les avantages suivants :

  • ils poussent les chercheuses et chercheurs à tenir compte de certains aspects de la gestion de données auxquels elles et ils n’auraient pas forcément réfléchi à l’avance autrement;
  • ils peuvent aider à se préparer en vue du processus d’approbation des aspects éthiques;
  • ils aident à diminuer la charge de travail et les problèmes liés aux données au cours d’un projet de recherche;
  • ils permettent d’améliorer les plans et les méthodologies de recherche.

Forme et contenu des plans de gestion des données

Tout au long de l’élaboration de leur plan, les chercheuses et chercheurs sont invités à se familiariser avec les ressources disponibles au sein de leur établissement et à collaborer avec les personnes représentant leur établissement (p. ex. les spécialistes de la gestion de données ainsi que le personnel du bureau de la recherche et des comités d’éthique de la recherche). Plusieurs modèles, outils et ressources de divers formats et ampleurs sont également disponibles en ligne pour aider à la préparation des plans, dont certains propres à une discipline ou un domaine. Par exemple, les candidates et candidats peuvent utiliser l’Assistant PGD, un outil national bilingue de gestion des données en ligne supporté par l’Alliance de recherche numérique du Canada. L’Assistant PGD offre des conseils et des exemples pour la préparation d’un plan et permet de partager, de réviser et d’exporter ce dernier.

Pour expliquer comment seront gérées les données de recherche d’un projet, les candidates et candidats peuvent, le cas échéant, utiliser les sections suivantes (toutes ces sections ne s’appliquent pas à tous les projets de recherche) :

  1. Collecte de données
    • Les données qui seront recueillies, créées, liées ou acquises
    • La manière dont les données seront recueillies
    • La manière dont les ensembles de données existants seront utilisés et les nouvelles données qui seront créées au cours du projet de recherche
      • Astuce : Abordez les questions relatives à la collecte des données telles que les types de données, les formats de fichiers, les conventions de dénomination et l’organisation des données – des facteurs qui amélioreront la facilité d’utilisation des données et contribueront à la réussite du projet.
  2. Documentation et métadonnées
    • La manière dont les données seront documentées et formatées
      • Astuce : Les données étant rarement explicites, toutes les données de recherche doivent être accompagnées de métadonnées (informations décrivant les données conformément aux meilleures pratiques de la communauté).
      • Astuce : Mettre en œuvre des mesures pour garantir l’accessibilité des données. Dans le plan de gestion des données, clarifier les formats dans lesquels les données seront conservées afin de s’assurer qu’ils soient compatibles avec l’infrastructure de la communauté (y compris l’accès à Internet et à d’autres technologies) et les mesures de soutien à l’accessibilité. Par exemple, les documents doivent être conservés dans des formats permettant l’utilisation de logiciels de synthèse vocale (c.-à-d. pas sous forme d’images) afin de faciliter l’accès des utilisatrices et utilisateurs ayant des troubles de la vue.
  3. Stockage et sauvegarde
    • La manière dont les données seront stockées au cours du projet de recherche
      • Astuce : Prévoir la manière dont les données de recherche seront stockées et sauvegardées tout au long de la durée du projet de recherche et au-delà. Un stockage et une sauvegarde appropriés permettent non seulement de protéger les données de recherche contre les pertes catastrophiques (dues à des défaillances matérielles et logicielles, des virus, des pirates informatiques, des catastrophes naturelles, des erreurs humaines, etc.), mais aussi d’en faciliter l’accès aux chercheuses et chercheurs d’aujourd’hui et de demain.
  4. Préservation
    • L’endroit où seront déposées les données pour leur préservation à long terme (voir l’exigence énoncée à la section 3.3 de la Politique des trois organismes sur la gestion des données de recherche)
      • Astuce : La conservation des données dépend de la valeur potentielle de réutilisation, de l’existence d’obligations de conservation ou de destruction des données et des ressources nécessaires pour conserver correctement les données et s’assurer qu’elles restent utilisables à l’avenir. Dans certaines circonstances, il peut être souhaitable de conserver toutes les versions des données (brutes, traitées, analysées, finales), mais dans d’autres cas, il peut être préférable de ne conserver que des données sélectionnées ou finales (p. ex. des transcriptions au lieu d’entretiens audio).
  5. Transmission et réutilisation des données
    • La manière dont les données seront transmises, le cas échéant, et le potentiel de réutilisation des données
    • Les procédures d’accès aux données qui seront mises en œuvre, le cas échéant
      • Astuce : Tenir compte des types de données qui seront utilisées dans le cadre du projet et du niveau de risque associé pour déterminer si les données sont sensibles et (ou) à haut risque. Pour en savoir plus, consulter la section « Conseils sur les données sensibles » des ressources de formation de l’Alliance de recherche numérique du Canada.
      • Astuce : Fournir une explication claire si les données ne peuvent pas être partagées de manière responsable et éthique; ne pas se contenter d’indiquer qu’elles ne seront pas partagées. Par exemple, certaines exigences des partenaires communautaires peuvent ne pas permettre le partage des données (p. ex. les connaissances autochtones traditionnelles ou sacrées). Expliquer le contexte et présenter le plan.
  6. Responsabilités et ressources
    • Les rôles et les responsabilités de l’équipe de recherche à l’égard des données (qui est responsable des tâches de gestion des données de recherche, du maintien du référentiel de données du projet, du transfert des connaissances, les rôles et les responsabilités des autres membres de l’équipe le cas échéant, etc.)
      • Astuce : Établir des procédures ou des politiques pour la formation continue des personnes participant au projet visé par le plan de gestion des données, y compris les éléments techniques et le maintien du référentiel.
      • Astuce : Un projet de grande envergure implique plusieurs gestionnaires de données. La chercheuse principale ou le chercheur principal doit identifier au début du projet toutes les personnes qui seront chargées des tâches de gestion des données pendant et après le projet.
  7. Obligations éthiques et juridiques
    • Les considérations éthiques, juridiques et commerciales qui s’appliquent aux données (p. ex. la manière dont le projet se conformera aux lois et aux lignes directrices éthiques qui concernent les données)
      • Astuce : Intégrer des consultations avec les communautés concernées tout au long de la durée du projet et tenir compte de la souveraineté des données et de la propriété des communautés, le cas échéant. Élaborer le plan de gestion des données en collaboration avec ces communautés, indiquer si ces dernières ont accepté les stratégies de gestion des données et comment elles seront impliquées dans la gestion des données.
      • Astuce : Tenir compte des éléments suivants pour les projets menés en collaboration avec des communautés éloignées et (ou) internationales :
        • Conformité à la législation sur les données (le plan de gestion des données doit être conforme à la juridiction pertinente la plus stricte)
        • Politiques relatives au franchissement des frontières internationales avec des données sur des appareils
        • Emplacement du serveur
        • Manière dont les chercheuses et chercheurs situés dans des lieux éloignés pourront télécharger des données (p. ex. accès et coût);
        • Accès aux données pour les chercheuses et chercheurs situés dans des lieux éloignés, y compris l’accès et la fiabilité d’Internet, les instruments ou les données stockées sur un serveur.

Ressources

Les établissements constituent un bon point de départ pour obtenir du soutien quant à la gestion des données de recherche et à la préparation de plans de gestion des données. Selon la Politique des trois organismes sur la gestion des données de recherche, les établissements d’enseignement postsecondaire et les hôpitaux de recherche qui sont admissibles à administrer des fonds des organismes subventionnaires sont tenus de mettre sur pied une stratégie institutionnelle de gestion des données de recherche montrant que l’établissement fournira à ses chercheuses et chercheurs un environnement qui favorise et appuie la gestion des données de recherche.

L’Alliance de recherche numérique du Canada est un organisme sans but lucratif financé par le gouvernement fédéral qui a un mandat ambitieux à remplir, à savoir transformer la manière dont les travaux de recherche sont organisés, gérés, stockés et utilisés à l’échelle des disciplines universitaires au Canada. Elle offre une suite d’outils et de services de gestion des données de recherche dans son site Web. Le CRSH tient à souligner les contributions du réseau de spécialistes de l’Alliance dans le développement de ces ressources.

Date de modification :