L'Open Research Data
Les données de recherche, les principes FAIR, les exigences des bailleurs de fonds et l'Open Data à la HES-SO.
L'Open Research Data vise à rendre les données de recherches financées par des fonds publics accessibles de façon permanente et gratuite. Le but étant leur réutilisation par d'autres afin d'améliorer la qualité et l'intégrité du travail scientifique.
C'est dans ce cadre que des acteurs du monde académique et politique mais aussi des éditeurs ont développé les principes FAIR pour rendre ces données Findable, Accessible, Interoperable and Reusable.
Désormais les grands bailleurs de fonds de la recherche et la HES-SO demandent un engagement dans ce sens à leurs chercheuses et chercheurs. C'est le cas aussi d'un nombre croissant d’éditeurs scientifiques qui adoptent des Data Policies et exigent dorénavant l’accès aux données devant permettre la vérification des résultats de recherches.
Les enjeux autour de l’Open data sont globalement plus complexes que ceux de l'Open Access. C'est une transformation radicale de la manière d’envisager la recherche. Un changement de culture pourrait-on dire. L'Open data soulève de nombreux enjeux scientifiques, éthiques, déontologiques, juridiques, techniques, économiques ou encore sociétaux. Elle nécessite aussi des infrastructures de dépôt des données bien plus lourdes que pour l'Open Access.
Il est important de souligner que la période actuelle est une période de transition, de tâtonnement. Beaucoup est encore à construire.
Données de recherche
Une grande variété de données
Qu'est-ce qu'une donnée de recherche? Cette question apparemment simple peut donner lieu à des réponses fort diverses selon les domaines.
Le rapport d'un chercheur à ses données varie fortement suivant son champ disciplinaire et/ou méthodologique. La nature des données, leur degré de confidentialité ou leur potentiel de réutilisation est très différent selon qu'il s'agisse, par exemple, d'un carnet de terrain ethnographique ou de séries statistiques économiques.
Les données de recherche prennent de multiples formes parmi lesquelles des données expérimentales, des données d’observation, des données opérationnelles, des données de tiers ou encore des données du secteur public, etc. Elles peuvent se présenter sous forme numérique, texte, sonore, image ou vidéo.
Définition large
Une définition large et des plus usitée de ce que sont les données de recherche émane de l'OCDE:
"des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche.
Ce terme ne s’applique pas aux éléments suivants : carnets de laboratoire, analyses préliminaires et projets de documents scientifiques, programmes de travaux futurs, examens par les pairs, communications personnelles avec des collègues et objets matériels (par exemple, les échantillons de laboratoire, les souches bactériennes et les animaux de laboratoire tels que les souris). L’accès à tous ces produits ou résultats de la recherche est régi par d’autres considérations que celles abordées ici."
Tiré de: Principes et lignes directrices pour l’accès aux données de la recherche financée sur fonds publics, 2007, p. 18.
Principes FAIR
Les principes FAIR (Findable, Accessible, Interoperable, Reusable) ont été élaboré par différents groupes d'acteurs. Leur but? Aider les êtres humains et les machines dans leur quête de données scientifiques. C'est là un des principaux défis de l'énorme croissance de données disponibles sur internet.
Car il ne suffit pas qu'elles y soient. Encore faut-il qu'elles soient trouvables, accessibles, interopérables et réutilisables. Ce n'est que dans ces conditions qu'elles pourront servir la communauté scientifique.
Ainsi, 15 indicateurs ont été établit afin d'évaluer le niveau FAIR des différentes infrastructures de dépôts de données. Les derniers développement sont disponibles sur GO-FAIR.
Voir aussi les explications des principes FAIR élaborés par le FNS. Ce document liste les responsabilités respectives des chercheurs et des dépôts de données pour atteindre les objectifs FAIR.
Exigences des bailleurs de fonds
Les exigences du FNS
Pour le FNS, les données de la recherche devraient être libres d'accès pour chacun, tant pour la communauté scientifique que pour le public.
Depuis octobre 2017, il est ainsi obligatoire d’inclure un plan de gestion des données (Data Management Plan ou DMP). Ce plan est désormais demandé par le FNS en cas d'obtention du financement.
Le FNS s'attend en outre à ce que les données produites au cours des travaux de recherche soient archivées dans des bases de données numériques en libre accès, pour autant qu'aucune clause juridique, éthique, concernant le droit d'auteur ou autre ne s'y oppose.
Le FNS permet aussi aux requérants de demander des fonds pour la préparation des données, la mise en ligne et la validation. Le téléchargement n’est pas pris en compte. Le FNS peut octroyer jusqu’à CHF 10’000 pour ces activités.
Si vos données open data sont produites dans le cadre d'un projet du FNS, n'oubliez pas de les budgétiser sous "Coûts d'accès aux données de recherche".
Pour plus d'information, voir le site du FNS
Les exigences d'Horizon Europe
Horizon Europe exige un accès ouvert immédiat à toutes les publications scientifiques et une gestion responsable des données de recherche afin que les données soient trouvables, accessibles, interopérables et réutilisables (FAIR). Les données seront rendues "aussi ouvertes que possible, mais seront autorisées à rester aussi fermées que nécessaire", en préservant les intérêts ou les contraintes légales. Les critères d'évaluation des propositions de recherche dans le cadre d'Horizon Europe tiendront compte de la qualité et de l'adéquation des pratiques de science ouverte dans les propositions soumises.
La rédaction d'un Data Management Plan (DMP) est obligatoire. Vou pouvez télécharger le modèle ici
Pour aller plus loin, voir :
- Fiche d'information : La science ouverte dans le programme Horizon Europe
- Guide du programme Horizon Europe
- Politique de la Comission européenne en Open Science
- Fiche de présentation du programme Horizon Europe
L'Open Research Data à la HES-SO
La stratégie Open HES-SO inclut dans sa politique la mise en œuvre des injonctions en matière d'ouverture des données de la recherche. Toutefois le Rectorat est tout à fait conscient des enjeux spécifiques à la HES-SO, soit à un contexte de recherche appliquée.
Enjeux de l'Open Research Data pour la HES-SO
La mise en oeuvre de l'Open Data peut s'avérer délicate pour la HES-SO dans certains cas parce que:
- des collaborations sont nouées avec des partenaires de terrain;
- de nombreuses recherches sont menées au profit d'entreprises ou d' institutions qui, elles-mêmes, financent les projets;
- les enjeux éthiques et de protection des données touchent tout particulièrement les projets sociaux et sanitaires;
- les enjeux de propriété intellectuelle sont centraux dans le cadre de projets de développement technologique.
Négocier en amont des projets afin de clarifier quelle partie des données sera publique ou exploitée et protégée (brevets, droits exclusifs, etc.) s'avère indispensable.
La mise en oeuvre de l'Open Data est encore dans une phase d'essai et de tâtonnement. La réflexion est en cours sur comment l'adapter aux spécificités de nos Hautes écoles.
Les projets Open Data de la HES-SO
1/ La HES-SO participe activement au projet national DLCM
(Data Life Cycle Management). Celui-ci contribue au développement de solutions nationales pour la gestion des données issues de la recherche. La HES-SO, par l’entremise de la HEG Genève (filière Information documentaire), est l’un des huit partenaires institutionnels de ce projet. Il est financé par le programme P5 de swissuniversities. Il offre aux chercheurs les services suivants:
- soutien à la réalisation de Data Management Plan (DMP);
- formation et consulting auprès d'un réseau d'experts de différents domaines;
- expertise dans l'utilisation d'outils informatique pour la gestion des données de recherche;
- service web pour la préservation des données de recherche.
2/ La HES-SO s'est associée au Conseil de Rectorat Azur+, regroupant les universités de Genève, Lausanne, Fribourg et Neuchâtel, afin de conclure un contrat de prestations avec une Sàrl émanant d’une étude d’avocats spécialisée pour la fonction de Data Protection Officer (DPO). Celle-ci constitue un appui à l'institution pour garantir que les pratiques de l'Open data soient conformes au Règlement sur la protection des données de l'Union européenne et de la Confédération. Un groupe de travail interdisciplinaire "Protection des données" a également été créé au sein de la HES-SO afin d’assurer la coordination autour des problématiques de protection des données dans l’institution ainsi que d’élaborer un diagnostic de la situation et des mesures à prendre.
3/ La HES-SO soutient le projet BioMedIT. Celui-ci vise à établir une infrastructure nationale sécurisée, coordonnée et en réseau, destinée à récolter, systématiser, archiver et mettre à disposition les données ainsi qu’à développer les capacités de calcul de la recherche biomédicale. Coordonné par l’Institut Suisse de Bio-informatique, BioMedIT rassemble les universités de Bâle, Berne, Fribourg, Genève, Lausanne et Zurich, l’EPF de Zurich, le Swiss Tropical and Public Health Institute et la HES-SO, par l’intermédiaire de la HEG Genève.
4/ La HES-So soutient le projet DAUnit (Data Acquisition Unit). Développé par la HES-SO Valais-Wallis, c'est un service destiné à accompagner les chercheurs en santé dans leurs projets de recherche notamment pour concevoir, adapter et mettre en œuvre des enquêtes et des questionnaires.