FR

L'Open Research Data vise à rendre les données de recherches financées par des fonds publics accessibles de façon permanente et gratuite. Le but étant leur réutilisation par d'autres afin d'améliorer la qualité et l'intégrité du travail scientifique.

C'est dans ce cadre que des acteurs du monde académique et politique mais aussi des éditeurs ont développé les principes FAIR pour rendre ces données Findable, Accessible, Interoperable and Reusable.

Désormais les grands bailleurs de fonds de la recherche et la HES⁠-⁠SO demandent un engagement dans ce sens à leurs chercheuses et chercheurs. C'est le cas aussi d'un nombre croissant d’éditeurs scientifiques qui adoptent des Data Policies et exigent dorénavant l’accès aux données devant permettre la vérification des résultats de recherches.

Les  enjeux  autour  de  l’Open  data  sont  globalement  plus  complexes  que ceux de l'Open Access. C'est une transformation radicale de la manière d’envisager la recherche. Un changement de culture pourrait-on dire. L'Open data soulève de nombreux enjeux scientifiques, éthiques, déontologiques, juridiques, techniques, économiques ou encore sociétaux. Elle nécessite aussi des infrastructures de dépôt des données bien plus lourdes que pour l'Open Access. 

Il est important de souligner que la période actuelle est une période de transition, de tâtonnement. Beaucoup est encore à construire.

Une grande variété de données

Qu'est-ce qu'une donnée de recherche? Cette question apparemment simple peut donner lieu à des réponses fort diverses selon les domaines.

Le rapport d'un chercheur à ses données varie fortement suivant son champ disciplinaire et/ou méthodologique. La nature des données, leur degré de confidentialité ou leur potentiel de réutilisation est très différent selon qu'il s'agisse, par exemple, d'un carnet de terrain ethnographique ou de séries statistiques économiques.

Les données de recherche prennent de multiples formes parmi lesquelles des données expérimentales, des données d’observation,  des données opérationnelles,  des données de tiers ou encore des données du secteur public, etc. Elles peuvent se présenter sous forme numérique, texte, sonore, image ou vidéo.

Définition large

Une définition large et des plus usitée de ce que sont les données de recherche émane de l'OCDE: 

"des  enregistrements  factuels  (chiffres,  textes,  images  et  sons),  qui  sont  utilisés  comme  sources  principales  pour  la  recherche  scientifique  et  sont  généralement  reconnus  par  la  communauté  scientifique  comme  nécessaires  pour  valider  des  résultats  de  recherche. Un  ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche. 

Ce terme ne s’applique pas aux éléments suivants : carnets de laboratoire, analyses préliminaires et projets de documents scientifiques, programmes de travaux futurs, examens par les pairs, communications personnelles avec des collègues  et  objets  matériels  (par  exemple,  les  échantillons  de  laboratoire,  les  souches  bactériennes  et  les  animaux  de  laboratoire  tels  que  les  souris).  L’accès à tous ces produits ou résultats de la recherche est régi par d’autres considérations que celles abordées ici."

Tiré de: Principes et lignes directrices pour l’accès aux données de la recherche financée sur fonds publics, 2007, p. 18. 

Les principes FAIR (Findable, Accessible, Interoperable, Reusable) ont été élaboré par différents groupes d'acteurs. Leur but? Aider les êtres humains et les machines dans leur quête de données scientifiques. C'est là un des principaux défis de l'énorme croissance de données disponibles sur internet.

Car il ne suffit pas qu'elles y soient. Encore faut-il qu'elles soient trouvables, accessibles, interopérables et réutilisables. Ce n'est que dans ces conditions qu'elles pourront servir la communauté scientifique. 

Ainsi, 15 indicateurs ont été établit afin d'évaluer le niveau FAIR des différentes infrastructures de dépôts de données. Les derniers développement sont disponibles sur GO-FAIR.

Voir aussi les explications des principes FAIR élaborés par le FNS. Ce document liste les responsabilités respectives des chercheurs et des dépôts de données pour atteindre les objectifs FAIR.

Les exigences du FNS

Pour le FNS, les données de la recherche devraient être libres d'accès pour chacun, tant pour la communauté scientifique que pour le public.

Depuis octobre 2017, il est ainsi obligatoire d’inclure un plan de gestion des données (Data Management Plan ou DMP). Ce plan est désormais demandé par le FNS en cas d'obtention du financement.

Le FNS s'attend en outre à ce que les données produites au cours des travaux de recherche soient archivées dans des bases de données numériques en libre accès, pour autant qu'aucune clause juridique, éthique, concernant le droit d'auteur ou autre ne s'y oppose.

Le FNS permet aussi aux requérants de demander des fonds pour la préparation des données, la mise en ligne et la validation. Le téléchargement n’est pas pris en compte. Le FNS peut octroyer jusqu’à CHF 10’000 pour ces activités.

Si vos données open data sont produites dans le cadre d'un projet du FNS, n'oubliez pas de les budgétiser sous "Coûts d'accès aux données de recherche".

Pour plus d'information, voir le site du FNS

Les exigences d'Horizon Europe

Horizon Europe exige un accès ouvert immédiat à toutes les publications scientifiques et une gestion responsable des données de recherche afin que les données soient trouvables, accessibles, interopérables et réutilisables (FAIR). Les données seront rendues "aussi ouvertes que possible, mais seront autorisées à rester aussi fermées que nécessaire", en préservant les intérêts ou les contraintes légales. Les critères d'évaluation des propositions de recherche dans le cadre d'Horizon Europe tiendront compte de la qualité et de l'adéquation des pratiques de science ouverte dans les propositions soumises. 

La rédaction d'un Data Management Plan (DMP) est obligatoire. Vou pouvez télécharger le modèle ici

Pour aller plus loin, voir :

 

La stratégie Open HES⁠-⁠SO inclut dans sa politique la mise en œuvre des injonctions en matière d'ouverture des données de la recherche. Toutefois le Rectorat est tout à fait conscient des enjeux spécifiques à la HES⁠-⁠SO, soit à un contexte  de recherche appliquée.

Enjeux de l'Open Research Data pour la HES⁠-⁠SO

La mise en oeuvre de l'Open Data peut s'avérer délicate pour la HES⁠-⁠SO dans certains cas parce que: 

  • des  collaborations sont nouées avec des  partenaires  de  terrain;
  • de nombreuses recherches sont menées au profit d'entreprises  ou  d' institutions  qui, elles-mêmes, financent les projets;
  • les enjeux éthiques et de protection des données touchent tout particulièrement les projets sociaux et sanitaires;
  • les enjeux de propriété intellectuelle sont centraux dans le cadre de projets de développement technologique.

Négocier  en  amont  des  projets  afin  de clarifier  quelle  partie  des  données  sera publique ou exploitée et protégée (brevets, droits exclusifs, etc.) s'avère indispensable.

La mise en oeuvre de l'Open Data est encore dans une phase d'essai et de tâtonnement.  La réflexion est en cours sur comment l'adapter aux spécificités de nos Hautes écoles.

Les projets Open Data de la HES⁠-⁠SO

1/ La  HES⁠-⁠SO  participe  activement au  projet  national DLCM
(Data  Life  Cycle  Management). Celui-ci contribue  au  développement  de  solutions  nationales pour la gestion  des  données  issues  de  la recherche. La  HES⁠-⁠SO, par l’entremise de la  HEG  Genève  (filière  Information  documentaire), est l’un  des  huit  partenaires  institutionnels  de  ce  projet. Il est  financé  par le   programme P5   de swissuniversities. Il offre aux chercheurs les services suivants:

  • soutien à la réalisation de Data Management Plan (DMP);
  • formation et consulting auprès d'un réseau d'experts de différents domaines;
  • expertise dans l'utilisation d'outils informatique pour la gestion des données de recherche;
  • service web pour la préservation des données de recherche.

2/ La HES⁠-⁠SO s'est  associée au Conseil de Rectorat Azur+, regroupant les universités de Genève, Lausanne, Fribourg et Neuchâtel, afin de conclure un contrat de prestations avec une Sàrl émanant d’une étude d’avocats spécialisée pour la fonction de Data Protection Officer (DPO). Celle-ci constitue un appui à l'institution pour garantir que les pratiques de l'Open data soient conformes au  Règlement sur la protection des données de l'Union européenne et de la Confédération. Un groupe de travail interdisciplinaire "Protection des données" a également été créé au sein de la HES⁠-⁠SO afin  d’assurer la coordination autour des  problématiques  de  protection  des  données  dans l’institution ainsi  que  d’élaborer  un  diagnostic  de  la  situation  et  des  mesures  à  prendre.

3/ La HES⁠-⁠SO soutient le projet BioMedIT. Celui-ci vise  à  établir  une  infrastructure nationale  sécurisée, coordonnée  et  en  réseau,  destinée  à  récolter,  systématiser, archiver et  mettre  à  disposition  les données ainsi qu’à développer les capacités de calcul de la recherche biomédicale. Coordonné par l’Institut Suisse de Bio-informatique, BioMedIT rassemble les universités de Bâle, Berne, Fribourg, Genève, Lausanne et Zurich, l’EPF de Zurich, le Swiss Tropical and Public Health Institute et la HES⁠-⁠SO,  par  l’intermédiaire  de  la  HEG Genève. 

4/ La HES-So soutient le projet DAUnit (Data Acquisition Unit). Développé par la HES⁠-⁠SO Valais-Wallis, c'est un service destiné à accompagner les chercheurs en santé dans leurs projets de recherche notamment pour concevoir, adapter et mettre en œuvre des enquêtes et des questionnaires.