Data science - DS


Concept

Pourquoi faire un master en Data Science ?

There is no shortage of enterprise data today. The digital era calls for analytics to be infused in every role, business process, decision and action.” (Gartner)

Plus de 90% des entreprises ont aujourd’hui identifié le Data Science comme un élément clé de leur compétitivité. Le Data Science est devenu une compétence transdisciplinaire nécessaire à toute entreprise d’ingénierie qui vit sa transformation digitale. Renforçant cette dynamique, des nouveaux paradigmes ont émergé dans le domaine de l’intelligence artificielle (IA) qui devient une réalité dans les entreprises suite aux avancées du deep learning, du big data et du calcul sur GPU. La formation Data Science du MSE répond donc à un besoin actuel du marché pour lequel des formations de niveau master sont nécessaires.

A quel niveau amène-t-on les étudiants?

Les étudiants recevant le diplôme de master en Data Science auront développé des compétences interdisciplinaires professionnelles dans trois domaines clés du Data Science. Le premier est le data engineering qui couvre les techniques d’acquisition, de stockage et de traitement des données. Le second est le data analytics qui couvre les processus de conversion des données brutes en information, modèles et connaissances actionnables, entre autres en utilisant les techniques modernes de l’IA. Le troisième est orienté vers la mise en production et la maintenance de data services qui utilisent les modèles issus du data analytics.


Public cible

Le profil Data Science s’inscrit dans le cadre du MSE (Master of Science in Engineering) qui est une offre de formation réalisée en commun par les HES suisses. Elle est consécutive à la formation Bachelor. Répondant à un besoin actuel des entreprises d’ingénierie tout domaine confondu, le profil Data Science est ouvert à tout étudiant titulaire d’un Bachelor of Science en Ingénierie.


Profil professionnel

L’activité professionnelle visée par le profil Data Science du MSE est celle de spécialiste, chef-fe de projet et/ou cadre supérieur·e au sein de grandes entreprises, de groupes de conseil, et d’administrations publiques qui mettent en place des projets liés à l’exploitation de leurs données, en Suisse ou à l’étranger. Le profil prépare à divers métiers comme:

  • Ingénieur·e Data Science
  • Data Architect
  • Chief Information Officer
  • Senior Data Engineer

Compétences à développer

Les étudiants recevant le diplôme MSE en Data Science auront développé des compétences interdisciplinaires professionnelles dans les trois domaines clés: data engineering, data analytics et data services. Ces compétences sont décrites dans la Section Spécialisation ci-dessous et correspondent à des besoins actuels identifiés du marché de l’emploi en Suisse et à travers le monde.


Spécialisations

Overview

Le profil Data Science est structuré selon trois domaines: le data engineering, le data analytics et les data services. Ces domaines sont couverts par les différentes formes d’enseignement du MSE incluant les modules centraux (contextuels, fondamentaux et techniques), les modules d’approfondissement et les projets.

Data Analytics

Le data analytics est le processus de conversion des données brutes en information, modèles et connaissances actionnables. Dans ce processus, des modèles et des algorithmes sont appliqués aux données. Ils sont construits grâce au machine learning, au deep learning, au traitement du langage naturel, au data mining et, de façon générale, aux mathématiques appliquées. Plus spécifiquement, les compétences suivantes sont visées:

  • Comprendre et appliquer des méthodes statistiques pour décrire et explorer les données.
  • Construire des modèles dérivés des données en utilisant des techniques de data mining, de machine learning et de deep learning.
  • Analyser et planifier des expériences permettant de construire, valider et optimiser des modèles selon les bonnes pratiques de l’état-de-l’art.

Data Engineering

Le data engineering couvre les techniques d’acquisition, de stockage et de traitement des données d’un point de vue informatique. Il inclut les protocoles de communication avec les capteurs tels que ceux utilisés pour l’Internet des Objets, la gestion des flux de données et les bases de données dont les solutions big data. Les aspects traitement des données incluent les techniques de nettoyage, de préparation et de sécurisation des données. Plus spécifiquement, les compétences suivantes sont visées:

  • Conceptualiser et organiser la collecte de données depuis les machines et systèmes utilisés dans les entreprises, en gérant la dimension hétérogène des sources de données dont les capteurs IoT d’entreprise, les bases de données structurées et non-structurées, les stacks technologiques big data et les flux de données en ligne.
  • Analyser, planifier et organiser le stockage des données en utilisant les technologies adéquates aux besoins des applications, tenant compte des contraintes de bande passante, de sécurité, de volume et de variété des données.
  • Conceptualiser, développer, évaluer et optimiser des applications capables de traiter de façon efficace des flux de données, d’en extraire des caractéristiques et d’y appliquer des modèles.

Data Services

Les data services sont liés à la mise en production de services actionnables par les entreprises. Ceci implique une compréhension des processus propres aux entreprises et la mise en place des pipelines de données qui les supportent, incluant techniques de déploiement et de maintenance. D’autres aspects non techniques tels que l’éthique, le droit, la sécurité et le respect de la vie privée font partie des considérations lors du déploiement de ces services.

  • Construire des “data products” en comprenant les besoins d’entreprise en termes de pipeline de données pour transformer des résultats d’analyse en informations actionnables pour les entreprises.
  • Organiser le déploiement, la maintenance et l’évolution des services de données en respectant des contraintes de qualité tels que les Service Level Agreements.
  • Comprendre les contraintes non techniques liées aux dimensions éthiques, vie privée, sécurité et intégrité des données dans des entreprises et institutions publiques. Organiser les services de données pour respecter ces contraintes.