Statistique, modélisation et science des données en santé (SMSDS)

Proposé en collaboration avec l’Université Paris Cité, le parcours SMSDS a pour objectif de former des professionnels aux méthodes statistiques de l’analyse de données dans le champ de la santé, en s’appuyant sur les méthodes usuelles et leurs évolutions récentes. Ce parcours intègre ainsi les outils statistiques modernes (inférence causale, statistique bayésienne, modélisation non linéaire, analyse de survie, gestion des données manquantes, etc.) et les méthodes d’apprentissage automatique issues du machine learning (apprentissage supervisé et non supervisé, modélisation de données de grande dimension, etc.).​

Présentation

Le parcours SMSDS permet aux étudiants de découvrir et d’utiliser une large gamme d’outils pertinents en biostatistique et en science des données dans le domaine de la santé, dans un contexte d’informatisation massive du système de santé (Système National des Données de Santé, entrepôts de données hospitaliers, données de cohortes…) et de constitution de bases de données biologiques de grande dimension (disciplines “omiques”).

Le parcours repose sur une interaction permanente entre cours théorique et exercices pratiques, avec pour principal objectif de développer l’autonomie des étudiants pour appréhender de nouvelles problématiques méthodologiques. Les compétences développées sont ainsi valorisables dans des domaines variés liés à l’analyse de données en santé : recherche clinique, épidémiologie, méthodologie statistique, etc.

Objectifs

L’objectif principal du parcours SMSDS de seconde année du master de Santé Publique est d’accompagner l’étudiant vers une maîtrise théorique et pratique de la biostatistique et de la science des données en santé permettant une insertion dans un milieu professionnel ou la poursuite vers un doctorat en vue d’une thèse de sciences.

Ces compétences reposent notamment sur :

  • une connaissance des outils statistiques fréquemment utilisés en épidémiologie et recherche clinique : modèles linéaires généralisés, modèles mixtes, modèles de survie et leurs adaptations dans un cadre d’inférence causale pour données observationnelles ;
  • une connaissance des principales méthodes d’apprentissage automatique et d’analyse de données de grande dimension ;
  • une connaissance des principales méthodes de modélisation de systèmes dynamiques ;
  • une introduction à l’inférence bayésienne et aux outils de modélisation ;
  • une maîtrise du logiciel R pour l’analyse de données et la représentation graphique ;
  • une acquisition des compétences permettant de travailler de façon autonome, individuellement ou en petits groupes, pour rechercher ou développer des approches méthodologiques permettant de répondre à une nouvelle problématique ;
  • Une compétence globale pour développer et traiter une question de recherche, de sa formulation à la rédaction d’un rapport ou article scientifique.

La présence d’un tronc commun permet de s’assurer d’un niveau de compétences et connaissances de qualité dans ces différents domaines. La diversité des unités d’enseignement (UE) optionnelles proposées permet ensuite à l’étudiant d’approfondir ses connaissances et compétences dans des domaines qu’il choisit pour un parcours adapté à ses objectifs personnels et/ou professionnels.

Conditions d’accès

Cette formation s’adresse aux étudiants en formation initiale ou continue ayant validé une première année de Master en Santé Publique avec une forte composante en statistique ou mathématique ou formation équivalente (par exemple diplôme inter-universitaire Cesam) ;

Les candidatures seront examinées par un comité pédagogique délivrant les autorisations d’inscription.

Organisation

Ce parcours comprend :

  • une formation théorique entre novembre et février (semestre 3, validant 30 crédits ECTS) ;
  • un stage de recherche de 4 à 6 mois dans une équipe labellisée (semestre 4, 30 crédits ECTS).

 

Semestre Période Contenu ECTS
S3 Fin octobre à mi-décembre

Enseignements obligatoires (tronc commun) :

  • 8 UE “socle”
  • 2 UE transversales
21
Début janvier à mi-février Enseignements optionnels : 3 UE appliquées ou d’approfondissement à choisir parmi 11 9
S4 Mi-février à début juillet Stage de recherche 30
Mi-juillet Soutenance du mémoire de stage  

 

Formation théorique

La formation théorique vise à l’acquisition des outils fondamentaux en statistique et analyse de données de santé. Elle consiste en une phase socle (tronc commun) d’enseignements obligatoires entre fin octobre et fin décembre, suivie d’une phase d’enseignements optionnels en janvier et février.

Les enseignements alternent cours magistraux, travaux pratiques et travaux personnels sur projets. Chaque UE obligatoire fait l’objet d’une validation spécifique utilisant la réalisation d’un projet. Les UE optionnelles sont validées de façon spécifique par un projet individuel ou en groupe.

Tous les cours auront lieu de fin octobre à février à Paris intra-muros.

Enseignements obligatoires (21 ECTS)

(fin octobre à mi-décembre)

Enseignements optionnels (9 ECTS)

(début janvier à mi-février)

3 UE optionnelles à choisir parmi 9

8 UE “socle” :

  • Inférence causale
  • Modèles linéaires généralisés, modèles mixtes
  • Modèles de survie
  • Données manquantes
  • Apprentissage statistique
  • Données de grande dimension
  • Modèles dynamiques
  • Méthodes bayésiennes

2 UE transversales :

  • Anglais
  • Modélisation

7 UE d’approfondissement :

  • Inférence causale
  • Modèles de survie
  • Données manquantes
  • Apprentissage statistique
  • Données de grande dimension
  • Modèles dynamiques
  • Méthodes bayésiennes

2 UE appliquées :

  • Schémas adaptatifs
  • Revues systématiques, méta-analyses
Stage de recherche

Le stage de recherche débute en février pour une durée de 4 à 6 mois, au sein d’une équipe de recherche labellisée en France ou à l’étranger. Les équipes pédagogiques du parcours SMSDS sont notamment affiliés à l’Institut Pierre-Louis d’Épidémiologie et de Santé Publique (Iplesp, UMR-S 1136) et au Centre de Recherche Épidémiologie et StatistiqueS (CRESS, UMR-S 1153), offrant de nombreux terrains de stage dans des domaines variés.

Le stage donne lieu lieu à la rédaction d’un mémoire en langue anglaise et à une soutenance orale en français (deux sessions, début juillet et début septembre).

Débouchés

Insertion professionnelle

Cette formation théorique et pratique permet d’obtenir une expertise en planification des études épidémiologiques et de recherche clinique, analyse de données, rédaction scientifique et présentation des résultats. Les compétences offertes par ce parcours sont celles recherchées pour les métiers de biostatisticien, modélisateur, méthodologiste ou data scientist en santé, en pleine expansion dans le domaine de la recherche biomédicale et dans les différents secteurs de la santé : laboratoires de recherche, structures hospitalières (unités de recherche clinique, centres de données), agences de santé françaises et internationales, administrations publiques, organismes liés à l’assurance maladie et à la protection sociale, sociétés de conseil spécialisées en analyse de données, industrie pharmaceutique, sociétés de recherche contractuelle (CRO), etc.

Poursuite d’études

L’obtention du Master Mention Santé Publique permet l’inscription en doctorat en vue de l’obtention d’une thèse d’université en sciences. Les équipes pédagogiques du parcours SMSDS sont notamment affiliées à l’École doctorale Pierre Louis de santé publique (ED 393 : Epidémiologie et Sciences de l’Information Biomédicale).

Candidatures
  • Pour les candidats ressortissants d’un des pays de l’Union Européenne, dépôt des dossiers de candidature complétés du 2 mai au 28 juin 2024
  • Pour tous les candidats, informations disponibles sur cette page : https://sante.sorbonne-universite.fr/formations/inscriptions/inscriptions-master-des-formations-en-sante
  • Attention, les universités partenaires peuvent classer différemment les candidatures : pour optimiser vos chances d’acceptation, il est fortement recommandé de candidater simultanément à Sorbonne Université et à l’Université Paris Cité.
Prérequis
  • Médecins, pharmaciens, chirurgiens-dentistes, vétérinaires titulaires d’une première année de master en sciences biologique et médicales
  • Elèves des écoles normales supérieures et des grandes écoles d’ingénieurs
  • Etudiants titulaires d’une première année de master ou équivalente avec une forte composante en statistique ou mathématique

Prérequis : bases en biostatistiques et probabilité, bases en épidémiologie, bases en biomédecine, bases en informatique, bases en évaluation médicale

INFORMATIONS ADMINISTRATIVES
medecine-dfs-sante-m2-smsds@sorbonne-universite.fr
Faculté de Santé Sorbonne-Université
Site Saint-Antoine
bureau 323 – 3e Etage
27 rue Chaligny
75012 PARIS

ÉQUIPE PÉDAGOGIQUE
Responsable du parcours :
Nathanaël Lapidus
rf.et1716409295isrev1716409295inu-e1716409295nnobr1716409295os@su1716409295dipal1716409295.lean1716409295ahtan1716409295