Il s’agit d’un projet financé par ShapeMed 2023 pour 3 ans. Notre objectif est de constituer une suite d’analyse de données multimodales, rassemblant les données cliniques, biologiques, moléculaires, pharmacologique et de résultats d’analyse d’image, des patients du CLB (périmètre à définir avec DPO et selon les données disponibles). Nous utiliserons les sources de données structurées, ainsi que des modèles de langue afin de combiner les données et produire une donnée cible qui correspondra à un compte rendu patient enrichit (figure 1). Afin d’utiliser ces données, nous utiliserons principalement des modèles de langues pour nos projets de recherche (SAEpred, pronostic, TM2…), et possiblement une stratégie de multi–agentic workflow (inspiré de https://arxiv.org/abs/2404.04667) pour la RCP moléculaire, qui nécessiterait de requêter un ou des outils existants (comme par exemple MedSam pour l’analyse d’images) et la modélisation de phénomènes dynamiques (par exemple avec une transformation par théorie des signatures) pour réaliser cette suite d’analyses. Nous faisons l’hypothèse qu’une analyse incluant de multiples données permettra d’améliorer les performances de prédiction d’événements futurs pour les patients suivis pour un cancer (SAEpred), ou l’éligibilité aux essais cliniques (TM2 et RCP moléculaire), ou la prédiction du pronostic des patients.
Directeur Général
Patients suivis au CLB avec plus de 4 comptes rendus et avec niveau d'information ≥5/7
Pour chaque sous-étude une intersection est prévue entre la base de données de textes et 1) les variables cliniques structurés, 2) les données moléculaires, 3) les données biologiques, 4) les données d’imageries de type scanner et éventuellement lames anapath numérisées.
Patients avec au moins une hospitalisation au CLB de 2000 à 2024, nous pouvons mettre au point une monté en charge progressive avec par exemple un premier travail sur 10K patients et après point d’étape augmenter le nombre de patients cibles.
Recherche scientifique menée dans l’intérêt légitime de lutte contre le cancer (articles 6.1.f et 9.2.j du Règlement (UE) n° 2016/679)
Responsable de l’équipe coordinatrice : Loic Verlingue, MD, PhD, CLB, CRCL
Equipes interne et externe
- ERIC Lab Lyon 2, externe, pas de demande d’accès aux données
- Plateforme bioinformatique Synergie
2 ans après la publication scientifique puis archivage sur un support distinct