Description grand public :
Dans le cadre du projet STRONG AYA, un tableau de bord a été développé par un membre de MAASTRO (Maastricht Radiation Oncology, Pays-Bas), pour permettre aux utilisateurs d’inspecter des données provenant de sources multiples. Cet outil, sous forme de dashboard, a pour objectif de contrôler la qualité des données fédérées utilisées en recherche. Parallèlement, la Data Factory (Lyon, France) a conçu un tableau de bord destiné à évaluer la qualité intrinsèque d’une base de données locale. Ce projet vise à mettre en évidence les différences entre ces deux approches d’évaluation - locale et fédérée – et à explorer leur complémentarité.
Description détaillée :
STRONG AYA est un réseau européen interdisciplinaire et multipartite dont l’objectif est l’amélioration de la recherche et des soins des adolescents et jeunes adultes en utilisant des données fédérées issues de multiples institutions. Un algorithme Vantage6 a été développé afin de réaliser des analyses sans centralisation ni partage de ces données, garantissant ainsi leur confidentialité. Un dashboard disposant d’une intégration à Vantage6, a été conçu pour permettre aux utilisateurs d’examiner ces données fédérées et d’évaluer leur qualité sur une interface unique. Parallèlement, un dashboard évaluant la qualité des données d’une base institutionnelle a été développé au sein de la data factory. À la différence du contrôle qualité précédent, celui-ci s’exécute sur des données locales, permettant ainsi l’identification d’incohérences à un niveau plus approfondi. L’objectif de ce projet est de comparer les résultats obtenus par ces deux outils et d’étudier la complémentarité de ces deux approches de contrôle qualité. Pour ce faire, ces deux outils doivent évaluer la qualité des données issues d’un même ensemble de données. Ce dataset est issu d’une base de données historique appartenant au CLB. La mise en commun et la réutilisation de ces données de santé nécessitent de renforcer leur protection : (i) La pseudonymisation des données de la base sera assurée par un protocole permettant d’éviter leur réidentification. (ii) Ces données sont hébergées sur leur site d’origine et ne seront pas partagées.
Centre Léon Bérard et Maastricht University Medical Center + (Pays Bas)
La population étudiée se compose de patientes incluses dans la base de données « Sein » répondant aux critères d’inclusion suivants : patientes majeures, avec un nouveau cas de cancer du sein histologiquement prouvé (quel que soit le type histologique, carcinome infiltrant invasif ou micro-invasif et/ou in situ), traitées par chirurgie première au CLB. Ce projet portera sur une sous-population spécifique de patientes enregistrées dans cette base: des patientes âgées de 18 à 39 ans au moment du diagnostic du cancer et qui ne se sont pas opposées à participer à la recherche.
Exécution d’une mission d’intérêt public (lutte contre le cancer)
CLB : Equipe habilitée du service "Data Factory" au sein de la Direction du système d'information et des données (DSID)s Natacha Perez (Data analyst – Data Factory, DSID). Quentin Filori (Data scientist – Data Factory, DSID)
Maastricht University Medical Center + : un membre du service "Research Institute for Oncology and Reproduction" (accès uniquement à des données pseudonymisées très profondément)
2 ans après la publication scientifique puis archivage sur un support distinct pour une durée conforme à la réglementation en vigueur