Passer au contenu

Le RRDS Canada lance une série de formations avec un programme accéléré sur l’analyse fédérée

Kim McGrail, une femme blanche souriante aux longs cheveux bruns, et Robert Platt, un homme blanc chauve souriant portant un pull-over rouge. Le texte se lit comme suit : Nouvelles. Analyse fédérée 101. Le logo du Réseau de recherche sur les données de santé du Canada se trouve au bas de la page.
thumbnail

“Cette série a été longuement mûrie”, a souligné la Dre Kim McGrail, directrice scientifique du RRDS Canada, en ouverture de la séance inaugurale de lAnalyse fédérée : La série d’apprentissage collectif sur l’état de la science. Organisée par le RRDS Canada, cette série en sept volets offre une exploration approfondie de l’analyse fédérée, depuis la pratique actuelle de l’analyse distribuée jusqu’à l’intelligence artificielle et l’apprentissage fédéré – ce qui est sans précédent dans le contexte canadien.

Pour construire cette série, le RRDS Canada a réuni un comité directeur composé d’expert-e-s universitaires et industriel-le-s en analyse de données, en couplage de données, en recherche sur les services de santé, en équité en santé et en biostatistique de tout le Canada, sous la direction de la Dre McGrail. “Dès le début de la préparation de cette série, nous avons réalisé que certains éléments essentiels manquaient, comme des définitions communes pour le type d’analyse de données que nous utilisions”, elle a expliqué.

Nous ne disons pas que l’analyse fédérée va s’imposer et devenir la seule façon d’utiliser les données, mais plus d’options peuvent rendre plus de choses possibles. ~ Kim McGrail, PDG RRDS Canada

L’analyse groupée, par exemple, est l’analyse de données individuelles combinées à partir de plusieurs localisations et sources de données différentes. “C’est ce que nous considérons comme l’analyse traditionnelle lorsque nous menons une recherche multirégionale. Nous rassemblons toutes les données en un seul endroit – elles sont mises en commun”, a déclaré la Dre McGrail. “Les données distribuées sont stockées dans plusieurs organisations, institutions ou centres de données, tandis que les données fédérées sont des données distribuées qui peuvent être analysées ensemble tout en restant séparées.

Avec les nouveaux développements en matière d’analyse statistique, l’analyse fédérée peut être un outil puissant pour les chercheur-euse-s, a ajouté la Dre McGrail, notant qu’il ne s’agit pas d’une méthode unique mais plutôt d’une option supplémentaire pour l’analyse des données. “Nous ne supposons pas qu’il existe une approche particulière qui soit une solution unique ou une solution miracle. Nous ne disons pas que l’analyse fédérée va s’imposer et devenir la seule façon d’utiliser les données, mais plus d’options peuvent rendre plus de choses possibles”, a-t-elle déclaré.

Comment abordons-nous l’analyse fédérée ? Selon Robert Platt, codirecteur exécutif du CNODES, trois éléments sont nécessaires : la cohérence d’un protocole et d’un plan analytique communs, l’harmonisation des données et un modèle de données commun. “Cela signifie que tout le monde travaille exactement à partir du même protocole et des mêmes étapes analytiques”, a déclaré le Dr Platt. “Nous normalisons les données à l’aide de cette approche de protocole commun afin que ces ensembles de données soient tous relativement identiques. Il s’agit là des premières étapes de la préparation, de l’interopérabilité et de la réutilisation des données à des fins d’analyse. En d’autres termes, l’harmonisation ou la normalisation des données est essentielle pour construire un modèle de données commun, une infrastructure logique normalisée qui organise et exploite des données provenant de nombreuses sources, avec un code analytique qui peut être exécuté dans n’importe quelle province ou territoire du pays.

La fédération des données permet d’aborder la localisation des données, la souveraineté des données, l’engagement continu de la communauté et les responsabilités concernant l’utilisation des données. Malgré les avantages potentiels de l’analyse fédérée, plusieurs défis subsistent, notamment les lois sur la protection de la vie privée et les différences organisationnelles : “Il y a la gestion des données et une approche du risque et de la prise de décision quant à savoir si les données peuvent circuler en dehors des institutions ou au-delà des frontières”, a déclaré la Dre McGrail. “Il y a aussi la taille et la complexité des données, par exemple les informations génomiques qui peuvent être très compliquées, ou les fichiers de données qui deviennent si volumineux qu’ils doivent souvent rester là où ils sont en raison de la complexité technique de la protection.

Mais, comme l’a fait remarquer le Dr Platt, les problèmes techniques et méthodologiques posés par l’analyse fédérée sont gérables. “Les difficultés se situent principalement au niveau juridique, politique et financier, lorsqu’il s’agit de mobiliser l’énergie et les fonds nécessaires à la conservation, à la préparation et à la documentation des données”, a déclaré le Dr Platt. Et McGrail de poursuivre : “Nous aurons besoin d’une forme d’infrastructure de données commune, idéalement intégrée aux structures existantes, ce qui signifie que nous n’avons pas nécessairement besoin de construire des choses entièrement nouvelles. Nous pouvons tirer parti des investissements déjà réalisés.”

C’est pourquoi le RRDS Canada a lancé L’analyse fédérée : la série d’apprentissage collectif sur l’état de la science pour favoriser une compréhension commune de l’analyse fédérée et de son potentiel inexploité pour répondre aux ambitions et aux défis de la recherche. “Nous voulons traduire les leçons apprises en outils et en ressources accessibles à l’ensemble de la communauté scientifique”, a précisé la Dre McGrail. “Dans certains cas, cela signifie qu’il faudra développer de nouveaux outils et éventuellement plaider en faveur de politiques, d’investissements ou d’autres ressources susceptibles de soutenir la recherche multirégionale.

L’analyse fédérée : Série d’apprentissage collectif sur l’état de la science se déroule chaque mois jusqu’en juillet. Elle pourrait être suivie d’une conférence destinée à présenter les connaissances acquises au cours de la série. Regardez les enregistrements précédents sur la chaîne YouTube du RRDS Canada.

Derniers articles

Visuel d'un homme portant des lunettes. Le texte se lit comme suit : Article d'actualité. Andrew Costa. Utiliser les données de l'ELCV pour aider les Canadiens à mieux vieillir. Logo du Réseau canadien de recherche sur les données de santé au bas de la page.

Un jeune homme souriant. Le texte se lit comme suit : Profil. Jaxon Diamond. Conseil consultatif public. Logo du Réseau de recherche sur Ies données de santé du Canada en bas à gauche.

Douze tuiles carrées avec des icônes représentant les données, la technologie et la science. Les logos du Réseau de recherche sur les données de santé du Canada et de Canadian Health Information Management Association figurent ci-dessous.