Projet « PARTAGES » : un corpus de plus de 6 000 comptes-rendus médicaux publiés
Le traitement automatique des langues (TAL) présente de nombreux cas d’usages stratégiques en santé : la transcription automatique des échanges en consultation, le résumé automatique des dossiers médicaux, voire l’assistance dans la décision clinique ou les tâches médico-administratives. De façon générale, ces nouveaux outils peuvent améliorer la qualité de travail du personnel médical ainsi que la relation patient-soignant, avec des bénéfices significatifs à la clé pour le système de santé publique.
Pour répondre à ces enjeux, le Health Data Hub* et ses partenaires ont construit « PARTAGES » (déveloPpement Avancé de communs numéRiques pour l’inTelligence Artificielle Générative En Santé) dans le cadre de l’appel à projets « communs numériques pour l’intelligence artificielle générative » de France 2030. Opéré pour le compte de l’État par Bpifrance, ce dispositif vise à accélérer la création et la mise en accessibilité de communs numériques sur l’ensemble de la chaîne de valeur de l’IA générative afin d’en assurer l’utilisation, par le plus grand nombre, et d’en favoriser l’émergence de produits et services innovants.
Un projet ambitieux et multi-partenarial incluant le GCS HOURAA
Ce projet rassemble 32 acteurs français, dont des laboratoires de recherche (CNRS, INRIA, universités), des établissements de santé publics et privés, ainsi que des entreprises deep tech. Cette mobilisation vise à concevoir des outils adaptés aux besoins concrets des professionnels de santé et à démocratiser l’IA générative en santé.
« PARTAGES est une initiative qui traduit notre volonté de construire des solutions innovantes grâce à une approche par cas d’usage. Grâce à cette collaboration avec le Health Data Hub et d’autres acteurs majeurs, le GCS HOURAA s’investit pour co-développer des outils d’intelligence artificielle qui répondront à des enjeux concrets. Ce projet est une opportunité unique pour les CHU de notre région de contribuer à l’élaboration de solutions durables, ouvertes et centrées sur les besoins des professionnels de santé », précise Angèle ROCHEREAU-BOSSARD, Déléguée générale du GCS HOURAA.
Et concrètement, comment cela va se passer pour le GCS HOURAA ?
Le GCS HOURAA bénéficie de financements pendant deux ans afin de recruter les ressources nécessaires pour évaluer les algorithmes qui seront fournis sur trois cas d’usages (c’est-à-dire spécialiser les modèles de langage pré-entrainés).
Les trois cas d’usages définis :
- Pseudonymisation automatique des données textuelles de santé pour toute utilisation secondaire des données de santé sur les autres cas d’usage.
- Résumé structuré de comptes rendu médicaux pour le personnel médical afin de gagner du temps.
- Aide au codage de l'information médicale pour faciliter la classification des prestations hospitalières et le remboursement par l'Assurance maladie.
L’ensemble des modèles développés seront mis à disposition en open-source pour une utilisation libre.
« PARTAGES permet d’initier et de roder notre organisation régionale scientifique et d’exploitation de données de vraies vies, présentes au sein de notre HUB d’EDS en cours de déploiement dans les 4 CHU parties-prenantes du GCS HOURAA. Il s’agit non seulement de contribuer aux développements nationaux de nouveaux outils dans le domaine du numérique en santé impliquant de l’IA, en s’appuyant sur la richesse de nos données hospitalières, mais également de s’approprier et d’évaluer localement le service rendu par ces nouveaux outils au service des usagers. Cette évaluation du service rendu sera naturellement réalisée en étroite interaction avec les usagers, selon des principes méthodologiques de référence dans le domaine, et constituera une véritable clé pour contribuer à une acceptabilité pérenne ou non de ces nouveaux outils », précise le Pr Alexandre MOREAU-GAUDRY, spécialiste de Santé Publique Numérique et de l’évaluation du service rendu d’Innovation Technologique au sein du CHU Grenoble Alpes.
Du nouveau en 2026
En premier livrable du projet PARTAGES, un corpus de plus de 6 000 comptes-rendus médicaux de patients fictifs rédigés par les praticiens partenaires du projet ont été publiés. Élaboré à partir de situations cliniques fictives, le corpus de comptes-rendus médicaux ne contient aucune donnée issue de patients réels. Il peut ainsi être mobilisé librement, sans aucune contrainte réglementaire, tout en conservant un haut niveau de réalisme et de pertinence clinique. En plus de ce corpus, PARTAGES met à disposition :
- un guide méthodologique encadrant la production et la relecture des comptes-rendus,
- des sous-ensembles annotés du corpus,
- quatre guides d’annotation dédiés aux cas d’usage du projet,
- un corpus de données médicales ouvertes (articles scientifiques, notices de médicaments, cas cliniques) ayant servi à l’entraînement de modèles de fondation.
* Le Health Data Hub est un groupement d’intérêt public (GIP) qui garantit l’accès aisé et unifié, transparent et sécurisé. Il facilite les interactions entre producteurs des données de santé, utilisateurs et citoyens, dans des conditions élevées de sécurité, et contribue ainsi à l'innovation et à fédérer l'écosystème de la santé numérique.
- Groupement de coopération sanitaire HOURAA (GCS HOURAA) - Rubrique
- Partenariats et coopérations - Rubrique
- Services numériques - Rubrique
Avec ces innovations, le GCS HOURAA confirme sa volonté de contribuer activement à la construction d’un écosystème de santé connecté et performant. En favorisant la collaboration entre l’ensemble de ces acteurs, ce projet participe à placer la France parmi les leaders mondiaux de l’IA générative appliquée à la santé.