Depuis le début de l'aventure Lifen, nous avons toujours été convaincus que l'Intelligence Artificielle représente un moyen d’améliorer la qualité des soins et de simplifier la vie quotidienne des professionnels de santé en les déchargeant des tâches fastidieuses et à faible valeur ajoutée, telles que la double-saisie.
Lifen Intégration permet d’intégrer les documents médicaux en quelques clics dans le DPI : une fois importés, les documents sont analysés par l’IA afin de réduire au minimum les entrées manuelles et les erreurs. L’objectif est donc de faciliter le travail des équipes.
Jusqu'à présent, notre intelligence artificielle a permis l’analyse de 75 millions de documents. Elle a été formée et continue de s’améliorer en permanence sur la base de ces documents analysés quotidiennement.
Comment notre Intelligence Artificielle se met-elle au service de l’intégration de documents médicaux ?
Nous avons interviewé Bettina Sarafis, Machine Learning Engineer chez Lifen, pour comprendre comment Lifen Intégration est au service de l’intégration de documents et permet ainsi de libérer du temps pour les équipes médicales.
L'intelligence artificielle (IA) est le concept qui permet à une machine ou à un système de détecter, de raisonner, d'agir ou de s'adapter comme un humain.
Le machine learning (ML) est une application de l’Intelligence Artificielle : grâce au ML, le système apprend et s’améliore de manière itérative. Le machine learning utilise des algorithmes pour analyser une quantité conséquente de données, les apprendre et ainsi prendre des décisions adaptées en toute autonomie. Plus le système est entrainé (et donc le plus de données est utilisées), plus il est performant.
L'objectif du machine learning est d'apprendre à une machine à exécuter une tâche spécifique et à fournir des résultats précis en identifiant des modèles.
[Source]
Notre Intelligence Artificielle est entrainée selon une boucle qu’on peut diviser en 3 parties :
L'IA détecte les documents entrants téléchargés par les utilisateurs sur l’application Lifen. Les utilisateurs peuvent mettre à jour la détection. Dès lors qu’un document est importé dans Lifen Intégration par un utilisateur, notre intelligence artificielle est appelée afin de prédire dans le document les informations nécessaires à son intégration (qui est le patient ? quel est la date de séjour ? quel est le type du document ?).À chacune de ces informations prédites - qui est le patient ? par exemple - est associé un niveau de confiance - à quel point je suis sure que cette information prédite est vraie ?En fonction de ce niveau de confiance, l’intégration sera possiblement automatique. Sinon l’utilisateur va devra valider ou modifier certaines des informations pré-remplies, correspondants aux prédictions de notre IA. Ensuite, les utilisateurs valident les métadonnées des documents pour déclencher des flux de travail en aval, tels que les intégrations dans le DPI.
Notre intelligence artificielle est entraînée sur un dataset de documents le plus représentatif de la donnée réelle. Ce dataset de documents est construit à la main par notre équipe d’ingénieurs en Machine Learning. Cet étape s’appelle l’”étiquetage”. On associe à chaque document du dataset une étiquette avec la vérité : qui est le patient, quel le type de document etc.
Grâce aux modifications des utilisateurs, on sait sur quels documents notre intelligence artificielle fait défaut et donc sur quels documents il faut se baser pour l’améliorer. Cela permet aux ingénieurs en Machine Learning de choisir les documents pertinents pour valider manuellement les nouvelles étiquettes à ajouter à l'ensemble de données d'apprentissage.
Au fur et à mesure que les utilisateurs valident ou modifient les métadonnées des documents (informations pré-remplies correspondants aux prédictions de notre IA), les identifiants des documents sont stockés avec des informations sur les validations des utilisateurs (par exemple, le type de document détecté par l'IA était correct, mais le prénom du patient est erroné). Cela permet aux ingénieurs en Machine Learning de choisir les documents pertinents pour valider manuellement les nouvelles étiquettes à ajouter à l'ensemble de données d'apprentissage. Afin de valider la vérité terrain pour les modèles (détection de code-barres, type de document) sur lesquels s'entraîner, les équipes n’ont accès qu’au texte pseudonymisé et/ou image flou qu’ils examinent.
Au fur et à mesure que de nouveaux documents étiquetés sont ajoutés au dataset d'entraînement, de nouveaux modèles peuvent être entraînés et évalués. Celle-ci doit apprendre de nouvelles expressions et patterns et ne pas désapprendre les anciens). Cette nouvelle IA peut ensuite être intégrée dans l’application pour remplacer le modèle utilisé pour l’'inférence (la première partie).
La boucle est bouclée.
les candidats modèles les plus pertinents (modèles qui ont appris de nouvelles expressions et n'ont pas désappris les anciennes) sont ensuite intégrés dans l'IA d'inférence pour boucler la boucle.
Le principe de notre Intelligence Artificielle est de de détecter dans le document, les informations nécessaires à l'intégration de celui-ci de manière automatique.
Nos modèles ont une architecture qu’on peux découper en 2 étapes :
Ces artefacts appartiennent à deux catégories principales :
On veut représenter les mots en fonction de leur signification. Avec cette représentation, paracétamol et Doliprane ont une représentation vectorielle proche, tandis que chaussure et patient vont avoir une représentation plus éloignée. Cette première étape est commune à tous nos algorithmes (on utilise le même modèle, modèle de type Language model) et permet au modèle de s’adapter à un grand nombre de templates de documents sans jamais les avoir vu.
On apprend à notre IA à réaliser une tâche bien précise comme extraire le patient ou la date de séjour. On a un modèle par tâche.
La boucle d’entraînement de notre IA permet de produire des artefacts (également appelés modèles) à partir des données brutes et, le cas échéant, des étiquettes de vérité terrain.
Depuis le logiciel métier, les professionnels de santé peuvent envoyer des documents à leurs correspondants sur tous les canaux (MSSanté, Apicrypt, postal, boîte mail classique).
Notre Intelligence Artificielle détecte automatiquement les destinataires et les praticiens peuvent préciser dans notre annuaire, le plus à jour de France, leur préférence de réception et automatise l'envoi.
Notre IA permet de rationaliser et automatiser massivement l'envoi de documents médicaux.
Grâce à l’Intelligence Artificielle, les équipes peuvent automatiser l'intégration via l'extraction automatique d’informations des documents apportés par les patients (documents scannés), les documents en pièces joints des mails MSSanté reçus, les documents numériques internes à l’établissement.
Tous les documents de toute source sont centralisés au sein de Lifen puis intégrés au sein du DPI.
Nous utilisons une seule et même Intelligence Artificielle pour nos produits. Cependant, en fonction de la solution utilisée (Lifen Documents ou Lifen Intégration), ce ne sont pas les mêmes informations qui sont extraites.
Lorsque Lifen Intégration est utilisée, plusieurs informations sont demandées : identité du patient, date de séjour, type de documents médicaux. Notre IA va scanner le document. En fonction du contexte du documents et des zones de texte, elle va détecter qui est le patient, quels sont les destinataires, quelle est la date du séjour.
L’identité du patient est détectée sur la base du Nom Prénom, Prénom, Date de naissance. Ces informations seront ensuite rapprochée avec les identités présentes dans la GAM / GAP de l’établissement (garantissant la bonne identification du patient).
Lors de la détection du type de document : une quinzaine sont détectables par notre Intelligence Artificielle. Nous basons les types de documents sur la base LOINC , qui est la référence pour les types de documents médicaux. Les principaux types de documents qu’on retrouve sont : les compte-rendus d'opérations, lettre de liaison, prescription, compte-rendu d'examen de bio, etc.
LOINC est un langage commun (un ensemble d'identifiants, de noms et de codes) permettant d'identifier les mesures, les observations et les documents relatifs à la santé. LOINC est un riche catalogue de mesures, notamment des tests de laboratoire, des mesures cliniques telles que les signes vitaux et les mesures anthropométriques, des instruments d'enquête normalisés, etc. La base contient également des codes pour les collections de ces éléments, tels que les panels, les formulaires et les documents.
Elle permet l'échange et l'agrégation de résultats cliniques pour la prestation de soins, la gestion des résultats et la recherche, en fournissant un ensemble de codes universels et de noms structurés pour identifier sans ambiguïté les éléments que l'on peut mesurer ou observer.
Sur la base des métadonnées détectées par l'IA, nous allons pouvoir intégrer le document dans le DPI au bon endroit pour le bon patient, à la bonne date et et avec le bon type de document.
Sur les 12 derniers mois, notre Intelligence Artificielle a analysé 23,5 millions documents uniques. 88% de ces documents sont prêts à l’envoi et nous avons 98,8% de taux de détection patient.
En utilisant notre application, il y a donc à la fois le gain de temps pour l'utilisateur, mais aussi un gain de sécurité face aux erreurs humaines.
Dans 91% des cas, l’IA va détecter toutes les informations. L’utilisateur n’aura rien à faire et le gain de temps est alors important.
Dans les 9% restants, l’utilisateur devra vérifier les informations pré-remplies par l’IA dans le document ou les remplir lui-même.
Par exemple, l’utilisateur devra :
Dans tous les cas, la majeure partie du travail aura déjà été faite.
Un second bénéfice a pu être constaté sur la réduction du nombre d’erreurs.
Les secrétariats et médecins intègrent quotidiennement des dizaines de documents et doivent donc remplir manuellement des centaines de champs. Des erreurs peuvent alors s’immiscer dans les informations remplies.
Utiliser une IA avec ce niveau de confiance et avec les vérifications qui sont demandées aux utilisateurs, permet de générer beaucoup moins d'erreurs humaines. En effet, notre application est branchée à la GAM de l'établissement. Donc lorsqu'on détecte un patient, il faut que ce patient existe dans la GAM sur la base de plusieurs traits d'identification : et par conséquent nos règles métier permettent donc de sécuriser l'intégration des documents au bon endroit.
In fine, que les champs soient complétés automatiquement grâce à l’IA ou manuellement par les personnes en charge de l’intégration des documents dans le DPI, Lifen Intégration permet aux professionnels de santé de bénéficier d’une meilleure lisibilité des dossiers patients, et donc globalement, à l’établissement de disposer d’un DPI plus qualitatif.
En résumé, grâce à Lifen Intégration, les documents médicaux sont intégrés en quelques clics dans le DPI : une fois importés, les documents sont analysés par l’IA pour en extraire les informations clés, dont l’identité patient, qui est matchée avec les identités présentes dans la GAM / GAP de l’établissement.
Lorsque les informations sont validées, les documents sont intégrés dans le DPI. Le processus est totalement automatisé et les interventions humaines limitées au strict minimum.
Lifen Intégration permet ainsi aux secrétaires de gagner du temps en matière d’intégration de documents dans le DPI tout en fiabilisant les informations reportées dans les dossiers patients.