Dans le dernier épisode de notre série sur les directeurs de l’OMF, nous vous proposons un entretien éclairant avec Wenzhong Xiao, PhD, directeur du Centre de recherche informatique sur les maladies complexes de l’OMF. Le Dr Xiao effectue l’analyse des données pour de nombreuses études cliniques de l’OMF, ainsi que l’analyse des réseaux basés sur la connaissance.
Le cœur du sujet
- Le Centre de recherche informatique sur les maladies complexes de l’OMF, dirigé par Wenzhong Xiao, PhD, effectue l’analyse des données pour de nombreuses études cliniques de l’OMF, en plus de l’analyse des réseaux basée sur les connaissances.
- L’équipe développe des outils utiles à l’analyse de différents types de données, notamment le traitement du langage naturel par l’IA pour les dossiers de santé électroniques et les algorithmes pour la protéomique.
- Leur approche d’analyse de réseaux basée sur les connaissances rassemble les résultats d’études distinctes et de celles menées sur des maladies similaires afin d’orienter les futures pistes de recherche.
- La majorité des travaux de l’équipe de calcul se situe au stade de l’ « analyse des données » du processus de recherche.
Le Centre de recherche informatique sur les maladies complexes de l’OMF, dirigé par Wenzhong Xiao, PhD, est particulièrement bien placé pour combiner les données provenant des centres de collaboration de l’OMF et de l’extérieur afin d’essayer d’acquérir une compréhension globale des mécanismes de l’EM/SFC et des maladies apparentées, d’identifier des biomarqueurs diagnostiques et prédictifs, et de découvrir des cibles thérapeutiques potentielles. À cette fin, l’équipe effectue des analyses pour de nombreuses études cliniques de l’OMF fondées sur des hypothèses, en plus de son travail de calcul.
Pendant l’analyse, l’équipe du Dr Xiao gère une grande variété de types de données, y compris les dossiers médicaux électroniques, les enquêtes, le séquençage génomique, la protéomique, la métabolomique, etc. Les outils informatiques utilisés pour analyser ces données sont souvent spécifiques au type d’étude ou de données évaluées. Par exemple, l’équipe développe des algorithmes qui analysent les milliers de points de données qu’elle obtient de la protéomique. En revanche, lorsqu’elle examine les données des dossiers médicaux électroniques, elle utilise l’intelligence artificielle et le traitement du langage naturel pour analyser les informations.
En plus d’analyser les données dans le contexte d’une étude clinique, l’équipe informatique mène de nouvelles études qu’il n’est pas possible de mener autrement. L’outil d’intelligence artificielle qu’elle a mis au point pour analyser les données des dossiers médicaux électroniques, par exemple, facilite les essais in silico (sur ordinateur), qui permettent d’utiliser les dossiers des patients pour évaluer rétrospectivement les avantages potentiels de différents traitements.
Ces outils aident également l’équipe à surmonter certains des défis traditionnels de la recherche sur l’EM/SFC et les maladies apparentées. Compte tenu des limites de financement que nous connaissons tous trop bien, les études sur l’EM/SFC ont souvent des échantillons plus petits et sont obligées de limiter l’analyse à moins de types de données que ce qui serait idéal. Combiné à une population de patients déjà hétérogène, il peut être difficile de tirer des conclusions utiles ou fiables de ces études lorsque les données sont considérées isolément.
L’équipe informatique de l’OMF utilise une approche d’analyse de réseau basée sur la connaissance pour aborder ces questions, en essayant de donner un sens aux données disponibles. L’analyse de réseau intègre des études distinctes et des informations provenant d’autres maladies afin de mieux comprendre l’EM/SFC et les maladies apparentées. En fin de compte, ces travaux permettront de hiérarchiser les études et les données recueillies compte tenu des ressources limitées.
L’équipe du Dr Xiao est étroitement impliquée dans l’étape d’analyse des données pour de nombreux projets de l’OMF, en plus de son travail de médecine de réseau qui consiste à analyser des données provenant de sources disparates.
Cliquez ici pour lire la transcription de la vidéo
Dr. Meadows : Bonjour à tous et bienvenue dans la dernière vidéo de notre série d’entretiens avec les directeurs de l’OMF. Aujourd’hui, j’ai le plaisir d’accueillir le directeur de notre Centre de recherche informatique, le Dr Wenzhong Xiao. Le Dr Xiao et son équipe se trouvent dans une situation passionnante au Centre de recherche informatique, car ils sont dans une position unique pour rassembler des informations provenant de nos autres centres de recherche, mais aussi de sources extérieures, afin d’essayer de dresser un tableau plus holistique de ce qui se passe dans le cas de l’EM/SFC. Bienvenue donc au Dr Xiao.
Dr Xiao : Merci, Danielle. Je suis ravi d’avoir l’occasion de m’adresser à la communauté des patients.
Dr. Meadows : L’interview d’aujourd’hui sera un peu différente des vidéos précédentes que j’ai réalisées avec d’autres directeurs et, je veux vous parler, Dr Xiao, de deux styles de travail différents que vous effectuez. L’un consiste à analyser les hypothèses de travail, l’autre est plus axé sur le calcul. Si nous pouvions d’abord discuter un peu de certains des outils que vous utilisez pour développer et aider à rassembler toutes les données cloisonnées sur l’EM/SFC, nous pourrions peut-être commencer par là. Pouvez-vous nous donner un bref aperçu de certains des outils que vous utilisez, comme par exemple l’intelligence artificielle, pour analyser les données d’une étude ?
Dr Xiao : Bien sûr ! J’ai eu l’occasion de faire travailler l’équipe sur l’EM/SFC et les maladies apparentées au cours des dernières années, depuis 2016 environ, en collaboration avec l’Open Medicine Foundation. Les études que nous menons en collaboration avec d’autres laboratoires de recherche tentent de comprendre essentiellement le mécanisme de l’EM/SFC et des maladies apparentées, et d’identifier ce que l’on appelle des biomarqueurs diagnostiques et prédictifs. Les biomarqueurs prédictifs sont ceux qui peuvent potentiellement être utilisés pour évaluer l’efficacité des traitements ainsi que les candidats potentiels à cibler dans les traitements.
Les études auxquelles nous participons vont donc des dossiers médicaux électroniques des patients aux enquêtes sur les symptômes et les traitements, en passant par de nombreuses études moléculaires telles que le séquençage génétique, la protéomique, la métabolomique, l’épigénétique, l’analyse cellulaire et d’autres analyses moléculaires.
Les outils que nous utilisons sont en quelque sorte spécifiques à chacune de ces études. Les études génétiques, par exemple, impliquent beaucoup d’analyses de séquences. C’est donc en quelque sorte l’arrière-cour des bioinformaticiens, où l’on apprend à l’université ou à l’école supérieure les moyens rapides et efficaces de comparer ces milliards de séquences à un coût abordable.
C’est donc ce que nous faisons lorsque nous essayons, par exemple, d’identifier des variantes génétiques chez des patients gravement malades dont nous avons séquencé le génome entier et de voir si ces variantes peuvent contribuer au processus de la maladie.
Je pense que nous venons de publier une préimpression, en fait aujourd’hui, et un autre projet sur lequel nous travaillons consiste à essayer de voir si nous pouvons identifier certains de ces auto-anticorps dans l’EM/SFC et les maladies apparentées, et voir si cela provient de ce que l’on appelle le mimétisme moléculaire. En d’autres termes, il s’agit de microbes qui partagent des séquences similaires à celles du protéome humain. Cela implique donc de très nombreux alignements des séquences microbiennes existantes avec le protéome humain. C’est le type d’analyse que nous effectuons généralement.
Lorsque nous étudions la protéomique, nous nous trouvons dans une situation où les protéines peuvent être modifiées. Il faut donc soit développer des algorithmes, soit adapter des algorithmes pour tenter de mener des calculs de manière efficace.
Une fois que nous avons identifié ce qui est significatif, ce que nous appelons la signature de la maladie, la question est de savoir comment lui donner un sens. Classiquement, les gens utilisent l’ontologie des gènes ou l’analyse des voies pour regrouper ces gènes, protéines ou métabolites significatifs en voies et voir quelle voie est enrichie. Il s’agit d’un problème de bioinformatique que les gens reconnaissent depuis les années 80 et 90.
Nous avons eu l’occasion de travailler avec un groupe d’étudiants de Stanford à la fin des années 1990 et au début des années 2000 et de mettre en place un système qui est actuellement utilisé par de nombreuses personnes dans le monde de la recherche pour examiner non seulement les gènes et les voies, mais aussi les régulations génétiques, les régulations métaboliques, et essayer d’exploiter les données d’autres études dans le cadre de cette analyse. C’est ce que nous appelons l’analyse de réseau basée sur les connaissances.
C’est donc le travail typique que nous faisons pour les études moléculaires. D’autre part, lorsque nous examinons le dossier médical électronique des patients, comme vous l’avez mentionné, en raison de l’IA et de l’apprentissage automatique, un grand nombre d’outils basés sur de grands modèles de langage et d’outils de traitement du langage naturel sont utilisés pour extraire des informations des dossiers médicaux électroniques des patients. Nous pouvons donc corréler ces informations avec, par exemple, les traitements et les symptômes des patients et essayer de voir, ce que nous appelons de nos jours des essais cliniques in silico, où l’on examine essentiellement les patients qui ont une chance égale de prendre un médicament particulier mais qui l’ont effectivement pris par rapport aux patients qui ont une chance égale de prendre ce médicament particulier mais qui ne l’ont pas pris, puis on analyse s’il y a une différence significative en termes de symptômes du patient et on suggère ensuite d’utiliser cette information comme ce que l’on appelle des preuves du monde réel pour donner la priorité aux traitements de l’EM/SFC et des maladies apparentées.
Dr. Meadows : C’est très bien, merci pour cette explication. Peut-on dire que lorsque nous pensons aux différents types de données qui sont collectées, vous avez mentionné une grande partie des données omiques, par exemple, vous utilisez des algorithmes que vous développez afin d’analyser ces données. Vous avez mentionné une grande partie des données omiques, par exemple, vous utilisez des algorithmes que vous développez afin d’analyser ces données. En ce qui concerne les dossiers médicaux électroniques, vous utilisez souvent des outils tels que l’IA pour donner un sens à toutes les notes cliniques et à tous les éléments intégrés dans le dossier médical électronique, puis en combinant ces différents types de données dans l’analyse que vous avez effectuée, vous étendez cette analyse par le biais d’une analyse de réseau, en apportant des données provenant d’autres sources pour essayer d’identifier les cibles de traitement les plus prometteuses. Cela vous semble-t-il correct ?
Dr. Xiao : Oui, absolument. Excellent résumé.
Dr. Meadows : C’est très bien. Ensuite, j’aimerais peut-être développer un peu le côté médecine de réseau, le côté analyse de réseau. Pouvez-vous nous parler un peu plus de ce processus et de ce à quoi il ressemble pour quelqu’un de l’extérieur ?
Dr. Xiao : Bien sûr, bien sûr, absolument. Grâce à cette analyse de multiples ensembles de données, nous nous sommes rendu compte, et beaucoup de gens dans la communauté le savent probablement avant nous, que l’EM/SFC est sous-étudié par rapport à beaucoup d’autres maladies. En d’autres termes, lorsque l’on compare ce que l’on appelle les sites d’échantillonnage d’une étude typique sur l’EM/SFC à certaines maladies bien étudiées comme le cancer ou les maladies cardiaques, la taille de l’échantillon est beaucoup plus petite.
De plus, nous n’avons généralement pas la possibilité d’effectuer des études multi-niveaux ou multi-omiques sur les mêmes patients. Je pense que cela est dû en grande partie à la limitation du financement. De nombreuses études ne portent donc que sur une seule dimension, soit la génétique, soit la protéomique ou la métabolomique des patients.
Ainsi, certains de ces outils traditionnels permettant d’exploiter ces multiples niveaux d’information sur les mêmes patients et leurs informations cliniques ne peuvent malheureusement pas encore être appliqués directement aux études sur l’EM/SFC. De plus, il existe souvent des différences significatives dans les ensembles de données recueillies par les différentes études, probablement en raison de l’hétérogénéité de la maladie. Cela fait partie de la complexité de cette maladie.
Nous avons donc pensé qu’une autre approche pourrait consister à intégrer les études que nous avons vues jusqu’à présent avec celles qui ont été réalisées pour d’autres maladies ainsi qu’avec les résultats obtenus. Ou encore, cette idée de connaissance basée sur d’autres maladies.
L’idée est que si nous pouvons identifier les maladies qui sont bien étudiées et qui ressemblent à l’EM/SFC, nous pourrons peut-être examiner ces maladies et voir ce qu’elles ont en commun. Cela nous permettra peut-être d’identifier le système pathologique, qu’il s’agisse d’un problème neurologique ou métabolique, ou des voies ou des gènes particuliers que nous pourrions étudier en priorité, compte tenu des ressources limitées dont nous disposons pour l’EM/SFC.
C’est ce sur quoi nous nous sommes concentrés ces deux dernières années. Et nous essayons de pousser ce processus un peu plus loin. C’est-à-dire que si nous identifions effectivement l’ensemble des maladies qui sont similaires à l’EM/SFC à plusieurs niveaux, nous pourrons peut-être même considérer certaines des maladies les plus courantes. Peut-être pourrons-nous même envisager certains des traitements médicamenteux qui se sont révélés efficaces dans ces maladies similaires. C’est donc quelque chose qui est en cours à l’heure actuelle, et qui nécessiterait évidemment une vérification et des essais cliniques pour vérifier si ces prédictions sont effectivement vraies.
Dr. Meadows : C’est très bien. D’une certaine manière, vous pouvez essayer de surmonter certains des défis que nous rencontrons avec l’EM/SFC en général, et l’hétérogénéité de la population. Ainsi, de nombreuses études ne sont pas en mesure d’examiner tous les aspects que nous aimerions examiner dans le cadre d’une petite étude.
Il est donc possible d’utiliser certains des éléments que nous observons dans des maladies similaires, des comorbidités, etc. et d’essayer de dégager des similitudes pour identifier la meilleure cible médicamenteuse.
Dr. Xiao : Exactement.
Dr. Meadows : D’accord, merci. Il est également possible d’examiner les différents niveaux. Vous pouvez donc étudier les gènes, mais aussi les protéines, la transcriptomique, la métabolomique, toutes ces choses différentes et les rassembler.
Dr. Xiao : Oui.
Dr. Meadows : C’est formidable ! Très bien, je pense qu’avec cela, nous allons conclure cette courte interview d’aujourd’hui. Je tiens à vous remercier pour le temps que vous nous avez consacré aujourd’hui, Dr Xiao.
Dr. Xiao : Absolument. C’est un plaisir de parler avec vous.
Le programme StudyME de l’OMF est un outil de recrutement mondial gratuit qui met en relation les personnes souhaitant participer à des études de recherche et les chercheurs qui les mènent. Rejoignez le programme StudyME de l’OMF, et montrons au monde entier combien de personnes veulent un remède.
Votre soutien aide à rendre possible cette recherche révolutionnaire. Envisagez de faire un don dès aujourd’hui pour faire progresser notre compréhension de l’EM/SFC.