Un outil de calcul novateur, le scSemiProfiler, rend la puissante technologie du séquençage sur cellule unique plus accessible pour la recherche dans le domaine de la santé

Le séquençage sur cellule unique est une technologie novatrice dans le secteur de la recherche dans les domaines de la biologie et de la médecine personnalisée. Cette technologie peut fournir des renseignements au niveau d’une seule cellule, permettant ainsi d’approfondir la compréhension de la complexité cellulaire. Elle peut également améliorer l’identification et la caractérisation des sous-populations cellulaires dans les échantillons de patientes et de patients, favoriser la découverte de biomarqueurs et améliorer des traitements personnalisés. Toutefois, les coûts prohibitifs des méthodologies traditionnelles limitent substantiellement l’application de cette technologie dans la recherche dans les domaines de la santé et de la médecine personnalisée, plus particulièrement dans les études à grande échelle.

Le chercheur Jun Ding, Ph. D., qui est titulaire d’une bourse prestigieuse du Fonds de recherche du Québec – Santé dans le domaine de l’intelligence artificielle en santé, est en train de changer ce paradigme. Avec son équipe de l’Institut de recherche du Centre universitaire de santé McGill (IR-CUSM), il a dirigé le développement d’un outil de calcul novateur, connu sous le nom de scSemiProfiler. Ce nouvel outil a été décrit dans un article publié récemment dans Nature Communications; les rédacteurs en chef de cette publication ont mis ce dernier en vedette comme étant l’un des 50 meilleurs articles publiés dans le domaine. Le nouvel outil de calcul rendra la technologie de séquençage sur cellule unique plus accessible pour la recherche. Il combine l’intelligence artificielle (IA) générative avec l’apprentissage actif, dans le but de créer des profils de données s’appliquant à des cellules uniques, ce qui permet d’obtenir des résultats de grande qualité à une simple fraction du coût du séquençage traditionnel sur cellule unique.

.Jun Ding (à gauche) dirige les travaux de recherche au sein du Programme de recherche translationnelle sur les maladies respiratoires à l’IR-CUSM. Le candidat au doctorat Jingtao Wang (au centre) est le premier auteur de l’article publié dans Nature Communications.

« L’outil novateur qu’est le scSemiProfiler permet d’accroître la portée du séquençage sur cellule unique à des applications de recherche plus larges et à des cohortes de personnes atteintes d’une maladie complexe, explique le professeur Ding, scientifique junior au sein du Programme de recherche translationnelle sur les maladies respiratoires à l’IR-CUSM et professeur adjoint au Département de médecine de l’Université McGill. Selon des évaluations du Centre universitaire de santé McGill datant de 2023, le séquençage de 20 000 cellules peut coûter environ 6 000 $, ce qui rend cette opération impossible dans le cas de projets de recherche à grande échelle. Toutefois, avec le scSemiProfiler, nous pouvons changer la donne. »

Développement d’une approche de « semi-profilage »

Jusqu’à maintenant, les chercheuses et les chercheurs ont eu recours à différentes méthodes pour tirer des conclusions à partir de données de masse obtenues au moyen de méthodes de séquençage plus abordables. Malgré leur utilité, ces méthodes n’offraient pas la résolution détaillée nécessaire pour les analyses effectuées sur cellule unique, ce qui s’avère crucial pour comprendre les maladies complexes.

Par contre, l’équipe de l’IR-CUSM a conçu une méthode permettant d’effectuer précisément et efficacement le « semi-profilage » sur cellule unique de cohortes de personnes atteintes d’une maladie donnée. L’outil scSemiProfiler tire parti des données de masse et des modèles de séquençage sur cellule unique provenant d’échantillons représentatifs. Les chercheurs ont démontré que le scSemiProfiler produit des ensembles de données très précis et compatibles avec les données obtenues au moyen du profilage complet, ce qui leur permet de mettre à profit des renseignements provenant des données de masse, tout en produisant de manière plus économique des données relatives au séquençage sur cellule unique.

« Nous pouvons pour l’essentiel diviser l’ensemble du cadre de travail en deux grandes parties, qui jouent toutes deux un rôle important pour ce qui est de produire un semi-profilage précis et efficace, ajoute Jingtao Wang, candidat au doctorat au sein du Programme de biologie computationnelle en médecine expérimentale à la Faculté de médecine et des sciences de la santé de l’Université McGill, et premier auteur de la publication. La première partie est ce que nous appelons la « sélection représentative », au cours de laquelle nous choisissons les échantillons de cellules uniques les plus représentatifs. Nous qualifions la seconde partie de “référence in silico”, qui fait référence au processus par lequel on déduit quelles sont les données relatives à la cellule unique cible au sein des données de masse. »

Le modèle génératif d’apprentissage profond reconstruit d’abord les données de référence de la cellule unique, puis introduit les renseignements relatifs à l’échantillon cible en exigeant que les données relatives à la cellule unique ainsi générées aient une valeur moyenne similaire à celle des données de masse relatives à l’échantillon cible.

« Le séquençage sur cellule unique est un outil d’une importance cruciale pour l’élucidation des subtilités des maladies complexes, poursuit le professeur Ding. Nous sommes ravis que notre outil soit en mesure de réduire le coût prohibitif du séquençage, plus particulièrement dans les études biomédicales plus vastes.»

Les prochaines étapes de nos travaux sont l’amélioration, la maintenance et la démocratisation de l’outil de calcul, concluent les chercheurs. Ils ont déjà rendu le scSemiProfiler accessible sur la plateforme GitHub à l’intention de la communauté scientifique. On créera par la suite un service infonuagique, dans le but de faciliter l’adoption de cet outil par des chercheuses et des chercheurs qui n’ont pas accès à de vastes ressources computationnelles.

« Nous sommes très honorés que l’équipe de rédaction en chef de Nature Communications ait décidé de mettre en vedette notre article sur le scSemiProfiler dans sa section Editor’s highlights publiée récemment, conclut le professeur Ding. Cette reconnaissance souligne l’importance de disposer d’outils efficaces par rapport au coût pour faire avancer la recherche sur les complexités cellulaires des maladies complexes. »

Les chercheurs reconnaissent avoir reçu du financement des Laboratoires Meakins Christie, qui ont octroyé une subvention à Jun Ding pour la chaire de recherche sur les maladies respiratoires, de même que des subventions des Instituts de recherche en santé du Canada, du Conseil de recherches en sciences naturelles et en génie du Canada et du Fonds de recherche du Québec – Santé.

Les chercheurs remercient aussi sincèrement l’équipe des services des technologies de l’information (TI) de l’IR-CUSM de son soutien technique et logistique.

À propos de l’article

Wang, J., Fonseca, G.J. et Ding, J., scSemiProfiler: Advancing large-scale single-cell studies through semi-profiling with deep generative models and active learning. Nat Commun 15, 5989 (2024). https://www.nature.com/articles/s41467-024-50150-1