Santé — La révolution du séquençage de prochaine génération

Michaël Sabeh — Programme de maîtrise en sciences biologiques

Santé — La révolution du séquençage de prochaine génération

Les nouvelles technologies de séquençage font partie des technologies qui évoluent actuellement le plus rapidement[1]. À ce rythme, elles feront en sorte que, dans quelques décennies, le séquençage du génome de chacun devienne chose courante dans la prévention et le traitement des maladies. Les scientifiques s’affairent activement afin d’exploiter au mieux ces informations génétiques et ainsi révolutionner le monde de la médecine. En l’an 2000, à la veille de la publication du premier génome humain presque complété, le président américain Bill Clinton a annoncé que ce génome « révolutionnera le diagnostic, la prévention et le traitement de la plupart, sinon de la totalité, des maladies humaines[2] ». À l’époque, on ne devinait toutefois pas l’énorme travail qu’il restait encore à faire avant que ce voeu ne devienne réalité.

Le séquençage du génome, qui consiste à déterminer l’ordre précis des nucléotides (molécules formant les unités de base dont la chaîne constitue l’ADN) de l’ensemble du matériel génétique d’un individu, devrait devenir chose courante dans les hôpitaux occidentaux d’ici quelques décennies. Cette information permettra, par exemple, de déterminer si un patient présente les mutations génétiques responsables d’une maladie particulière avant qu’il ne la développe. Non seulement elle servira alors à diagnostiquer ou à prévenir une maladie, mais elle guidera aussi la médecine de demain dans le choix du traitement qui conviendra le mieux à chacun[3].

Plusieurs de ces mutations génétiques sont en outre déjà connues, car elles sont de nos jours largement étudiées. Mais le séquençage coûte encore trop cher pour servir d’outil dans les hôpitaux.

L’ADN et l’ARN, les bases pour comprendre le séquençage

L’acide désoxyribonucléique (ADN) est une molécule, contenue dans les cellules, qui englobe l’ensemble des informations génétiques nécessaires à la vie. L’ADN a une structure très complexe : il est organisé en doubles brins, puis enroulé autour de protéines qui forment les chromosomes. L’humain possède 23 paires de chromosomes. Ces derniers, qui constituent le génome, sont de longues chaînes d’ADN qui contiennent l’ensemble de nos gènes, une multitude d’éléments régulateurs ainsi que d’autres éléments dont les fonctions sont encore inconnues. L’ADN est constitué de quatre nucléotides — A, T, C et G —, qui sont liés par paires et dont la suite permet de synthétiser les différentes protéines qui forment les outils nécessaires au fonctionnement de la cellule. Chez l’humain, le génome est composé d’environ 3,2 milliards de paires de bases (les nucléotides), pour un total de 20 000 à 25 000 gènes environ.

Avant d’être utilisé par la cellule, l’ADN est tout d’abord transcrit en acide ribonucléique (ARN). Tous les ARN, selon leur structure, remplissent une fonction particulière ou servent d’intermédiaires pour la synthèse d’une protéine. Ces ARN intermédiaires, dits messagers (ARNm), sont donc traduits en protéines qui accompliront une fonction précise dans une cellule, par exemple : transporter de l’eau, intervenir dans le cycle du glucose ou encore reconnaître un agent pathogène.

Séquencer le génome, c’est déterminer l’ordre précis des nucléotides de l’entièreté de l’ADN. Il est aussi possible de séquencer de l’ARN, c’est-à-dire de tous les gènes qui sont transcrits (exprimés) à un moment précis. Il est alors question du séquençage du transcriptome, une technique quantitative qui peut être utilisée dans des études d’expression des gènes. Quand il est effectué à différents moments dans le cycle de vie d’un organisme, le séquençage de l’ARN permet d’étudier la dynamique du transcriptome ; quand il est plutôt effectué sur plusieurs espèces proches, il aide les chercheurs à comprendre les différences liées à des mutations dans les séquences de nucléotides et dans le profil d’expression de gènes communs à ces espèces[4].

 Les débuts du séquençage

Frederick Sanger, un biochimiste anglais, a reçu deux prix Nobel de chimie (1958 et 1980), le second pour avoir développé une méthode permettant d’obtenir la séquence d’un fragment d’ADN. Cette méthode, conçue à la fin des années 1970, est aujourd’hui connue sous le nom de « séquençage Sanger ». Toute première technique de séquençage (d’ailleurs encore utilisée de nos jours), elle a connu beaucoup d’améliorations au cours des trois décennies subséquentes.

La technique de Sanger consiste à synthétiser le deuxième brin d’ADN en laboratoire et à arrêter la synthèse de manière aléatoire. Le dernier nucléotide à s’ajouter aura la particularité d’avoir un marqueur fluorescent, et une couleur différente est associée à chacun des quatre nucléotides, ce qui permettra de les différencier. En répétant l’exercice plusieurs fois, les chercheurs obtiennent une multitude de fragments de différentes longueurs, qu’ils peuvent ensuite séparer par ordre de grandeur. Cette méthode leur donnera une suite de couleurs correspondant à la séquence d’ADN.

Cette technique, qui était longue, coûteuse et laborieuse, est maintenant automatisée et largement accessible dans des centres de séquençage. Elle permet aujourd’hui d’obtenir avec grande précision la séquence de longs fragments à un coût infime. Malgré ce bas coût « unitaire », le séquençage du génome humain avec cette technique reste incroyablement élevé (plus d’un million de dollars) étant donné la longueur de celui-ci, ce qui a poussé le développement des technologies de séquençage à haut débit, aussi appelé « séquençage de prochaine génération[5] ».

Lumière sur les technologies de séquençage à haut débit

Plusieurs technologies ont vu le jour au cours de la dernière décennie et se font concurrence afin de dominer le marché du séquençage. Ion Torrent et Illumina sont parmi les plus importantes.

Les appareils de la technologie Ion Torrent isolent des fragments d’ADN sur des microbilles. Ces fragments d’ADN sont ensuite copiés plusieurs fois afin d’obtenir plusieurs fragments identiques par bille. Ces microbilles sont alors déposées sur une plaque dotée de micropuits et d’un semi-conducteur qui détecte la libération d’ions hydrogène dans chaque puits. Cette technique assure de ne placer qu’un fragment d’ADN par bille (plusieurs fragments identiques à la suite de la copie) et qu’une bille par puits. Lors du séquençage, le brin complémentaire au brin fixé à la bille est synthétisé. Un seul nucléotide y est ajouté à la fois s’il correspond au brin de départ permettant la synthèse du brin complémentaire, libérant ainsi des ions hydrogène, qui sont détectés par le semi-conducteur. L’appareil permet donc de déterminer la séquence des nucléotides venus s’ajouter au brin complémentaire. La plaque contient plusieurs millions de micropuits afin d’analyser des millions de séquences simultanément.

La technologie Illumina, quant à elle, se base sur la lumière afin de séquencer l’ADN. Tout comme Ion Torrent, elle séquence des millions de fragments d’ADN à la fois. Les fragments sont cependant placés sur une plaque et, après avoir été copiés plusieurs fois, y forment des amas de séquences identiques. Dans cette technique aussi, un nucléotide doit correspondre au nucléotide du premier brin pour se fixer au brin complémentaire, en voie de synthèse. Lorsque ce nucléotide s’ajoute, une molécule émet de la lumière. La machine prend alors une photographie et, comme chaque nucléotide émet une lumière différente, il est possible de déterminer la séquence des nucléotides en fonction de la couleur émise par chacun.

Ces nouvelles technologies ont permis de réduire drastiquement le coût du séquençage, passant, pour le génome humain, d’environ 100 000 000 $ au début du siècle… à moins de 10 000 $ en 2012 ! De plus, les deux techniques présentent un taux d’erreur extrêmement faible. Elles ont néanmoins un grand défaut : elles ne peuvent pas séquencer des fragments de grande taille. Il faut donc maintenant assembler des millions de petites séquences par bio-informatique ! C’est ainsi que des équipes de recherche ont développé des algorithmes informatiques pour rattacher ces millions de séquences en un génome complet.

Le séquençage de troisième génération verra bientôt le jour. Ces nouvelles technologies très prometteuses permettront en effet de séquencer un génome en bien moins d’étapes, grâce à des fragments de très grande taille. L’arrivée de ces technologies pourrait réduire davantage le coût du séquençage et pourra certainement le rendre accessible à tous.

Où en est la science ?

L’utilisation du séquençage d’un génome dans le diagnostic de maladies devait initialement consister à trouver la probabilité qu’une mutation génétique soit responsable d’une maladie. Cette probabilité était basée sur la fréquence de cette mutation génétique chez les patients malades comparativement à des individus sains. Le médecin devait ensuite rechercher ces mutations par des méthodes moins coûteuses. Cependant, une telle approche n’a pas donné de résultats concluants, car l’identification de mutations génétiques spécifiques à des maladies n’entraînait pas un diagnostic sûr. Malgré ce constat d’échec, des études ont tout de même permis de déterminer un pourcentage de risque de développer certaines maladies. Ces tests, maintenant largement accessibles, ne sont toutefois pas assez fiables pour être utilisés dans les hôpitaux.

C’est pourquoi les chercheurs dirigent maintenant leurs espoirs vers le séquençage du génome entier de chaque patient. En effet, en sachant dès l’enfance qu’elle est à risque de développer des maladies cardiovasculaires, puisqu’elle possède une certaine mutation génétique, une personne ne changerait-elle pas son mode de vie, par exemple en ne consommant pas de tabac ou encore en réduisant son apport en cholestérol ? Lorsqu’il n’en coûtera que quelques milliers de dollars pour faire séquencer son génome, gouvernements et compagnies d’assurance préféreront probablement le diagnostic préventif à une vie entière de traitements coûteux. Aux États-Unis, des lois sont déjà établies sur l’interdiction de la discrimination génétique, tant pour empêcher les compagnies d’assurance de refuser des clients que pour empêcher des employeurs de refuser des candidats « porteurs » de maladies génétiques.

D’autre part, les coûts du séquençage diminuant sans cesse, il est de plus en plus courant que les laboratoires de recherche aient recours à cette méthode dans les études qu’ils effectuent, avec des résultats réellement intéressants. Par exemple, l’identification de gènes essentiels à l’infection d’organismes parasites a été réalisée à l’aide du séquençage, permettant de mieux comprendre les processus d’infections[6]. C’est cependant une technologie qui offre une trop grande quantité de données par rapport à la quantité d’information qu’il est possible d’exploiter pour le moment.

Seulement pour la médecine ?

Plusieurs questions restent aussi à résoudre avant de maîtriser cette méthode au point de l’utiliser pour diagnostiquer des maladies. Par exemple, comment cibler avec certitude la ou les mutations réellement responsables d’une maladie ? Ou encore, comment atteindre un niveau statistiquement significatif de sûreté dans l’identification d’une mutation responsable d’une maladie avec un nombre de données expérimentales réduit ? De telles questions restent déterminantes dans l’étude des causes génétiques des maladies[7]. De plus, les scientifiques s’affairent activement à comprendre le rôle des gènes dans le développement de maladies complexes. En effet, l’évolution d’une maladie n’est souvent pas causée par une variation d’un seul gène, mais par une multitude de facteurs impliquant aussi, bien souvent, l’expression et l’interaction de plusieurs gènes. Bientôt, avec l’accumulation de connaissances en génétique et la conception de nouveaux algorithmes informatiques, l’analyse de telles données deviendra possible[8]. Le séquençage se voit déjà attribuer toutes sortes d’applications, mais la communauté scientifique ne peut même pas encore imaginer le potentiel d’information recueillie par le séquençage complet des génomes et des transcriptomes.

Il ne faut pas non plus penser que le séquençage complet du génome se limite à l’humain. Les gènes d’innombrables organismes pathogènes n’attendent que de se faire séquencer afin de révéler les secrets de leur mécanisme d’infection. Le séquençage du génome ou du transcriptome d’un organisme pathogène peut en effet révéler comment celui-ci contourne le système immunitaire ou encore indiquer s’il est résistant à un certain antimicrobien[9]. Les percées à ce sujet permettront un traitement plus adapté, puisque plusieurs souches d’une même espèce pathogène ne réagissent pas de la même manière aux traitements.

Au-delà de la santé humaine, le secteur agricole est aussi largement concerné par les avancées du séquençage. Les végétaux sont la cible de plusieurs agents pathogènes (bactéries, virus, champignons, nématodes) qui réduisent énormément la productivité agricole. Au Canada seulement, l’agriculture est un marché d’environ 120 milliards de dollars et subit annuellement des pertes considérables à cause des agents pathogènes qui s’attaquent aux plantes. Plusieurs études sont en cours afin de trouver des gènes candidats à un traitement potentiel, et le séquençage est l’outil qui permet de réaliser ces études[10].



[1] STEIN, Lincoln D. « The case for cloud computing in genome informatics », Genome Biology, vol. 11, no 5, 2010, p. 207-214.

[2] WENDELSDORF, Katherine. « Gene testing revolution: Disease prediction results skyrocket for whole genome and whole exome sequencing », http://www.geneticliteracyproject.org/2013/10/22/gene-testing-revolution-disease-prediction-results-skyrocket-for-whole-genome-and-whole-exome-sequencing/, page consultée le 22 octobre 2013.

[3] ROYCHOWDHURY, Sameek, Matthew K. IYER, Dan R. ROBINSON, Robert J. LONIGRO, Yi-Mi WU, Xuhong CAO et collab. « Personalized oncology through integrative high-throughput sequencing: A pilot study », Science Translational Medicine, vol. 3, no 111, 2011, p. 111-121.

[4] WANG, Zhong, Mark GERSTEIN et Michael SNYDER. « RNA-Seq: A revolutionary tool for transcriptomics », Nature Reviews Genetics, vol. 10, no 1, 2009, p. 57-63.

[5] SHENDURE, Jay et Hanlee JI. « Next-generation DNA sequencing », Nature Biotechnology, vol. 26, no 10, 2008, p. 1135-1145.

[6] RUTTER, William B., Tarek HEWEZI, Sahar ABUBUCKER, Tom R.MAIER, Guozhong HUANG, Makedonka MITREVA et collab. « Mining novel effector proteins from the esophageal gland cells of meloidogyne incognita », Molecular Plant-Microbe Interactions, vol. 27, no 9, 2014, p. 965-974.

[7] KILPINEN, Helena et Jeffrey C. BARRETT. « How next-generation sequencing is transforming complex disease genetics », Trends in Genetics, vol. 29, no 1, 2013, p. 23-30.

[8] COSTANZO, Michael, Anastasia BARYSHNIKOVA, Jeremy BELLAY, Yungil KIM, Eric D. SPEAR, Carolyn S. SEVIER et collab. « The genetic landscape of a cell », Science, vol. 327, no 5964, 2010, p. 425-431.

[9] GORDON, Nicola Claire, James R. PRICE, Kevin COLE, Richard Geoffrey EVERITT, Marcus J. MORGAN, John M. FINNEY et collab. « Prediction of staphylococcus aureus antimicrobial resistance by whole-genome sequencing », Journal of Clinical Microbiology, vol. 52, no 9, 2014, p. 1182-1191.

[10] RUTTER et collab., op. cit.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *