Faire séquencer son ADN : j’ai testé, voici comment ça marche

Les progrès de la génétique permettent désormais au particulier de faire séquencer son ADN facilement. Comment s’y prendre pour séquencer son génome et dans quel(s) but(s) ?

Par J. Sedra.

faire séquencer son ADN, c'est désormais facile
ADN credits James Gentry (CC BY-NC-ND 2.0)

Faire séquencer son ADN, comment ça se passe ?

Les progrès de la recherche en génétique et particulièrement la mise au point de techniques de séquençage de l’ADN à haut débit il y a une dizaine d’années ont réduit spectaculairement le coût de l’analyse de l’ADN humain, au point qu’aujourd’hui plusieurs entreprises proposent ce service directement aux particuliers, et non plus aux seuls laboratoires et chercheurs. Par exemple Pathway Genetics vend des dépistages pour des maladies ou conditions spécifiques, mais on trouve aussi des offres de séquençage « global » couvrant l’ADN entier, auprès de trois compagnies : la plus connue est 23andme, récemment rachetée par Google, il y a aussi FamilyTreeDNA et ses partenaires FamilyFinder et Ancestry.com ou encore le projet Genographic proposé par le groupe média National Geographic.

Chacune a une orientation spécifique : 23andme vise (ou plutôt visait principalement au départ) le séquençage à fins médicales générales, FamilyTreeDNA comme son nom l’indique vise plutôt à retrouver ses origines immédiates (enfants illégitimes ou adoptés, réfugiés / déportés et migrants). Cette distinction est importante : pour des raisons de coût et de rapidité chacune d’entre elle a mis au point sa propre puce de séquençage ou utilise un modèle « industriel » spécifique et de ce fait, elles ne testent pas exactement la même chose.

L’ADN humain est subdivisé en 23 paires de chromosomes, portant chacun de 50 à 250 millions de bases (représentant entre 300 et 2000 gènes pour chacun), ainsi que 16000 bases environ d’ADN mitochondrial (pour 37 gènes). Un séquençage du type proposé au grand public est une lecture « en diagonale » de l’intégralité de cet ADN, et le résultat de ce séquençage est stocké sous la forme d’une liste de SNPs (pour single nucleotide polymorphism) ou snip, c’est-à-dire qu’on ne garde de cette longue lecture que les bases qui varient entre les humains, et on omet l’écrasante majorité des bases dont on est raisonnablement sûr qu’elles sont identiques pour tout le monde. Donc on n’obtient pas au final une longue liste de ATCG représentant son ADN du début à la fin, mais une litanie de lignes de type « référence de SNP – numéro de chromosome – emplacement génétique – bases relevées sur chaque exemplaire de chromosome » :

rs3737717 1 1242084 AA
i6054370 1 1246013 GG
i6019334 1 1248166 CC
i6019335 1 1248974 TT

On connaît aujourd’hui environ un million de ces bases variantes, on pense qu’il y en aurait environ 2 millions au total, on devrait les connaître à peu près toutes d’ici 2050, mais en attendant chaque compagnie se concentre sur 500 à 600 000 SNPs parmi les mieux connus et variant plus fréquemment, ou ayant le plus d’intérêt médical ou généalogique. Le nombre de SNPs marche un peu comme les pixels des images numériques : c’est un simple niveau de résolution. Ce sont les premiers quelques gros pixels qui en disent le plus, et chaque niveau supplémentaire de résolution apporte de moins en moins de détail et de précision.

adn hollande rené le honzec

Il faut aussi tenir compte du fait que les machines de séquençage ne sont pas parfaites : elles peuvent échouer à lire un SNP, voire faire une mauvaise lecture. Pour illustrer : 23andme garantit commercialement la délivrance d’au moins 99,9% de résultats pour les SNPs analysés, soit moins de 0,1% de « non-lectures » (no-call), et réalise plusieurs lectures de votre ADN pour s’en assurer. Mais loi des grands nombres oblige, il faut aussi compter entre une grosse dizaine et une petite centaine de SNPs qui seront rapportés avec un résultat erroné. Et aussi qu’une erreur humaine reste toujours possible.

Les prix du séquençage du génome sont assez comparables

Je n’ai pas trop regardé mais il me semble que les prix sont comparables entre les trois grands fournisseurs. Les frais de port sont conséquents parce qu’un échantillon vivant d’ADN ça ne se conserve pas longtemps et que c’est expédié à l’international. D’ailleurs il y a quelques pays qui interdisent carrément ce genre d’envoi, comme la Russie et quelques pays d’Amérique Latine. Mais on peut circonvenir à ces limites en se faisant réexpédier le kit dans un pays voisin grâce à un réexpéditeur commercial, et en mentant lors de l’envoi en retour de l’échantillon.

Dans mon cas j’ai fait appel à 23andme. Leur kit arrive dans une grande pochette (dans mon cas via DHL, qui est probablement le partenaire de choix de 23andme pour l’Europe), contenant une seconde pochette plus petite pour le retour, et perdu à l’intérieur : une petite boîte contenant le tube d’échantillonnage et les explications (en anglais uniquement). Il faut enregistrer un compte associé au numéro figurant sur le kit avant de le renvoyer rempli.

La plus grosse contrainte pour le test c’est clairement l’envoi en retour, donc il faut, soit habiter juste à côté d’un centre DHL Express (et pas un centre DHL ordinaire, attention !), soit organiser un enlèvement avec eux. Il faut n’avoir rien mangé depuis au moins 30 minutes avant de remplir le tube. Il y a la place pour au moins 3 ou 4 échantillons dans la pochette de retour (de mémoire elle est prépayée pour 500 grammes), donc on peut aussi économiser pas mal en faisant plusieurs tests d’un coup.

Le kit met 48h à arriver au labo, ensuite il faut 3 à 6 semaines pour les résultats. Dès l’enregistrement du compte on peut participer aux études de recherche génétique auxquelles 23andme s’associe, en répondant à une bonne douzaine de questionnaires de toutes sortes (sur la dépression, arthrite, Parkinson, cancer, droitier-ou-gaucher, bronzage, allergies, souplesse, qualité du sommeil, etc.).
Comme la FDA (autorité sanitaire fédérale US) a brutalement interdit fin 2003 à 23andme de fournir des informations générales de santé à ses clients (alors qu’ils reçoivent des grants du NIH, voilà pour la cohérence étatique…), la compagnie s’est rapidement réorientée en recherche d’origine ancestrale et généalogique ; il y a donc aussi des pages pour renseigner son arbre généalogique, soit manuellement soit par import d’un fichier GEDCOM exportable par exemple depuis un service comme geneanet. Le kit comprend d’ailleurs un abonnement limité à myheritage.com de 6 mois mais qui n’apporte franchement rien d’utile (quasiment toutes les fonctions restent payantes). Mieux vaut s’inscrire sur geneanet et transférer les données par fichier GEDCOM.

Ce qui est bien : 23andme a plus de 800 000 ADNs déjà en banque, leur fonction de recherche de cousins distants est très efficace et précise, en plus de permettre d’exporter toutes les correspondances au format CSV, donc il y a de quoi s’occuper si on recherche ses origines généalogiques.

Ce qui est moins bien : les fonctions « pays d’origine » et haplotypes (=caractérisation patrilinéale et matrilinéale respectivement par le chromosome Y et l’ADN mitochondrial) sont inexactes voire fausses. Les origines non-européennes des segments d’ADN sont largement sous-estimées, et certaines populations entières ne sont pas du tout référencées (Arméniens et Romanichels, par exemple) ou basées sur un nombre insuffisant d’échantillons. Le typage du Y s’arrête à la mutation M418 pour la branche R1a, et pour toutes les branches, certaines variantes récemment identifiées (=depuis 2013, en gros) sont simplement manquantes (c’était le cas pour mes ADN mitochondrial et Y).

Et bien sûr, 23andme ne donne plus (du moins pour l’instant) d’informations de santé. Heureusement toutes ces limitations peuvent être réduites ou levées en exploitant de nombreux outils disponibles sur l’Internet.

Sur le web