Un essai de comparaison de résultats ADN

J’ai partagé sur ce blog un article sur mes débuts dans le monde des tests ADN avec Myheritage. Après ces premiers pas, j’ai découvert la possibilité de récupérer un fichier “raw data”, c’est-à-dire le fichier de données brutes de mon ADN, afin de le transférer vers d’autres outils d’analyse de l’ADN pour faire une comparaison des résultats et affiner ainsi ma compréhension de mes origines ethniques. Je me suis dirigée vers les services gratuits (parce que tout ça, ça finit par coûter de l’argent quand même!) et j’ai pu m’amuser pas mal à base de graphiques et prédictions, un peu comme si j’étais allée chez la Madame Irma de la généalogie.

Pour récupérer le raw data, il faut chercher un peu (je ne vais pas l’expliquer ici, on trouve un tas d’explications sur le net). Il s’agit d’un fichier interminable avec plein de numéros parfaitement incompréhensibles pour les simples mortels comme moi. Une fois qu’on l’a obtenu (ça ne prend que quelques minutes), il suffit de le charger sur les sites qui acceptent les données brutes et attendre les résultats (qui tardent entre 24 et 72 heures. Je n’ai jamais eu à attendre plus de 24 heures, personnellement). Les sites qui acceptent ces transferts sont FTDNA (partenaire de Myheritage), DNA.Land et Gedmatch. Le premier est une compagnie qui propose aussi des kits pour faire le test autosomal, micotondrial ou Y-DNA. Le deuxième est un site mis en place par des chercheurs pour aider à l’interprétation des données et à la recherche sur les génomes. Le troisième réunit différents calculateurs de résultats, issus de différents projets scientifiques sur l’étude des populations. Il est un peu compliqué à comprendre dans un premier temps mais apporte beaucoup d’informations intéressantes. Je laisse ici un lien vers un article (en anglais) d’un blog qui offre une explication détaillée du fonctionnement de Gedmatch. D’autres sites existent mais ne sont, pour le moment, pas compatibles avec les fichiers de Myheritage: je me concentrerai donc sur ces trois outils d’analyse, c’est déjà bien.

Pour rappel, voici les résultats que Myheritage m’avait donnés:

Screenshot-2017-11-4 Estimación Étnica - Castot Web Site - MyHeritage

Ces résultats reflétaient assez bien, à mon sens, les origines que je connaissais: père moitié normand, moitié croate et mère moitié basque, moitié tchèque.

Le premier outil sur lequel j’ai téléchargé mon fichier de données brutes est FTDNA. Voici les résultats obtenus:

Screenshot-2017-11-4 myFTDNA - My Origins

Cette fois, les résultats sont à 99% européens. J’étais tout excitée à l’idée que le 1% restant soit d’une partie plus exotique du globe mais en fait, non. C’est scandinave et séparé du reste car considéré par le calculateur comme des résultats trop bas pour être réellement fiables.

On voit que la plus grosse différence se situe au niveau de la première ligne: là où Myheritage considerait que je possédais 52,7% de gènes d’Europe du Nord-ouest (essentiellement France et Allemagne), FTDNA m’octroie un 36% des îles britanniques. Comme FTDNA sépare les populations d’Europe du Nord-ouest de celles des îles britanniques, il faut en conclure que leur calculateur estime que ma part nord-européenne est plus proche de ce qui se trouve en Grande-Bretagne. Ils estiment également que le pourcentage est élevé, mais pas autant que ce que Myheritage considère et augmentent considérablement ma part d’Europe de l’Est, qui passe de 15 à 25%. Le reste est assez similaire.

Passons à DNA.Land. Leurs résultats sont les suivants:

Screenshot-2017-11-4 DNA LAND

100% européenne à nouveau, avec une répartition plus par zones différenciées que par pays. Cette fois, ma part d’Europe du Nord-ouest descend à 23%, au profit d’une part d’Europe du Nord-est divisée entre Slave du Nord et Finnois. Mes origines croates se retrouvent dans les 25% d’Europe du Sud et centrale. Et le Sud-ouest de l’Europe, qui reste assez constant, reflète mes origines basques. DNA.Land donne une explication de ce qu’inclut et n’inclut pas chaque zone. Par exemple, pour les Slaves du Nord, ils incluent les Biélorusses, les Estoniens, les Lituaniens, les Mordves, les Russes et les Ukrainiens. Ils n’incluent pas les Altaïens, les Kalmyks, les Nganasan, les Aldygei les Turkmènes, les Albanais, les Bulgares, les Finnois et les Ashkénazes (si vous êtes comme moi, vous venez de googliser un certain nombre de noms de peuples et avez voyagé jusqu’en Sibérie et au Caucase).

Ils apportent également une carte explicative qui a l’avantage de montrer la répartition des populations de référence qu’ils utilisent dans leurs calculs. Ils découpent, à partir de ces populations, des zones géographiques d’influence sur lesquelles ils estiment qu’on peut situer les particularités des génomes de chaque individu.

Screenshot-2017-11-4 DNA LAND(1)

Les points qui sont cochés sont les populations qui correspondent à mes résultats et ceux qui sont marqués d’un cercle barré sont les populations qui ne correspondent pas. L’intensité des couleurs des régions indique le pourcentage retrouvé dans mon ADN.

Enfin, passons à Gedmatch. J’ai mis quelques heures à comprendre parfaitement comment fonctionait le site. L’interface est sobre et studieuse et ne facilite pas vraiment la compréhension. Il s’agit donc d’un recueil de calculateurs de ce qu’ils appellent “admixture” (origines ethniques). Plusieurs projets sont accessibles. Certains sont plus adaptés à certains types de populations que d’autres: MDLP est plus généraliste ; Eurogenes – comme son nom l’indiqué – est plus orienté vers les personnes d’origine européenne, même si certaines populations non européennes sont présentées ; Dodecad est principalement orienté vers les Asiatiques et les Africains ; Harappa World se concentre principalement sur les personnes d’origine Sud-asiatique ; Ethiohelix étudie les personnes d’origine africaine ou mélangées Afrique/Europe, Afrique/Asie ou Afrique/Moyen-Orient ; PuntDNAL s’intéresse aux origines préhistoriques ; GedrosiaDNA, enfin, est plus adapté aux Eurasiens et se penche aussi sur les origines préhistoriques.

Si on choisit un projet qui n’est pas vraiment adapté à nos origines, les résultats seront faussés. Par exemple, j’ai testé mes résultats africains et j’ai obtenu un résultat à 65% Nord-africain et 35% Est-africain, ce qui est plus caractéristique de populations du Maghreb.  Comme je n’ai pas d’origines maghrébines, le calculateur a tout simplement interprété les résultats en fonction des populations étudiées et m’a donné les estimations les plus proches. Et je suis plus proche, au niveau de l’ADN, d’un algérien que d’un congolais.

Donc la première chose à faire, une fois qu’on a fait joujou avec tous les calculateurs, c’est de choisir celui qui s’adapte le mieux à nos origines. Quand celles-ci ne sont pas connues, on peut commencer avec un des calculateurs du MDLP. En ce qui me concerne, Eurogenes est, bien entendu, le calculateur le plus adapté.

Une fois qu’on a choisi le calculateur, on se retrouve face à plusieurs versions possibles. Il y a 13 versions du Eurogenes, qui se basent sur un nombre plus ou moins important de zones de répartition de l’ADN. L’un d’eux est également orienté sur les origines préhistoriques et compare le pourcentage d’ADN de chasseurs-cueilleurs et celui de fermiers du néolithique.

Le site donne aussi la possiblité de voir le résultat de l’admixture par chromosome, dans un tableau, ou représenté par des couleurs réparties sur les choromosomes. On peut aussi faire une comparaison avec d’autres résultats d’éventuels cousins. Bref, c’est assez complexe. Et ce n’est pas fini.

Une fois qu’on a choisi un calculateur et une version de ce calculateur, qu’on a entré son numéro de kit, on obtient un résultat graphique avec pourcentages et un lien vers ce qu’ils apellent “oracle” (quand je vous disais que c’était Madame Irma!). L’oracle peut être simple ou sur plusieurs populations mélangées (Oracle-4). Je vous laisse en exemple le résultat que j’obtiens avec le calculateur Eurogenes K13:

Screenshot-2017-11-4 https www gedmatch com

 

Sur les 13 zones de populations observées, j’obtiens des résultats positives dans 7 cas. Les résultats inférieurs à 1 ne doivent pas être pris en considération car il peut s’agir de “bruit”. Il y a donc 6 zones de populations qui donnent des résultats positifs dans mon cas. Du plus fort poucentage au plus faible: Nord-atlantique ; Baltique ; Ouest-méditerranéen ; Est-méditerranéen ; Ouest-asiatique ; Est-asiatique. Si je clique sur le bouton “Oracle-4”, voici ce que j’obtiens:

Screenshot-2017-11-4 https www gedmatch com(2)Screenshot-2017-11-4 https www gedmatch com(3)

L’Oracle me propose ses interprétations pour une population d’origine, deux populations d’origine, trois populations d’origine et quatre population d’origines. Il m’indique aussi la distance entre chaque résultat et mon mélange personnel. La mesure de la distance est un chiffre situé entre 0 et 20. Plus le chiffre est petit, plus les populations proposées sont proches de mon mélange personnel.

Évidemment ces résultats, une fois encore, dépendent des populations prises en considération et il faut les prendre plus comme une orientation que comme une vérité juste et irrévocable.

La “Spreadsheet” est intéressante à lire car elle décrit toutes les populations observées avec les proportions trouvées dans leur ADN de chacune des 13 zones prises en considération par le calculateur.

Finalement, si on observe plus le tableau d’ensemble que le détail par pays, on se rend compte de la cohérence de tous les résultats. Alors, pour approfondir, j’ai demandé à ma mère de faire le test. Les résultats ne sont pas encore arrivés mais ils apporteront, je l’espère, de nouvelles informations.

 

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s