Un essai de comparaison de résultats ADN

J’ai partagé sur ce blog un article sur mes débuts dans le monde des tests ADN avec Myheritage. Après ces premiers pas, j’ai découvert la possibilité de récupérer un fichier “raw data”, c’est-à-dire le fichier de données brutes de mon ADN, afin de le transférer vers d’autres outils d’analyse de l’ADN pour faire une comparaison des résultats et affiner ainsi ma compréhension de mes origines ethniques. Je me suis dirigée vers les services gratuits (parce que tout ça, ça finit par coûter de l’argent quand même!) et j’ai pu m’amuser pas mal à base de graphiques et prédictions, un peu comme si j’étais allée chez la Madame Irma de la généalogie.

Pour récupérer le raw data, il faut chercher un peu (je ne vais pas l’expliquer ici, on trouve un tas d’explications sur le net). Il s’agit d’un fichier interminable avec plein de numéros parfaitement incompréhensibles pour les simples mortels comme moi. Une fois qu’on l’a obtenu (ça ne prend que quelques minutes), il suffit de le charger sur les sites qui acceptent les données brutes et attendre les résultats (qui tardent entre 24 et 72 heures. Je n’ai jamais eu à attendre plus de 24 heures, personnellement). Les sites qui acceptent ces transferts sont FTDNA (partenaire de Myheritage), DNA.Land et Gedmatch. Le premier est une compagnie qui propose aussi des kits pour faire le test autosomal, micotondrial ou Y-DNA. Le deuxième est un site mis en place par des chercheurs pour aider à l’interprétation des données et à la recherche sur les génomes. Le troisième réunit différents calculateurs de résultats, issus de différents projets scientifiques sur l’étude des populations. Il est un peu compliqué à comprendre dans un premier temps mais apporte beaucoup d’informations intéressantes. Je laisse ici un lien vers un article (en anglais) d’un blog qui offre une explication détaillée du fonctionnement de Gedmatch. D’autres sites existent mais ne sont, pour le moment, pas compatibles avec les fichiers de Myheritage: je me concentrerai donc sur ces trois outils d’analyse, c’est déjà bien.

Pour rappel, voici les résultats que Myheritage m’avait donnés:

Screenshot-2017-11-4 Estimación Étnica - Castot Web Site - MyHeritage

Ces résultats reflétaient assez bien, à mon sens, les origines que je connaissais: père moitié normand, moitié croate et mère moitié basque, moitié tchèque.

Le premier outil sur lequel j’ai téléchargé mon fichier de données brutes est FTDNA. Voici les résultats obtenus:

Screenshot-2017-11-4 myFTDNA - My Origins

Cette fois, les résultats sont à 99% européens. J’étais tout excitée à l’idée que le 1% restant soit d’une partie plus exotique du globe mais en fait, non. C’est scandinave et séparé du reste car considéré par le calculateur comme des résultats trop bas pour être réellement fiables.

On voit que la plus grosse différence se situe au niveau de la première ligne: là où Myheritage considerait que je possédais 52,7% de gènes d’Europe du Nord-ouest (essentiellement France et Allemagne), FTDNA m’octroie un 36% des îles britanniques. Comme FTDNA sépare les populations d’Europe du Nord-ouest de celles des îles britanniques, il faut en conclure que leur calculateur estime que ma part nord-européenne est plus proche de ce qui se trouve en Grande-Bretagne. Ils estiment également que le pourcentage est élevé, mais pas autant que ce que Myheritage considère et augmentent considérablement ma part d’Europe de l’Est, qui passe de 15 à 25%. Le reste est assez similaire.

Passons à DNA.Land. Leurs résultats sont les suivants:

Screenshot-2017-11-4 DNA LAND

100% européenne à nouveau, avec une répartition plus par zones différenciées que par pays. Cette fois, ma part d’Europe du Nord-ouest descend à 23%, au profit d’une part d’Europe du Nord-est divisée entre Slave du Nord et Finnois. Mes origines croates se retrouvent dans les 25% d’Europe du Sud et centrale. Et le Sud-ouest de l’Europe, qui reste assez constant, reflète mes origines basques. DNA.Land donne une explication de ce qu’inclut et n’inclut pas chaque zone. Par exemple, pour les Slaves du Nord, ils incluent les Biélorusses, les Estoniens, les Lituaniens, les Mordves, les Russes et les Ukrainiens. Ils n’incluent pas les Altaïens, les Kalmyks, les Nganasan, les Aldygei les Turkmènes, les Albanais, les Bulgares, les Finnois et les Ashkénazes (si vous êtes comme moi, vous venez de googliser un certain nombre de noms de peuples et avez voyagé jusqu’en Sibérie et au Caucase).

Ils apportent également une carte explicative qui a l’avantage de montrer la répartition des populations de référence qu’ils utilisent dans leurs calculs. Ils découpent, à partir de ces populations, des zones géographiques d’influence sur lesquelles ils estiment qu’on peut situer les particularités des génomes de chaque individu.

Screenshot-2017-11-4 DNA LAND(1)

Les points qui sont cochés sont les populations qui correspondent à mes résultats et ceux qui sont marqués d’un cercle barré sont les populations qui ne correspondent pas. L’intensité des couleurs des régions indique le pourcentage retrouvé dans mon ADN.

Enfin, passons à Gedmatch. J’ai mis quelques heures à comprendre parfaitement comment fonctionait le site. L’interface est sobre et studieuse et ne facilite pas vraiment la compréhension. Il s’agit donc d’un recueil de calculateurs de ce qu’ils appellent “admixture” (origines ethniques). Plusieurs projets sont accessibles. Certains sont plus adaptés à certains types de populations que d’autres: MDLP est plus généraliste ; Eurogenes – comme son nom l’indiqué – est plus orienté vers les personnes d’origine européenne, même si certaines populations non européennes sont présentées ; Dodecad est principalement orienté vers les Asiatiques et les Africains ; Harappa World se concentre principalement sur les personnes d’origine Sud-asiatique ; Ethiohelix étudie les personnes d’origine africaine ou mélangées Afrique/Europe, Afrique/Asie ou Afrique/Moyen-Orient ; PuntDNAL s’intéresse aux origines préhistoriques ; GedrosiaDNA, enfin, est plus adapté aux Eurasiens et se penche aussi sur les origines préhistoriques.

Si on choisit un projet qui n’est pas vraiment adapté à nos origines, les résultats seront faussés. Par exemple, j’ai testé mes résultats africains et j’ai obtenu un résultat à 65% Nord-africain et 35% Est-africain, ce qui est plus caractéristique de populations du Maghreb.  Comme je n’ai pas d’origines maghrébines, le calculateur a tout simplement interprété les résultats en fonction des populations étudiées et m’a donné les estimations les plus proches. Et je suis plus proche, au niveau de l’ADN, d’un algérien que d’un congolais.

Donc la première chose à faire, une fois qu’on a fait joujou avec tous les calculateurs, c’est de choisir celui qui s’adapte le mieux à nos origines. Quand celles-ci ne sont pas connues, on peut commencer avec un des calculateurs du MDLP. En ce qui me concerne, Eurogenes est, bien entendu, le calculateur le plus adapté.

Une fois qu’on a choisi le calculateur, on se retrouve face à plusieurs versions possibles. Il y a 13 versions du Eurogenes, qui se basent sur un nombre plus ou moins important de zones de répartition de l’ADN. L’un d’eux est également orienté sur les origines préhistoriques et compare le pourcentage d’ADN de chasseurs-cueilleurs et celui de fermiers du néolithique.

Le site donne aussi la possiblité de voir le résultat de l’admixture par chromosome, dans un tableau, ou représenté par des couleurs réparties sur les choromosomes. On peut aussi faire une comparaison avec d’autres résultats d’éventuels cousins. Bref, c’est assez complexe. Et ce n’est pas fini.

Une fois qu’on a choisi un calculateur et une version de ce calculateur, qu’on a entré son numéro de kit, on obtient un résultat graphique avec pourcentages et un lien vers ce qu’ils apellent “oracle” (quand je vous disais que c’était Madame Irma!). L’oracle peut être simple ou sur plusieurs populations mélangées (Oracle-4). Je vous laisse en exemple le résultat que j’obtiens avec le calculateur Eurogenes K13:

Screenshot-2017-11-4 https www gedmatch com

 

Sur les 13 zones de populations observées, j’obtiens des résultats positives dans 7 cas. Les résultats inférieurs à 1 ne doivent pas être pris en considération car il peut s’agir de “bruit”. Il y a donc 6 zones de populations qui donnent des résultats positifs dans mon cas. Du plus fort poucentage au plus faible: Nord-atlantique ; Baltique ; Ouest-méditerranéen ; Est-méditerranéen ; Ouest-asiatique ; Est-asiatique. Si je clique sur le bouton “Oracle-4”, voici ce que j’obtiens:

Screenshot-2017-11-4 https www gedmatch com(2)Screenshot-2017-11-4 https www gedmatch com(3)

L’Oracle me propose ses interprétations pour une population d’origine, deux populations d’origine, trois populations d’origine et quatre population d’origines. Il m’indique aussi la distance entre chaque résultat et mon mélange personnel. La mesure de la distance est un chiffre situé entre 0 et 20. Plus le chiffre est petit, plus les populations proposées sont proches de mon mélange personnel.

Évidemment ces résultats, une fois encore, dépendent des populations prises en considération et il faut les prendre plus comme une orientation que comme une vérité juste et irrévocable.

La “Spreadsheet” est intéressante à lire car elle décrit toutes les populations observées avec les proportions trouvées dans leur ADN de chacune des 13 zones prises en considération par le calculateur.

Finalement, si on observe plus le tableau d’ensemble que le détail par pays, on se rend compte de la cohérence de tous les résultats. Alors, pour approfondir, j’ai demandé à ma mère de faire le test. Les résultats ne sont pas encore arrivés mais ils apporteront, je l’espère, de nouvelles informations.

 

Un test ADN comme point de départ

À la découverte du test ADN

Il y a plusieurs mois, j’ai commandé un kit ADN sur le site de Myheritage, une compagnie israélienne qui propose des services de lecture de l’ADN autosomal pour déterminer les origines ethniques des individus qui font le test. Ce service n’est pas directement disponible en France car la loi française ne permet pas les tests ADN sans décision juridique mais comme je vis en Espagne, cela n’a pas été un problème pour moi. Myheritage est une compagnie parmi d’autres: la technique de lecture des origines ethniques via l’adn a connu un essor phénoménal aux États-Unis ces dernières années et plusieurs compagnies existent sur le marché. Parmi elles, on peut citer Ancestry.com, 23andMe, FTDNA, Igenea… Les prix varient entre 80€ et 200€ environ, selon les compagnies et les tests réalisés. Soyons honnêtes, j’ai pris le test le moins cher.

Après avoir fait commande du test, je me suis renseignée sur les différentes compagnies. J’ai appris que Ancestry était la plus ancienne, et la plus populaire avec 23andMe. Myheritage est la plus récente aparemment et sa base de données est petite en comparaison à d’autres.

Je me suis aussi intéressée au test ADN en lui-même. Myheritage analyse l’ADN autosomal. Je ne suis pas une experte en génétique mais voici un récapitulatif très simple des différents tests:

  • le test sur l’ADN autosomal analyse les 22 chromosomes qui forment le génome humain et compare les séquences de l’ADN de chaque individu analysé avec les ADN récoltés auprès de populations de référence. Cette comparaison permet de donner une estimation sur les origines ethniques d’une personne.
  • le test sur l’ADN mitocondrial analyse la lignée maternelle d’un individu. Le génome mitocondrial passe uniquement de la mère à l’enfant, ce qui veut dire qu’une femme le transmet à ses enfants des deux sexes, mais pas un homme. Grâce à cette analyse, on trouve l’haplogroupe d’appartenance d’un individu sur sa lignée maternelle (mère de la mère de la mère de la mère, etc.). J’aurais du mal à définir ce qu’est un haplogroupe mais il s’agit d’une catégorisation des êtres humains dans de grands groupes génétiques qui font référence aux déplacements de populations et à leur évolution depuis la préhistoire. Certains haplogroupes sont retrouvés plus fréquemment dans certaines régions que dans d’autres.
  • le test sur l’ADN-Y ne peut être réalisé que sur les individus mâles. Il s’agit d’étudier le chromosome Y dont seuls les hommes héritent, qui va permettre de retracer la lignée exclusivement paternelle (le père du père du père du père, etc.) d’un individu et de le placer dans un haplogroupe.

Certaines compagnies comme 23andMe, FTDNA ou Igenea proposent des tests sur l’ADN mitocondrial ou sur l’ADN-Y. Ces tests ne donnent pas de résultats intéressants pour une généalogie récente car ils nous situent dans de grands groupes de populations. Le test autosomal donne un résultat plus précis et plus récent mais il n’est pas possible de savoir ce qui est hérité du père et ce qui est hérité de la mère.

Chacun d’entre nous hérité de la moitié des gènes de son père et la moitié des gènes de sa mère. On va donc hériter de la moitié des marqueurs ethniques de chacun de nos parents. Mais la répartition ne se fait pas de façon forcément égale. Prenons l’exemple d’une personne dont les parents sont de deux origines différentes. Si la mère est moitié française et moitié tchèque, comme la mienne, il n’est pas dit que j’hériterai de 25% de gènes français et 25% de gènes tchèques. Ça peut être un 30%-20% ou 15%-35%… Et c’est parfaitement aléatoire.

En continuant dans mes recherches sur ces tests, je me suis rendu compte aussi qu’il ne fallait pas prendre les résultats au pied de la lettre. Tout d’abord parce que ce n’est pas une science exacte: les compagnies ont leurs propres algorythmes pour déterminer les origines ethniques d’un ADN. Ensuite, parce que les populations de référence ne recouvrent pas la totalité du globe: les scientifiques analysent des populations d’origine dans plusieurs parties du globe (les individus testés ont 4 grands-parents nés dans la même région) et c’est un sacré boulot d’analyser la totalité des groupes ethniques existant sur terre. Enfin, parce que de nombreuses populations se ressemblent énormément (c’est le cas des pays avec des frontières communes) et qu’il est pratiquement impossible de les différencier.

Et sur toutes ces constatations arrivent mes résultats sur le site de Myheritage. Les voici:

Screenshot-2017-11-3 Estimación Étnica - Castot Web Site - MyHeritage

(Les résultats sont en espagnol mais je ne pense pas que ce soit trop difficile à comprendre).

Alors, voilà, je suis un exemple de mélange purement européen, ce qui n’est pas une grande surprise. Myheritage, comme les autres sites, montre une carte à côté des résultats pour nous aider à situer les zones dans lesquelles notre ADN est retrouvé. On peut voir que le résultat “Europe du Nord-ouest” recouvre la France, l’Allemagne, la Suisse, la Belgique, les Pays Bas, une partie de la République Tchèque, de la Pologne, du Danemark, de l’Italie, de l’Autriche, de l’Espagne et de l’Angleterre. C’est un gros morceau d’Europe, en somme. Pas étonnant, connaissant mes origines, que mon résultat sur cette zone soit élevé.

En Europe du Sud, j’ai supposé que les résultats sur l’Italie étaient dûs à mes origines croates et ceux sur la péninsule ibérique à mes origines basques. Enfin, mes origines slaves se partagent entre l’Europe du Nord-ouest, l’Europe orientale et la Baltique.

Autrement dit: pas de grande révélation par rapport à ce que je savais déjà. Mais cela m’a quand même aidée à dégager quelques hypothèses pour commencer à résoudre les zones d’ombres de mon arbre. En effet, mon père m’a toujours raconté que son père avait été abandonné par sa mère et était de père inconnu. Né en Normandie en 1914, il a été placé dans un foyer et n’a jamais connu ses parents, bien que sa mère lui ait laissé son nom de famille. Il serait donc impossible de retracer ses origines et l’ADN pourrait quand même donner une indication utile. Ce qui est le cas: le pourcentage élevé sur l’Europe du Nord-ouest m’ont laissé à penser que les parents de mon grand-père étaient tous deux de la partie Nord de la France, ou la Belgique, ou le Sud de l’Angleterre. Jai pu, quelques temps plus tard, confirmer cette hypothèse et découvrir, au passage, qu’il faut se méfier des histoires familiales (mais ça, je le raconterai dans une autre entrée).

Une autre légende familiale, du côté de mon père, qui aime beaucoup les légendes, consistait à dire que ma grand-mère croate était à moitié juive. Mon père avait élaboré cette hypothèse sur la base du nom de famille de sa mère (Šut, qu’il faut prononcer choute) qui n’est pas un nom courrant en Croatie. Le test ADN permet de déterminer de possibles origines juives chez une personne. Il est bien entendu qu’être juif c’est, avant tout, appartenir à une religion, mais il se trouve que les populations juives d’Europe de l’Est, du Sud ou d’Afrique du Nord, ont eu un comportement assez endogame et se sont peu mélangées aux autres populations. Ce qui permet aux généticiens d’isoler des caractéristiques génétiques proprement ashkénazes ou sépharades. Et mes résultats sur les populations juives sont nuls, ce qui exclut la possibilité d’avoir un arrière-grand-père juif et rejoint les constatations que j’avais faites en étudiant un peu ma branche croate (pas de prénoms proprement juifs, pas de tradition orale, à par le discours paternel).

Les compagnies comme Myheritage font également une comparaison de l’ADN de chaque individu avec toutes les personnes qu’ils ont dans leur base de données, ce qui permet de trouver de possibles cousins. Dans mon cas, Myheritage a trouvé, à ce jour 33 personnes qui peuvent avoir un lien de parenté avec moi. Ce sont tous des cousins assez lointains et il m’est impossible, à ce jour, de les connecter à mon arbre généalogique. Certains d’entre eux sont aux États-Unis, d’autres en Finlande, aux Pays-Bas, au Vénézuela, en République Tchèque, en Suède, en Grande-Bretagne, en Turquie… Bref, un peu partout. Comme leur base de données s’agrandit au fur et à mesure que les gens font le test avec eux, d’autres cousins peuvent apparaître au fil du temps.

Comme ces résultats m’ont laissée un peu sur ma faim et m’ont donné envie d’en savoir plus, j’ai poussé mes recherches sur les différentes lectures de l’ADN. Je les partage dans un autre article de ce blog.