PDA

View Full Version : Le grAnd mystère des cousins autosomaux qui sont aussi des cousins paternels Y-STR



Ric
04-11-2016, 03:00 PM
J'ai 63 noms sur mon arbre généalogique. C'est encore trop peu mais 'quand même', ces noms ne me donnent pas le moindre indice qui me permette de les racrocher à un quelconque cousin autosomal obtenu à 23&me.
Pire, certains de ces noms, ceux qui font partie de ma liste d'enrichissement 'autosomale' à 23&me, reviennent aussi très souvent dans ma liste de cousins Y-STR au niveau 12 marqueurs.
Je n'ignore rien des turpitudes intellectuelles que les faux 'match' STR à 12 marqueurs peuvent engendrer et je me suis fait dire que ces 'match' STR étaient des coincidences.
Bien, mais ces coincidences revenants aussi sous forme de cousins autosomaux distants à 23&me, il faut donc que ces cousins autosomaux soient aussi des coincidences et que ces deux coincidences coincident. Cela fait trois coincidences nécessaires pour expliquer ces doubles cousinages autosomaux et Y.

Une explication plus économique serait que mes cousins autosomaux à 23&me, soient en fait des cousins 'Identical by State' et non 'By descent' et dans la masse des segments IBS qu'ils représentent, il y aurait quelque apparentés, apparentés 'by State' donc, qui auraient aussi fait un test Y-STR, dont certains coincideraient avec mes propres STR par chance...

Mouais, si cela était vrai, il serait légitime de trouver ces segments autosomaux IBS de façon courante dans toute la population de La région 'en Haut à droite', pardon, je veux dire 'Grand Est' et que tous les gens de cette région aient à peu prés les mêmes coincidences que moi avec la base de donnée de 23&me (ou autre), même si nous ne sommes pas apparentés.

Bref, j'aimerais savoir s'il arrive que des Français du quart Nord Est obtiennent occasionnellement des cousins AUTOSOMAUX portant les noms suivants : Brown, Anderson, Clark, Miller, Taylor, Jones, Ward, Wood, Robinson.
Merci de votre aide.

ffoucart
04-11-2016, 05:03 PM
Je suis du Grand Nord (en haut de la Terre du Milieu), mais j'ai des Miller, assez nombreux. Et pas mal de Johnson aussi. Il y a aussi des Wood, des Anderson,....

Ric
04-11-2016, 06:18 PM
@ffoucart, cela va en faveur de segments non-spéçifiques répendus dans la region et qui correspondent à ces personnes.

Mes plus proches cousins autosomaux sont un 'Brown' et un 'Wood', tous deux évalué à 4ème cousin. Le 'Brown' autosomal est M-269 et j'ai une douzaine de Y-STR 12 matches de ce nom, mais aucun d'eux n'est allé plus loin que M-269 dans les SNP, donc impossible de savoir si les hommes de ce clan sont dans mon clade ou pas, mais je présume que non, ils doivent être dans un clade diférent du mien, sinon j'aurais obtenu des 'matches' plus élevé que 12/12 avec ces Wood.
J'ai aussi des Johnson...bref apparemment on peu tirer des segments qui correspondent à des ancêtres communs beaucoup plus anciens que l'évaluation de 23&me.

En fait, malgrés l'abondance de matches STR 12/12 (j'en ai ~1700 et ça augmente d'une dizaine par mois) , je pensais que peut être 90% d'entres eux étaient totalement pure chance, mais qu'il en restait quand même une petite minorité à scruter : ceux qui donnaient aussi des matches autosomaux du même nom. Mais je dois reconnaître que c'est plutôt 100% de mes matches STR 12/12 qui doivent partir à la poubelle.
Pour preuve, récemment un Francais de ma région est arrivé presque pile poil dans mon clade CTS4065 et pourtant nos motifs STR ne correspondent pas, même au niveau des 12 marqueurs. Coup dur : cela signifie vraiment que 100% de mes ~1700 STR matches sont à mettre sur le compte du mode de variation des STR. Pratiquement tout ce qui est M-269 est à la 'portée statistique' de mon motif STR particulier pour les douze premiers marqueurs.
Cela, plus les segments autosomiques non-spécifiques en Middle Earth, et les doubles relations autosomales + STR, s'expliquent assez bien.

Bref, bref, on redécouvre la roue, que nous sommes tous issus d'un petit nombre d'ancêtres communs à 5000 ans de distance et que forcément au niveau ADN cela va créer beaucoup plus de similarité que de différences.

FredH
04-12-2016, 11:19 AM
En fait, malgrés l'abondance de matches STR 12/12 (j'en ai ~1700 et ça augmente d'une dizaine par mois)...
Bref, bref, on redécouvre la roue, que nous sommes tous issus d'un petit nombre d'ancêtres communs à 5000 ans de distance et que forcément au niveau ADN cela va créer beaucoup plus de similarité que de différences.

1700 match STR12/12? j'ai 1 match pour STR12/12 et 0 au dessus et rien depuis 2014... . et aucun match pour le mt-DNA I3a!

Ric
04-12-2016, 12:56 PM
1700 match à 12/12 et 11/12 et rien au dessus, oui....Cela arrive pour ceux qui n'ont pas de mutations à plus de GD= 1 ou 2 du Mode pour M-269 dans les douze premiers marqueurs. En tolérant plus de GD, j'imagine que vous auriez aussi des match 12/12, mais cela ne représenterait que le fait que M-269 est ancestral à votre motif STR pour ces 12 marqueurs.

Si les match 12/12 avaient une quelconque valeur, donc que ces 1700 matches étaient réellement affiliés à ma ligne paternelle, sans pour autant être tous dans mon sous-clade SNP particulier, alors les gens qui sont dans ce sous-clade SNP particulier devraient, à plus forte raison être TOUS des match 12/12 avec moi, ce qui nest pas le cas.
Pour prendre un exemple précis, ma situation serait identique à la votre si vous aviez 1700 matches 12/12 qui soient tous M269 ou L11, mais que les gens qui sont CTS4528 ne soient pas plus souvent des matches 12/12 avec vous que ceux qui ne le sont pas. Ce que vous pouvez savoir en regardant les motifs STR des gens de votre groupe/clade particulier, pour les rares qui ont fait un BigY ou un pack SNP.

Donc les matches 12/12 n'ont aucune valeur dans le sens qu'ils indiquent une filiation à M269, voire R1b et c'est à peu prés tout. J'imagine que quand j'aurai un match STR dans mon sous-clade, ça sera au niveau 37 ou 67 marqueurs.
Dans mon cas cependant, j'avais un doute parce que mon test autosomal à 23&me me donne des cousinages enrichis avec les mêmes noms que mes matches STR 12/12. Pour expliquer cela, je présume que le segment autosomal en commun avec les 'Brown' est répendu dans mon pool génetique regional de façon indépendante d'un lien familial récent, donc identique 'by state' et que les gens qui font des tests autosomaux étant plus portés à faire des test STR, et étant tous R1b ou M-269 comme 80% des Européens, un motif STR proche du mode de M269 comme le mien va coincider avec le leur, au niveau 12/12, très souvent.

Bon, j'avais d'ailleurs demandé dans le forum FTDNA la question : "si les matches 12/12 n'ont aucune valeur généalogique, pourquoi alors les donner en liste de 'DNA matches' comme si c'était de vrais cousins paternels ?", alors que tout ce que ca veut dire c'est que ce sont des Européens, ne serait-ce pas tromper le client ?
On m'a fait les gros yeux, mais pour moi la réponse est simple et c'est : Business.
Le client dépense dans des kits de ceci et cela, $$$$$$$$, on lui fait miroiter des résultats : 'vous allez retrouvez vos cousins paternels...blablabla', donc forcément, ce client apprécie un minimum de retour pour ses $. Quand rien ne revient , c'est frustrant et cela n'incite pas à investir plus ni à conseiller ses amis d'en faire autant....bad reviews...business quoi.

Bon enfin, ils peuvent s'en tirer en disant que tous les R1b sont effectivement cousins...et plus encore si on remonte jusque la Pangée primitive. Mais j'ai pas payé pour savoir si je suis cousin avec les protochordés à 500 millions d'années de distance.

PS: j' ai supprimé l'exemple avec 'Brown' car ce nom représente peut être bien l'un de mes seul cousin lointain véritable.

FredH
04-12-2016, 02:12 PM
GD=1 , j'ai 11 match... Si j'avais eu match même 12/12 avec une personne du même nom ou similaire, il y aurait eu un intérêt généalogique certain en ce qui me concerne. Le fait que j'ai eu un match même avec un nom différent mais originaire de la même région m'a forcé à examiner en profondeur ma généalogie et de découvrir des choses qui n'étaient pas évidentes au départ comme une adoption. Mais en effet combiné avec l'haplogroupe, c'est mieux si on a les mêmes SNP et le même haplotype ça veut aussi dire quelque chose du point de vue généalogie et histoire familiale. Pour en revenir à votre question, Brown, Anderson, etc sont des noms extrêmement communs chez les anglo-saxons , c'est mieux de repérer les noms peu communs et encore. Tout est une question de probabilité.

Tolan
04-12-2016, 02:19 PM
Pour comparer les matches STRs, à mon avis, il faut s'appuyer sur les marqueurs "hors-modal".
Par exemple, vous êtes DF27.
Comparer vos marqueurs STRs avec le modal DF27. Notez ceux qui sont différents.
Ensuite comparer vos marqueurs qui sont différents avec les autres DF27.
Si ce sont les mêmes marqueurs qui sont différents, alors il est possible qu'il y a un ancêtre commun plus jeune que DF27 et qui peut correspondre à un sous-groupe.

Mais de toute façon, 12 marqueurs, c'est nettement insuffisant. 37 est un minimum, 64 c'est pas mal!

Autrement, les anglo-saxons ont beaucoup moins de patronymes différents que nous.
J'ai les mêmes noms que vous qui reviennent aussi

Ric
04-12-2016, 02:55 PM
GD=1 , j'ai 11 match... Si j'avais eu match même 12/12 avec une personne du même nom ou similaire, il y aurait eu un intérêt généalogique certain en ce qui me concerne
c' est l'avantage d'avoir un motif de STRs loin du mode en raison par exemple d' un STR particuliérement atypique : pas de faux matches, ou pas de matches du tout, mais quand il y en a un, c' est Bingo.
C'est mon cas au niveau des 37 marqueurs, j'ai DYS607 = 11, alors que le mode pour ce STR est 15 ou 16 pour tout le clade DF27 et probablement aussi M269. Je n'ai jamais vu personne avec un DYS607 en dessous de 12 dans le groupe DF27 entier et avec une GD de 4 ou 5 avec le mode sur un seul STR, inutile de dire que je ne matche personne au niveau 37.
C'est assez ironique, je suis très proche du mode pour les 12 premiers marqueurs, donc je matche tout le monde ou presque, et je suis très amodal ensuite, donc je ne matche personne au niveau 37 ou plus.
Mais comme vous, gràce à ce marqueur atypique, le jour où j'aurai un match au niveau 37, il y a fort à parier qu'il s'agisse d'un cousin paternel véritable. Mais ce jour viendra t-il ?


Si j'avais eu match même 12/12 avec une personne du même nom ou similaire pour ceux qui ont un STR atypique responsable de 90% de la GD avec des matches 'potentiels', je ne crois pas que cela soit un cas de figure probable. Si vous matchez avec une personne du même nom, c'est que vous êtes un match pour ce STR atypqiue particulier, donc vous réduisez d'un seul coup 90% de la GD et vous allez directement être un match de niveau 37 ou plus.

Il y a un cas similaire dans mon groupe SNP où une personne a un STR très très atypique, à 8 GD du Mode sur un seul STR ! si je crois me souvenir. Pas de surprise, cette personne n'a aucun match. Le problème est d'expliquer l'origine de ce STR atypique, pourrait-il être dû à une mutation récente où la DNA-Polymérase glisserait de plusieurs repetitions à la fois dans ce Short Tandem Repeat ?
Et si cette mutation était apparue il y a une ou deux generations seulement, elle a pour effet, en introduisant un GD=8 d'un seul coup, de faire vieillir artificiellement tout les ancêtres potentiels de cette personne. Par exemple, en admettant que la mutation ait eu lieue chez son grand-pére, celui-ci risquerait de ne pas être un match, alors qu'il devrait évidemment l'être.

Savez vous si vous avez un STR atypique (loin du mode) ? pour le savoir, vous pouvez simplement regarder le codage couleur de votre motif STR dans votre groupe SNP et comparer aux autres.

Ric
04-12-2016, 03:15 PM
Pour comparer les matches STRs, à mon avis, il faut s'appuyer sur les marqueurs "hors-modal".
Par exemple, vous êtes DF27.
Comparer vos marqueurs STRs avec le modal DF27. Notez ceux qui sont différents.
Ensuite comparer vos marqueurs qui sont différents avec les autres DF27.
Si ce sont les mêmes marqueurs qui sont différents, alors il est possible qu'il y a un ancêtre commun plus jeune que DF27 et qui peut correspondre à un sous-groupe.

Mais de toute façon, 12 marqueurs, c'est nettement insuffisant. 37 est un minimum, 64 c'est pas mal!

Autrement, les anglo-saxons ont beaucoup moins de patronymes différents que nous.
J'ai les mêmes noms que vous qui reviennent aussi

Tout a fait d'accord et merci de confirmer pour les noms.
On en revient à l utilité douteuse de donner les match pour 12 marqueurs dans ce cas. J'ai proposé 'good for business' mais si quelqu'un a une meilleure explication.....

Entiérement d'accord aussi sur l'utilité de se focaliser sur les marqueurs atypiques.
Mais cela pose la question suivante : FTDNA ne propose pas de matches quand la GD est trop grande (plus que GD=7 pour Y67) alors que Ysearch montre tous les matches quelque soit la distance GD, même ceux qui ne se qualifient pas comme matches à FTDNA. Pour ceux qui on un STR atypique n'est il pas justifié de regarder ce que deviennent ces matches 'trop lointains' une fois le STR atypique corrigé ? Après tout on ne sait pas quand ce STR particulier a subi cette mutation atypique et quand on a une GD de 5 sur un seul STR, et que l'on corrige arbitrairement en le remplaçant par le mode, des gens qui se trouvent à 57/67 (GD=10) sur Ysearch se retrouveraient maintenant à 57+5/67 = 62/67 ce qui n'est plus très loin.

FredH
04-12-2016, 05:04 PM
.

Savez vous si vous avez un STR atypique (loin du mode) ? pour le savoir, vous pouvez simplement regarder le codage couleur de votre motif STR dans votre groupe SNP et comparer aux autres.
Oui il est atypique, Ils sont tous DYS393=13 or le mien est = 12. DYS393 est le premier STR dans la liste sur FTDNA. DYS393=13 c'est ce qui est le plus fréquent en Europe de l'Ouest. Avoir peu de match c'est un avantage si on trouve quelque chose... C'est peut être dû au fait que la France est l'un des pays les plus vastes et les plus variés d'Europe mais aussi en retard en matière d'analyse et de test génétique.

Ric
04-12-2016, 08:32 PM
Oui il est atypique, Ils sont tous DYS393=13 or le mien est = 12. DYS393 est le premier STR dans la liste sur FTDNA. DYS393=13 c'est ce qui est le plus fréquent en Europe de l'Ouest. Avoir peu de match c'est un avantage si on trouve quelque chose... C'est peut être dû au fait que la France est l'un des pays les plus vastes et les plus variés d'Europe mais aussi en retard en matière d'analyse et de test génétique.


Dans le groupe DF27, je vois que DYS393=12, bien que minoritaire, est présent de temps en temps. Par exemple près de la moitié des membres du sous-clade R1b-P312>DF27>Z196>L176.2>L165+ montre la valeur DYS393=12

Mais quand je parle d'un STR atypique, j'entends aussi bien la fréquence que la magnitude de la différence avec le mode. Dans le groupe DF27 encore une fois, il y a un DYS qui vaut 10 quasiment pour tout le monde, avec de très rares 11, sauf un gars qui a...0 . Soit il s'agit d'une erreur mais si c'est réel, cette personne n'aucune chance d'obtenir des match STR. Mon cas est moins extrême avec une GD de 4 ou 5 par rapport au mode sur le seul marqueur DTS607, mais ce qui m' ennuie plus c'est que personne d'autre n'a cette valeur dans le groupe DF27 entier. Si cette valeur était une conséquence du mécanisme classique du yoyo pour les STR (par exemple +1, -1, +1, +1, -1 etc. de façon aléatoire) j'imagine que quelqu'un d'autre aurait DYS607=11 ou au moins des valeurs approchantes. Mais non, il n'y a personne avec cette valeur parmi les ~1600 membres du groupe DF27. Une seule personne montre la valeur 12, mais elle n'est même pas dans mon sous-clade particulier et représente donc un cas de 'convergence évolutive' et non pas de filiation. Cela me fait penser que ce DYS607 a brusquement changé chez un de mes ancêtres, de façon importante et assez récente, sinon je verrais des valeurs similaires chez d'autres membres DF27, a fortiori proches de mon clade.
Bref, dépendement du nombre moyen de générations attribué en moyenne pour obtenir 1 GD, nombre qui varie en fonction de chaque STR mais qui est en général proche de 2 je crois, si une telle mutation de GD=4 s'est produite chez un de mes ancétres proches, ceux immédiatement derrière lui se retrouve avec (4 ou 5) X 2 = 8 ou 10 générations derrriére du point de vue de la GD. C'est un sacré coup de vieux pris en une seule génération réelle.
La solution coûte de l'argent : faire tester des membres paternels proches, et en plus en France....bof.

FredH
04-13-2016, 06:13 AM
Pour calculer le nombre de générations en fonction du nombre de mutation, on oublie, j'ai l'impression, la taille de la population dont appartient l'individu qui va avoir la mutation. Autrement dit, plus on est nombreux, plus il y aura de mutation à chaque génération. C'est tellement vrai qu'on remarque une explosion du nombre de mutations et des ramifications de l'arbre phylogénétiques à chaque changement climatique ou technologique qui favorise l'explosion démographique de l'espèce humaine. Mettons que votre lignée paternelle ait eu par le passé une croissance démographique favorable alors il s'est produit à ce moment là une croissance du nombre des mutations puis si il est survenu famine ou calamités diverses opérant une réduction du nombre de branches comme c'est souvent le cas comme la nature est cyclique, on se retrouve avec des mutations peu communes et isolées sur un nombre relativement faible de génération. Il y aussi un autre facteur, c'est l'échantillonnage qui est loin d'être uniforme en fonction du lieu et des populations. Certaines populations sont mieux connues que d'autres.

Ric
04-13-2016, 02:27 PM
Certes : effets de population plus effet échantillonage, c'est l'autre possibilité alternative.

Ce que j'essaie de comprendre ici, c'est l'apparition d'un variation très importante du nombre de répétitions dans un Short Tandem Repeat donné ET la rareté de ce variant dans un clade vieux de 4500 ans comme DF27. La variance est aussi relative, +/- 5 Repeats quand le mode est de 40, est beaucoup moins important que +/- 5 Repeats quand le mode est de 10.
Le mécanisme de variation du nombre de Repeats a été comparé par Richad Hulan a un Yoyo. C'est à dire que la Polymérase glisse lors de la réplication et introduit un Repeat de plus mais quelques génération suivantes, elle introduit un Repeat de moins, revenant donc à la valeur initiale. Sans surprise, ce mécanisme rend très difficile l'apparition des Variances importantes, ce qui peut avoir un intérêt biologique si la cellule ne veut pas se retrouver avec un chromosome Y en perpétuelle expension, mais surtout ce mécanisme crée des intermédiaires.

Pour moi, ces VARIANCES IMPORTANTES ET RARES s'expliquent quand la polymérase glisse plutôt de plusieurs unités répétées à la fois avant de reprendre son Yoyo habituel les génération suivantes. Cela ne crée pas de valeurs intermédiaires et si la mutation est suffisémment récente elle sera confinée à un très petit nombre d'individus donc extrémement rare même dans un gros clade comme Df27.
C'est le cas de l'individu dans le gropue df27 qui a une variance de -10 dans un STR dont le mode est 10. Bref, il a zéro Repeats et son STR a complétement disparu. Dans le clade DF27, le mode de ce STR est 10 et on observe des 9, 10 et 11, et c'est tout. Cette personne est probablement espagnole, donc issue d'un pays qui teste un peu, au moins via les Hispaniques Américains.
Pour DYS607 le mode est probalement 15 et pour les ~1600 membres du clade on observe 99% de 14, 15 et 16, quelques rares 13, un seul 12, un seul 11. Cela commence a faire beaucoup une variance de 4 quand le mode est 15. Donc pour moi, c'est une mutation récente et importante.
L'effet pervers de ces mutations, comme je l'ai dit plus haut, est de rendre quasi impossible d'avoir des matches STR quand la limite est 7 GD pour 67 marqueurs et que 4 GD sont déjà prises par un seul marqueur.

L'autre explication, bottlenecks et biais d'échantillonage, est moins économique en hypothèses de mon point de vue. On imagine un petite population qui contient tous les variants STR qui changent graduellement sur le mode du Yoyo. Cette population se disperse, puis une réduction de population arrive, qui supprime au hazard certains variants presque partout. En France il reste un variant STR rare et loin du mode, épargné par la famine mais invisible parce que la France ne teste pas ou peu, donc on ne verra pas ce variants, ni ses intermédiaires avec le mode, sauf très rares exceptions.
Mais à chaque fois il faudrait invoquer cette coincidence pour tous les STR, chaque fois qu'une variance importante et rare apparait dans un clade. L'abscence d'intermédaires dans le nombre des répétitions entre le Mode et les Variants rares, est trop générale pour que cela soit une explication générale.

FredH
04-13-2016, 06:48 PM
Je ne connaissais cette histoire de yoyo. Autrement dit, le marker STR revient vers une position d'équilibre qui correspondrait à la valeur moyenne "le mode" observée pour un haplogroupe donné. Peut être que d'autres positions d'équilibres sont trouvées lorsque justement les STR s'éloignent trop du mode, ce qui explique que le STR dans ce cas ne revient pas. Je dis ça mais je ne suis pas généticien. Mais ces systèmes moléculaires complexes peuvent avoir plusieurs positions d'équilibres même rapprochées, ce qui explique d'ailleurs la diversité des haplotypes.

Ric
04-13-2016, 08:27 PM
Au début je croyais que les glissements se faisaient vraiment au hazard et que l'on pouvait naivement espérer se dire que plus on est loin du Mode, plus on est loin en nombre de générations aussi. Mais cet effet yoyo ruine tout. Enfin, il faut bien qu'il y ait un mécanisme pour empécher les Répétitions et autres junk rétrotransposons de prendre trop d'ampleur, autrement, le chromosome Y étant haploide et sans 'copie de secours', rien n'empécherait les STR de rapidement augmenter la taille du chromosome Y, et on se retrouverait avec des chromosomes Y de tailles très différentes dans la population. Selon moi, ce mécanisme est surtout fait pour 'diminuer' le nombre de répétition, plutot que de le garder à un nombre arbitraire. Dailleurs, comment la cellule pourrait elle savoir le nombre de répétitions idéal à garder pour un STR donné ? Honnêtement, je n'ai pas trouvé beaucoup d'informations la dessus. L'explication du 'Yoyo' provient d'une observation empirique à mon avis.
Une tendance évolutive à la diminution des Repeats expliquerait peut être le cas du gars qui se retrouve avec zero Repeat. Le Mode est 10, mais un glissement sévére de plusieurs Repeats à la fois a pu avoir lieu, et son ancétre paternel a pu se retrouver avec 6 ou moins, proche d'un seuil en dessous duquel la polymérase efface tout. D'ailleurs, dans la liste du froupe DF27, on peut observer qu'il n'y a aucun Repeats en dessous de 8.

Dans le clade df27, en plus du gars qui est passé de 10 à 0, il y a un autre qui est passé de 9-9 à 0-0. Pourtant, aucun d'eux n'est indiqué comme MIN dans les tables. Quelqu'un sait-il pourquoi ?
Il y a aussi un gars qui est passé de 15 (mode) à 8, mais dans ce cas, 8 est indiqué comme MIN.
Donc sans faire de statistiques précises, j'ai quand même l'impression que les plus grandes variances sont celles qui vont à la baisse. J'ai vu des variations à la hausse de 34-36 à 40-44, mais déjà en valeur relative c'est moins important.