PDA

View Full Version : Rencontres Nord-Sud



anglesqueville
05-08-2018, 04:25 PM
J'ai posté récemment sur une procédure de mixage de données génétiques, que j'avais appliquée à un Pygmée et un Nganasan. Réfléchissant un peu à la procédure technique, assez pénible, j'en suis venu à la simplifier et à l'automatiser (sous R, après préparation des données sous PLINK). Héhé, ça tourne comme dans un rêve. Je n'ai pas pu résister: je l'ai appliquée à un Italien du Nord et à un Norvégien, tous deux extraits de HumanOrigins, 1.232.949 snps ( pas mal...)

Donc voilà, 4 kits gedmatch.
italnor1: 50% italien + 50% norvégien, Z737431
italnor2: 75% italien + 25% norvégien, Z075053
italnor3: 87.5% italien + 12.5% norvégien, Z697196
italnor4: 93.75% italien + 6.25% norvégien, Z636081

Amusez-vous un peu, et si vous trouvez certains oracles amusants (ou démoralisants, ce qui revient au même), postez-les ici. Mais ne traînez pas trop, car je ne laisserai pas ces kits sur gedmatch éternellement.

Arnfried
05-08-2018, 04:47 PM
En tout cas, tout tes italo-norvégiens ont les yeux bien bleus!
Même le plus "méditerranéen"!

23048 :nod:

Camulogène Rix
05-08-2018, 04:49 PM
J'ai juste regardé ce que donne italnor2 avec l'Eurogenes V2 K15 et cela donne ceci:

71.5% Spanish_Galicia + 28.5% Norwegian @ 9.79

Ton Italien, il ne serait pas plutôt de Saint Jacques de Compostelle? ou alors il y a un truc qui m'échappe dans cette méthode (ce qui est possible)

Arnfried
05-08-2018, 04:52 PM
Camulogène,
comment fais-tu pour obtenir des pourcentages précis en Oracle?
Car sur Gedmatch je n'ai pas de pourcentages :tsk: (enfin que des multiples de 25)

anglesqueville
05-08-2018, 04:57 PM
J'ai juste regardé ce que donne italnor2 avec l'Eurogenes V2 K15 et cela donne ceci:

71.5% Spanish_Galicia + 28.5% Norwegian @ 9.79

Ton Italien, il ne serait pas plutôt de Saint Jacques de Compostelle? ou alors il y a un truc qui m'échappe dans cette méthode (ce qui est possible)

Quelle méthode? Crois-moi, c'est un Italien que j'ai pris: HGDP01147. Le Norvégien est NOR119. Je viens de m'amuser à sortir la table de corrélation d'italnor3 (celui qui a un arrière-grand-parent norvégien (les nombres de la carte de Lukasz). regarde (et cherche l'arrière-gd-père...)

italnor3 1
IT_Tuscany 0,79499753
Swiss_Italian 0,76978106
IT_Veneto 0,76375634
IT_North 0,74980988
Austria_Tyrol 0,74404016
Albania_FYROM 0,7427938
IT_Marche 0,73213849
Albania_South 0,73157752
IT_Friuli 0,71760341
Albania_Montenegro 0,71471618
Kosovo 0,71449702
Albania_North 0,71444904
IT_Aosta 0,71235154
IT_Piedmont 0,71015928
IT_Lazio 0,70898278
FR_Corsica 0,70549407
IT_Abruzzo 0,69835627
Swiss_German 0,64761642
Macedonia_FYROM 0,64753005
Bosnian 0,64271848
IT_Apulia 0,63838101
South_Romania 0,63436587
Bulgaria 0,63412554
Sicily_Trapani 0,6264942
Sicily_Ragusa 0,62531436
France_Central 0,62362701
Serbian 0,62265955
IT_Campania 0,62096994
Spain_Baleares 0,60846623
Romania_SE 0,60117492
IT_Calabria 0,59813735
Sicily_Palermo 0,5975746
Sicily_Agrigento 0,59295532
Romania_SW 0,59027014
Sicily_Catania 0,58667311
South_Germany 0,57858157
West_Serbian 0,57313114
Malta 0,56712989
Sicily_Caltanisetta 0,55612125
Spanish_Basque 0,55449007
German_West 0,55284176
France 0,5409712
Sicily_Messina 0,53938238
Belgium 0,53873726
France_South 0,53777564
France_NorthEast 0,53764678
Croatian 0,53060599
Pat 0,51521253
NE_Romania 0,51342761
Austria 0,5052367
France_NorthWest 0,50153231
Romania_NW 0,48619219
dad 0,48452158
Portugal 0,48284151
Slovenian 0,45978358
Spain_Galicia 0,45717907
IT_Sardinia 0,45579948
Central_Dutch 0,44886962
SE_England 0,44839233
Hungary 0,4271039
South_Dutch 0,42602028
Spain_Valencia 0,42554799
Spain_Catalan 0,41897377
German_North 0,41154122
Spain_Andalusia 0,40722997
Spain_Canarians 0,40416989
Romania_Central 0,38990335
Spain_average 0,38903337
NW-England 0,38292173
Asturia 0,3828557
mom 0,36830675
Sweden 0,35916556
England_Cumberland 0,35900844
Scotland 0,3529124
Czechs_Moravians 0,3528704
Spain_Aragon 0,341631
NE-England 0,3376661
FR_Bretagne 0,33405794
British_mixed 0,33114745
SW-England 0,32996132
Slovak 0,32587399
Moldavian 0,32043897
Denmark 0,31392274
Northern_Ireland 0,30465477
Carpathian_Rusyns 0,30459163
German_East 0,29873725
Spain_Centabria 0,29372163
North_Dutch 0,2907129
Orcadian 0,28239938
Ireland 0,26754951
Welsh 0,2519602
Norway 0,24476552
PL_South_Poland 0,23446636
Spain_La-Rioja 0,21950006
PL_SE_Carpathia 0,21340957
PL_Upper_Silesia 0,21226047
Ukrainian_Central 0,20215979
Norway_north 0,19946796
Sweden_north 0,19791448
Ukrainian_East 0,19046863
PL_Wielkopolska 0,18075416
France_SW 0,16725981
Pl_Kashubians 0,14501251
PL_average 0,14170698
Belarusian_Polesye 0,11931765
Russian_Oryol 0,11647687
Pl_north 0,11338048
Russian_Kursk 0,10584764
PL_Mazovia 0,099097364
Ukrainian_West 0,097435327
Russian_Voronezh 0,089653281
Finnish_SW 0,089593803
Belarusian_West 0,082569848
Estonian 0,079871965
Russian_Bryansk 0,076371858
Russian_Tver 0,074661526
Russian_Tambov 0,073012822
Belarusian_East 0,067914205
Finnish_East 0,06701955
Karelian 0,066330766
Russian_Smolensk 0,066274265
Russian_Don_Cossack 0,065020372
Russian_North 0,064963052
Finnish_Inkeri 0,0648107
PL_Podlasie_East_Mazovia 0,063945679
Saami_NO 0,062419591
Russian_Center 0,061735743
Vepsian 0,05875162
Russian_Meshtchyora 0,052051174
Russian_Perm 0,051243314
Russian_Pinega 0,04919757
Saami 0,046595552
Russian_Kostroma 0,045037219
Russian_Novgorod_Pskov 0,044258395
Latvian 0,044219204
Russian_Vyatka 0,043057043
French_Basque 0,039818268
PL_Sudovia 0,039577525
Erzya 0,038306309
Lithuanian 0,037128879
Russian_Novgorod_Yaroslavl 0,033171546
Komi 0,01516861
Moksha 0,014684073
Udmurt -0,01763764
Mari -0,044886139

Camulogène Rix
05-08-2018, 05:50 PM
Camulogène,
comment fais-tu pour obtenir des pourcentages précis en Oracle?
Car sur Gedmatch je n'ai pas de pourcentages :tsk: (enfin que des multiples de 25)

J'ai regardé ce que cela donnait avec le "Mixed mode population sharing", dans lequel j'obtiens dans mon cas:

63.7% Tuscan + 36.3% Norwegian @ 3.58

Mais il est vrai que je ne suis pas un italien du nord avec un grand-père norvégien.

Arnfried
05-08-2018, 05:54 PM
Super merci, je regardai toujours dans le Oracle 4 du coup ça allait pas

anglesqueville
05-09-2018, 09:40 AM
Comme je l'espérais, ces 4 faux italo-norvégiens n'ont pas de match, à la seule exception des deux kits HGDP de l'Italien que quelqu'un a chargé. Il faut noter que ce kit (Z803652) a, lui, beaucoup de matchs ("réels"). Comme quoi Therrien.joel qui se posait la question peut être rassuré: il n'est pas si facile de simuler un faux individu sur gedmatch. Cela dit, ce n'était pas mon objet, ce fil et le sien se sont téléscopés. J'aimerais bien que vous me disiez (en particulier les nouveaux) ce que vous pensez des calculateurs gedmatch appliqués à ces italnor.
Note: avant de descendre un calculateur en flamme, pensez à regarder le nombre de snps pris en compte dans l'analyse (c'est écrit en petit en bas d'écran). Ces kits ont beaucoup de snps, mais pas forcément beaucoup en commun avec le pannel utilisé par le calc puisque ce ne sont pas des kits 23&me ou ftdna.

anglesqueville
05-09-2018, 04:52 PM
J'ai un peu regardé italnor3 (celui qui a 12.5% d'allèles issus du Norvégien). Pourquoi celui-là? Parce que ce taux d'une dizaine de % est celui de l'influx de Yamnaya dans le Hajji-Firuz soi-disant du néolithique, et aussi celui des Mycéniens. Cela m'intéressait donc de faire tourner qpAdm dessus. Mais avant qpAdm, les vieilleries... Voilà ce que j'ai trouvé de mieux. Je m'arrête au premier mélange North_Italian/Norwegian:


Eurogenes K13
1 67% Spanish_Valencia + 33% Serbian @ 2.95
2 72.4% Spanish_Cataluna + 27.6% Bulgarian @ 3.12
3 67.3% Spanish_Valencia + 32.7% Romanian @ 3.15
4 72.8% North_Italian + 27.2% Southeast_English @ 3.22
5 70.5% Spanish_Cataluna + 29.5% Romanian @ 3.23
6 75.7% North_Italian + 24.3% Orcadian @ 3.49
7 69.9% Spanish_Valencia + 30.1% Bulgarian @ 3.49
8 78% North_Italian + 22% Norwegian @ 3.5

Je n'ai pas essayé V2K15 ni EuTest, qui doivent donner des choses comparables. Quant à K36 avec nMonte3, il est à la ramasse.

Dodecad V3

1 69% Tuscan (HGDP) + 31% Orcadian (HGDP) @ 2.36
2 69.4% Tuscan (HGDP) + 30.6% Orkney (1000 Genomes) @ 2.44
3 67.2% Tuscan (HGDP) + 32.8% CEU (HapMap) @ 2.46
4 69.2% Tuscan (HGDP) + 30.8% Argyll (1000 Genomes) @ 2.47
5 88.6% N_Italian (Dodecad) + 11.4% German (Dodecad) @ 2.63
6 86.8% N_Italian (Dodecad) + 13.2% Slovenian (Xing) @ 2.64
7 88.3% N_Italian (Dodecad) + 11.7% Argyll (1000 Genomes) @ 2.65
8 88.4% N_Italian (Dodecad) + 11.6% N._European (Xing) @ 2.75
9 87.6% N_Italian (Dodecad) + 12.4% CEU (HapMap) @ 2.76
10 93% N_Italian (Dodecad) + 7% FIN (1000Genomes) @ 2.76
11 88.6% N_Italian (Dodecad) + 11.4% Orcadian (HGDP) @ 2.78
12 88.8% N_Italian (Dodecad) + 11.2% Orkney (1000 Genomes) @ 2.79
13 92.4% N_Italian (Dodecad) + 7.6% Swedish (Dodecad) @ 2.83
14 93.9% N_Italian (Dodecad) + 6.1% Finnish (Dodecad) @ 2.83
15 90.1% N_Italian (Dodecad) + 9.9% Mixed_Germanic (Dodecad) @ 2.88
16 92.8% N_Italian (Dodecad) + 7.2% Norwegian (Dodecad) @ 2.99

Contrairement à ce que je prévoyais, MDLP n'est pas très bon, et ne parlons pas de Gedrosia ni de PuntDNAl. Maintenant qpAdm. J'ai bien sûr demandé une modélisation en fonction de Italian_North et de Norwegian ( avec qpAdm, il faut demander quelque chose, il ne suffit pas de cliquer). Résultat:


(italnor3 mergé avec HumanOriginsPublic2068 réduit à 680.000 snps)





best coefficients (Ital_North/Norwegian): 0.870 0.130

Jackknife mean: 0.869657493 0.130342507

std. errors: 0.075 0.075

chisq tail prob

9.856 0.696903

C'est beaucoup mieux que ce que j'espérais.

Titane
05-09-2018, 05:25 PM
Comme je l'espérais, ces 4 faux italo-norvégiens n'ont pas de match, à la seule exception des deux kits HGDP de l'Italien que quelqu'un a chargé. Il faut noter que ce kit (Z803652) a, lui, beaucoup de matchs ("réels"). Comme quoi Therrien.joel qui se posait la question peut être rassuré: il n'est pas si facile de simuler un faux individu sur gedmatch. Cela dit, ce n'était pas mon objet, ce fil et le sien se sont téléscopés. J'aimerais bien que vous me disiez (en particulier les nouveaux) ce que vous pensez des calculateurs gedmatch appliqués à ces italnor.
Note: avant de descendre un calculateur en flamme, pensez à regarder le nombre de snps pris en compte dans l'analyse (c'est écrit en petit en bas d'écran). Ces kits ont beaucoup de snps, mais pas forcément beaucoup en commun avec le pannel utilisé par le calc puisque ce ne sont pas des kits 23&me ou ftdna.

Oui, j’ai même un genocousin en commun avec Z803652...;)

Camulogène Rix
05-09-2018, 09:36 PM
Avec Dodecad V3

Camu:

60.1% Tuscan (Xing) + 39.9% N._European (Xing) @ 3.03

Italnor 2:

58 % Tuscan (HGDP) + 42% CEU (HapMap) @ 3.61

Pas mal joué Angle:thumb:

A l'occasion regarde ce qu'il donne avec qpAdm.

anglesqueville
05-09-2018, 09:53 PM
Avec Dodecad V3

Camu:

60.1% Tuscan (Xing) + 39.9% N._European (Xing) @ 3.03

Italnor 2:

58 % Tuscan (HGDP) + 42% CEU (HapMap) @ 3.61

Pas mal joué Angle:thumb:

A l'occasion regarde ce qu'il donne avec qpAdm.

Vraiment à l'occasion, parce que concrètement, merging+conversion+etc, c'est quand même du boulot ... pour un individu qui n'existe pas. Mais juré, je regarderai. Logiquement on doit être dans les parages de 0.75+0.25, aucune raison que cela ne marche pas aussi bien qu'avec italnor3.
edit: pardon, avec Tuscan, le premier coeff doit être inférieur (je pense qu'Italian_North doit plutôt se référer à Bergame). Bon, à voir.

anglesqueville
05-10-2018, 02:06 PM
Camu, voilà pour toi. italnor2 (fabriqué avec 75% d'Italian du nord et 25% de Norvégien), analysé par qpAdm. Comme je n'ai pas cherché bien loin pour la right list, l'ajustement est assez pourri, mais je devrais pouvoir l'améliorer. En tout cas, pour ce qui est de la balance... je te laisse juge: 0.763 + 0.237. (chi2: 9.37 tail_prob: 0.497). Je vais essayer d'améliorer l'ajustement. Je n'ai pas de Toscans dans ma base, donc impossible de comparer avec Dodecad.
A l'instant (nouveaux outgroups), coeffs: 0.781/0.219 (st err: 0.124) tail_prob: 0.576, un peu meilleur.
Héhé, j'ai été dérangé et j'ai laissé cette fenêtre ouverte sans cliquer, donc mon message n'est pas parti. Et j'ai encore mieux:
chi2: 9.505 tail_prob: 0.659275 coeff: 0.785 / 0.215 (err: 0.119)

Camulogène Rix
05-10-2018, 04:41 PM
Je n'ai pas de Toscans dans ma base, donc impossible de comparer avec Dodecad.

J'aime bien les Toscans car ils pourraient être assez proches des Romains de l'époque d'Auguste:

Italian_Tuscan
"Corded_Ware_Germany" 43.8
"Greece_LN" 43.75
"Mycenaean" 7.9
"Jordan_EBA:I1730" 2.8
"Iran_Chalcolithic:I1665" 1.7

Les Italiens du Nord ont probablement 3 pts de Corded_ware_Germany en plus.

Theconqueror
05-10-2018, 05:31 PM
Meme l'indestructible MDLPK16 peut macher ton 081 :-)

MDLP K16 Modern 4-Ancestors Oracle

Admix Results (sorted):

# Population Percent
1 Neolithic 34.53
2 Caucasian 27.58
3 NorthEastEuropean 18.76
4 Steppe 17.61
5 NearEast 1.12


Finished reading population data. 517 populations found.
16 components mode.

--------------------------------

Least-squares method.

Using 1 population approximation:
1 Italian_Bergamo @ 4.420834
2 Provencal_Provence @ 7.953936
3 Italian_Friul @ 7.978974
4 Corsican_Corsica @ 8.432714
5 Spanish_Baleares @ 8.600327
6 Swiss_Switzerland @ 8.928599
7 Montenegrian_Montenegro @ 8.933933
8 Italian_NorthIitaly @ 8.980148
9 Spanish_Spain @ 9.013986
10 Italian_Tuscany @ 9.034974
11 Serbian_Serbia @ 9.174214
12 Macedonian_Macedonia @ 9.357780
13 French_EastFrance @ 9.407574
14 French_NorthwestFrance @ 9.525359
15 German_Germany @ 9.601941
16 Romanian_Apuseni @ 9.725253
17 Romanian_Gorj @ 9.796975
18 Kosovar_Kosovo @ 10.261971
19 Bulgarian_Bulgaria @ 10.763699
20 Moldavian_Molodva @ 11.103065

Using 2 populations approximation:
1 50% German_Germany +50% Italian_Tuscany @ 3.771222


Using 3 populations approximation:
1 50% Italian_Bergamo +25% Italian_Bergamo +25% Pole_EastPoland @ 3.358037


Using 4 populations approximation:
++++++++++++++++++++++++++++++++++++++++++++++++++ ++++++++++++++++++++++++++++++++++++++++++++++++++ ++++++++++++++++++++++++++++++++++++++++++++++++++ ++++++++++++++++++++++++++++++++++++++++++++++++++ +++++++++++++++++++
1 German_Germany + Italian_Bergamo + Italian_Bergamo + Italian_Bergamo @ 2.934682
2 Dutch_Netherlands + Italian_Bergamo + Italian_Bergamo + Italian_Bergamo @ 3.077492
3 German_Lipsian_(Saxony) + Italian_Bergamo + Italian_Bergamo + Italian_Bergamo @ 3.108669
4 French_France + Italian_Bergamo + Italian_Bergamo + Kosovar_Kosovo @ 3.142947
5 German_Germany + Italian_Bergamo + Italian_Bergamo + Italian_Tuscany @ 3.199541
6 Croat_Croatia + Italian_Bergamo + Italian_Bergamo + Italian_Bergamo @ 3.264675
7 English_Kent + Italian_Bergamo + Italian_Bergamo + Italian_Tuscany @ 3.268609
8 German_Germany + Italian_Bergamo + Italian_Bergamo + Kosovar_Kosovo @ 3.273831
9 French_France + Italian_Bergamo + Italian_Bergamo + Macedonian_Macedonia @ 3.283896
10 German_Germany + Italian_Bergamo + Italian_Bergamo + Macedonian_Macedonia @ 3.287148
11 English_Kent + Italian_Bergamo + Italian_Bergamo + Kosovar_Kosovo @ 3.295680
12 Bulgarian_Bulgaria + French_France + Italian_Bergamo + Italian_Bergamo @ 3.295956
13 English_Kent + Greek_Thessaloniki + Italian_Bergamo + Italian_Bergamo @ 3.318718
14 Dutch_Netherlands + Italian_Bergamo + Italian_Bergamo + Italian_Tuscany @ 3.335575
15 French_France + Greek_Thessaloniki + Italian_Bergamo + Italian_Bergamo @ 3.336490
16 French_NorthwestFrance + Italian_Bergamo + Italian_Bergamo + Italian_Bergamo @ 3.354015
17 Italian_Bergamo + Italian_Bergamo + Italian_Bergamo + Pole_EastPoland @ 3.358037
18 French_EastFrance + Italian_Bergamo + Italian_Bergamo + Italian_Bergamo @ 3.370228
19 Italian_Bergamo + Italian_Bergamo + Italian_Bergamo + Scottish_Dumfries_Galloway @ 3.379591
20 Bulgarian_Bulgaria + French_France + Italian_Bergamo + Italian_Bergamo @ 3.380450

Camulogène Rix
05-11-2018, 05:02 PM
Camu, voilà pour toi. italnor2 (fabriqué avec 75% d'Italian du nord et 25% de Norvégien), analysé par qpAdm. Comme je n'ai pas cherché bien loin pour la right list, l'ajustement est assez pourri, mais je devrais pouvoir l'améliorer. En tout cas, pour ce qui est de la balance... je te laisse juge: 0.763 + 0.237. (chi2: 9.37 tail_prob: 0.497). Je vais essayer d'améliorer l'ajustement. Je n'ai pas de Toscans dans ma base, donc impossible de comparer avec Dodecad.
A l'instant (nouveaux outgroups), coeffs: 0.781/0.219 (st err: 0.124) tail_prob: 0.576, un peu meilleur.
Héhé, j'ai été dérangé et j'ai laissé cette fenêtre ouverte sans cliquer, donc mon message n'est pas parti. Et j'ai encore mieux:
chi2: 9.505 tail_prob: 0.659275 coeff: 0.785 / 0.215 (err: 0.119)

Fin de l'expérience pour moi: l'Eurogenes EU test me modélise en fait mieux qu'il ne le fait pour Italnor2:

Camu:
75.5% North_Italian 24.5% Norvegian @3.11

Italnor2:
66.9% Tuscan 31.1% North_Swedish @18.71

Si elle nous lit, ce dont je ne doute pas, Titane devrait regarder ce que donnent ses fistons. Ils
devraient taper dans les mêmes eaux.

Bon, sur ce je vais aller dîner d'un bonne escalope milanaise arrosée d'un verre de Christiana:P

anglesqueville
05-11-2018, 08:09 PM
^^ Bon, je vois que tu préfères alimenter tes 75.5%, plutôt que tes 24.5% ( par exemple d'excellents Fiskekaker arrosés d'akvavit Linie glacée)...

Camulogène Rix
05-11-2018, 08:42 PM
La Christiana est aussi une vodka norvégienne ;)

Christiana est l'ancien nom d'Oslo (cf. "Sult").

anglesqueville
05-11-2018, 10:11 PM
Tiens, je connais la Norvegia ( pas terrible, apparemment comme la Christiana faite avec des patates du Trøndelag et de l'eau de fonte glaciaire). Hum... A l'occasion, si tu en trouves, goûte l'akvavit Linie. Et on ne me fera jamais accepter l'idée que les akvavits sont des vodkas, non mais! J'ai souvenir d'un dîner à l'akvavit ( c'était de la danoise de base, il est vrai, de l'Aalborg de table, pas de la merveilleuse Jubileum). Les lendemains n'ont pas chanté... J'espère que tu as bu beaucoup d'eau après ta vodka.

Titane
05-12-2018, 03:09 AM
Fin de l'expérience pour moi: l'Eurogenes EU test me modélise en fait mieux qu'il ne le fait pour Italnor2:

Camu:
75.5% North_Italian 24.5% Norvegian @3.11

Italnor2:
66.9% Tuscan 31.1% North_Swedish @18.71

Si elle nous lit, ce dont je ne doute pas, Titane devrait regarder ce que donnent ses fistons. Ils
devraient taper dans les mêmes eaux.

Bon, sur ce je vais aller dîner d'un bonne escalope milanaise arrosée d'un verre de Christiana:P
Fils de Titane
1 50% English +50% Tuscan @ 4.663839. Version FT-DNA
Ou

1 50% English +50% Tuscan @ 5.040544. Version 23andMe