Results 1 to 7 of 7

Thread: Conversion fichiers plink (bed/bim/fam)

  1. #1
    Registered Users
    Posts
    565
    Sex
    Location
    Grand Genève
    Y-DNA
    E-M81 (North Africa)
    mtDNA
    I3a1 (Steppe)

    Conversion fichiers plink (bed/bim/fam)

    Je souhaiterais convertir 3 fichiers plink (bed/bim/fam) ci-dessous qui contiennent les génomes d'une trentaine d'individus (tous regroupés dans le même fichier Bed)

    northafrica_syria_filtered.bed
    northafrica_syria_filtered.bim
    northafrica_syria_filtered.fam

    en format BAM ceci afin de les convertir ensuite avec le BAM_Analysis_Kit_1_8 en format acceptable par Gedmatch (ftdna, 23andme) et de pouvoir les uploader sur Gedmatch.

    Donc, quelle est la méthode la plus simple et la plus directe pour passer du format Plink au format BAM (avec un fichier par individu bien entendu) si cela est possible ? sinon comment faire pour convertir simplement ces 3 fichiers plink au format 23andme ou FtDna avec un fichier par individu ?
    Last edited by E_M81_I3A; 10-13-2018 at 07:27 AM.
    Estimated Ancestry: Western Eurasia 90%, Africa 10% (Ancient North Africa 5%, SSA 5%)
    Living Dna: Europe 83, NearEast 6.8, Africa 10.1 (NorthAfrica 4.6, Yoruba 4.2, Mandinka 1.4)
    Basal K7: Basal 43.7, Villabruna 42.7, ANE 7.7, SSA 4.7, EastEurasian 1
    Global 25: Iberomaurusian 11, WHG 6, Barcin_N 46, Levant_ChL 6, Yamnaya 26, Yoruba 5
    Eurogenes K13: North_Atlantic 26.2, West_Med 24.8, East_Med 17.7, Baltic 8.9, Red_Sea 7.7, Sub-Saharan 5.6, Northeast_African 4.7, West_Asian 3.0

  2. #2
    Registered Users
    Posts
    565
    Sex
    Location
    Grand Genève
    Y-DNA
    E-M81 (North Africa)
    mtDNA
    I3a1 (Steppe)

    Je pense que j'ai trouvé..

    Il faut les convertir plutôt en VCF puis uploader le fichier VCF sur GedMatch genesis qui accepte ce format.
    Last edited by E_M81_I3A; 10-13-2018 at 09:01 AM.
    Estimated Ancestry: Western Eurasia 90%, Africa 10% (Ancient North Africa 5%, SSA 5%)
    Living Dna: Europe 83, NearEast 6.8, Africa 10.1 (NorthAfrica 4.6, Yoruba 4.2, Mandinka 1.4)
    Basal K7: Basal 43.7, Villabruna 42.7, ANE 7.7, SSA 4.7, EastEurasian 1
    Global 25: Iberomaurusian 11, WHG 6, Barcin_N 46, Levant_ChL 6, Yamnaya 26, Yoruba 5
    Eurogenes K13: North_Atlantic 26.2, West_Med 24.8, East_Med 17.7, Baltic 8.9, Red_Sea 7.7, Sub-Saharan 5.6, Northeast_African 4.7, West_Asian 3.0

  3. #3
    Moderator
    Posts
    5,181
    Sex
    Location
    Normandy
    Ethnicity
    northwesterner
    Y-DNA
    U152>L2>Z367
    mtDNA
    H5a1

    Normandie Netherlands Friesland Finland Orkney
    Sous Plink, si ton fichier s'appelle: FichierGlobal (pour northafricanetc, c'est trop long pour ce post). Tu ouvres le fichier .fam avec ton éditeur de texte, tu copies la ligne correspondant à l'individu que tu veux extraire sous un fichier, disons keep_machin. Ensuite, sous Plink

    ./plink --bfile FichierGlobal --keep keep_machin --recode 23 --out machin

    Je passe sur des détails, ne sachant pas si tu veux garder tous les SNPs, garder les indels, etc. Le résultat est un fichier machin.txt. Attention, le fait de recoder au format 23&me n'a aucun rapport avec les snps que contiendra ton fichier. Le format 23&me est strictement un fichier texte, sans aucune contrainte supplémentaire. Si tu ne veux pas d'ennuis avec gedmatch tu as peut-être intérêt à ajouter le drapeau: --snps-only just-acgt (espace entre le drapeau et l'option). De toute manière ça ne fait jamais de mal de virer les multialléliques.
    En North alom, de North venom
    En North fum naiz, en North manom

    (Roman de Rou, Wace, 1160-1170)

  4. The Following User Says Thank You to anglesqueville For This Useful Post:

     E_M81_I3A (10-13-2018)

  5. #4
    Registered Users
    Posts
    565
    Sex
    Location
    Grand Genève
    Y-DNA
    E-M81 (North Africa)
    mtDNA
    I3a1 (Steppe)

    Merci effectivement je venais de voir que --recode avec l'option 23 permettait de convertir directement en format 23andme..

    Jai pu uploader un individu en format vcf sur gedmatch genesis mais malheureusement il semble que le nombre de snp en commun entre affymetrix 6.0 et les calculateurs eurogenes ne soit que d'environ 30 000...

    Je vais essayer quelques autres avec le format 23andme directement pour voir...
    Last edited by E_M81_I3A; 10-13-2018 at 12:27 PM.
    Estimated Ancestry: Western Eurasia 90%, Africa 10% (Ancient North Africa 5%, SSA 5%)
    Living Dna: Europe 83, NearEast 6.8, Africa 10.1 (NorthAfrica 4.6, Yoruba 4.2, Mandinka 1.4)
    Basal K7: Basal 43.7, Villabruna 42.7, ANE 7.7, SSA 4.7, EastEurasian 1
    Global 25: Iberomaurusian 11, WHG 6, Barcin_N 46, Levant_ChL 6, Yamnaya 26, Yoruba 5
    Eurogenes K13: North_Atlantic 26.2, West_Med 24.8, East_Med 17.7, Baltic 8.9, Red_Sea 7.7, Sub-Saharan 5.6, Northeast_African 4.7, West_Asian 3.0

  6. #5
    Moderator
    Posts
    5,181
    Sex
    Location
    Normandy
    Ethnicity
    northwesterner
    Y-DNA
    U152>L2>Z367
    mtDNA
    H5a1

    Normandie Netherlands Friesland Finland Orkney
    Si les Snps sont en Affymetrix, il faudrait peut-être renommer les identifiants. Sous Plink tu dois utiliser --update-name avec en option un fichier texte donnant en première colonne 1 les ancients identifiants et en 2 les nouveaux. Encore faut-il constituer un tel fichier. Je ne l'ai jamais fait pour des Aff. Sinon le programme que je suis en train d'expérimenter, GenotypeHarmonizer, fait cela, précisément son job est d'aligner les séquences sur un fichier de références (1kg pour moi) mais tu peux lui demander d'aligner les identifiants par la même occasion. Mais il te faudrait installer GH et installer une base de référence avec des #rs comme identifiants. Dans tous les cas c'est assez lourd. Il y a peut-être un moyen plus léger, quoique j'en doute, mais tu peux demander à David ou Kurd, ou poster une requête sur cog-gen https://groups.google.com/forum/#!forum/plink2-users .
    En North alom, de North venom
    En North fum naiz, en North manom

    (Roman de Rou, Wace, 1160-1170)

  7. The Following User Says Thank You to anglesqueville For This Useful Post:

     E_M81_I3A (10-13-2018)

  8. #6
    Registered Users
    Posts
    565
    Sex
    Location
    Grand Genève
    Y-DNA
    E-M81 (North Africa)
    mtDNA
    I3a1 (Steppe)

    J'ai donc uploadé cinq individus sur Gedmath Genesis (le premier en VCF et les autres en format 23andme)

    ML5982651 Algeria_Timimoun BerZN103
    AU9634430 Morocco_Errachida BerE2
    DQ4950171 Morocco_Tiznit BER_BerT3
    QB4539992 Tunisia_Sened BerS20
    XX1856983 Syria_Ber1AH252

    Apparemment quelqu'un avait du déjà uploadé quelques individus de l'étude car il y des "duplicate kits" pour certains.

    Même avec 31 000 SNPS en communs avec Eurogenes K13 les résultats sont excellents.
    Last edited by E_M81_I3A; 10-13-2018 at 08:24 PM.
    Estimated Ancestry: Western Eurasia 90%, Africa 10% (Ancient North Africa 5%, SSA 5%)
    Living Dna: Europe 83, NearEast 6.8, Africa 10.1 (NorthAfrica 4.6, Yoruba 4.2, Mandinka 1.4)
    Basal K7: Basal 43.7, Villabruna 42.7, ANE 7.7, SSA 4.7, EastEurasian 1
    Global 25: Iberomaurusian 11, WHG 6, Barcin_N 46, Levant_ChL 6, Yamnaya 26, Yoruba 5
    Eurogenes K13: North_Atlantic 26.2, West_Med 24.8, East_Med 17.7, Baltic 8.9, Red_Sea 7.7, Sub-Saharan 5.6, Northeast_African 4.7, West_Asian 3.0

  9. #7
    Banned
    Posts
    6,337
    Sex
    Location
    Torun
    Ethnicity
    Central 75% + 25% Mazovia
    Nationality
    Pole
    Y-DNA
    R1a > M198 > YP 1337

    Poland
    Quote Originally Posted by rz1706 View Post
    J'ai donc uploadé cinq individus sur Gedmath Genesis (le premier en VCF et les autres en format 23andme)


    Apparemment quelqu'un avait du déjà uploadé quelques individus de l'étude car il y des "duplicate kits" pour certains.
    Ys, it's me. I uploaded to Gedmatch (but majority to standard version) all possible modern samples from public datasets but keep them private, sorry))
    Last edited by lukaszM; 10-14-2018 at 07:30 PM.

Similar Threads

  1. Plink, Admixtools ( and their friends)
    By anglesqueville in forum Autosomal (auDNA)
    Replies: 7
    Last Post: 05-24-2017, 01:39 PM
  2. plink/convertf/mergeit : my nightmare
    By anglesqueville in forum Inquiries Corner
    Replies: 10
    Last Post: 03-05-2017, 10:59 PM
  3. PLINK and 23andme raw data file
    By sonofaroli in forum Inquiries Corner
    Replies: 5
    Last Post: 02-25-2017, 08:45 PM
  4. A question about Plink
    By Anabasis in forum Inquiries Corner
    Replies: 0
    Last Post: 11-11-2015, 03:40 PM

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •