Frage:
Konvertieren von VCF-Dateien in PLINK-Bed / Bim / Fam-Dateien
Sarah
2018-03-01 00:55:00 UTC
view on stackexchange narkive permalink

Ich versuche, den besten Weg zu finden, um VCF-Dateien in binäre PLINK-Bed / Bim / Fam-Dateien zu konvertieren, aber es scheint, dass es viele verschiedene Möglichkeiten gibt, dies zu tun. (Verwenden Sie beispielsweise Plink 1.9 --vcf tag, bcftools, GATK und vcftools).

Natürlich haben sie alle wahrscheinlich ihre Verwendung, und Sie könnten wahrscheinlich eine Weile damit verbringen, darüber zu diskutieren, aber kann jemand eine kurze, einfache Erklärung geben, ob die Methoden im Allgemeinen gleich sind oder ob die eine oder andere im Allgemeinen gleich ist am besten für bestimmte Situationen? Danke!

Hallo Sarah, hast du am Ende eine Methode der anderen vorgezogen? Ich bin auf demselben Boot wie vor einigen Monaten und versuche nur, mir einen Überblick über die verschiedenen Methoden zu verschaffen. Vielen Dank!
Hallo @gaelgarcia! Nachdem ich mehr mit meinem PI gesprochen hatte, stellte ich fest, dass ich mich geirrt hatte und die VCF-Dateien nicht in Plink konvertieren musste, aber ich habe andere Plink-Befehle verwendet, die anscheinend gut funktionieren, und ich gehe davon aus, dass der Befehl plink --vcf funktioniert funktioniert gut. Seien Sie vorsichtig, wenn Sie sich darum kümmern, welche Allele Dur / Moll sind, da manchmal die Reihenfolge in Plink geändert wird. Weitere Informationen finden Sie im Abschnitt "Variant Call Format" auf dieser [Seite] (https://www.cog-genomics.org/plink2/input).
Zwei antworten:
gringer
2018-03-01 03:38:45 UTC
view on stackexchange narkive permalink

Da Plink VCF-Dateien nativ einliest und Plink Ihr gewünschtes Ausgabeformat ist, erwarte ich, dass plink --vcf <file> die beste Option ist.

Es gibt Vorbehalte im Zusammenhang mit den Arten von Varianten, die Plink aus den VCF-Dateien abruft, hauptsächlich im Zusammenhang mit Einschränkungen der eigenen Dateiformate von Plink. Aber wenn Ihr Endziel Plink ist, sollte das in Ordnung sein.

Woher weiß PLINK, was in die .fam-Datei geschrieben werden soll, da nur die VCF als Eingabe verwendet wird?
Es sieht so aus, als würde PLINK die Beispiel-IDs verwenden, um Familien- / Einzel-IDs zu erstellen. Weitere Informationen finden Sie im Abschnitt "Variant Call Format" auf dieser [Seite] (https://www.cog-genomics.org/plink2/input).
@gaelgarcia haben Sie jemals herausgefunden, woher es weiß, was es in die fam-Datei schreiben soll? Ich arbeite jetzt mit einem anderen Datensatz und habe Probleme, den besten Weg zu finden, um die Fam-Dateien korrekt zu schreiben.
Sarah
2019-02-28 12:48:50 UTC
view on stackexchange narkive permalink

Zusätzlicher Leckerbissen, den ich im letzten Jahr erfahren habe und den ich mit anderen teilen wollte, die daran arbeiten.

Plink erstellt eine äußerst generische fam -Datei für Sie, aber wenn Wenn Sie diese Fam-Datei aktualisieren, um die Familienstruktur, das Geschlecht usw. Ihrer Bevölkerung widerzuspiegeln, beachten Sie, dass bei Verwendung von Plink-Binärdateien (Bett / Bim / Fam) die Reihenfolge der Personen in der Fam-Datei mit der Reihenfolge der Personen in übereinstimmen muss die anderen Dateien (dies ist die Reihenfolge der Personen in der generischen fam-Datei)

Für vcftools ist das Flag --gzvcf erforderlich. plink --vcf kann komprimierte VCFs verarbeiten.
Danke @ChristopherChang Ich werde das in der Antwort beheben


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...