Frage:
Imputieren fehlender Genotypen aus separaten Genotypisierungspanels
Greg
2017-06-01 12:27:26 UTC
view on stackexchange narkive permalink

Was ist der aktuelle Standard für die Zuordnung fehlender Genotypen zwischen zwei Genotypisierungspanels? Ich habe zwei Populationen, die unter Verwendung von zwei verschiedenen Panels (A & B) genotypisiert wurden, und ich möchte alle Genotypen in Population B für die in Panel A verwendeten Positionen unterstellen.

Ich habe die Beispiele für gelesen impute2, und ich denke, das, wonach ich suche, ist dieses Beispiel, "Imputation mit einem unphasierten Referenzpanel".

Einfach ausgedrückt, ich möchte eine Liste von SNPs, eine Variantendatei für Population B und Haplotypinformationen von 1.000 Genomen bereitstellen und unterstellte Genotypen für jeden SNP in der Liste erhalten. Ist impute2 der Stand der Technik?

Es kommt darauf an, ob wir das gesamte Genom, alle Chromosomen unterstellen, dann ist impute2 ziemlich solide. Unphased Panel würde ein besseres Ergebnis liefern, aber langsame Leistung. Wenn wir eine Region unterstellen, denke ich, dass Beagle besser ist.
Ich möchte nicht das gesamte Genom unterstellen, sondern nur bestimmte bestimmte Stellen.
Einer antworten:
#1
+4
winni2k
2017-06-01 20:22:21 UTC
view on stackexchange narkive permalink

Da Sie erwähnen, dass Sie 1000 Genome als Referenzpanel für die Eingabe von Genotypen in Ihre beiden SNP-Chip-Panels verwenden möchten, gehe ich davon aus, dass Sie mit menschlichen Daten arbeiten.

In diesem Fall stehen Ihnen mehrere Optionen zur Verfügung:

  • Wenn Ihre beiden Panels europäischer Herkunft sind, ist es wahrscheinlich am besten, den HRC zu verwenden Referenzpanel zusammen mit einem schnellen Genotyp-Imputationstool wie Beagle 4.1, um Genotypen in jedem Ihrer beiden SNP-Chip-Panels separat zu imputieren.
  • Wenn Ihre Panels nicht von sind Europäischer Abstammung, dann möchten Sie wahrscheinlich das 1000-Genom-Phase-3-Referenzpanel mit Beagle 4.1, Impute2 oder Minimac3 verwenden.

In beiden Fällen stehen zwei Phasendienste zur Verfügung Ein Großteil des schweren Hebens für Sie 1, 2.

Das zweite Papier des Wellcome Trust Case-Control Consortium führte eine Cross-Imputations-Analyse, wie Sie beschreiben. Ich sehe nicht viele Studien mit mehreren SNP-Chip-Panels. Sie müssen bei Ihrer Analyse darauf achten, dass Sie bei der Verwendung von zwei verschiedenen SNP-Chip-Panels nicht von Batch-Effekten betroffen sind.

Außerdem funktioniert keine dieser Methoden, wenn die Region, in die Sie imputieren, zu wenige aufweist Varianten. Ich bin mir nicht sicher, wie viele Varianten mindestens vorhanden sind. Wenn Sie jedoch ein Genotypisierungspanel für das gesamte Genom mit mindestens 500.000 SNPs verwenden, sollten Sie in Ordnung sein, wenn Sie jeweils ein ganzes Chromosom unterstellen.

Vielen Dank! Dies scheinen gute Optionen zu sein. Und ja, ich arbeite mit menschlichen Daten. Ich weiß nicht genau, welche ethnische Zugehörigkeit die Teilnehmer haben, und ich vermute, dass es sich wahrscheinlich um eine vielfältige Bevölkerung handelt, daher sind 1000 Genome für mich am sinnvollsten. Sie erwähnen Beagle ein paar Mal. Gibt es einen Grund, warum Sie es bevorzugen?
Ich habe nicht genug Erfahrung im Vergleich der drei Programme Beagle 4.1, Impute2 und Minimac3, um wirklich eine Präferenz auszusprechen. Sie sollten mit jedem von ihnen eine Imputation von guter Qualität erhalten, aber auf sich selbst testen, was einfach ist, indem Sie durchgehaltene Genotypen unterstellen. Die einzige Einschränkung besteht darin, dass Impute2 meiner Meinung nach wahrscheinlich etwas länger dauern wird als die anderen Programme, wenn von einem Referenzpanel die Größe des HRC eingegeben wird.
Beagle hat super funktioniert und war einfach zu bedienen. Ich empfehle es sehr


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...