Frage:
Arbeiten mit alten Genom-Builds
zx8754
2017-06-01 01:47:18 UTC
view on stackexchange narkive permalink

Ist die Arbeit mit und das Verlassen auf alte Genom-Builds noch gültig?

Zum Beispiel NCBI36 / hg18. Würden Ergebnisse von Papieren, die auf alten Builds basieren, LiftOver und eine erneute Analyse erfordern, um nützlich zu sein?

Ein bisschen Kontext, dies hängt mit anderen Beiträgen zusammen, in denen aCGH-Ergebnisse basieren bei altem Build: Wie validiere ich ein einzelnes ArrayCGH-Beispielergebnis?

Dies hängt wahrscheinlich davon ab, welche Art von Analyse Sie im Kopf haben. Am Ende werden alle Daten, die wir heute generieren, eines Tages veraltet sein, aber es bedeutet nicht, dass alle Schlussfolgerungen falsch sind. Wenn Sie sich genauer mit den Analysetypen befassen, die Sie im Kopf haben (oder mit konkreten Papieren, die hg18 verwenden), ist es möglicherweise einfacher, eine korrekte Antwort zu geben.
Vier antworten:
#1
+8
Karel Brinda
2017-06-01 02:03:51 UTC
view on stackexchange narkive permalink

Meiner Meinung nach ist es nicht sehr zuverlässig. LiftOver ist in Bezug auf Transformationen, die es unterstützen kann, sehr begrenzt. Das LiftOver Chain-Format kann nur übereinstimmende Regionen in derselben Reihenfolge erfassen. Dies bedeutet, dass Indels berücksichtigt werden können, aber selbst einfache strukturelle Variationen werden problematisch.

Wenn beispielsweise eine neuere Assembly verfügbar ist, wird normalerweise empfohlen, alle Lesevorgänge neu zuzuordnen, anstatt die vorhandenen zu transformieren Ausrichtungen.

#2
+4
Manuel
2017-06-01 04:34:31 UTC
view on stackexchange narkive permalink

Ich denke, dass derzeit nur hg19 / GRCh37 in Betracht gezogen werden kann, da viele Datenbanken wie gnomAD diese Version noch ausschließlich verwenden. Auf der anderen Seite hat hg38 / GRCh8 viele wichtige Korrekturen und die nützliche (aber noch nicht genutzte) Funktion alternativer Loci.

Alles aus älteren Releases sollte einem neueren zugeordnet werden.

#3
+2
story
2017-06-08 11:38:40 UTC
view on stackexchange narkive permalink

Sie könnten liftOver verwenden, was nicht immer großartig ist.

Immer wenn ich darauf stoße (insbesondere auf NGS-Daten, die in der SRA verfügbar sind), erhalte ich oft nur die Rohdateien (z. B. fastqs) und re-re Ausrichten / Neuzuordnen.

In Ihrem Fall (Arrays) kann es etwas schwierig sein. Nicht unmöglich, da ich kürzlich einige alte Hefe-DNA / RNA-Microarray-Daten genommen und auf das neueste Genom aktualisiert habe. Benötigt nur die richtigen Daten (wie DNA zur Normalisierung) und ein gutes Verständnis des gesamten Prozesses.

Ein letzter Ausweg / eine letzte Alternative besteht darin, Ihre neuen Daten an das alte Genom anzupassen Vergleiche anstellen können. Dies ist nicht ideal, funktioniert jedoch in Fällen, in denen ein Upgrade einer Quelle nicht möglich ist oder einen RIESIGEN Zeit- / Arbeitsaufwand erfordert. Ich habe dies für ein paar Fliegenexperimente gemacht, bei denen alle verfügbaren / vorherigen Daten in dm3 gemacht wurden. Alle alten Genome finden Sie im Allgemeinen auf http://archive.ensembl.org.

#4
  0
burger
2017-06-08 05:09:09 UTC
view on stackexchange narkive permalink

Bei Mäusen sehe ich immer noch Leute, die mm9 / NCBI37 in hochkarätigen Veröffentlichungen verwenden, obwohl mm10 / GRCm38 vor mehr als 5 Jahren (2011) veröffentlicht wurde. Ich persönlich halte das nicht für eine großartige Idee, aber laut Peer Reviewern ist sie sicherlich gültig.

Es hängt auch von Ihrer Anwendung ab. Wenn Sie mit codierenden Regionen arbeiten (wahrscheinlich seit langem bekannt) oder genomweite Statistiken extrahieren (z. B. Anreicherung bei TSS), sollten die Unterschiede vernachlässigbar sein.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...