Frage:
Ausrichtungsbasiert vs. referenzfrei (Transkriptomanalyse)?
SmallChess
2017-05-17 10:19:49 UTC
view on stackexchange narkive permalink

Ich möchte mich auf die Transkriptomanalyse konzentrieren. Wir wissen, dass es möglich ist, RNA-Seq-Experimente basierend auf Alignment oder k-meren zu analysieren.

Möglicher Alignment-Workflow:

Möglicher referenzfreier Workflow:

  • Sequenz quantifizieren liest mit Kallisto referenzfreiem Index

Beide Strategien generieren eine Genexpressionstabelle.

F: Was sind Vor- und Nachteile für jeden Ansatz? Können Sie eine Richtlinie geben?

Eine referenzfreie Quantifizierung existiert nicht wirklich (und Kallisto nicht).
Hier ist ein Projekt, das versucht, Tools für Sequenzierungsdaten mit hohem Durchsatz ohne Referenz zu erstellen: https://colibread.inria.fr/project/
Zwei antworten:
#1
+11
Sarah Carl
2017-05-17 12:58:47 UTC
view on stackexchange narkive permalink

Zunächst möchte ich betonen, dass "ausrichtungsfreie" Quantifizierungswerkzeuge wie Salmon und Kallisto nicht referenzfrei sind. Der grundlegende Unterschied zwischen ihnen und herkömmlichen Alignern besteht darin, dass sie keine bestimmte Position (weder in einem Genom noch in einem Transkriptom) angeben, der ein Lesevorgang zugeordnet ist. Ihr allgemeiner Zweck besteht jedoch immer noch darin, die Expressionsniveaus (oder Unterschiede) eines bekannten Satzes von Transkripten zu quantifizieren; Daher benötigen sie eine Referenz (die willkürlich definiert werden kann).

Das wichtigste Kriterium für die Entscheidung, welcher Ansatz verwendet werden soll (und dies gilt für fast alles in der Genomik), ist genau die Frage, die Sie möchten Antworten. Wenn Sie hauptsächlich daran interessiert sind, die Expression reifer mRNA aus bekannten Transkripten zu quantifizieren und zu vergleichen, ist ein auf Transkriptomen basierendes Alignment möglicherweise am schnellsten und besten. Möglicherweise übersehen Sie jedoch potenziell interessante Merkmale außerhalb dieser bekannten Transkripte, wie neue Isoformen, nicht-kodierende RNAs oder Informationen zu Prä-mRNA-Spiegeln, die häufig aus intronischen Lesevorgängen gewonnen werden können (siehe EISA a) > Methode).

In diesem Dokument werden auch einige gute Überlegungen dazu angestellt, welche Tools je nach der Frage, die Sie beantworten möchten, am besten funktionieren.

Zum Schluss noch eine Der schnelle und flexible Aligner (der mit oder ohne Referenztranskriptom verwendet werden kann) ist STAR.

#2
+7
H. Gourlé
2017-05-17 11:29:37 UTC
view on stackexchange narkive permalink

Ich würde nicht sagen, dass Kallisto (oder Lachs) referenzfrei sind. Sie verwenden ein Transkriptom als Referenz und ein Konzept namens Pseudo-Alignment , das den Prozess der Zuordnung Ihrer Lesevorgänge zu einem Transkript erheblich beschleunigt.

Das heißt, beide Ansätze von (i) Mapping gegen ein Referenzgenom (was Sie als Alignment Workflow bezeichnet haben) und (ii) die Kartierung gegen ein Referenztranskriptom dient unterschiedlichen Zwecken

Die Transkriptomkartierung unter Verwendung von Pseudoalignent wird zur Methode der Wahl für das Gen. / Transkriptquantifizierung und differentielle Expressionsanalyse. Der Nachteil ist, dass Sie sich nur auf bekannte Transkripte konzentrieren.

Zwei typische Workflows sind:

  • Kallisto gefolgt von Sleuth
  • Lachs, gefolgt von tximport und DESeq2 / EdgeR

Die Genomkartierung ist nützlich, um beispielsweise neue Isoformen zu entdecken. Sie sollten TopHat nicht mehr verwenden, da es vom Autor eingestellt wurde.

Ein typischer Workflow wäre:

  • Hisat2 (Ausrichtung)
  • StringTie (Transkriptassemblierung und Häufigkeitsschätzung)
  • Ballkleid (differentieller Ausdruck)
Es ist nur erwähnenswert (zusätzlich zu dieser sehr nützlichen Antwort), dass Lachs auch mit dem Paket [wasabi] (https://github.com/COMBINE-lab/wasabi) mit Sleuth verwendet werden kann.


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...