Frage:
Normalisierungsmethoden mit RNA-Seq ERCC-Spike in?
SmallChess
2017-05-17 10:24:25 UTC
view on stackexchange narkive permalink

ERCC Spike-In ist eine Reihe synthetischer Kontrollen, die für RNA-Seq. Ich bin daran interessiert, damit meine RNA-Seq-Proben zu normalisieren. Insbesondere möchte ich die Spike-Ins verwenden, um technische Verzerrungen und Abweichungen zu beseitigen, die nicht Teil meiner Analyse sein sollten.

Die Website enthält keine Details dazu, wie ich das tun kann

F: Was sind die möglichen Normalisierungsstrategien? Können Sie sie kurz beschreiben?

Interessieren Sie sich für Bulk- oder Einzelzell-RNA-Sequenz? Der Wert von Spike-Ins ist abhängig davon sehr unterschiedlich
Zwei antworten:
#1
+9
Scott Gigante
2017-05-17 10:43:41 UTC
view on stackexchange narkive permalink

Sie können RUVSeq verwenden. Hier ist ein Auszug aus der Veröffentlichung 2013 Nature Biotechnology:

Wir bewerten die Leistung der Spike-In-Kontrollen des External RNA Control Consortium (ERCC) und untersuchen die Möglichkeit von Verwenden Sie sie direkt zur Normalisierung. Wir zeigen, dass die Spike-Ins nicht zuverlässig genug sind, um in Standardverfahren zur globalen Skalierung oder auf Regression basierenden Normalisierungsverfahren verwendet zu werden. Wir schlagen eine Normalisierungsstrategie vor, die als "Unerwünschte Variation entfernen" (RUV) bezeichnet wird und die störenden technischen Effekte durch Durchführung einer Faktoranalyse an geeigneten Sätzen von Kontrollgenen (z. B. ERCC-Spike-Ins) oder Proben (z. B. Replikationsbibliotheken) ausgleicht. P. >

RUVSeq passt im Wesentlichen ein verallgemeinertes lineares Modell (GLM) an die Ausdrucksdaten an, wobei Ihre Ausdrucksmatrix $ Y $ eine Matrix $ m $ mal $ n $ ist, wobei $ m $ die Anzahl der Stichproben ist und $ n $ die Anzahl der Gene. Das Modell läuft auf

$ Y = X * \ beta + Z * \ gamma + W * \ alpha + \ epsilon $

hinaus, wobei $ X $ die interessierenden Bedingungen beschreibt ( zB Behandlung vs. Kontrolle), $ Z $ beschreibt beobachtete Kovariaten (z. B. Geschlecht) und $ W $ beschreibt unbeobachtete Kovariaten (z. B. Charge, Temperatur, Labor). $ \ beta $, $ \ gamma $ und $ \ alpha $ sind Parametermatrizen, die den Beitrag von $ X $, $ Z $ und $ W $ aufzeichnen, und $ \ epsilon $ ist zufälliges Rauschen. Für eine Untergruppe sorgfältig ausgewählter Gene (z. B. ERCC-Spike-Ins, Housekeeping-Gene oder technische Replikate) können wir annehmen, dass $ X $ und $ Z $ Null sind, und $ W $ finden - die "unerwünschte Variation" in Ihrer Stichprobe.

#2
+4
gringer
2017-08-02 03:16:10 UTC
view on stackexchange narkive permalink

Wir haben allen unseren RNASeq-Daten ERCC-Spike-Ins hinzugefügt, für den Fall, dass andere Personen dies in Zukunft für nützlich halten. Ich habe es jedoch nie in meinen eigenen Analysen verwendet, da ich mir keine vernünftige Art der Verwendung vorstellen kann.

Die typische Empfehlung für ERCC besteht darin, es proportional zur eingegebenen RNA-Menge hinzuzufügen Dies setzt jedoch voraus, dass die Gesamtzell-RNA-Anzahl über verschiedene Zellen hinweg ähnlich ist (was nachweislich falsch ist, wenn man die RNASeq-Ergebnisse einzelner Zellen betrachtet).

Ich muss mir noch eine Situation vorstellen, in der ERCC bessere Ergebnisse liefern würde Ergebnisse als ein "Housekeeping" -Gensatz, der aus den ursprünglichen Messwerten entnommen wurde.

Warum sollten Sie ERCC einschalten, wenn Sie keine Verwendung haben?
Wir machen das Gleiche, die benötigte Sequenzierungstiefe ist sehr gering, daher billig und "sicherer als leid".
Wir haben versucht, Dinge zu finden, die hinzufügen könnten, dass wir in Zukunft keine erneuten Läufe mehr durchführen müssen.
Ein möglicher Vorteil besteht darin, dass Sie wissen, dass mit den Nukleinsäuren etwas schief gelaufen ist (z. B. schlechte Extraktion, zu geringer Input usw.), wenn Sie in bestimmten Proben als extreme Verzerrungen erscheinen (z. B. ein RIESIGER Prozentsatz der Lesevorgänge geht an ERCC).
Ja, ich denke, ERCCs sind eine vernünftige Positivkontrolle für die Probenvorbereitung. Diese Probenvorbereitungsprobleme treten tendenziell auch auf andere Weise auf (z. B. hoher ribosomaler Kartierungsanteil, niedrige Kartierungsrate, GC-Differenz, Anzahl der über dem X-Niveau exprimierten Transkripte, PCA).


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...