Frage:
Bestätigen Sie den Erfolg oder Misserfolg der RNA-Seq-Normalisierung
Scott Gigante
2017-05-18 05:28:24 UTC
view on stackexchange narkive permalink

Ich arbeite mit einer Reihe von (Bulk-) RNA-Seq-Daten, die über mehrere Läufe hinweg zu verschiedenen Jahreszeiten gesammelt wurden. Ich habe meine Daten mithilfe der Normalisierung von Bibliotheksgröße / Quantil / RUV normalisiert und möchte (quantitativ und / oder qualitativ) prüfen, ob es der Normalisierung gelungen ist, die Batch-Effekte zu entfernen.

Es ist wichtig anzumerken, dass mit "Normalisierung erfolgreich" einfach gemeint ist, dass unerwünschte Variationen entfernt wurden. Weitere Analysen sind erforderlich, um sicherzustellen, dass biologische Variationen nicht entfernt wurden. Welche Diagramme / statistischen Tests / Softwarepakete bieten eine erste Qualitätskontrolle für die Normalisierung?

Zwei antworten:
#1
+17
SmallChess
2017-05-18 05:49:44 UTC
view on stackexchange narkive permalink

Sie sollten Boxplots und PCA-Plots verwenden. Werfen wir einen Blick auf das RUV-Papier:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4404308/

Vor der Normalisierung und nach der UQ-Normalisierung :

enter image description here

Bibliotheken tun dies Cluster nicht wie erwartet je nach Behandlung. ... für UQ-normalisierte Zählungen. Die UQ-Normalisierung führt nicht zu einer besseren Clusterbildung der Proben ...

Vor der Normalisierung sehen die Mediane im Box-Plot unter den Replikaten offensichtlich sehr unterschiedlich aus.

Nachher Bei der UQ-Normalisierung sehen die Mediane genauer aus, aber Trt.11 sieht aus wie ein Ausreißer. Darüber hinaus sind die Behandlungen nicht auf dem PCA-Plot zusammengefasst. Da es sich um Replikate handelt, möchten Sie, dass sie sich in der Handlung befinden.

Nach der RUV-Normalisierung

enter image description here

... RUVg verkleinert die Ausdrucksmaße für Bibliothek 11 in Richtung des Medians über Bibliotheken hinweg, was auf Robustheit gegenüber Ausreißern hinweist. ... Bibliotheken gruppieren sich wie von der Behandlung erwartet. ...

Das RUV hat die Verteilung robuster gemacht und die Stichproben näher am PCA-Plot. Es ist jedoch immer noch nicht perfekt, da eine der Behandlungen nicht nahe an den beiden anderen auf dem ersten PC liegt.

Die Vignetten für Bioconductor RUVSeq beschreiben die beiden Funktionen: plotRLE und plotPCA .

Ich möchte auf die Unterscheidung zwischen einem RLE-Diagramm (hier gezeigt) und einem gewöhnlichen Boxplot hinweisen (eine Unterscheidung, die auf Seite 3 des Vorabdrucks von April 2017 für RLE-Diagramme vorgenommen wurde: Visualisierung unerwünschter Variationen in hochdimensionalen Daten unter https://arxiv.org/ pdf / 1704.03590.pdf). Ansonsten eine ausgezeichnete Antwort, aber wichtig zu erklären, was RLE bedeutet.
#2
+8
Daniel Standage
2017-05-23 00:07:50 UTC
view on stackexchange narkive permalink

Eine visuelle Überprüfung mit Histogrammen, Boxplots oder einer anderen Verteilungsvisualisierung ist der richtige Weg. Vor der Normalisierung sehen Ihre Häufigkeiten möglicherweise ungefähr so ​​aus. Pre-norm

Nach der Normalisierung sollten sie ungefähr so ​​aussehen. Post-norm

Siehe diesen Blog-Beitrag als Beispiel für Code.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...