Frage:
Validierung identifizierter Subpopulationen von Zellen in scRNA-seq
Deffiz
2017-06-03 00:22:35 UTC
view on stackexchange narkive permalink

Bei der Analyse von Einzelzell-RNA-seq-Daten gibt es verschiedene unbeaufsichtigte Ansätze zur Identifizierung mutmaßlicher Subpopulationen (z. B. wie bei Suerat- oder SCDE-Paketen verfügbar).

Gibt es eine gute Möglichkeit, die Clusterlösungen rechnerisch zu validieren? Unterschiedliche Methoden können zu leicht unterschiedlichen Clustering-Ergebnissen führen. Wie kann man wissen, welches das beste ist, d. H. Repräsentativ für biologische Subpopulationen?

Es ist ein bisschen töricht zu versuchen, Berechnungsmethoden ohne einen bekannten Wahrheitsdatensatz rechnerisch zu validieren ...
Ich habe scRNA in Einzelzell-RNA geändert (da scRNA auch kleine bedingte RNA bedeutet).
@Kamil "scRNA-seq" ist ein etablierter Name für Einzelzell-RNA-seq.
Zwei antworten:
olga
2017-06-03 00:50:22 UTC
view on stackexchange narkive permalink

Hier könnte ein SC3-Ansatz für das Einzell-Consensus-Clustering hilfreich sein. Ziel ist es, "hohe Genauigkeit und Robustheit durch Kombination mehrerer Clustering-Lösungen durch einen Konsensansatz" zu erreichen. https://www.nature.com/nmeth/journal/v14/n5/full/nmeth.4236.html

Alec
2017-06-14 06:38:02 UTC
view on stackexchange narkive permalink

Während bessere Methoden zur Bewertung Ihrer Cluster darin bestehen, einen externen Datensatz oder einen Datensatz mit bekannter Wahrheit zu verwenden, gibt es eine Vielzahl interner Validierungsmetriken, mit denen Clusterlösungen ohne einen anderen Datensatz verglichen werden können.

Hier einige Metriken:

  • Davies-Bouldin-Index
  • Calinski-Harabasz-Index
  • Root-Mean-Square-Standardabweichung

In diesem Clustering-Test finden Sie viele weitere Informationen: http://stke.sciencemag.org/content/9/432/re6

Diese internen Validierungsmetriken bewerten Ihre Clustering-Lösung anhand von drei Kennzahlen: Kompaktheit, Verbundenheit und Trennung. Wenn Sie diese Metriken zum Vergleichen von Clustering-Lösungen verwenden, müssen Sie berücksichtigen, welche Metrik für Ihre Ergebnisse geeignet ist, da einige Algorithmen bestimmte Maßnahmen optimieren.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...