Bei der Analyse von Einzelzell-RNA-seq-Daten gibt es verschiedene unbeaufsichtigte Ansätze zur Identifizierung mutmaßlicher Subpopulationen (z. B. wie bei Suerat- oder SCDE-Paketen verfügbar).
Gibt es eine gute Möglichkeit, die Clusterlösungen rechnerisch zu validieren? Unterschiedliche Methoden können zu leicht unterschiedlichen Clustering-Ergebnissen führen. Wie kann man wissen, welches das beste ist, d. H. Repräsentativ für biologische Subpopulationen?