Spezifische Zelltypidentifikation bei der Einzelzellsequenzierung

Frage:

Spezifische Zelltypidentifikation bei der Einzelzellsequenzierung

Nikita Vlasenko

2018-05-26 05:07:46 UTC

view on stackexchange narkive permalink

Um zu definieren, welche Zelle von welchem Typ ist, müssen wir eine Reihe von Regeln identifizieren. Beispielsweise sollten Neuronen eine der folgenden Aussagen machen: Thy1 , Rbfox3 , MAP2 , Camk2b , Gad1 , Cck , Reln und sollte keine ausdrücken der folgenden: cd45 , Tmem119 , CD11b , ... und andere. Vielleicht sollte Rbfox3 immer in irgendwelchen Neuronen exprimiert werden. Daher müssen diese Regeln nach meinem Verständnis manuell zusammengestellt werden, um jeden Zelltyp aus der Literatur zu identifizieren. Ich würde davon ausgehen, dass viele Menschen bereits mit diesem Problem konfrontiert waren und vielleicht eine Software dafür entwickelt haben. Gibt es eine Software, mit der wir eine Matrix von Expressionsdaten für einzelne Zellen bereitstellen und die Typen mit einem gewissen Grad an Sicherheit zuweisen können?

Ich weiß, dass wir möglicherweise auch Heatmaps dafür verwenden können, z.

zelltypspezifische Gene - Heatmap mit rangbasiertem Ansatz

Aber auch dies scheint zu manuell zu sein. Außerdem glaube ich nicht, dass wir verschiedene neuronale Typen basierend auf nur einer Heatmap zuordnen können.

Vier antworten:

Peter

2018-05-29 20:13:33 UTC

view on stackexchange narkive permalink

Ich kenne eine solche Software nicht.

Ich glaube jedoch, dass diese Bemühungen etwas fehlgeleitet sind. Der Zweck der Einzelzellsequenzierung besteht darin, ein besseres Verständnis der Zellen zu erhalten. ihre Heterogenität und funktionelle Vielfalt oder entwicklungs- / biologische Prozesse wie Differenzierung unter Verwendung einer Methode mit höherer "Auflösung". Mit anderen Worten, wenn wir die Methoden hätten, nach denen Sie fragen, wäre das Einzelzellenexperiment nicht erforderlich.

Wenn Sie Ihre Daten unter Verwendung von Vorkenntnissen durch eine Pipeline laufen lassen, besteht die Gefahr, dass Ideen auf die Daten, anstatt zu sehen, was die Daten Ihnen sagen: Es wäre besser, zu versuchen, die biologisch relevante Heterogenität und Diversität in Ihren Zellen zu verstehen und zu erklären, zusammen mit einem kritischen Vergleich der Zelltypmerkmale (Expression von Genen, Signalwegen) mit dem beschriebenen Wissen Diese Frage ist auch der Frage sehr ähnlich, die Sie zuvor gestellt haben und die beantwortet wurde.

Es ist auch gut zu erkennen, dass Ihr Ansatz viele implizite Annahmen enthält, wie z. Zellen können eindeutig als +/- Expression für jedes Gen kategorisiert werden, oder sie ignorieren die Systemebene (Netzwerke und Pfade), wodurch wiederum Konzepte für die Daten erzwungen werden.

Dies würde eine Methode bedeuten eine Tabelle mit Zelltypmarkierungen zu erstellen, wie in der verknüpften Liste beschrieben Wenn Sie oben antworten, schreiben Sie ein Skript, das einen Grenzwert für die Expression von Genen in Ihren Daten bestimmt (siehe dies), und ordnen Sie dann die Zelltypen für jede Zelle. Sie können beispielsweise die Anzahl oder den Anteil der eindeutig exprimierten Gene messen (obwohl dies sehr einfach ist).

Wenn Sie mit maschinellem Lernen vertraut sind, können Sie auch einen Klassifizierer für einen mit Anmerkungen versehenen Datensatz trainieren Verwenden Sie dies dann für neue Daten.

Siehe auch eine Convenience-Funktion unten, die eine Tabelle mit Markergenen für jeden Zellcluster (dh (die Ausgabe von Seurat :: FindAllMarkers () ) sowie eine Referenz-df-Liste der Gene und der entsprechenden Zelle erfordert Geben Sie die Spalten HGNC_symbol und Cell_type ein und geben Sie die Tabelle mit den Auflistungsclustern, ihren Markergenen und den entsprechenden Zelltypen zurück.

  getCelltypes <- Funktion (Marker, Referenz) {marker.celltype <- Marker marker.celltype $ Cell_type <- marker.celltype $ gene marker.celltype $ Cell_type <- with (Referenz, celltype [match (marker.celltype $ Cell_type, gene)]) return (marker.celltype)}

Viele Varianten dieser Referenztabelle und -funktion können erstellt werden. Sie können sie jederzeit ändern.

Ich denke, wir können in Zukunft eine solche Klassifizierungssoftware erwarten, die Referenzdaten aus dem menschlichen Protein verwendet Atlas, HCA und ähnliche Projekte.

Shrek

2019-07-09 16:49:30 UTC

view on stackexchange narkive permalink

SingleR, eine neuartige Berechnungsmethode zur unvoreingenommenen Erkennung des Zelltyps von scRNA-seq: https://github.com/dviraran/SingleR

Willkommen auf der Website. Könnten Sie Ihre Antwort um die Verwendung dieses Tools zur Beantwortung der Frage erweitern?

yuqi_yuqi

2020-01-14 23:02:01 UTC

view on stackexchange narkive permalink

singleCellNet ist eine Berechnungsmethode, die überwachtes maschinelles Lernen für quantitative Zelltypanmerkungen verwendet. singleCellNet ermöglicht auch den plattformübergreifenden und artübergreifenden Vergleich . Es wird auch aktiv unterstützt.

Hier ist der Github https://github.com/pcahan1/singleCellNet und die Vignette https://pcahan1.github.io/singleCellNet/

Atakan

2020-07-28 01:18:54 UTC

view on stackexchange narkive permalink

Wir haben kürzlich ein webbasiertes Tool namens CIPR (Cluster Identity Predictor) veröffentlicht, das bei Cluster-Annotationen hilft. Sie können einen von 7 Referenzdatensätzen auswählen (einige enthalten Neuronen) oder eine benutzerdefinierte Referenzgenexpressionsdatei hochladen, um die Clusteridentität vorherzusagen. Sie können das Manuskript lesen, um weitere Informationen zur Funktionsweise des Algorithmus zu erhalten. Kurz gesagt, es vergleicht differentiell exprimierte Gene oder globale Expressionsmuster in Ihren Daten mit bekannten Referenzdatensätzen und erstellt schnelle visuelle Ausgaben. Ich finde es hilfreich für interaktive Analysen, bei denen ich verschiedene Clustering-Parameter und dergleichen ausprobiere.

Dieser Artikel ist eine gute Ressource, die verschiedene Cluster-Aufrufalgorithmen vergleicht.

ⓘ

Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 4.0-Lizenz, unter der er vertrieben wird.

über - juristisches

Loading...