Frage:
Wie kann der Zelllinienbeitrag aus RNASeq-Daten geschätzt werden?
llrs
2017-05-30 12:30:54 UTC
view on stackexchange narkive permalink

Unter Verwendung einer Laser-Capture-Mikrodissektion von Zellen wurde eine Gruppe von Zellen, die mit dem interessierenden Marker gefärbt waren, sequenziert. In einer anderen Kohorte von Patienten (dies ist alles menschliches Lebergewebe) wurde das gesamte Gewebe sequenziert (RNA-Sequenz in beiden Fällen).

Kann ich den Beitrag der in der gesamten Leber markierten Zellen abschätzen ("Gewicht von") Diese Zellen "in der Leber in Worten meines PI)?

Mein Bauchgefühl ist, dass dies nicht auf diese Weise möglich ist. Es würde sowohl eine Einzelzellsequenzierung als auch eine Ganzgewebesequenzierung erfordern, um den Beitrag von abzuschätzen jede Zelllinie. Aber vielleicht gibt es ein Werkzeug, das angesichts der Zelllinien oder des Hauptausdrucks anderer Zelllinien mit der Verwendung von GSVA oder einem ähnlichen Werkzeug verglichen werden kann.

Haben Sie sich Werkzeuge zur Beimischungsschätzung angesehen (das tun Sie)? Wie genau muss die Schätzung sein?
Ich habe noch nichts von der Beimischungsschätzung gehört, daher habe ich nicht nach Tools mit diesem Schlüsselwort gesucht. Ich habe kein Bedürfnis nach Präzision, je mehr, desto besser: D. Aber ich vermute, dass meine Daten nicht zu gut sind (ich habe nur 6 technische Replikate der Lasermikrodissektion), daher kann ich nicht viel erwarten.
Vier antworten:
#1
+6
Iakov Davydov
2017-06-01 14:01:04 UTC
view on stackexchange narkive permalink

Es gibt einige Berechnungsmethoden, die dies versuchen (ich habe sie nie verwendet, also keine Erfahrung):

  1. CellMix, basierend auf Sätzen von Markergenen listet
  2. Subset Prediction from Enrichment Correlation auf, die auf Korrelationen mit subset-spezifischen Genen über eine Reihe von Proben basiert.
  3. Zelltypanreicherung, die unsere hochexprimierte, zellspezifische Gendatenbank verwendet.
  4. Zelltypspezifische Signifikanzanalyse unter Verwendung der differentiellen Genexpression für jeden Zelltyp
  5. ol >

    Für einige Methoden müssen Sie möglicherweise einige Referenz-Expressionsstufen aus öffentlichen Datenbanken oder Veröffentlichungen abrufen.

    Beachten Sie Folgendes: Sie können den Zellanteil nicht wirklich berechnen, sondern nur den RNA-Anteil. Wenn Sie einen guten Grund haben anzunehmen, dass die RNA-Menge pro Zelle sehr ähnlich ist, ist dies ein guter Indikator für den Zellanteil in einem Gewebe.

Schöne Referenzen. Ich werde diese Einschränkung im Auge behalten. Vielen Dank
#2
+4
gringer
2017-06-01 17:48:19 UTC
view on stackexchange narkive permalink

Die Entfaltung von Zellen wird in diesem Biostars-Beitrag erwähnt, in dem CIBERSORT für Immunzellmischungen und das Bioconductor-Paket DeconRNASeq erwähnt werden.

Soweit Ich bin mir bewusst, dass es bestenfalls möglich ist, eine proportionale Darstellung der Transkriptexpression aus Standard-Hochdurchsatz-Sequenzierungsergebnissen zu erhalten, da die Sequenzer und der Probenvorbereitungs-Workflow so ausgelegt sind, dass unabhängig von der Anzahl die gleichen Lesevorgänge ausgegeben werden Eingabemenge.

CIBERSORT klingt nach einem schönen Werkzeug, das einen Versuch wert ist.
#3
  0
Dr_Hope
2020-08-18 19:18:02 UTC
view on stackexchange narkive permalink

Sie können öffentliche Einzelzell-RNA-Sequenzdaten oder Bulk-RNA-Sequenz für gereinigte Primärzellen als Referenz herunterladen und dann CIBERSORT oder MuSiC verwenden, um sich zu entfalten kompatibel, TPM aus RNA-seq kann mit CPM in 3 '(10X, Drop-seq usw.) Einzelzelldaten und TPM in Einzelzelldaten voller Länge (SMARTseq usw.)

verglichen werden
#4
  0
Reza Rezaei
2020-08-18 21:31:11 UTC
view on stackexchange narkive permalink

Eigentlich habe ich vor einem Monat nach der gleichen Frage gesucht und ein paar Pakete gefunden, die verwendet werden können. Zuallererst kann ihre Funktionalität die Schätzung des Zellanteils, die Schätzung der zellspezifischen Genexpression oder beide dieser Funktionen sein. Zweitens sind ihre primären Eingaben erwartungsgemäß Bulk-RNA-Sequenzdaten und einige möchten auch Einzelzell-RNA-Sequenzdaten als sekundäre Eingabe. Die beliebteste ist das Kind der berühmten Cibersort CIBERSORTX. Ich ging ihre Website durch und las die Tutorials. Sie haben mehrere Beispieldatensätze, die zum Erlernen ihrer Plattform verwendet werden können. Die beiden größten Mängel waren jedoch, dass sie ihren Quellcode nicht geteilt haben, was bedeutet, dass wir das Ergebnis nicht auf unseren eigenen Systemen reproduzieren können und alle unsere Daten auf Stanford-Server hochladen müssen (Sicherheitsbedenken!). Das zweite Problem ist, dass es keinen API-Zugriff auf ihren Server gibt und alles online erfolgen sollte, was eine sehr geringe Kompatibilität mit anderen Tools bedeutet.

Die Idee, Entfaltung und tiefes Lernen zu verwenden, um die Subpopulation von Zellen aus der Masse abzuleiten RNA-seq, ist großartig. Also habe ich gesucht, ob andere auch etwas Ähnliches und vielleicht sogar Besseres getan haben. Ich habe drei weitere Tools gefunden:

  1. MuSiC: https://www.nature.com/articles/s41467-018-08023-x
    Veröffentlicht in Nature Communication und einige Monate älter als Cibersortx. Ich habe ihren Algorithmus noch nicht studiert und kann daher nicht sagen, ob ihre Methode besser als Cibersortx ist oder nicht. Der Teil, der den Unterschied ausmacht, ist jedoch, dass alle ihre Werke, einschließlich ihres Quellcodes, Open Source sind. Ich kann also auf ihren Code zugreifen und wir müssen unsere unveröffentlichten Daten nicht auf einen nicht sicheren Online-Server hochladen (im Gegensatz zu cibersortx). Das zweite gute ist, dass es in der R-Sprache implementiert ist, die ich für die meisten meiner RNA-seq-Datenanalysen verwende, sodass es problemlos mit anderen Tools kompatibel ist.

  2. Scaden: https://advances.sciencemag.org/content/6/30/eaba2619.full Dieser ist auch Open Source und leicht zugänglich. Es ist in Python geschrieben und läuft in der Shell. Es ist also einigermaßen kompatibel mit anderen Tools (nicht so kompatibel wie MuSic). Wir können unsere Daten wieder lokal verarbeiten und müssen unsere Daten nicht auf Server hochladen (was gut ist). Sie behaupten, dass ihre Methode eine bessere Korrelation mit den realen scRNA-seq-Daten aufweist als sowohl Cibersortx als auch MuSic (nicht immer !!). Das Ausführen ihrer Tools scheint aufgrund ihrer Tutorials einfach zu sein (ich habe es noch nicht auf meinem System ausgeführt!). Ihre Tutorials scheinen jedoch etwas verwirrend zu sein und es scheint, dass sie sich noch in der Vorabversion befinden und sie Fehler haben !!

  3. CDSeq: https: / /github.com/kkang7/CDSeq_R_Package Schließlich fand ich das CDSeq-Paket, das keine scRNA-seq-Eingabe benötigt, um Einzelzellanteile und zellspezifische Genexpression in Massendaten zu finden. Es wird nur Ihr Buld als Eingabe und Information über sehr wenige Parameter gezählt und macht das Ganze automatisch und überraschend gut, habe ich überprüft! Wenn Sie das Genexpressionsmuster Ihrer spezifischen Zellen finden und es auch als Eingabe verwenden könnten, ist es optional und bietet Ihnen eine noch bessere Schätzung.

  4. ol>


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...