Frage:
Klassifizierung (überwachtes Lernen) von Expressionsdaten auf Pfadebene
J. Doe
2018-02-27 16:31:08 UTC
view on stackexchange narkive permalink

Ich habe mich gefragt, ob es eine Möglichkeit gibt, Klassifizierungsalgorithmen (z. B. Random Forest) auf Microarray-Daten anzuwenden, ohne die Gene als Prädiktoren / Merkmale zu verwenden, sondern den Pfad, zu dem sie gehören.

Die Sache ist das Die Ausdrücke der Gene, die zum selben Pfad gehören, sollten irgendwie zusammengefasst und in einen neuen Wert umgewandelt werden, der diesen Pfad für jede bestimmte Probe beschreibt.

Lassen Sie mich ein Beispiel geben.

Angenommen, wir haben g1, g2, g3, g4, g5, g6, g7, g8, g9, g10 als Gene und p1, p2, p3 als Pfade.

und g1, g2, g3 gehören zu p1 , während g3, g4, g5, g6 zu p2 gehören und g2, g6, g7, g8, g9, g10 gehören zu p3

Ein Gedanke ist die Berechnung des mittleren Ausdrucks von über Gengruppen pro Probe und führen Sie dann den Klassifizierungsalgorithmus über diesen Werten aus. Aber ich würde gerne Ihre Meinung zu einem solchen Ansatz und auch Ihre Vorschläge zur Verwendung einer anderen Methode hören / lesen.

Das Endziel wäre die Extraktion der wichtigsten Klassifizierungsprädiktoren (Pfade). .

Nehmen Sie an, dass die Expression von Genen in Signalwegen ähnlich ist? Denn in einem echten Experiment sind sie es nicht.
Nein, ich möchte so etwas nicht annehmen, aber ich habe den Mittelwert erwähnt, um die Gene der einzelnen Pfade zu gruppieren. Dieser Ansatz mag völlig falsch sein, aber deshalb habe ich hier gepostet. Um Feedback und unterschiedliche Meinungen zu erhalten.
Mein Punkt ist, dass ich keinen Algorithmus gesehen habe, der die Expressionswerte verschiedener Gene in einen Wert umwandeln kann, der einen bestimmten Weg darstellt.
Oh ok. Aha...
Es sieht so aus, als würden Sie versuchen, den von IPA oder ähnlichen Tools erzeugten Aktivierungs-Z-Score falsch neu zu erfinden. Ich schlage vor, Sie verwenden das stattdessen einfach.
IPA ist kommerziell. Ist es nicht? Können Sie mir kostenlose R-basierte zur Verfügung stellen, um zu verstehen, was genau Sie vorschlagen?
Einer antworten:
llrs
2018-02-27 20:28:54 UTC
view on stackexchange narkive permalink

Schauen Sie sich das Paket GSVA an. Es ermöglicht die Konvertierung einer Matrix mit Genen x Samples in einen Pfad x Samples mit verschiedenen Methoden ssgsea, gage, gsva ...

Anschließend können Sie Verwenden Sie diese Matrix als Eingabe für die differentielle Expression von Pfaden oder Klassifizierungsalgorithmen oder was auch immer.


Dies hängt jedoch von der Eingabe der von Ihnen angegebenen "Pfade" ab. Stellen Sie sicher, dass die Pfade korrekt sind. Beachten Sie auch, dass sich die Pfadtopologie mit den Bedingungen ändern kann.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...