Klassifizierung (überwachtes Lernen) von Expressionsdaten auf Pfadebene

J. Doe

2018-02-27 16:31:08 UTC

view on stackexchange narkive permalink

Ich habe mich gefragt, ob es eine Möglichkeit gibt, Klassifizierungsalgorithmen (z. B. Random Forest) auf Microarray-Daten anzuwenden, ohne die Gene als Prädiktoren / Merkmale zu verwenden, sondern den Pfad, zu dem sie gehören.

Die Sache ist das Die Ausdrücke der Gene, die zum selben Pfad gehören, sollten irgendwie zusammengefasst und in einen neuen Wert umgewandelt werden, der diesen Pfad für jede bestimmte Probe beschreibt.

Lassen Sie mich ein Beispiel geben.

Angenommen, wir haben g1, g2, g3, g4, g5, g6, g7, g8, g9, g10 als Gene und p1, p2, p3 als Pfade.

und g1, g2, g3 gehören zu p1 , während g3, g4, g5, g6 zu p2 gehören und g2, g6, g7, g8, g9, g10 gehören zu p3

Ein Gedanke ist die Berechnung des mittleren Ausdrucks von über Gengruppen pro Probe und führen Sie dann den Klassifizierungsalgorithmus über diesen Werten aus. Aber ich würde gerne Ihre Meinung zu einem solchen Ansatz und auch Ihre Vorschläge zur Verwendung einer anderen Methode hören / lesen.

Das Endziel wäre die Extraktion der wichtigsten Klassifizierungsprädiktoren (Pfade). .

Nehmen Sie an, dass die Expression von Genen in Signalwegen ähnlich ist? Denn in einem echten Experiment sind sie es nicht.

Nein, ich möchte so etwas nicht annehmen, aber ich habe den Mittelwert erwähnt, um die Gene der einzelnen Pfade zu gruppieren. Dieser Ansatz mag völlig falsch sein, aber deshalb habe ich hier gepostet. Um Feedback und unterschiedliche Meinungen zu erhalten.

Mein Punkt ist, dass ich keinen Algorithmus gesehen habe, der die Expressionswerte verschiedener Gene in einen Wert umwandeln kann, der einen bestimmten Weg darstellt.

Oh ok. Aha...

Es sieht so aus, als würden Sie versuchen, den von IPA oder ähnlichen Tools erzeugten Aktivierungs-Z-Score falsch neu zu erfinden. Ich schlage vor, Sie verwenden das stattdessen einfach.

IPA ist kommerziell. Ist es nicht? Können Sie mir kostenlose R-basierte zur Verfügung stellen, um zu verstehen, was genau Sie vorschlagen?