Ich habe mich gefragt, ob es eine Möglichkeit gibt, Klassifizierungsalgorithmen (z. B. Random Forest) auf Microarray-Daten anzuwenden, ohne die Gene als Prädiktoren / Merkmale zu verwenden, sondern den Pfad, zu dem sie gehören.
Die Sache ist das Die Ausdrücke der Gene, die zum selben Pfad gehören, sollten irgendwie zusammengefasst und in einen neuen Wert umgewandelt werden, der diesen Pfad für jede bestimmte Probe beschreibt.
Lassen Sie mich ein Beispiel geben.
Angenommen, wir haben g1, g2, g3, g4, g5, g6, g7, g8, g9, g10
als Gene und p1, p2, p3
als Pfade.
und g1, g2, g3
gehören zu p1
, während g3, g4, g5, g6
zu p2 gehören
und g2, g6, g7, g8, g9, g10
gehören zu p3
Ein Gedanke ist die Berechnung des mittleren Ausdrucks von über Gengruppen pro Probe und führen Sie dann den Klassifizierungsalgorithmus über diesen Werten aus. Aber ich würde gerne Ihre Meinung zu einem solchen Ansatz und auch Ihre Vorschläge zur Verwendung einer anderen Methode hören / lesen.
Das Endziel wäre die Extraktion der wichtigsten Klassifizierungsprädiktoren (Pfade). .