Wie wählt man die repräsentativsten Wege aus einer Genanreicherungsanalyse aus?

llrs

2017-05-26 19:07:00 UTC

view on stackexchange narkive permalink

Ich habe eine Anreicherungsanalyse für einen Cluster von Genen durchgeführt. Die Ausgabe ist eine Liste von Pfaden und deren p-Wert (die Pfade werden ausgewählt, weil der p-Wert < 0,05 ist). Die Liste ist immer noch ziemlich lang, deshalb möchte ich sie reduzieren. Zu diesem Zweck habe ich den Würfelkoeffizienten der Pfade in einer Matrix $ p $ x $ p $ berechnet, wobei $ p $ die Anzahl der Pfade in der Liste ist. Ich möchte sowohl diejenigen, die unterschiedlicher sind (sie überlappen sich weniger, ihr Würfelkoeffizient ist niedriger) als auch die Pfade, die repräsentativer für die ähnlichsten Pfade sind (wenn es also eine Gruppe von 5 Pfaden gibt, die sich über 0,8 überlappen, nehmen Sie nur einen).

Wie kann ich die repräsentativsten Pfade auswählen?

Es gibt ein ähnliches -Tool für GO, das jedoch darauf verzichtet, nicht signifikantes GO zu verwerfen, während hier alle anfänglichen Pfade bereits signifikant sind.

Wenn ich die Pfade mithilfe der Würfelkoeffizientenmatrix gruppiere, weiß ich nicht, wo (oder wie) ich schneiden soll.

Ich habe versucht, anhand der Höhe die Pfade auszuwählen. Bei der Interpretation der Höhe bin ich mir jedoch nicht sicher.

Einige andere Werkzeuge, die ich gesehen habe, verwenden ein mehrdimensionales Skalierungsdiagramm, aber ich bin nicht sicher, ob es hilfreich wäre, es auszuführen und an einem bestimmten Punkt der ersten Dimension zu schneiden.

Verwenden Sie einen p-Wert <0,05 oder einen p-Wert <0,05 / (Anzahl der getesteten Begriffe)? Ersteres sollten Sie verwenden, um Fehlalarme aufgrund mehrerer Tests zu vermeiden

Ich vermute, Sie müssen sich mit einer "einigermaßen guten" heuristischen Lösung zufrieden geben, da das zu lösende Problem einige verschiedene Variablen enthält (Anzahl der Pfade in der Gruppe, gewünschte Überlappung / Entfernung zwischen Pfaden usw.) .) Ich kann mir viele mögliche Antworten vorstellen.

Die Korrektur von @CloudyGloudy für mehrere Tests ist bereits abgeschlossen. Entschuldigung, ich habe es zuvor nicht erwähnt. Ja, ich habe mit der Idee gespielt, eine Überlappung / Distanz von 0,5 zu wählen und diese darüber zu halten, aber das würde außerhalb der Pfade bleiben, die sich völlig von den anderen unterscheiden, aber vielleicht könnte ich diejenigen über 0,75 und diejenigen unter 0,25 auswählen