Ich habe eine Anreicherungsanalyse für einen Cluster von Genen durchgeführt. Die Ausgabe ist eine Liste von Pfaden und deren p-Wert (die Pfade werden ausgewählt, weil der p-Wert < 0,05 ist). Die Liste ist immer noch ziemlich lang, deshalb möchte ich sie reduzieren. Zu diesem Zweck habe ich den Würfelkoeffizienten der Pfade in einer Matrix $ p $ x $ p $ berechnet, wobei $ p $ die Anzahl der Pfade in der Liste ist. Ich möchte sowohl diejenigen, die unterschiedlicher sind (sie überlappen sich weniger, ihr Würfelkoeffizient ist niedriger) als auch die Pfade, die repräsentativer für die ähnlichsten Pfade sind (wenn es also eine Gruppe von 5 Pfaden gibt, die sich über 0,8 überlappen, nehmen Sie nur einen).
Wie kann ich die repräsentativsten Pfade auswählen?
Es gibt ein ähnliches -Tool für GO, das jedoch darauf verzichtet, nicht signifikantes GO zu verwerfen, während hier alle anfänglichen Pfade bereits signifikant sind.
Wenn ich die Pfade mithilfe der Würfelkoeffizientenmatrix gruppiere, weiß ich nicht, wo (oder wie) ich schneiden soll.
Ich habe versucht, anhand der Höhe die Pfade auszuwählen. Bei der Interpretation der Höhe bin ich mir jedoch nicht sicher.
Einige andere Werkzeuge, die ich gesehen habe, verwenden ein mehrdimensionales Skalierungsdiagramm, aber ich bin nicht sicher, ob es hilfreich wäre, es auszuführen und an einem bestimmten Punkt der ersten Dimension zu schneiden.