Frage:
Wie unterscheiden sich die Algorithmen für enge und breite Spitzen von MACS2?
Ian Sudbery
2017-05-20 05:21:09 UTC
view on stackexchange narkive permalink

Das Peak-Calling-Tool MACS2 kann Peaks entweder im schmalen Peak-Modus (für fokussierte Signale wie den Transkriptionsfaktor ChIPseq) oder im breiten Peak-Modus (für stärker entschärfte Signale wie bestimmte Histon-Modifikationen) aufrufen.

Der Algorithmus für Anrufe mit schmalen Spitzen ist in der MACS-Veröffentlichung gut beschrieben. Aber ich finde nicht viel Dokumentation darüber, wie sich Peak Calling im Broad Peak-Modus unterscheidet. Das Handbuch enthält nur Folgendes:

--broad

Wenn dieses Flag aktiviert ist, versucht MACS, breite Regionen in BED12 (einem genmodellähnlichen Format) zusammenzusetzen ) indem nahe gelegene stark angereicherte Regionen in eine breite Region mit lockerem Cutoff gebracht werden. Die breite Region wird durch einen weiteren Cutoff durch --broad-Cutoff gesteuert. Die maximale Länge der Länge eines breiten Bereichs beträgt das 4-fache von d von MACS

. Dies beschreibt jedoch nicht genau, wie dies durchgeführt wird.

Welchen Algorithmus verwendet MACS zum Aufrufen breiter Peaks?

Ich habe den [Algorithmus] gefunden (https://github.com/taoliu/MACS/blob/24a1eab9fe7e885c27a37dbac2efb99d6da8dc74/MACS2/IO/BedGraph.pyx#L594), aber ehrlich gesagt konnte ich den Versuch / außer der Konstruktion in Zeile 629 nicht wirklich bekommen. ..
Einer antworten:
#1
+10
Daniel Kim
2017-05-21 02:38:55 UTC
view on stackexchange narkive permalink

Die Schlüsselfunktion lautet call_broadpeaks :

Die der Funktion beigefügte Beschreibung lautet:

Diese Funktion Versuchen Sie, angereicherte Regionen zu finden, in denen die Punktzahlen kontinuierlich höher sind als ein bestimmter Grenzwert für Stufe 1, und verknüpfen Sie sie mithilfe der Lücke über dem Grenzwert für Stufe 2 mit einer maximalen Länge von lvl2_max_gap.

Scoring_function_s: Symbole von Funktionen zu Punktzahl berechnen. 'p' für pscore, 'q' für qscore, 'f' für Fold Change, 's' für Subtraktion. Beispiel: ['p', 'q']

lvl1_cutoff_s: Liste der Grenzwerte in stark angereicherten Regionen, entsprechend den Bewertungsfunktionen.

lvl2_cutoff_s: Liste der Grenzwerte in weniger angereicherten Regionen

min_length: minimale Peaklänge, Standard 200.

lvl1_max_gap: maximale Lücke zum Zusammenführen von angereicherten Peaks in der Nähe, Standard 50.

lvl2_max_gap : Maximale Länge der Verknüpfungsregionen, Standard 400.

Gibt sowohl das allgemeine PeakIO-Objekt für stark angereicherte Regionen als auch die breiten Regionen mit Lücken in BroadPeakIO zurück.

Um eine grundlegende Erklärung zu geben, Der Algorithmus scheint (kurz) wie folgt zu sein:

  1. Es werden zwei separate Ebenen von Peaks genannt, Ebene 1 (ein höheres pval, dh signifikanter) und Ebene 2 (ein niedrigeres pval) ). Level 1 wird von -p und Level 2 von --broad-cutoff gesteuert. Wenn jeder Peakset aufgerufen wird, werden sie sofort durch den Parameter für die maximale Lücke für jeden Satz verknüpft.

  2. Dann wird davon ausgegangen, dass alle Peaks der Ebene 1 innerhalb der Peaks der Ebene 2 liegen sollten (dies ist der Fall) eine explizite Annahme von MACS2), gruppiert der Algorithmus Peaks der Ebene 1 innerhalb der Peaks der Ebene 2, um einen breiten Peak auszugeben.

  3. ol>

    ...

    Dies hat Einige Implikationen:

    1. Die breiten Spitzenaufrufe kommen wirklich nur von den Spitzenwerten der Ebene 2 (+ Verknüpfung). Mit den Peak-Calls der Ebene 1 können Sie Sub-Peaks unterscheiden (so dass Sie Peaks mit Lücken haben können).

    2. Abgesehen von der Verknüpfung sind die breiten Spitzenaufrufe dieselben wie die schmalen Spitzenaufrufe, wenn Sie beide mit demselben pval-Schwellenwert anrufen (z. B. wenn Sie --broad-cutoff 0.1 im Breitspitzenmodus und -p 0.1 für den Schmalspitzenmodus)

    3. ol>
Könnten Sie in Ihrer Antwort klarstellen, dass "höherer pval" tatsächlich "niedriger" oder "signifikanter" p-Wert ist und dass "niedriger pval" tatsächlich "höherer" oder "weniger signifikanter" p-Wert ist? Ich sehe voraus, dass jemand durch den Wortlaut verwirrt wird.
Klarstellung hinzugefügt - danke für den Fang!


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...