Gibt es vorgeschlagene Parameter, um ONT-Lesevorgänge mit STAR-long an das Referenzgenom anzupassen? Im Moment habe ich die hier vorgeschlagenen Parameter verwendet, aber ich habe ein seltsames Verhalten bemerkt.
Ich habe RNA-Reads ( D. melanogaster ) von R7
und R9
Flusszellen getrennt. Ich habe nur ausgewählt, um 2D
Lesevorgänge in der Kategorie pass
zu analysieren.
Ich habe 113249 Lesevorgänge für R7
und 40318 Lesevorgänge für R9
. Ich habe diese Lesevorgänge ausgerichtet und (nur!) 150 eindeutig zugeordnete Lesevorgänge für R7
-Daten und 8017 eindeutig zugeordnete Lesevorgänge für R9
-Daten erhalten. Ich habe versucht, denselben Befehl auf einem anderen Server mit neuer Kompilierung erneut auszuführen, aber die Ausgabedatei stimmt mit diesen 150 Lesevorgängen überein.
Wenn ich jedoch dasselbe mit GMAP ausrichte, erhalte ich 78016 eindeutig zugeordnete Lesevorgänge für R7
und 33523 eindeutig zugeordnete Lesevorgänge für R9
, also vermute ich dass beim Ausrichtungslauf etwas schief gelaufen ist.
Mir ist bewusst, dass sich die beiden Mapper sehr unterschiedlich verhalten, wobei STAR-long präziser ist und lieber Mappings mit weniger Lesevorgängen, aber an besseren Orten meldet, und GMAP insgesamt weniger präzise ist und versucht, das meiste davon abzubilden das liest sich aber an nicht so guten orten.
Ich habe mich gefragt, ob einige von Ihnen Erfahrung damit haben und mir die besten Parameter für RNA-Reads von ONT vorschlagen könnten?