Ich suche nach einer Möglichkeit, Regionen mit geringer Komplexität und andere Wiederholungen im Genom von Escherichia coli zu identifizieren. Ich fand heraus, dass RepeatMasker zum Beispiel beim Zeichnen von Genomen von Prokaryoten verwendet werden kann ( E. coli Beispiel). RepeatMasker arbeitet jedoch mit einem begrenzten Datensatz von Arten, von denen keine Prokaryoten sind. Wenn beim Ausführen von RepeatMasker keine Art angegeben ist, werden diese standardmäßig mit den Daten von Homo Sapiens verglichen.
Dies scheint eher unzureichend zu sein, aber die relevanteste Alternative, PRAP, erfordert ein "totes" Tool (VisCoSe, von Michael Spitzer).
- Ist es immer noch ratsam, RepeatMasker für Escherichia coli zu verwenden?
- Wenn ja, welche Einstellungen würden die Relevanz maximieren? ol>