Frage:
Was sind alle Referenzdateien, die vom bwa-Index erstellt wurden, und hängen diese davon ab, ob die Referenz komprimiert ist?
mattm
2017-06-03 00:36:08 UTC
view on stackexchange narkive permalink

Ich habe eine gezippte Referenz mit bwa indiziert: bwa index reference.fa.gz , wodurch eine Reihe anderer Dateien reference.fa.gz. {amb, ann, bwt, pac, sa} . Diese funktionieren einwandfrei mit der bwa-Ausrichtung.

Ich habe festgestellt, dass samtools keine komprimierte Referenz verwendet. Daher plane ich, eine entpackte Version der Referenz für meinen Workflow zu verwenden, anstatt zwei separate Darstellungen von zu verwenden die Referenz.

Sind die Dateien reference.fa.gz. {amb, ann, bwt, pac, sa} davon abhängig, dass die Referenz komprimiert wird? Muss ich die entpackte reference.fa mit bwa neu indizieren oder kann ich einfach die aktuellen Dateien umbenennen, um den Teil .gz des Dateinamens zu entfernen?

Einer antworten:
#1
+6
Devon Ryan
2017-06-03 00:46:16 UTC
view on stackexchange narkive permalink

Sie erhalten genau den gleichen Index ( amb , ann , bwt , pac und sa files), ob die Referenz komprimiert ist oder nicht. BWA erstellt auch eine eigene gepackte Referenzsequenz (die .pac-Datei), sodass Sie nach dem Indexieren nicht einmal das Genom benötigen.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...