Ich habe derzeit mehrere hundert BAM-Dateien, die von jemand anderem heruntergeladen wurden. Diese sind unberührt geblieben - bevor ich mit ihnen arbeite, möchte ich noch einmal überprüfen, ob diese BAMs vollständig heruntergeladen wurden.
Ich kann mir keine MD5-Prüfsummen ansehen.
Um die BAMs zu validieren, würde ich Picards ValidateSamFile verwenden, https://broadinstitute.github.io/picard/command-line-overview.html#ValidateSamFile
java -jar picard.jar ValidateSamFile \ I = input.bam \ MODE = SUMMARY
Ich könnte ein Bash-Skript schreiben und diese BAMs ausführen und lesen Sie dann die Picard-Ausgabe durch. Dies überprüft jedoch, ob die BAM gültig ist und nicht, ob sie vollständig heruntergeladen wurde (z. B. könnte die BAM korrekt heruntergeladen werden, aber auf andere Weise von Natur aus fehlerhaft sein).
Wenn die BAM vollständig heruntergeladen wurde, ist dies nicht der Fall Gibt es nicht einige "Dateiende" -Bytes, die ich schnell überprüfen könnte? Gibt es andere effizientere Methoden?