Frage:
Was ist der Unterschied zwischen Samtools, Bamtools, Picard, Sambamba und Biobambam?
medbe
2017-06-03 04:50:11 UTC
view on stackexchange narkive permalink

Nach einigen Google-Suchen habe ich mehrere Tools mit überlappenden Funktionen zum Anzeigen, Zusammenführen, Stapeln usw. gefunden. Ich habe keine Zeit, diese Tools auszuprobieren. Ich werde also nur sehen, ob jemand die Antwort bereits kennt: Was ist der Unterschied zwischen Sie? Performance? Eigenschaften? Oder etwas anderes? Welches ist generell bevorzugt? Samtools?

Diese Frage wird wahrscheinlich zu einer Meinungsdebatte über die Vorzüge (oder auf andere Weise) verschiedener Tools führen, von der bei StackExchange abgeraten wird. Es wäre hilfreich, wenn eine einzige Frage gestellt würde, vorzugsweise eine, die versucht, sich von den Vorlieben der Menschen fernzuhalten.
In "etwas anderes" können Sie die Qualität der Dokumentation hinzufügen, was ein wichtiger Faktor bei der Entscheidung sein kann, welches Tool verwendet werden soll.
Einer antworten:
#1
+15
gringer
2017-06-03 06:50:55 UTC
view on stackexchange narkive permalink

Die offensichtliche Antwort ist, dass verschiedene Leute sie geschrieben haben. In der Bioinformatik ist es ziemlich üblich, dass Menschen mit Informatik-Hintergrund mit vorhandenen Tools frustriert sind und ihr eigenes alternatives Tool erstellen (anstatt ein vorhandenes Tool zu verbessern). Im Laufe der Zeit werden in Tools mit ähnlichen anfänglichen Zielen beliebte Funktionen implementiert (und schließlich werden Fehler behoben), sodass es weniger darauf ankommt, welches Tool für gängige Methoden verwendet wird.

Hier ist mein Eindruck von den Tools :

  1. samtools - ursprünglich geschrieben von Heng Li (der auch BWA schrieb). Die Benutzer, die jetzt an samtools arbeiten, behalten auch die Spezifikation des Ausrichtungsdateiformats für SAM, BAM und CRAM bei, sodass neue Dateiformatfunktionen wahrscheinlich zuerst in samtools implementiert werden.

  2. bamtools - dies scheint von Derek Barnett, Erik Garrison, Gabor Marth und Michael Stromberg geschrieben worden zu sein, um das samtools-Toolkit zu spiegeln, verwendet jedoch C ++ anstelle von C

  3. picard - Java-Tools, die vom Broad Institute zur Bearbeitung von BAM / SAM-Dateien geschrieben wurden. Das Schreiben in Java erleichtert das Portieren auf andere Betriebssysteme, sodass es auf Windows-Systemen möglicherweise besser funktioniert. Ich bin eher mit der Verwendung von Picard auf Filterebene (z. B. Entfernen von PCR-Duplikaten) und für statistische Analysen vertraut, aber es ist mit der Java HTS-Bibliothek von samtools verknüpft und teilt daher wahrscheinlich einen Großteil der Funktionen.

  4. sambamba - ein GPL2-lizenziertes Toolkit, das in der Programmiersprache D geschrieben wurde (vermutlich von Artem Tarasov und Pjotr ​​Prins). Ich habe es nicht verwendet (und kenne keine Leute, die es verwendet haben), aber die Github-Seite schlägt vor: "Fast 5 Jahre lang war der Hauptvorteil gegenüber samtools das parallele BAM-Lesen. Schließlich wurde im März 2017 samtools 1.4 veröffentlicht und erreichte die Parität dazu. "

  5. Biobambam - geschrieben von German Tischler in C ++. Ich habe auch keine Erfahrung mit diesem Toolkit. Dies scheint einige Multithreading-Funktionen zu haben, ähnelt aber ansonsten anderen Toolkits.

  6. ol>
Ein Vergleich der Sortiergeschwindigkeit zwischen SAMtools (Version 1.2) und Sambamba (Version 0.6.3) [hier] (https://www.basepairtech.com/blog/sorting-bam-files-samtools-vs-sambamba/).
Angesichts der Tatsache, dass ältere Versionen von Samtools langsamer als Sambamba sind, müssen Sie manchmal auch die Anforderungen der gesamten Pipeline berücksichtigen. Bei einigen älteren Programmen müssen beispielsweise alte Versionen von Samtools ausgeführt werden. Dies kann es schwierig machen, die Geschwindigkeitsvorteile neuerer Samtools zu nutzen, und dazu führen, dass Sie ein anderes Programm verwenden, anstatt verschiedene Versionen desselben Tools in Ihrem Programm unterstützen zu müssen Pipeline.


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...