Frage:
Warum Illumina, wenn PacBio längere und bessere Lesungen bietet?
SmallChess
2019-01-31 11:39:46 UTC
view on stackexchange narkive permalink

PacBio bietet eine längere Leselänge als die kurzen Lesevorgänge von Illumina. Längere Lesevorgänge bieten eine bessere Möglichkeit für die Genomassemblierung und das Aufrufen struktureller Varianten. Es ist nicht schlechter als kurze Lesevorgänge zum Aufrufen von SNP / Indels und zur Quantifizierung von Transkripten. Klingt so, als ob PacBio alles kann, was die Illumina-Plattform bieten kann.

Wäre das ein Grund, sich für Illumina zu entscheiden, wenn PacBios lange Lesevorgänge alles und mehr können?

PacBio hatte früher hohe Fehlerraten und teure Bibliotheken mit geringem Durchsatz. In Bezug auf das Transkriptom, es ist nicht quantitativ, muss mehrere Bibliotheken mit unterschiedlichen Fragmentlängen erzeugen, wiederum nicht quantitativ, erfasst nur reichlich vorhandene Transkripte, vermisst LncRNAs.
@geek_y Können Sie bitte detailliert und wenn möglich unter Bezugnahme darauf eingehen? Ihre Antwort wird für unsere Benutzer nützlich sein, nicht nur für mich!
@geek_y "gewohnt". Bedeutet das, dass PacBio 2019 ähnliche Fehlerraten / Durchsätze wie Illumina hat?
Ich habe nicht nachverfolgt, aber es kann keine niedrigen Fehlerraten und keinen hohen Durchsatz wie illumina haben. PacBio wäre sehr nützlich für Genom- oder Transkriptomassemblierungsprobleme, aber alles andere wie SNP-Aufruf, quantitative Genexpressionsanalyse, Chromatinanalyse (ChIPs, Histone) etc), 3D-Genomprobleme (Hi-C "like") wären besser mit Illumina, an dem die meisten Leute arbeiten.
PacBio ist erheblich teurer und hat eine höhere Fehlerrate (zumindest im Laufe der Jahre ist es besser geworden). Für die Genomassemblierung verwenden Menschen häufig einen hybriden Ansatz. Für andere Zwecke hat PacBio relativ wenig zu bieten.
Ich stimme dafür, diese Frage als nicht zum Thema gehörend zu schließen, da es nicht um Bioinformatik geht, sondern um NGS.
Huh? Bioinformatik * beinhaltet * NGS. Ich stimme dafür, diese Frage zu schließen, weil sie hauptsächlich auf Meinungen basiert.
Meiner Meinung nach beziehen sich nicht alle NGS-Fragen auf Bioinformatik, @gringer, und nicht jede Bioinformatik hat mit NGS zu tun. Daher stimme ich Ihrer Aussage zu "Bioinformatik * beinhaltet * NGS" nicht zu. Diese Frage bezieht sich auf die Spezifikationen verschiedener Plattformen und kann in einem Forum wie [SEQanswers] (http://seqanswers.com/) gestellt werden.
Leute, kein Grund, feindselig zu sein. Die Bioinformatik basiert auf Plattformen. Diese Frage bezieht sich darauf, welche Plattform für lange oder kurze Lesevorgänge in der Bioinformatik geeignet ist und ist themenbezogen.
Dies ist ein relevanter neuer Preprint: https://www.biorxiv.org/content/10.1101/519025v2TLDR: CCS verbessert die Qualität bis vor kurzem auf Kosten reduzierter Länge. Aber immer noch ein ziemlich teurer Ansatz.
@benn Die Analyse von NGS-Daten ist ein wesentlicher Bestandteil der Bioinformatik. Im weiteren Sinne ist die Generierung von NGS-Daten auch hier ein Thema, da sie für die Arbeit des Bioinformatikers, der sie analysieren wird, sehr relevant ist. Ich verstehe nicht, warum Sie dieses Off-Thema in Betracht ziehen würden. Wir haben sogar [eine Metadiskussion] (https://bioinformatics.meta.stackexchange.com/q/35/298) über solche Dinge geführt, und der Konsens war klar: Biologische Fragen sind thematisch, wenn sie relevant sind Bioinformatik.
Okay Leute, zum Thema
Die engen Abstimmungen behaupten, dass diese Frage meinungsbasiert ist, aber es gibt einige sehr objektive Antworten auf die Frage, welche Sequenzierungsplattform zu wählen ist. Ich denke, die Frage selbst könnte ein wenig umformuliert werden, aber es ist definitiv eine Diskussion zum Thema.
Ich könnte dafür stimmen, die Frage zu schließen, weil sie zu allgemein ist (es gibt keine einzige gute Antwort), aber ich stimme @DanielStandage zu - es gibt so viele objektive Gründe, warum man sich für Illumina entscheidet, und es kann für Forscher, die mit ngs beginnen, sehr wertvoll sein Beachten Sie zumindest einige dieser Kriterien. Ich denke, das ist eine gute Frage.
Zum Schließen von Genomen verwenden Menschen häufig beides: Pac Bio für langgelesene Gerüste, Illumina für hohe Genauigkeit und mehr Abdeckung. Sie haben auch verschiedene Arten von Fehlern, so dass ein einfacher Vergleich der Fehlerraten nicht die ganze Geschichte ist. Sie müssen eine bestimmte Anwendung im Auge haben, um eine Entscheidung darüber zu treffen, welche Sequenzierungsplattform am besten ist. (Das Auflisten einer bestimmten Anwendung in Ihrer Frage würde auch die Neinsager hier unterdrücken, die denken, dass Ihre Frage zu allgemein oder nicht zum Thema gehört.)
Drei antworten:
#1
+14
Kamil S Jaron
2019-01-31 22:12:47 UTC
view on stackexchange narkive permalink

Es gibt so viele Gründe, warum man Illumina PacBio vorziehen möchte (beachten Sie auch, dass es sich um eine falsche Dichotomie handelt, zumindest ist Oxford Nanopore eine wettbewerbsfähige Sequenzierungsplattform):

  • Der erste (IMHO und der häufigste Grund) sind immer noch die Kosten sowohl für die Sequenzierung als auch für die Instrumente. Illumina kann ein Gbit / s Daten für \ $ 7 - \ $ 93 sequenzieren. Die PacBio-Sequenzierung kostet dieselbe Webseite \ 115 USD pro Gbit / s, in unserem Sequenzierungszentrum jedoch ~ 200 USD. Obwohl ONT möglicherweise bereits eine billigere Lösung hat. Bearbeiten, ich habe gerade einen Google Sheat mit Preisen gefunden, der häufig aktualisiert zu werden scheint, scheint, dass das Verhältnis immer noch Illumina Short Reads ~ 10x billiger als PacBio hält.
  • RNA-seq ( dh Analyse einer Genexpression) ist mit PacBio aufgrund der bevorzugten Sequenzierung kleinerer Fragmente nicht möglich; Es wurde immer gezeigt, dass kürzere Gene stärker exprimiert werden. Um klar zu sein, ist es möglich, RNA mit PacBio zu sequenzieren (das Schlüsselwort ist iso-seq), aber die Analyse der Genexpression ist problematisch.
  • Es ist viel einfacher, fragmentierte DNA zu extrahieren (betrifft kleine Nichtmodellorganismen ; obwohl kürzlich eine einzelne Mücke sequenziert wurde, so dass wir eine weitere Verbesserung erwarten können)
  • andere Sequenzierungstechniken wie RAD-seq, die die Genotypisierung mit sehr geringem Aufwand und Kosten ermöglichen, habe ich Ich habe noch nie jemanden gesehen, der in Betracht gezogen hat, lange Lesevorgänge für eine solche Genotypisierung zu verwenden.
  • Genomprofilierung (Assembler-freie Genombewertung) basierend auf kmer-Spektrenanalyse ist mit PacBio-Daten aufgrund höherer Fehlerraten nicht möglich . Interessenkonflikt: Ich bin Entwickler eines der Tools zur Genomprofilerstellung ( Smudgeplot).
  • DNA in formalinfixierten, in Paraffin eingebetteten Proben ist ohnehin fragmentiert (~ 300 bp). Daher macht es keinen Sinn, sie mit einer teureren Long-Read-Technologie zu sequenzieren (beigesteuert von @mRoten).
  • Ich wette, es wird viele andere Anwendungen geben, die mir nicht bekannt sind
Bitte fügen Sie hinzu, dass die DNA der FFPE-Probe fragmentiert ist (~ 300 nt), sodass die Illumina-Short-Read-Sequenzierung immer noch die niedrigsten Kosten pro Base aufweist als PacBio. Selbst ConcatSeq (https://www.nature.com/articles/s41598-017-05503-w) erhöht die Lesezahl nur um den Faktor 5. Illumina ist immer noch der Gewinner.
Ich habe die Antwort an das Community-Wiki weitergeleitet, damit die Leute leichter Gründe für Illumina hinzufügen / aktualisieren können. Da dies nicht vollständig ist, keine zeitstabile Antwort.
#2
+5
Michael
2019-01-31 17:33:23 UTC
view on stackexchange narkive permalink

Drei Gründe für Illumina:

  * Viel besser für eine große Anzahl von Proben (problemlos 96 Proben handhaben). * SNP-Anrufe sind viel besser - viel größere Tiefe * Hardwarekosten, eine Illumina MiSeq-Maschine ist billig  

PacBio-SNP-Anrufe wurden durch DNA-Modifikation der zu verwendenden Eingänge auf den Standard von Illumina verbessert sequenziert, aber es hängt von der Anwendung ab.

#3
+5
Ian Sudbery
2019-01-31 18:37:02 UTC
view on stackexchange narkive permalink

Viele Analysen, die heutzutage auf Illumina-Maschinen durchgeführt werden, erfordern eine große Anzahl von Lesevorgängen. Zum Beispiel benötigen die meisten Analysen in ChIP-seq, RNA-seq, ATAC-seq usw. 10 oder sogar 100 Millionen Lesevorgänge, damit die Statistiken ordnungsgemäß funktionieren.

Dies beschränkt sich jedoch nicht nur auf die Sequenzierung als Assay-Experiment. Hohe Tiefen sind auch für Dinge wie das Aufrufen somatischer Varianten wichtig. Oder einfach die Sequenzierung von medizinischen Genkanälen, bei denen Sie möglicherweise nur 20 Amplikons mit jeweils 500 bp haben, dies aber bei 100 Patienten so billig wie möglich tun müssen.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 4.0-Lizenz, unter der er vertrieben wird.
Loading...