Idealerweise wurden diese BQSR-Methoden unter Berücksichtigung der Tatsache durchgeführt, wie technische Fehler die Basisqualitätsaufrufe tatsächlich vermasseln und wann sich die Maschinen noch in der Entwicklungsphase befanden, während sie für das 1000G-Projekt verwendet wurden. Ab sofort sind Maschinen leistungsfähiger und leistungsfähiger, wenn es unwahrscheinlich ist, dass sie verwendet werden. Wir verwenden sie jedoch mit aufgelisteten SNPs, um die Kovariaten zu finden und ein Modell um die Daten herum zu erstellen, indem wir die Informationen mit Tricks des maschinellen Lernens verwenden, um die Qualität dieser Basisaufrufe zu verbessern . Idealerweise sollte es angemessener sein, wenn alte Maschinen von Illumina oder anderen Standardfirmen verwendet werden, aber bei neuen Maschinen, die sehr leistungsfähig sind und einen hohen Durchsatz haben, sollten sie dazu neigen, zu sinken. Ich erinnere mich nicht, ob solche Tests durchgeführt wurden, aber ich weiß natürlich, dass neue Sequenziermaschinen solche Tests immer durchführen, um zu zeigen, dass sie solche Fehler reduziert haben, aber dennoch einen solchen BQSR für Variantenaufrufe empfehlen. Das Problem ist nun die Liste der SNPs. Für mich ist dies das eigentliche Problem, da die Liste, die wir verwenden, weit davon entfernt ist, Goldstandard zu sein, und wenn dies nicht richtig erledigt wird, ist alles, was wir über Qualität schließen, immer noch wackelig. Dieser Link ist ziemlich informativ, aber er ist alt. Ich würde wirklich Verbesserungen mit neuen Sequenzern sehen. Allerdings interessieren sich sehr wenig Menschen für solche Tests in der akademischen Forschung und auch für das Translationslabor. Sie werden wirklich keine Zeit und kein Geld dafür investieren, es sei denn, die Einrichtung verfügt über einige Bioinformatiker, die solche Tests immer durchführen, während sie einen neuen Sequenzer für das Institut kaufen. In Bezug auf die klinische Genomik zum Auffinden von Varianten denke ich, dass die leistungsstärksten und aktuellsten Sequenzer verwendet werden sollten, aber nicht sicher sind, ob sie noch BQSR verwenden und wenn ja, welche Liste sie verwenden, um ein Modell der Kovariation um die Daten herum zu erstellen.