Frage:
Formel für die k-mer-Abdeckung
user44697
2017-07-26 18:35:43 UTC
view on stackexchange narkive permalink

Sei $ C $ die Basisabdeckung, $ R $ ist die Länge der Lesevorgänge und $ K $ ist die Länge von $ k $ -mer. Dann kann $ k $ -mer Coverage $ C_k $ berechnet werden als $ C_k = C \ cdot (R - K + 1) / R $.

Könnte jemand bitte erklären, warum diese Gleichung gültig ist (I ' Ich bin meistens verwirrt darüber, warum es durch $ R $ geteilt wird.

Quelle: Velvet-Handbuch Abschnitt 5.1

Zwei antworten:
Kamil S Jaron
2017-07-27 15:02:09 UTC
view on stackexchange narkive permalink

Die Antworten haben mich immer noch verwirrt, also habe ich versucht, mit allen Schritten zu rechnen. Ich nehme diese Definition "$ C_k $ ist die Anzahl der Lesevorgänge, die ein k-mer enthalten." und entsprechende Definition für die Abdeckung ($ C $): "$ C $ ist die Anzahl der Lesevorgänge, die eine Basis abdecken".

Die Abdeckung beträgt $ C = \ frac {T \ cdot R} {L} $, Dabei ist $ T $ die Gesamtzahl der Lesevorgänge, $ R $ die Leselänge und $ L $ die Länge des Genoms. In Anbetracht der $ C_k $ -Definition ist $ C_k = \ frac {T (R - K + 1)} {L-K + 1} $, wobei $ R - K + 1 $ nur die Anzahl der Kilometer in einem Lesevorgang ist, und $ L-K + 1 $ ist die Anzahl der Kilometer in einem Genom. Dann ist

$$ C_k = \ frac {T (R - K + 1)} {L-K + 1} = \ frac {T (R - K + 1)} {L-K + 1} \ cdot \ frac {R} {R} = \ frac {R - K + 1} {R} \ cdot \ frac {T \ cdot R} {L - K + 1} $$

Da $ L >> K $, können wir $ L - K + 1 \ ungefähr L $ approximieren, dann reduzieren wir den Ausdruck auf

$$ \ frac {R - K + 1} {R} \ cdot \ frac {T \ cdot R} {L} = \ frac {R - K + 1} {R} \ cdot C $$

Dies ist die Formel für $ C_k $.

Devon Ryan
2017-07-27 01:45:29 UTC
view on stackexchange narkive permalink

$ C_k $ ist definiert als die Anzahl der Lesevorgänge, die ein k-mer enthalten. Der Bruchteil eines Lesevorgangs, der verfügbar ist, um ein k-mer zu enthalten, ist $ (R-K + 1) / R $, was die Anzahl der k-mers im Lesevorgang geteilt durch seine Länge ist. Dieses Mal ist die Nukleotidbedeckung ($ C $) dann die erwartete Bedeckung des k-mer.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...