Die Antworten haben mich immer noch verwirrt, also habe ich versucht, mit allen Schritten zu rechnen. Ich nehme diese Definition "$ C_k $ ist die Anzahl der Lesevorgänge, die ein k-mer enthalten." und entsprechende Definition für die Abdeckung ($ C $): "$ C $ ist die Anzahl der Lesevorgänge, die eine Basis abdecken".
Die Abdeckung beträgt $ C = \ frac {T \ cdot R} {L} $, Dabei ist $ T $ die Gesamtzahl der Lesevorgänge, $ R $ die Leselänge und $ L $ die Länge des Genoms. In Anbetracht der $ C_k $ -Definition ist $ C_k = \ frac {T (R - K + 1)} {L-K + 1} $, wobei $ R - K + 1 $ nur die Anzahl der Kilometer in einem Lesevorgang ist, und $ L-K + 1 $ ist die Anzahl der Kilometer in einem Genom. Dann ist
$$ C_k = \ frac {T (R - K + 1)} {L-K + 1} = \ frac {T (R - K + 1)} {L-K + 1} \ cdot \ frac {R} {R} = \ frac {R - K + 1} {R} \ cdot \ frac {T \ cdot R} {L - K + 1} $$
Da $ L >> K $, können wir $ L - K + 1 \ ungefähr L $ approximieren, dann reduzieren wir den Ausdruck auf
$$ \ frac {R - K + 1} {R} \ cdot \ frac {T \ cdot R} {L} = \ frac {R - K + 1} {R} \ cdot C $$
Dies ist die Formel für $ C_k $.