Ich betrachte eine Genomsequenz für 2019-nCoV auf NCBI. Die FASTA-Sequenz sieht wie folgt aus:
>MN988713.1 Wuhan Fischmarkt Pneumonien Virusisolat 2019-Ncov / USA-IL-1/2020, komplett genomeATTAAAGGTTTATACCTTCCCAGGTAACAAACCAACCAACTTTCGATCTCTTGTAGATCTGTTCTCTAAACGAACTTTAAAATCTGTGTGGCTGTCACTCGGCTGCATGCTTAGTGCACTCACGCAGTATAATTAATAACTAATTACTGTCGTTGACAGGACACGAGTAACTCGTCTATCTTCTGCAGGCTGCTTACGGTTTCGTCCGTG ... ... TTAATCAGTGTGTAACATTAGGGAGGACTTGAAAGAGCCACCACATTTTCACCGAGGCCACGCGGAGTACGATCGAGTGTACAGTGAACAATGCTAGGGAGAGCTGCCTATATGGAAGAGCCCTAATGTGTAAAATTAATTTTAGTAGTGCTATCCCCATGTGATTTTAATAGCTTCTTAGGAGAATGACAAAAAAAAAAAA
Coronavirus ist ein RNA-Virus, daher hatte ich erwartet, dass die Sequenz aus AUGC
-Zeichen besteht. Aber die Buchstaben hier sind ATGC
, was wie DNA aussieht!
Ich habe eine mögliche Antwort gefunden, dass dies die Sequenz einer "komplementären DNA" ist . Ich habe gelesen, dass
der Begriff cDNA auch verwendet wird, typischerweise in einem bioinformatischen Kontext, um sich auf die Sequenz eines mRNA-Transkripts zu beziehen, ausgedrückt als DNA-Basen (GCAT) anstatt RNA-Basen (GCAU).
Ich glaube jedoch nicht, dass es sich bei dieser Theorie um eine cDNA handelt. Wenn dies wahr wäre, wäre das Ende der wahren mRNA-Sequenz ... UCUUACUGUUUUUUUUUUUU
oder ein "Poly (U)" - Schwanz. Ich glaube jedoch, dass das Coronavirus einen Poly (A) -Schwanz hat.
Ich fand auch, dass der Beginn aller hervorgehobenen Gene mit der Sequenz ATG
beginnt. Dies ist das DNA-Äquivalent von dem RNA-Startcodon AUG
.
Ich glaube also, dass ich die wahre mRNA in 5 betrachte '→ 3' Richtung, aber mit allen U
konvertiert in T
.
Also, ist das wirklich das, was ich sehe? Ist dies ein Formatierungs- / Darstellungsproblem? Oder enthält 2019-nCoV wirklich DNA statt RNA?