Frage:
GRCh38 vcf-Datei mit häufigen Krebsmutationen
719016
2017-06-15 16:56:52 UTC
view on stackexchange narkive permalink

Gibt es auf der GRCh38-Assembly eine VCF-Datei mit häufigen Krebsmutationen, die ich irgendwo herunterladen kann? Vielleicht von einem der großen internationalen Konsortien für Krebsgenomik?

Mit "allgemein" meine ich, welche Mutationen bei verschiedenen Krebsarten immer wieder vorkommen.

Wie würden Sie das definieren? Irgendeine Variante in> 1 Krebstyp gefunden? Bei wie vielen Patienten? Müssen Sie dann Varianten ausschließen, die nur bei einer Krebsart vorkommen? Sollten dies nur ursächliche Varianten sein? Was ist, wenn bei drei verschiedenen Krebspatienten eine Variante gefunden wurde, die aber absolut keinen Zusammenhang mit ihrem Krebs hat? Und ja, das ist nicht nur möglich, sondern fast sicher, da viele Varianten in der Bevölkerung sehr verbreitet sind. Möchten Sie dies durch die Häufigkeit der Varianten begrenzen? Bitte bearbeiten Sie Ihre Frage und schränken Sie sie ein.
@terdon Es hört sich so an, als würden Sie davon ausgehen, dass er Populationsgenetik betreibt, was möglicherweise der Fall ist oder nicht. In der Krebsgenetik kümmern sie sich normalerweise nur um somatische Varianten, so dass automatisch ausgeschlossen wird, dass "Varianten in der Bevölkerung sehr häufig sind". Ich denke, was die Frage wirklich braucht, ist eine Klärung der Keimbahn gegenüber somatischen Mutationen.
Drei antworten:
burger
2017-06-18 22:04:43 UTC
view on stackexchange narkive permalink

Wenn Sie nach Krebsmutationen suchen, ist die primäre Ressource COSMIC und sie stellen GRCh38-VCFs bereit. Die Download-Seite ist hier: http://cancer.sanger.ac.uk/cosmic/download

Es liegt an Ihnen, wie Sie "common" definieren, aber Der VCF enthält viele Informationen, die Sie verwenden können.

terdon
2017-06-15 17:55:47 UTC
view on stackexchange narkive permalink

Ihre Frage enthält nicht genügend Informationen für eine bestimmte Antwort, dies sollte jedoch zunächst einmal ausreichen.

  1. Rufen Sie die VCF-Datei ab, in der alle Varianten in Clinvar von NCBI beschrieben werden:

      wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar.vcf.gz  
  2. Extrahieren Sie alle Varianten, deren VCF-Zeile das Wort "Krebs" enthält:

      zgrep -iE '^ # | CLNDBN = [^;] * Krebs' clinvar.vcf.gz > cancer.vcf  
  3. ol>

    Nun sollten Sie das wahrscheinlich weiter nach Variantenhäufigkeit, Krebsart usw. usw. filtern, aber das sollte ein guter Anfang sein.

gringer
2017-06-15 18:22:39 UTC
view on stackexchange narkive permalink

Das Problem bei der Suche nach krebsassoziierten Varianten besteht darin, dass es schwierig sein kann, falsche Effekte (z. B. ethnische Zugehörigkeit) aus verursachenden Varianten herauszuarbeiten. Wenn Sie daran interessiert sind, welche Gene an den meisten Krebsarten beteiligt sind, sind die Anmerkungen für die NanoString-Panels recht gut:

Der Abschnitt "Unterstützungsdokumente" dieser Seiten enthält einen Link zu einer Excel-Datei mit Genlisten und Sonde Sequenzen. Obwohl diese Listen keine Informationen über Varianten enthalten, die die Funktion stören, habe ich ein wenig Mühe zu überlegen, warum es im Voraus nützlich wäre, dies zu wissen, es sei denn, das Ziel besteht darin, Krebs durch CRISPR oder ähnliches auszulösen.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...