Frage:
Zuordnungen von Probeset zu Probeset zwischen Affymetrix-Arrays
Prradep
2017-05-18 17:52:23 UTC
view on stackexchange narkive permalink

Ich bin daran interessiert, Zuordnungen zwischen verschiedenen Arten von Affymetrix-Arrays zu identifizieren. Mir ist bekannt, dass Zuordnungen zwischen Gen und Sondensatz mithilfe der Biomart-Datenbank von Ensembl extrahiert werden können.

  Die Ensembe-Gen-ID ENSG00000181019 entspricht 1. AFFY HG-U133_Plus_2s 210519_s_at2. AFFY HuGene-1_0-st-v1 8002303  

Gibt es eine Möglichkeit, Zuordnungen von Probeset-IDs zwischen zwei Arrays zu extrahieren (z. B. HG-U133_Plus_2, HuGene-1_0-st-v1)?

  zB: 210519_s_at und 8002303  
Ist Ihre Frage, wie Sie überlappende Sondensätze zwischen Arrays finden können? Oder wie man Sondensätze im Allgemeinen identifiziert? Es ist nicht klar.
Ich habe ein Beispiel hinzugefügt. Ist das jetzt sinnvoll?
Grundsätzlich können Sie also zwei Gen-ID-Zuordnungen aus Ensembls Biomart abrufen. Richtig? Was hindert Sie daran, diese beiden Tabellen basierend auf der Ensembl-Gen-ID zu verbinden? Sie können die Funktion "Zusammenführen" in der Anweisung "R" oder "JOIN" in SQL verwenden.
@IakovDavydov oder ein Unix-Join würden ebenfalls funktionieren
Das Problem ist: Alle Zuordnungen sind nicht genau eins zu eins. Entweder Sondensätze von HG-U133_Plus_2 oder HuGene-1_0-st-v1, die auf eine Ensembl-Gen-ID abgebildet sind.
@Prradep Wenn Sie erklären, was das zugrunde liegende Problem ist, das Sie zu lösen versuchen, können wir Ihnen möglicherweise bessere Ratschläge geben
Sie sollten nicht unbedingt damit rechnen, Eins-zu-Eins-Zuordnungen zu sehen, siehe meine Antwort unten.
Drei antworten:
#1
+9
neilfws
2017-05-19 06:18:14 UTC
view on stackexchange narkive permalink

Wenn Ihre Frage lautet: Können Probeset-IDs von verschiedenen Plattformen auf ähnliche Weise wie Probesets auf Gene abgebildet werden, lautet die Antwort: Ja. Mit BioMart können Sie fast alles, was eine ID hat, auf alles andere mit einer ID abbilden.

Sie können BioMart entweder über die Weboberfläche oder programmgesteuert verwenden. Eine kurze Anleitung zur Verwendung der Weboberfläche für die Zuordnung von HG U133 Plus 2 zu HuGene 1.0:

  1. Gehen Sie zu der Startseite
  2. Wählen Sie H. . sapiens Ensembl-Gene für Ihre Datenbank; Menschliche Gene (GRCh38.p10) für Ihren Datensatz
  3. Klicken Sie in der linken Spalte auf Filter.
  4. Erweitern Sie "REGION", scrollen Sie nach unten zu GENE und wählen Sie "Microarray-Sonden / Sondensatz-ID eingeben" list [Max 500 empfohlen] "
  5. Wählen Sie AFFY HG U133 PLUS 2 Sonden-ID (s) und kopieren / fügen Sie eine Liste ein oder laden Sie sie hoch, eine pro Zeile
  6. Klicken Sie links auf Attribute -hand-Spalte
  7. Blättern Sie durch, deaktivieren Sie, was Sie nicht sehen möchten, und wählen Sie aus, was Sie tun, z. B. Gene Stable ID, AFFY HuGene 1 0 st v1-Sonde und AFFY HG U133 Plus 2-Sonde
  8. Klicken Sie abschließend im Menü oben in der linken Spalte auf "Ergebnisse".
  9. ol>

    Und Sie sollten ein Ergebnis wie dieses sehen (Sie Klicken Sie auf die Schaltfläche "Ergebnisse".

    Sie sollten aus zwei Gründen nicht mit einer Eins-zu-Eins-Zuordnung rechnen:

  • Gene haben Jedem Transkript werden mehrere Transkripte und Probensätze zugeordnet.
  • Einige Transkripte haben mehr als einen Probensatz: In diesem Fall werden die HuGene-IDs 8002301 und 8002303 den Transkripten zugeordnet Dieses Gen

Schließlich: Hier ist ein programmatisches Beispiel mit R / BioMart:

  Bibliothek (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") ergibt <-getBM (Attribute = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), Filter = " .hs) Ergebnisse ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at  
#2
+7
rmflight
2017-05-19 06:53:56 UTC
view on stackexchange narkive permalink

Anstelle von biomaRt ist es auch möglich, die in Bioconductor selbst integrierten Mapping-Datenbanken zu verwenden und im zweiten von Sonde zu Gen und dann von Gen zu Sonde abzubilden. Einige R-Codes zum Konvertieren zwischen hgu133 und hgu95 unter Verwendung derselben Sonden-ID, die in einer anderen angegeben ist:

  Bibliothek (hgu133plus2.db) Bibliothek (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- select (hgu133plus2.db, keys = query_probe, column = "ENSEMBL") ensembl_hgu95 <-select (hgu95av2.db, keys = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBL", column = "PROBEID") dplyr :: inner_jbl (h , by = "ENSEMBL", Suffix = c (". 133", ".95"))  
#3
+2
rmflight
2017-05-19 06:57:32 UTC
view on stackexchange narkive permalink

Andere Antworten erklären, warum es möglicherweise keine Eins-zu-Eins-Zuordnung zwischen den Sonden gibt.

Die AbsID-Datenbank führt die Konvertierung basierend auf der Zuordnung der Sondensequenzen zu einem Genomaufbau durch Bestimmt dann die Zuordnungen basierend auf überlappenden Genomausrichtungskoordinaten. Dies ist sehr nützlich, wenn Sie sicher sein möchten, dass zwei Sonden tatsächlich dasselbe Transkript messen.

Es hängt jedoch davon ab, ob beide Sonden am Genom ausgerichtet sind.

Haftungsausschluss: Ich habe in der Gruppe gearbeitet, die das AbsID-Mapping-Tool bereitstellt.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...