Frage:
Wie kann ich Gennamen für einen Stoffwechselweg aus KEGG extrahieren?
becko
2017-09-24 16:14:22 UTC
view on stackexchange narkive permalink

Hinweis: Diese Frage wurde auch bei Biostars

gestellt. Ich benötige die Liste der an der Glykolyse beteiligten Gennamen (um eine Beispiel). Nicht manuell, ich muss dies in einem Skript tun. Idealerweise mit Python. Ich denke, KEGG ist die richtige Datenbank, um dies zu tun, aber jeder andere (kostenlose) Vorschlag würde es tun.

Wie kann ich das tun?

Nach Ihrer Kenntnis gibt es andere Stoffwechselwege, einschließlich MetaCyc, Reaktom, ...
Ich konnte sehen, dass diese Frage auf Biostars erneut veröffentlicht wird. Hier ist die Lösung: [https://www.biostars.org/p/274321/#274326 lightboxes(https://www.biostars.org/p/274321/#274326]
Drei antworten:
#1
+5
terdon
2017-09-24 17:39:49 UTC
view on stackexchange narkive permalink

Ich habe dieses kleine Skript mit der KEGG-API erstellt:

  #! / usr / bin / env python3import urllib.requestimport reimport syspathway = 'hsa00010' # glycolysisurl = "http://rest.kegg.jp/get/" + pathwithwith urllib.request.urlopen (url) als f: lines = f.read (). decode (' utf-8 '). splitlines () want = 0 für Zeile in Zeilen: fields = line.split () ## Die Liste der Gene beginnt hier, wenn Felder [0] ==' GENE ': want = 1 ## Die Zeile mit GENE ist anders print (Felder [2] .rstrip (';')) ## Wir haben den nächsten Abschnitt der Datei elif want == 1 erreicht und re.match ('^ \ S', Zeile): sys.exit (); ## Wir sind immer noch in der Liste der Gene, wenn wollen == 1 und len (Felder) >1: print (Felder [1] .rstrip (';'))  
#2
+5
Pierre
2017-09-24 19:20:25 UTC
view on stackexchange narkive permalink

unter Verwendung der REST-API von togows: Man kann eine JSON-Struktur der Gene abrufen, die einem Kegg-Pfad zugeordnet sind. Beispiel: http://togows.org/entry/kegg-pathway/hsa00010/genes.json

  [{"3101": "HK3; Hexokinase 3 [ KO: K00844] [EC: 2.7.1.1], 3098: HK1; Hexokinase 1 [KO: K00844] [EC: 2.7.1.1], 3099: HK2; Hexokinase 2 [KO: K00844] [EC: 2.7.1.1], 80201: HKDC1; Hexokinasedomäne mit 1 [KO: K00844] [EC: 2.7.1.1], 2645: GCK; Glucokinase [KO: K12407] [EC: 2.7.1.2], 2821: GPI; Glucose-6-phosphat-Isomerase [KO: K01810] [EC: 5.3.1.9], 5213: PFKM; Phosphofructokinase, Muskel [KO: K00850] [EC : 2.7.1.11], 5214: PFKP; Phosphofructokinase, Thrombozyten [KO: K00850] [EC: 2.7.1.11], 5211: PFKL; Phosphofructokinase, Lebertyp [KO: K00850] [EC: 2.7.1.11], 2203: FBP1; Fructose-Bisphosphatase 1 [KO: K03841] [EC: 3.1.3.11], 8789: FBP2; Fructose-Bisphosphatase 2 [KO: K03841] [EC: 3.1.3.11], 230: ALDOC; Aldolase, Fructose-Bisphosphat C [KO: K01623] [EC: 4.1.2.13], 226: ALDOA; Aldolase, Fructose-Bisphosphat A [KO: K01623 ] [EC: 4.1.2.13] ", 229: ALDOB; Aldolase, Fructose-Bisphosphat B [KO: K01623] [EC: 4.1.2.13], 7167: TPI1; Triosephosphat-Isomerase 1 [KO: K01803] [EC: 5.3.1.1], 2597: GAPDH; Glycerinaldehyd-3-phosphat-Dehydrogenase [KO: K00134] [EC: 1.2.1.12], 26330: GAPDHS; Glycerinaldehyd-3-phosphat-Dehydrogenase, spermatogen [KO: K10705] [EC: 1.2.1.12], 5232: PGK2; Phosphoglyceratkinase 2 [KO: K00927] [EC: 2.7.2.3], 5230: PGK1; Phosphoglyceratkinase 1 [KO: K00927] [EC: 2.7.2.3], 5223: PGAM1; Phosphoglyceratmutase 1 [KO: K01834] [EC: 5.4.2.11], 5224: PGAM2; Phosphoglyceratmutase 2 [KO: K01834] [EC: 5.4.2.11], 441531: PGAM4; Mitglied der Phosphoglyceratmutase-Familie 4 [KO: K01834] [EC: 5.4.2.11], 2027: ENO3; Enolase 3 [KO: K01689] [EC: 4.2.1.11], 2026: ENO2; Enolase 2 [KO: K01689] [EC: 4.2.1.11] ",
2023: ENO1; Enolase 1 [KO: K01689] [EC: 4.2.1.11], 5315: PKM; Pyruvatkinase, Muskel [KO: K00873] [EC: 2.7.1.40], 5313 PKLR; Pyruvatkinase, Leber und RBC [KO: K12406] [EC: 2.7.1.40], 5161: PDHA2; Pyruvatdehydrogenase alpha 2 [KO: K00161] [EC: 1.2.4.1], 5160: PDHA1; Pyruvatdehydrogenase alpha 1 [KO: K00161] [EC: 1.2.4.1], 5162: PDHB; Pyruvatdehydrogenase (Lipoamid) beta [KO: K00162] [EC: 1.2.4.1] 1737: DLAT; Dihydrolipoamid-S-Acetyltransferase [KO: K00627] [EC: 2.3.1.12], 1738: DLD; Dihydrolipoamid-Dehydrogenase [KO: K00382] [EC: 1.8.1.4], 160287: LDHAL6A; Lactatdehydrogenase A wie 6A [KO: K00016] [EC: 1.1.1.27], 92483: LDHAL6B; Lactatdehydrogenase A wie 6B [KO: K00016] [EC: 1.1.1.27] 3939: LDHA; Lactatdehydrogenase A [KO: K00016] [EC: 1.1.1.27], 3945: LDHB; Lactatdehydrogenase B [KO: K00016] [EC: 1.1.1.27], 3948: LDHC; Lactatdehydrogenase C [KO: K00016] [EC: 1.1.1.27], 124: ADH1A; Alkoholde Ydrogenase 1A (Klasse I), Alpha-Polypeptid [KO: K13951] [EC: 1.1.1.1], 125: ADH1B; Alkoholdehydrogenase 1B (Klasse I), Beta-Polypeptid [KO: K13951] [EC: 1.1.1.1], 126: ADH1C; Alkoholdehydrogenase 1C (Klasse I), Gamma-Polypeptid [KO: K13951] [EC: 1.1.1.1], 131: ADH7; Alkoholdehydrogenase 7 (Klasse IV), Mu- oder Sigma-Polypeptid [KO: K13951] [EC: 1.1.1.1], 127: ADH4; Alkoholdehydrogenase 4 (Klasse II), pi-Polypeptid [KO: K13980] [EC: 1.1.1.1], 128: ADH5; Alkoholdehydrogenase 5 (Klasse III), Chi-Polypeptid [KO: K00121] [EC: 1.1.1.1 1.1.1.284], 130: ADH6; Alkoholdehydrogenase 6 (Klasse V) [KO: K13952] [EC: 1.1.1.1], 10327: AKR1A1; Aldo-Keto-Reduktase-Familie 1 Mitglied A1 [KO: K00002] [EC: 1.1.1.2], 217: ALDH2; Aldehyddehydrogenase 2-Familie (mitochondrial) [KO: K00128] [EC: 1.2.1.3], 224: ALDH3A2; Mitglied der Aldehyddehydrogenase 3-Familie A2 [KO: K00128] [EC: 1.2.1.3] ",
219: ALDH1B1; Aldehyddehydrogenase 1-Familienmitglied B1 [KO: K00128] [EC: 1.2.1.3], 501: ALDH7A1; Aldehyddehydrogenase 7-Familienmitglied A1 [KO: K14085] [EC: 1.2. 1.3 1.2.1.8 1.2.1.31], 223: ALDH9A1; Aldehyddehydrogenase 9-Familienmitglied A1 [KO: K00149] [EC: 1.2.1.3 1.2.1.47], 221: ALDH3B1; Aldehyddehydrogenase 3 Familienmitglied B1 [KO: K00129] [EC: 1.2.1.5], 222: ALDH3B2; Aldehyddehydrogenase 3 Familienmitglied B2 [KO: K00129] [EC: 1.2.1.5], 220: ALDH1A3 ; Aldehyddehydrogenase 1-Familienmitglied A3 [KO: K00129] [EC: 1.2.1.5], 218: ALDH3A1; Aldehyddehydrogenase 3-Familienmitglied A1 [KO: K00129] [EC: 1.2.1.5], 84532 ACSS1; Mitglied der kurzkettigen Acyl-CoA-Synthetase-Familie 1 [KO: K01895] [EC: 6.2.1.1], 55902: ACSS2; Mitglied der kurzkettigen Familie der Acyl-CoA-Synthetase 2 [KO: K01895] [ EC: 6.2.1.1], 130589: GALM; Galactose-Mutarotase [KO: K01785] [EC: 5.1.3.3], 5236: PGM1; Phosphoglucomutase 1 [KO: K01835] [EC: 5.4. 2,2], 55276: PGM2; Phosphogluc Omutase 2 [KO: K15779] [EC: 5.4.2.7 5.4.2.2], 2538: G6PC; katalytische Glucose-6-Phosphatase-Untereinheit [KO: K01084] [EC: 3.1.3.9], 57818: G6PC2; katalytische Glucose-6-Phosphatase-Untereinheit 2 [KO: K01084] [EC: 3.1.3.9], 92579: G6PC3; katalytische Glucose-6-Phosphatase-Untereinheit 3 ​​[KO: K01084] [EC: 3.1.3.9], 83440: ADPGK; ADP-abhängige Glucokinase [KO: K08074] [EC: 2.7.1.147], 669: BPGM; Bisphosphoglyceratmutase [KO: K01837] [EC: 5.4.2.11 5.4.2.4], 9562: MINPP1; multiple Inositol-Polyphosphat-Phosphatase 1 [KO: K03103] [EC: 3.1.3.80 3.1.3.62], 5105: PCK1; Phosphoenolpyruvatcarboxykinase 1 [KO: K01596] [EC: 4.1.1.32], 5106: PCK2; Phosphoenolpyruvatcarboxykinase 2, mitochondrial [KO: K01596] [EC: 4.1.1.32] "}]  
#3
+2
gringer
2018-01-12 08:29:44 UTC
view on stackexchange narkive permalink

Antworten von Biostars:

GeneSCF Das Modul 'prepare_database' extrahiert alle Pfade mit entsprechenden Genen als einfaches Tabellenformat in einer Klartextdatei. Aktivieren Sie unter dem angegebenen Link die Option "Zweistufiger Prozess" (Unterüberschrift) (der erste Schritt erledigt Ihre Aufgabe).


Sie können die KEGG REST-API zum Extrahieren von Genen verwenden Namen vom Weg. Python-Anforderungsbibliothek kann verwendet werden, um REST-Aufrufe an die KEGG REST-API und Abfrageinformationen durchzuführen. Bitte folgen Sie diesem Tutorial, wenn Sie ein Neuling in den Python-Programmier- und REST-Webdiensten sind.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...