Frage:
Stabile Download-URLs
Manuel
2017-06-01 04:40:03 UTC
view on stackexchange narkive permalink

Ein großes Problem, mit dem ich regelmäßig konfrontiert bin, ist, dass URLs zum Herunterladen von Bioinformatik-Daten (z. B. RefSeq-Releases oder NCBI-Genom-Releases) verschwinden.

Hat jemand eine gute Lösung dafür?

Haben Sie Beispiele für bestimmte URLs, die nicht mehr funktionieren? Einige Projekte bemühen sich sehr, Permalinks bereitzustellen.
Genom-Releases sind versioniert, sodass die URL möglicherweise verschoben wird, die Daten jedoch noch vorhanden sind.
Können Sie angeben, welche Plattform oder welche Art von Daten Sie für eine stabile URL suchen? Viele Websites bieten einen FTP-Server für große Downloads
Ich denke, dies ist eine gute Frage, möglicherweise mit geringfügigen Änderungen: URIs für große Datenbanken verschwinden selten, aber stabile Kennungen sind nicht immer offensichtlich markiert (z. B. verwendet Ensembl standardmäßig eher die "aktuelle" Version als eine stabile URI).
Die Frage sollte mit einigen Beispielen gewürzt werden, aber es gibt einen sehr guten Punkt.
Ich bezog mich auf NCBI-Inhalte, z. B. dbSNP, bei denen die neueste Version für GRCh37 verschwunden ist und aus einer UCSC-Tabelle interpoliert werden muss.
Einer antworten:
#1
+4
Matt Bashton
2017-06-03 18:36:29 UTC
view on stackexchange narkive permalink

Der Persistent Uniform Resource Locator oder PURL ist eine solche Lösung. Diese sind etwas robuster als Permalinks, da sie die Änderung des Domainnamens überleben sollen. Die Bio-Ontologie-Community verwendet sie bereits http://purl.bioontology.org/docs/index.html



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...