Datenbanken sprengen

Ich helfe einem Kollegen beim Einrichten eines lokalen Blast-Servers. Mein Hintergrund ist Informatik, daher entschuldige ich mich, wenn ich falsche Terminologie verwende.

Auf der NCBI-Blastn-Webseite ist eine der aufgelisteten Datenbanken „NCBI Genomes (Chromosom)“. Ich kann diese Datenbank nicht finden, die auf der Datenbank-Download-Seite aufgeführt ist ( ftp://ftp.ncbi.nlm.nih.gov/blast/db/ ).

Wie lautet der Name dieser Datenbank, wie sie auf der FTP-Site aufgeführt ist?

Haben Sie versucht, die NCBI-Hilfe zu kontaktieren?
Neben NCBI können Sie auch Genome von UCSC und Ensembl verwenden.

Antworten (2)

Mit den Blast-Binärdateien erhalten Sie ein Perl-Skript update_blastdb.pl, mit dem Sie vorformatierte Datenbanken von ncbi herunterladen können (es ist sowieso so ziemlich ein Skript, das die Daten von dem Ort abruft, den Sie gefunden haben). With update_blastdb.pl --showalllistet alle verfügbaren Blast-Datenbanken auf und wahrscheinlich ist refseq_genomic das, was Sie brauchen, es sei denn, Ihre Abfrage betrifft nur menschliche Daten.

Dies basiert jedoch auf der Annahme, dass Ihre Abfragedaten Nukleotiddaten sind – Sie müssen möglicherweise andere Datenbanken und Tools für Proteine ​​auswählen

Im Gegensatz zu den Behauptungen von Maxim Kuleshov unterscheiden die NC- und NT-Beitrittspräfixe nicht zwischen Organismen, sondern dem Genom-Assemblierungsstatus, wie in der verlinkten Dokumentation und den refseq-Versionshinweisen, Abschnitt 3.8, angegeben

human_genomic.*tar.gzist Human RefSeq (NC_######) Chromosomendatensätze mit lückenbereinigten verketteten NT_-Contigs und other_genomic.*tar.gzfür nichtmenschliche Organismen ( mehr über RefSeq-Zugangsnummern wie NC_ und NT_). Weitere Informationen finden Sie in der Readme-Datei .