Moltyp kontrolliertes Vokabular?

Bei der Übermittlung von Sequenzen mit tbl2asn an NCBI/GenBank heißt es in der Dokumentation, dass es ein kontrolliertes Vokabular für den Schlüssel "moltype" gibt, aber nirgendwo im Internet kann ich eine vollständige Liste dieses Vokabulars finden. „mRNA“ und „genomisch“ werden auf mehreren Seiten als Beispiele angegeben, und ich kann der Sequin-Dokumentation entnehmen, was die GUI-Deskriptoren aller Vokabelbegriffe sind (z. B. „genomische DNA“), aber ich kann die Begriffe selbst nicht finden . Irgendwelche Ideen, wo ich diese Liste finden kann?

Etwas umständlich, aber könnten Sie Sequin herunterladen, um zu sehen, was es in der Fasta für jeden Molekültyp ausgibt?
Ich hatte nicht bemerkt, dass Sequin Fasta-Dateien ausgibt. Ich habe gerade nachgesehen, und es scheint keinen dieser Deskriptoren in der FASTA-Datei zu enthalten, die exportiert werden, wenn Sie den Export-Befehl verwenden.
Tut mir leid, ich weiß wirklich nichts darüber. Nur ein Gedanke, den ich hatte.
Es war ein guter Gedanke. Wie Sie sehen können, habe ich meinen Kommentar (vielleicht unangemessen) bearbeitet, weil ich ihn getestet habe und er nicht zu funktionieren schien.

Antworten (2)

Es gibt diese Seite „Controlled vocabulary for /mol_type qualifier“, die 2013 von der International Nucleotide Sequence Database Collaboration erstellt wurde. Sie besagt, dass die zulässigen Werte sind:

„genomische DNA“, „genomische RNA“, „mRNA“, „tRNA“, „rRNA“, „andere RNA“, „andere DNA“, „transkribierte RNA“, „virale cRNA“, „nicht zugewiesene DNA“, „nicht zugewiesene RNA“. "

Ich fand dies als zweites Ergebnis einer Google-Suche nach Moltyp-Vokabular .

Das habe ich auch gefunden. Das Problem dabei ist, dass in den von NCBI bereitgestellten Beispielen "genomic" einer der gültigen Werte "moltype" ist. „genomisch“ selbst erscheint nicht auf dieser kontrollierten Vokabularliste.
Eine andere Möglichkeit ist natürlich, dass die andere NCBI-Dokumentation ungültig ist und dass dies auch das kontrollierte Vokabular ist, das sie verwenden.
Ich habe gerade von NCBI gehört. Obwohl dieses kontrollierte Vokabular im Widerspruch zu ihrer eigenen Dokumentation steht (von der ich vermute, dass sie veraltet ist), ist es das Vokabular, das sie jetzt verwenden.

Ich habe eine archivierte Version von Sequin for Database Submissions and Updates: A Quick Guide gefunden , veröffentlicht von NCBI.

  • moltype sollte einen der folgenden Werte verwenden. Beispiel: [moltype=genomic]
    • genomisch
    • Vorläufer-RNA
    • mRNA
    • rRNA
    • tRNA
    • snRNA
    • scRNA
    • anders-genetisch
    • cRNA
    • snoRNA
    • transkribierte RNA
Gut gemacht! Das sieht so aus, als wäre es das, was ich brauche. Seltsam, dass das nicht öffentlich ist.
Die andere Möglichkeit ist, dass die OTHER-Dokumentation veraltet ist und dass das kontrollierte Vokabular, das mgkrebbs gefunden hat, auch dasjenige ist, das NCBI verwendet.
@DavidMaddison Ja, es ist seltsam. Es kann sich lohnen, sich diesbezüglich an das NCBI zu wenden.
Ja, ich habe dem NCBI heute früh eine Nachricht geschickt, in der ich darum gebeten habe. Ich werde berichten!
Siehe meinen neuen Kommentar zu mgkrebbs Antwort.