Inwieweit ist es möglich zu verstehen, ob ein Bakterium ein Protein produzieren kann? (nur in silico!)

Ich muss eine Frage zu einer Teilaufgabe meiner Diplomarbeit beantworten: Können die Bakterien X das Protein Y produzieren ?

Ich suchte natürlich Google und BLAST. Es gibt keine Daten, die belegen, dass dieses spezifische Bakterium jemals diese Proteinsequenz produziert hat.

Mein Doktorvater möchte jedoch, dass ich tiefer gehe [1] , aber ich weiß nicht, wie ich es in silico machen soll , um eine angemessene Antwort zu geben.

Was ich mit den vorliegenden Daten tun möchte, ist, eine Datenbank auf localhost mit allen Versionen des in BLAST aufgeführten Proteins zu erstellen ( ich verwende Ruby, bin mir nicht sicher, wie ich all diese Daten noch im FASTA-Format abrufen kann, aber ich werde es herausfinden ) und alle Bakterienstämme, die in BLAST aufgeführt sind, und einen Fuzzy-String-Matching durchführen .

Das ist wie Brute-Force. Nachdem ich eine mögliche Punktzahl habe, kann ich die beste Punktzahl von allen bekommen, sie ein wenig studieren und dann meine Antwort einreichen.

Gibt es eine andere Möglichkeit, dieses Problem anzugehen, um eine ordnungsgemäße, zumindest teilweise ausgefeilte Antwort zu übermitteln?

HINWEIS: Ich habe keinen Zugang zu einem Labor, alle Experimente müssen in silico durchgeführt werden.

[1] Mein Vorgesetzter glaubt, dass, WENN dieses Bakterium dieses Protein bräuchte, es in der Lage sein würde, es nach Belieben zu produzieren, ohne sich Mutationen zu unterziehen. Und da sein Maß an Hingabe und Wissen in Bezug auf die Molekularbiologie beängstigend ist, ist es schwer zu glauben, dass er falsch liegt.

Ich komme aus dem Nasslabor – und meine Erfahrung ist, dass man praktisch jedes Gen in einen passenden Vektor klonen und in Bakterien exprimieren kann. Sie brauchen die richtigen regulatorischen Sequenzen (Promotoren usw.), aber es ist möglich. Die Frage, ob dieses Protein in großen Mengen produziert wird und ob es löslich ist, ist etwas anderes. Außerdem werden viele Proteine ​​posttranslational modifiziert, was Bakterien nicht können.
Hallo Chris. Ich bin nicht daran interessiert, irgendetwas zu klonen, aber danke für die Info.
Ich habe das verstanden. Ich wollte einfach einen Kommentar zur praktischen Seite dieses Problems hinzufügen, das könnte Ihnen auch helfen?
Natürlich @Chris, ich werde in meiner Arbeit erwähnen, dass es möglich ist, das gewünschte Ergebnis durch Klonen zu erzielen. Ohne Ihren Kommentar hätte ich diesen zusätzlichen Absatz nicht gehabt, der meine Arbeit sowieso besser macht :-) ... Also nochmals vielen Dank!
Um es klar zu sagen: Sie wollen einen Algorithmus, der passt, ob das gegebene Fasta vom Bakteriengenom produziert werden kann?
@DevashishDas Nein, ich habe bereits ein Juwel mit einer Liste von Fuzzy-Matching-Algorithmen. Ich würde gerne wissen, ob es einen anderen Ansatz gibt, der es wert ist, verfolgt zu werden, außer dem. HINWEIS: Jeder Kommentar zu den Algorithmen wäre auch gut: Hamming, Jaro, JaroWinkler, Levenshtein, LongestSubsequence, LongestSubstring, PairDistance, Sellers . Dies sind diejenigen, die von der Bibliothek unterstützt werden, die ich verwenden werde.
Sprechen Sie darüber, ob das Bakterium ein Protein natürlich produziert oder ob es ein bestimmtes Protein exprimieren könnte?
@JackAidley Ob es bei Bedarf ein bestimmtes Protein (in beliebiger Menge) exprimieren könnte.
Sie können einen ORF aus der DNA/RNA-Sequenz vorhersagen, aber Sie können nicht sicher sein, ob das Protein produziert wird. Sie können entweder LC-MS durchführen, um zu sehen, ob charakteristische Peptide produziert werden, oder molekularbiologische Experimente durchführen, wie Chris vorgeschlagen hat. Sie können Ihre Sequenz auch mit GFP markieren und sehen, ob sie exprimiert wird.
Sie können Proteomics-Daten (falls verfügbar) für Ihre Bakterien herunterladen und nach den Signaturpeptiden suchen, die Ihr Protein-x wahrscheinlich produziert.
Wenn Sie sich nur ansehen, ob ein Protein exprimiert werden kann, verstehen Sie Ihren Vorgesetzten möglicherweise falsch. Die Menge an Proteinen , die von einem bestimmten Bakterium benötigt wird, ist eine winzig kleine Teilmenge der Menge an Proteinen, die Bakterien produzieren können, vorausgesetzt, das Gen, das für das Protein kodiert, wird den Bakterien zur Verfügung gestellt . Wenn Sie stattdessen neugierig sind, ob ein Bakterium ein bestimmtes Protein ohne Änderungen an seinem Genom exprimieren kann, gibt es viele Proteine, die im Genom kodiert sind, aber nur unter bestimmten Umständen exprimiert werden. Ich würde mich an deiner Stelle nach Veranstaltern umsehen, um mehr darüber zu erfahren

Antworten (1)

Ihr Problem läuft schließlich darauf hinaus, Ihre Sequenz in den Blast-Datenbanken zu durchsuchen. Die Durchführung von Blast scheint wahrscheinlich der beste Weg zu sein, um herauszufinden, ob Ihr Bakterium dieses spezifische Protein exprimiert oder nicht. Wenn Sie es mit Blast nicht in der nächstgelegenen Spezies finden konnten, versuchen Sie es mit PSI-BLAST, das Ihnen entfernte Homologe zurückgeben würde, anhand derer Sie sehen können, ob Ihr Protein in den anderen Bakterienarten exprimiert wird.

Ich bin an etwas dran, das Blast verwendet (ich habe die Idee verworfen, ein eigenes Skript zu schreiben, um dies zu tun, sobald ich mit BLAST herumgespielt habe). Ich weiß, dass E. Coli mein Protein (es ist dokumentiert) auf Proteinebene produzieren kann. Ich konnte keinen perfekten Übereinstimmungsgedanken finden, ich habe eine zu 74 % positive Übereinstimmung gefunden. Dann suchte nach Desulfovibrio und fand eine 75% positive Übereinstimmung (für einen bestimmten Stamm). Ich denke, es ist genug, ich kann das Risiko nicht eingehen, die Frage endgültig zu beantworten, aber es sind genug Daten, um einige Denkanstöße und mögliche Richtungen zu geben. Kommentare sind mehr als willkommen! Ty!