Einstieg in die Bioinformatik [geschlossen]

Ich bin ein Bachelor-Student der Elektrotechnik im zweiten Jahr und autodidaktischer Programmierer. Ich habe mich schon immer für Biologie interessiert, habe mich aber nie damit beschäftigt (abgesehen von zwei Jahren Biologie in der Sekundarschule und ein bisschen Biochemie im Chemieunterricht).

Besonders fasziniert mich das Zusammenspiel von Informatik und Biologie, sowohl Informatik für die Biologie als auch von der Biologie inspirierte Informatikkonzepte. Denken Sie an Dinge wie das menschliche Genomprojekt, genetische Algorithmen, Deep Learning, Proteinstrukturvorhersage usw. usw. Ich denke, dass viele dieser Dinge (die für biologische Dinge verwendete Informatik) - soweit ich weiß - Teil der Bioinformatik sind.

Ich habe Herausforderungen an Rosalind gemacht und obwohl sie nett sind, fühlt es sich eher an, als würde man das Rad trainieren/neu erfinden. Obwohl es vielleicht zu viel verlangt ist, möchte ich etwas "Echtes" machen, das tatsächlich verwendet werden könnte. Nicht, dass ich gleich loslegen möchte, ohne zu lernen, aber ich habe kein Bild im Kopf, was ich nach etwas Theorie machen kann.

Ich suche einen Überblick über das Gebiet der Bioinformatik und eine Anleitung zum Einstieg. Einige Beispiele, woran ich arbeiten kann. Vielleicht gibt es einen leistungsintensiven Algorithmus, für den ich mit dem Entwerfen von Chips (ASICs) beginnen kann, um den Prozess zu beschleunigen. Dies nur ein Beispiel.

Ich hoffe ihr könnt mir helfen, danke im Voraus.

Willkommen bei Bilogy.SE! Ich bin mir nicht sicher, ob Sie sich mehr für Bioinformatik , Computational Biology oder Biological Computation interessieren . Die Unterscheidung zwischen diesen Feldern ist manchmal unklar und kann unterschiedlich sein, je nachdem, wen Sie fragen, aber ich denke, es lohnt sich, sich etwas Zeit zu nehmen, um ihre Definitionen zu lesen.
Ein erster Schritt zur Bioinformatik oder Computerbiologie besteht wahrscheinlich darin, die Grundlagen der Molekularbiologie zu verstehen ( Hier ist ein Link zur Khan-Akademie, der hilfreich sein kann).
Danke schön. :) Meines Wissens liegen Bioinformatik und Computational Biology sehr nah beieinander. Die Bioinformatik konzentriert sich etwas mehr auf die (theoretische) Informatik, während die Computerbiologie sich etwas mehr auf die Mathematik konzentriert. (Wiederum ist dies meine Vorstellung davon.) Für biologische Berechnungen sehe ich einen größeren Unterschied, weil es umgekehrt ist (Computer, die Biologie verwenden, anstatt Biologie, die Computer verwendet). Ich habe einige Grundkenntnisse in Molekularbiologie (oder Biochemie, ich denke, das ist mehr oder weniger dasselbe). (weitermachen...)
Ich weiß zum Beispiel, wie man einen DNA-Strang in RNA in Aminosäuren übersetzen oder (einige einfache) Mutationen identifizieren kann. Aber (natürlich) weiß ich wirklich nicht, wie ich die 3D-Struktur eines Proteins vorhersagen würde. Daher fällt es mir ein bisschen schwer zu wissen, wo ich anfangen soll. Wenn ich mir ansehe, wie ich zum Programmieren gekommen bin, wollte ich eine Website erstellen, also habe ich nach einem Tutorial gesucht. Wenn ich etwas Neues wollte, habe ich gesucht, wie es geht, und es nebenbei gelernt. Bei der Bioinformatik habe ich es schwerer. Ich habe nicht wirklich ein Ziel vor Augen wie die Erstellung dieser Website, wenn Sie verstehen, was ich meine. (weitermachen...)
Und das liegt daran, dass ich nicht wirklich weiß, was ich damit machen werde (Bioinformatik-Kenntnisse). Jedenfalls weiß ich Ihre Hilfe sehr zu schätzen.
Gut, dass Sie diese Grundlage haben. Ich würde empfehlen, den Beitrag dann einzugrenzen. Im Moment glaube ich nicht, dass es möglich ist, Ihre Frage vollständig zu beantworten, da sie zu weit gefasst ist. Zum Beispiel bin ich Bioinformatiker (genauer gesagt Computer-Populationsgenetiker; ich untersuche verschiedene Evolutionsprozesse mithilfe individueller Simulationen und versuche, statistische Methoden zu entwickeln), aber ich habe keine Ahnung, wie man die Faltung eines Proteins vorhersagt.
Wenn ich die Frage stellen darf: Warum bist du Elektrotechnik, wenn du dich für Bioinformatik interessierst? Ich sehe keinen großen Zusammenhang. Natürlich ist es keine Schande (im Gegenteil), wenn man an einem anderen Thema arbeitet als dem, das man durch die Universitätsausbildung erhält, aber ich bin nur neugierig
Ich interessiere mich für Computer und Elektronik, deshalb habe ich mich dafür entschieden. Ich habe das Gefühl, dass die Elektrotechnik einem wirklich beibringt, wie sie funktionieren. Abgesehen davon haben mich Biologie (und Bioinformatik) schon immer interessiert, also sollte eine Kombination dieser beiden großartig sein.
@Remi.b Auch newscientist.com/article/… zeigt ein nettes (und für mich wirklich interessantes) Beispiel.
Ich stimme für die Schließung als zu breit. Ich stimme jedoch zu, wie @David sagte, dass es für Sie wahrscheinlich am besten ist, jemanden an Ihrer eigenen Universität zu kontaktieren, dessen Forschung für Sie von Interesse ist, wenn Sie Ihr Interesse nicht eingrenzen können.
Ich stimme für das Schließen, weil dies auf Meinungen basiert. Ich kenne Bioinformatiker, die als Physiker, Biochemiker, Biologen, Informatiker, Mathematiker, Mediziner usw. angefangen haben und an ganz unterschiedlichen Projekten arbeiten. Es gibt keinen eingleisigen "besten" Weg oder die richtige Nische, in die man einsteigen kann. Bewerben Sie sich für einige Bioinformatik-Projekte/Positionen/Praktika und sehen Sie, ob Sie sie bekommen. Viel Glück.
@Remi.b Außerdem wird EEE viele systemtechnische Module haben und richtige Programmiermodule enthalten (die meisten Bio-Kurse haben bestenfalls ein einzelnes Modul zu R oder Perl, das Sie kaum in die Idee einer Variablen einführt) und eine Tonne der Mathematik. Mit diesem Abschluss sind Sie für ein Werkzeugbauprojekt gut aufgestellt: Die Biologie, die Sie später lernen können!

Antworten (4)

Mein Rat ist, Kontakt zu Biologen in Ihrer eigenen Universität aufzunehmen.

Sie sagen, Sie wollen echte Probleme, und ich begrüße dies, da das Ansprechen echter Probleme der beste Weg ist, um Zeitverschwendung zu vermeiden (was ein allzu häufiges Schicksal bei Streifzügen dieser Art ist). Wie nehme ich Kontakt auf? Vermutlich sind die sozialen Medien der richtige Weg. In deinem Alter solltest du wissen, wie man es benutzt. Sie müssen sich jedoch an Doktoranden und Mitarbeiter richten, nicht an Studenten.

Bücher lesen ist schön und gut, aber bis Sie wissen, was das Problem ist, wissen Sie nicht, worauf Sie sich konzentrieren sollen. Und Biologie ist zu breit und unstrukturiert, um sie durch Lesen zu meistern.

Ich würde eher empfehlen, einen PI direkt zu kontaktieren, als soziale Medien zu nutzen. Viele PIs stellen gerne einen Studenten ein, der Interesse zeigt.
@Remi.b — Sicher, was auch immer funktioniert. Würde ein Student wissen, an welchen PI er sich wenden soll? Wie auch immer, mein Punkt ist, dass ein junger Internet-versierter Student dieses Wissen in seinem eigenen Umfeld nutzen sollte, um seine Bereitschaft zu bewerben, sich an einem Projekt zu beteiligen. Er sollte es besser wissen als ich.
Danke für deine Antwort. Halten Sie es für besser, jemanden aus der Bioinformatik-Abteilung meiner Universität zu kontaktieren oder Biologen direkt zu kontaktieren?
@Kevin Ich würde definitiv zur Bioinformatikabteilung gehen. Vermutlich haben sie bereits Projekte mit den Biologen, aber wenn Sie ihnen sagen, was Ihre Fähigkeiten sind, haben sie vielleicht etwas, was Sie tun können. Zumindest können sie dich beiseite lassen.

Sie finden verschiedene Bioinformatik-Tutorials auf: https://www.biostars.org/t/Tutorials/

Als Computerbiologe würde ich jedoch dringend empfehlen, Biologievorlesungen zu besuchen und viele Lehrbücher zu lesen, die Themen außerhalb der Lieblingsthemen der heutigen Bioinformatik behandeln (Bruce Alberts "Molecular Biology of the Cell" wäre ein guter Anfang):

Technische Aspekte sind einfach zu lösen und zu lernen (und auch auszulagern). Der schwierige Teil besteht darin, intelligente Probleme zu finden und zu verstehen, wie Sie einige Dinge schneller als Ihre Konkurrenten lösen können, indem Sie Bioinformatik mit anderen Ansätzen kombinieren.

Übrigens: Mir gefällt Ihre Idee, sich der Bioinformatik von der Hardwareseite aus zu nähern (siehe auch Evolvable Hardware ).

Ja, ich habe über evolvierbare Hardware gelesen, es klingt so fantastisch. Leider habe ich das Gefühl, es wird nicht mehr viel erforscht, warum auch immer. (Vielleicht ein Grund mehr, sich darauf einzulassen.) Und danke für Ihren Rat, ich werde nach diesem Buch suchen.

Abgesehen von dem, was in anderen Antworten vorgeschlagen wurde, sollten Sie auch versuchen, den neuesten Stand der Bioinformatik kennenzulernen , dh sich darüber informieren, was in den letzten Jahren getan wurde, ein offenes Auge für neue Veröffentlichungen im haben Bereich und lassen Sie sich von dem inspirieren, woran andere Leute arbeiten/gearbeitet haben.

Dieser Beitrag von Stephen Turner fasst eine Reihe von Bioinformatik-bezogenen Zeitschriften/RSS-Feeds, Blogs, Mailinglisten, E-Mail-Benachrichtigungen/Abonnements und Twitter-Konten zusammen, die Sie zuweisen oder regelmäßig überprüfen sollten, um auf dem Laufenden zu bleiben.

Ich bin selbst Informatiker und habe noch nie Biologie in meiner High School studiert. ( Vielleicht würden die Leute hier anfangen, mich zu schlagen, aber ich gestehe, ich habe Biologie bis ins kleinste Detail gehasst - vielleicht Bytes oder Megabytes )

Im Herbst 2013/14 waren es dieselben Pavel Pavenzer und Philip Compeau von Rosalind, die mich in die Bioinformatik eingeführt haben ( ich habe mich rein zufällig in diesen Kurs eingeschrieben ) und Bioinformatik klang ziemlich cool. Erstens, weil das Programmieren ziemlich cool war, da ich nur String-Algorithmen anwenden musste, und später war ich vom schönen Design des Genoms des allmächtigen Allah fasziniert.

Nun, hier ist eine Zusammenfassung meiner Erfahrungen, die ich mit Ihnen teilen möchte:

  • Kaufen Sie ein gutes Buch über Genomik ( PS. Verma und VK Agarwal sind ziemlich gut - ich fand es gut genug )
  • Beherrschen Sie die grundlegenden Bioinformatik-Algorithmen (die Sie auf Rosalind finden)
  • Überprüfen Sie Websites wie TCGA, ICGC auf Genexpressionsdaten. Es ist in numerischer Form und Sie werden es genießen, statistische Algorithmen wie PCA, Regression usw. darauf anzuwenden
  • Wenn Sie an der Klassifizierung von Sequenzdaten interessiert sind, würde ich Ihnen empfehlen, String Kernels von CS Leslie et al. ( Ich kann Ihnen die Implementierung mit SVM auf C++ zur Verfügung stellen, wenn Sie möchten )
  • In den meisten Bioinformatik-Kursen lernen Sie Sequence-Alignment-Algorithmen oder HMMs. Sie werden Ihre Zeit verschwenden. Nimm sie nicht zu ernst. Sie finden den Grund für die Ablehnung von HMMs im String Kernel-Papier (HMMs verwenden einen heuristischen Ansatz und sind im Vergleich zu SVMs sehr langsam und ineffizient).
  • Es gibt noch viel zu tun an epigenetischen Daten. Mit wenig Aufwand können Sie zur Gemeinschaft beitragen, indem Sie Ihre Forschungsergebnisse veröffentlichen. Ich würde Ihnen empfehlen, auch diesen Aspekt zu überprüfen. Aber noch einmal, nehmen Sie eine Sache nach der anderen und Sie werden mit Nature Scitable beginnen ( verwenden Sie diese Website nur in den ersten paar Wochen – behalten Sie einen klaren Kopf und nehmen Sie sich eine Aufgabe nach der anderen vor. Ich habe meine Zeit verschwendet, indem ich gierig war zu viel gelernt, bis ich zu Nature Scitable kam und Mann! Genau das, wonach ich gesucht habe. )
Während die Bioinformatik derzeit ein bisschen stark auf ziemlich standardisierte Probleme mit Sequenzen ausgerichtet ist, könnten Sie auch Themen wie Computer Vision (und bis zu einem gewissen Grad Kontrolltheorie) in Betracht ziehen, die derzeit in vielen führenden Veröffentlichungen zur Computerbiologie zu sehen sind.