Proteindesign

Energiepotentiale verschiedener Konfigurationen
Energiepotentiale verschiedener Stoffgruppen

Das Proteindesign, synonym Proteinoptimierung oder rationales Proteindesign, bezeichnet die gezielte Anpassung der Eigenschaften von Proteinen durch ortsspezifische Mutagenese der DNA. Sie ist neben der zufällig entstehenden gerichteten Evolution eine der beiden Strategien des Protein-Engineering.

Prinzip

Ziele des Proteindesigns sind Veränderungen von

Verfahren und Effekte

Die gezielte Veränderung rekombinanter Proteine kann zu Funktionsverlusten oder -gewinnen führen. Neben den gezielten Veränderungen an Protein werden zur Steigerung der Genexpression im Zuge eines Vektordesigns meistens auch DNA-Abschnitte außerhalb der proteincodierenden Sequenz verändert. Durch die Wahl eines für die jeweilige Art geeigneten Promotors, Enhancers und Terminators kann die Genexpression gesteigert werden. Weiterhin kann durch eine Shine-Dalgarno-Sequenz (bei Bakterien) oder eine Kozak-Sequenz (bei Eukaryoten) die Erkennung der mRNA am Ribosom verbessert und durch ein Polyadenylierungssignal am 3’-Ende und durch die Vermeidung von AUUUA-Sequenzen kann der vorzeitige Abbau der mRNA gemindert werden.

Punktmutationen

Durch eine Codon-Optimierung kann die Expressionsrate gesteigert werden, indem nur diejenigen 20 Aminosäurecodons verwendet werden, die in der jeweiligen Art am stärksten exprimiert werden (siehe Codon Usage).[1] Eine gehäufte Verwendung suboptimaler Codons ist dagegen eine Methode zur Attenuierung von viralen Lebendimpfstoffen.[2] Neben den Codons können auch andere RNA-Sequenzen sich auf die Menge an gebildetem Protein auswirken und werden bei einer Codon-Optimierung mit einbezogen.[3] Posttranslational modifizierbare Aminosäuren, wie sie in Glycosylierungs-, Phosphorylierungs-, Methylierungs-, Acetylierungs-, Sulfatierungs-, Myristylierungs-, Palmitoylierungs-, Farnesylierungs-, GPI-Anker- und Geranylgeranylierungsstellen vorkommen, können durch gezielte Punktmutationen in der DNA in das Protein eingeführt oder entfernt werden.

Durch die Veränderung eines katalytischen Zentrums, einer Substratbindungsstelle oder einer für eine Aktivierung notwendigen Bindungsstelle für andere Moleküle (z. B. bei Kofaktoren, temporären Protein-Protein-Interaktionen oder bei Proteinkomplexen) können kompetitive Inhibitoren erzeugt werden.

Die Biologische Halbwertszeit eines Proteins kann verlängert werden, in dem Peptidaseschnittstellen, PEST-Sequenzen und bestimmte N-terminale Aminosäuren aus der N-End Rule geändert werden.

Punktmutationen können auch über die Veränderung der Primärstruktur die Sekundär-, Tertiär- und Quartärstruktur beeinflussen, wie unter anderem über Disulfidbrücken-ausbildende Cysteine. α-Helices können durch rotationsflexible (Glycin), helixbildende (z. B. Alanin) und helixbrechende Aminosäuren (Prolin) modifiziert werden. Unübliche Aminosäuren können über die Verwendung eines erweiterten genetischen Codes eingeführt werden.[4]

Insertionen und Deletionen

Neue Proteindomänen und damit einhergehende Funktionen können durch leserasterkonforme Insertionen von DNA-Sequenzen (aus Multiplen von drei Nukleotiden) in ein Gen hinzugefügt werden, die entstehenden hybriden Proteine bezeichnet man als Fusionsproteine.

Gelegentlich werden zur Aufreinigung und zum Nachweis kurze leserasterkonforme DNA-Sequenzen hinter das Startcodon oder vor das Stopcodon des Gens eingefügt, welche als Protein-Tags bezeichnet werden.

Weitere übliche Insertionen sind flexible Verbindungen (engl. linker, zwischen zwei Proteindomänen eines Fusionsproteins), daneben auch Inteine oder Protease-Erkennungssequenzen, die eine Abspaltung eines Teils des Proteins in vitro oder in vivo ermöglichen.

Transiente Insertionen können durch das Einfügen von Inteinen oder durch Verwendung des Cre-lox-Systems erzeugt werden.

Durch leserasterkonforme Deletionen von Multiplen von drei Nukleotiden können Eigenschaften entfernt werden. Dabei können gelegentlich auch andere Eigenschaften des Proteins in den Vordergrund treten, wie z. B. bei der Entfernung regulatorischer Domänen. Die Lokalisation in einem Zellkompartiment kann durch Hinzufügen oder Entfernen von Signalsequenzen verändert werden. Durch das Hinzufügen oder Entfernen einer Transmembrandomäne können lösliche Proteine und Membranproteine ineinander überführt werden. Bei einer Insertion von codierenden Sequenzen für zellpenetrierende Peptide kann der Zelleintritt eines Proteins erhöht werden.

Multimerisierung

Durch Veränderung von viralen Kapsidproteinen oder durch multimerisierende Proteine können größere Proteinpartikel erzeugt werden.[5]

Stabilisierung

Verschiedene kleine Proteine (meist unter 200 Aminosäuren) werden als Gerüst zur Stabilisierung verwendet, z. B. Affibodies, Affimere, ankyrin repeat proteins (DARPins), Repebodies, Anticaline, Fibronectine und Kunitz-Proteindomänen.[6][7] Cyclopeptide sind geschlossen ringförmige Peptide, die durch die Zyklisierung keine Enden aufweisen und eine größere biologische Halbwertszeit aufweisen. Durch Vernetzung können Proteine stabilisiert werden, z. B. bei einer Immobilisierung. Per Peptidsynthese erzeugte β-Peptide besitzen ein verlängertes Peptid-Rückgrat.

Kopplung

Durch Vernetzungsmittel können z. B. zwei Proteine in vitro aneinander gekoppelt werden.

Markierung

Im Zuge einer Markierung können verschiedene Signalmoleküle an ein Protein gehängt werden.

Beispiele

Im beginnenden 21. Jahrhundert beschleunigte sich die Entwicklung des Proteindesigns durch den Einsatz der molekularen Modellierung am Computer. Beispiele für diese Entwicklung umfassen stereoselektive Katalysen,[8] die Detektion von Ionen,[9] und antivirale Eigenschaften.[10]

Durch computergestützte Methoden wurde im Jahr 2003 eine neue, künstliche Proteinfaltung erzeugt (Top7),[11] ebenso entstanden so auch Sensoren für unnatürliche Moleküle.[12] Auch die Spezifität für Kofaktoren der Xylose-Reductase von Candida boidinii wurde von NADPH zu NADH geändert.[13]

Dabei sind jedoch vermutlich nicht alle Proteinstrukturen per Proteindesign erhältlich, da manche Konfigurationen und Konformationen sich aus sterischen Gründen nicht ausbilden können. Ebenso existieren Software-basierte Grenzen der Veränderungsmöglichkeiten.

Software

  • IPRO verändert die Proteine zur Erhöhung der Affinität zu einem Substrat oder Kofaktor.[13] Dies wird durch mehrere zufällige Veränderungen des Proteinrückgrates im Bereich spezifischer Positionen zur Identifikation der niedrigsten Energiekombinationen der Rotamere und zur Bestimmung der Konfiguration mit der niedrigsten Energie bei einer gezielten Veränderung. Der iterative Herangehensweise erlaubt IPRO die additive Berechnung mehrerer Mutationen zur Optimierung der Substratspezifität oder Kofaktorbindung.
  • EGAD: A Genetic Algorithm for protein Design.[14] Ein kostenloses Softwarepaket zum Proteindesign und zur Voraussage der Effekte von Mutationen bezüglich der Proteinfaltung und der Affinität. EGAD bezieht auch parallel mehrere Strukturen beim Entwurf von Bindestellen oder fixierten Konformationen. Daneben können auch bewegliche Liganden mit oder ohne rotierenden Bindungen berechnet werden. EGAD kann auch mit mehreren Prozessoren verwendet werden.
  • RosettaDesign. Ein Softwarepaket, das kostenlos für den akademischen Gebrauch ist.[15][16][17] RosettaDesign ist über einen Webserver erhältlich.[18]
  • Sharpen ist eine Open-Source Bibliothek zum Proteindesign und zur Strukturvorhersage.[19] SHARPEN bietet unterschiedliche kombinatorische Optimierungsmethoden (z. B. Monte Carlo, Simulated Annealing, FASTER[20]) und bewertet die Proteine anhand des ‘’Rosetta all-atom force field" oder des ‘’molecular mechanics force fields’’ (OPLSaa). Daneben beinhaltet SHARPEN auch die Möglichkeit zur Berechnung mit mehreren Prozessoren.
  • WHAT IF software. Eine Software zur Modellierung, zum Proteindesign, zur Validierung und zur Visualisierung von Proteinen.
  • CheShift ist eine Software zur Validierung von Proteinstrukturen.
  • Abalone ist eine Software zur Modellierung und Visualisierung.[21]
  • ProtDes ist eine Software zum Proteindesign, basierend auf dem ‘’CHARMM molecular mechanics package‘‘.[22]

Literatur

  • K. P. Murphy: Methods In Molecular Biology, Vol. 168: Protein Structure, Stability, And Folding. Humana, New Jersey 2001, ISBN 978-0-89603-682-6.
  • Hubert Rehm, Thomas Letzel: Der Experimentator: Proteinbiochemie / Proteomics. 6. Auflage. Spektrum Akademischer Verlag, Heidelberg 2009, ISBN 978-3-8274-2312-2.
  • E. Buxbaum: Fundamentals of Protein Structure and Function. Springer, New York 2007, ISBN 978-0-387-26352-6.
  • T. Vo-Dinh: Methods in Molecular Biology, Vol. 300: Protein Nanotechnology, Protocols, Instrumentation, and Applications. Humana, New Jersey 2004, ISBN 978-1-58829-310-7.
  • P. Kaumaya: Protein Engineering. Intech, 2012, ISBN 978-953-510-037-9 (englisch); intechopen.com
  • K. Arndt, K. Muller: Methods in Molecular Biology. Vol. 352: Protein Engineering Protocols, Humana, New Jersey 2007. ISBN 978-1-58829-072-4.
  • Kevin M. Ulmer: Protein engineering. In: Science, 1983, Band 219(4585), S. 666–671. PMID 6572017.
  • Friedrich Lottspeich, Haralabos Zorbas: Bioanalytik. Spektrum Akademischer Verlag, Heidelberg 1998, ISBN 978-3-8274-0041-3.
  • R. Guerois, M. de la Paz: Methods in Molecular Biology. Vol. 340: Protein Design. Humana, New Jersey 2006, ISBN 1-59745-116-9.

Einzelnachweise

  1. E. Kotsopoulou, V. N. Kim, A. J. Kingsman, S. M. Kingsman, K. A. Mitrophanous: A Rev-independent human immunodeficiency virus type 1 (HIV-1)-based vector that exploits a codon-optimized HIV-1 gag-pol gene. In: J Virol., 2000, Band 74(10), S. 4839–4852. PMID 10775623; PMC 112007 (freier Volltext).
  2. S. Mueller, J. R. Coleman, E. Wimmer: Putting synthesis into biology: a viral view of genetic engineering through de novo gene and genome synthesis. In: Chemistry & biology. Band 16, Nummer 3, März 2009, S. 337–347, doi:10.1016/j.chembiol.2009.03.002, PMID 19318214, PMC 2728443 (freier Volltext).
  3. S. Fath, A. P. Bauer, M. Liss, A. Spriestersbach, B. Maertens, P. Hahn, C. Ludwig, F. Schäfer, M. Graf, R. Wagner: Multiparameter RNA and codon optimization: a standardized tool to assess and enhance autologous mammalian gene expression. In: PLOS ONE. Band 6, Nummer 3, März 2011, S. e17596, doi:10.1371/journal.pone.0017596, PMID 21408612, PMC 3048298 (freier Volltext).
  4. R. Martin: Methods in Molecular Biology, Vol. 77: Protein Synthesis, Humana, New Jersey 1998. ISBN 978-0-89603-397-9.
  5. Yen-Ting Lai, Eamonn Reading, Greg L. Hura, Kuang-Lei Tsai, Arthur Laganowsky, Francisco J. Asturias, John A. Tainer, Carol V. Robinson, Todd O. Yeates: Structure of a designed protein cage that self-assembles into a highly porous cube. In: Nature Chemistry. 2014, S. , doi:10.1038/nchem.2107.
  6. A. Skerra: Alternative non-antibody scaffolds for molecular recognition. In: Current Opinion in Biotechnology. Band 18, Nummer 4, August 2007, S. 295–304, doi:10.1016/j.copbio.2007.04.010. PMID 17643280.
  7. M. Gebauer, A. Skerra: Engineered protein scaffolds as next-generation antibody therapeutics. In: Current opinion in chemical biology. Band 13, Nummer 3, Juni 2009, S. 245–255, doi:10.1016/j.cbpa.2009.04.627. PMID 19501012.
  8. Alan Saghatelian, Yohei Yokobayashi, Kathy Soltani, M. Reza Ghadiri: A chiroselective peptide replicator. In: Nature. 409, S. 797–801, doi:10.1038/35057238.
  9. T. Nagai: Circularly permuted green fluorescent proteins engineered to sense Ca2+. In: Proceedings of the National Academy of Sciences. 98, S. 3197–3202, doi:10.1073/pnas.051636098.
  10. M. J. Root: Protein Design of an HIV-1 Entry Inhibitor. In: Science, 291, S. 884–888, doi:10.1126/science.1057453.
  11. B. Kuhlman: Design of a Novel Globular Protein Fold with Atomic-Level Accuracy. In: Science, 302, 2003, S. 1364–1368, doi:10.1126/science.1089427.
  12. Loren L. Looger, Mary A. Dwyer, James J. Smith, Homme W. Hellinga: Computational design of receptor and sensor proteins with novel functions. In: Nature. 423, 2003, S. 185–190, doi:10.1038/nature01556.
  13. a b George A. Khoury, Hossein Fazelinia, Jonathan W. Chin, Robert J. Pantazes, Patrick C. Cirino, Costas D. Maranas: Computational design of xylose reductase for altered cofactor specificity. In: Protein Science, 18, 2009, S. 2125–2138, doi:10.1002/pro.227.
  14. User’s Manual for EGAD! a Genetic Algorithm for protein Design!. Archiviert vom Original am 2. Mai 2009. Abgerufen am 17. Oktober 2013.
  15. Y. Liu, B. Kuhlman: RosettaDesign server for protein design. In: Nucleic Acids Research, 34, 2006, S. W235–W238, doi:10.1093/nar/gkl163.
  16. Gautam Dantas, Brian Kuhlman, David Callender, Michelle Wong, David Baker: A Large Scale Test of Computational Protein Design: Folding and Stability of Nine Completely Redesigned Globular Proteins. In: Journal of Molecular Biology. 332, 2003, S. 449–460, doi:10.1016/S0022-2836(03)00888-X.
  17. Gautam Dantas, Colin Corrent, Steve L. Reichow, James J. Havranek, Ziad M. Eletr, Nancy G. Isern, Brian Kuhlman, Gabriele Varani, Ethan A. Merritt, David Baker: High-resolution Structural and Thermodynamic Analysis of Extreme Stabilization of Human Procarboxypeptidase by Computational Protein Design. In: Journal of Molecular Biology, 366, 2007, S. 1209–1221, doi:10.1016/j.jmb.2006.11.080.
  18. Rosetta Design. Abgerufen am 20. August 2012.
  19. SHARPEN. Abgerufen am 20. August 2012.
  20. Johan Desmet, Jan Spriet, Ignace Lasters: Fast and accurate side-chain topology and energy refinement (FASTER) as a new method for protein structure optimization. In: Proteins: Structure, Function, and Genetics. 48, 2002, S. 31–43, doi:10.1002/prot.10131.
  21. Abalone. Abgerufen am 20. August 2012.
  22. PROTDES. Abgerufen am 20. August 2012.

Auf dieser Seite verwendete Medien

Knowledge based potential.png
Autor/Urheber: Edboas, Lizenz: CC BY-SA 3.0
Knowledge-based potential energy function.
MM PEF.png
Autor/Urheber: Edboas, Lizenz: CC BY-SA 3.0
Physics on a molecular scale. The atoms in a molecule can be modeled as charged spheres connected by springs that maintain bond lengths and angles. The charged atoms interact with each other (via Coulomb's law) and with solvent. The model shown is called a molecular mechanics potential energy function, and it is used by programs like Folding@Home to simulate how molecules move and behave. The molecule shown is an alanine dipeptide.