Codonverwendung

Codonverwendung (englisch Codon Usage), auch Codon Bias, beschreibt das Phänomen, dass Varianten des universellen genetischen Codes von verschiedenen Spezies unterschiedlich häufig verwendet werden. Bestimmte Codons des degenerierten Codes werden bevorzugt benutzt, was letztlich der tRNA-Konzentration innerhalb der Zelle entspricht. Die Codonverwendung spielt eine große Rolle bei der Regulation der Proteinbiosynthese. Selten verwendete Codons können die Translation bremsen, während häufig genutzte Codons die Translation beschleunigen können.

Anwendung – Codon-Optimierung

Die heterologe Genexpression wird in vielen biotechnologischen Anwendungen eingesetzt, einschließlich der Proteinproduktion, des Metabolic Engineering und bei mRNA-Impfstoffen. Da die tRNA-Pools zwischen verschiedenen Organismen variieren, kann die Transkriptions- und Translationsrate einer bestimmten kodierenden Sequenz weniger effizient sein, wenn sie in einem nicht-nativen Kontext platziert wird. So achtet man zum Beispiel bei der (aus Kostengründen häufig bevorzugten) gentechnischen Produktion menschlicher Proteine in Bakterien auf die Tatsache, dass das Bakterium, beispielsweise E. coli, über eine andere Codonverwendung verfügt als der Mensch. Damit die Bakterien das artfremde menschliche Gen ebenfalls schnell und effizient für die Translation ablesen können wie ihre eigenen Gene, wird es gentechnisch verändert. Das Resultat ist eine angepasste Gensequenz, die dem Codonverwendungs-Repertoire des Bakterienstamms weitgehend entspricht, aber noch für dasselbe Protein codiert.

Eine weitere Möglichkeit ist die Codon-Optimierung, wodurch bei der Herstellung eines rekombinanten Proteins die Expressionsrate gesteigert werden kann. Dabei werden bevorzugt diejenigen 20 Aminosäurecodons verwendet werden, deren tRNA im exprimierenden Organismus in größerer Menge vorhanden ist^[1]^[2] oder die mRNA resistenter gegen Abbau macht.^[3] Außerdem kann die aus der Codonverwendung resultierende Faltung der mRNA eine Rolle spielen: Da die Sekundärstruktur des 5'-Endes der mRNA die Translationseffizienz beeinflusst, können synonyme Veränderungen in diesem Bereich der mRNA zu tiefgreifenden Auswirkungen auf die Genexpression führen. Die Codonverwendung in nicht-kodierenden DNA-Regionen kann daher eine wichtige Rolle für die RNA-Sekundärstruktur und die nachgeschaltete Proteinexpression spielen. Insbesondere kann eine ungünstige Sekundärstruktur an der Ribosomen-Bindungsstelle oder am Initiationscodon die Translation hemmen, und die mRNA-Faltung am 5'-Ende kann die Proteinexpression in hohem Maße beeinflussen.^[4] Weiterhin kann die Faltung des gebildeten Proteins bereits während der Translation am Ribosom von der Translationsgeschwindigkeit abhängen, weshalb die Codonverwendung auch einen Einfluss auf die Konformation des kodierten Proteins haben kann.^[5]

Codon Usage Tabelle

In folgender Tabelle ist die Häufigkeit der Nutzung eines bestimmten Codons pro 1000 Codons einer DNA-Sequenz gezeigt. Verglichen wurde der codon bias des E. coli Sicherheitstamms K12 mit dem der Bäckerhefe und dem des Menschen.^[6]

Aminosäure	Codon	E. coli K12	S. cerevisiae	H. sapiens	Aminosäure	Codon	E. coli K12	S. cerevisiae	H. sapiens
Valin (V)	GUU	16,8	22,1	11,0	Alanin (A)	GCU	10,7	21,2	18,4
	GUC	11,7	11,8	14,5		GCC	31,6	12,6	27,7
	GUA	11,5	11,8	7,1		GCA	21,1	16,2	15,8
	GUG	26,4	10,8	28,1		GCG	38,5	6,2	7,4
Leucin (L)	CUU	11,9	12,3	13,2	Prolin (P)	CCU	8,4	13,5	17,5
	CUC	10,5	5,4	19,6		CCC	6,4	6,8	19,8
	CUA	5,3	13,4	7,2		CCA	6,6	18,3	16,9
	CUG	46,9	10,5	39,6		CCG	26,7	5,3	6,9
Leucin (L)	UUA	15,2	26,2	7,7	Serin (S)	UCU	5,7	23,5	15,2
Leucin (L)	UUG	11,9	27,2	12,9		UCC	5,5	14,2	17,7
Phenylalanin (F)	UUU	19,7	26,1	17,6		UCA	7,8	18,7	12,2
Phenylalanin (F)	UUC	15,0	18,4	20,3		UCG	8,0	8,6	4,4
Isoleucin (I)	AUU	30,5	30,1	16,0	Threonin (T)	ACU	8,0	20,3	13,1
	AUC	18,2	17,2	20,8		ACC	22,8	12,7	18,9
	AUA	3,7	17,8	7,5		ACA	6,4	17,8	15,1
Methionin (M)	AUG	24,8	20,9	22,0		ACG	11,5	8,0	6,1
Aminosäure	Codon	E. coli K12	S. cerevisiae	H. sapiens	Aminosäure	Codon	E. coli K12	S. cerevisiae	H. sapiens
Asparaginsäure (D)	GAU	37,9	37,6	21,8	Glycin (G)	GGU	21,3	23,9	10,8
Asparaginsäure (D)	GAC	20,5	20,2	25,1		GGC	33,4	9,8	22,2
Glutaminsäure (E)	GAA	43,7	45,6	29,0		GGA	9,2	10,9	16,5
Glutaminsäure (E)	GAG	18,4	19,2	39,6		GGG	8,6	6,0	16,5
Tyrosin (Y)	UAU	16,8	18,8	12,2	Cystein (C)	UGU	5,9	8,1	10,6
Tyrosin (Y)	UAC	14,6	14,8	15,3	Cystein (C)	UGC	8,0	4,8	12,6
Stopp	UAA	1,8	1,1	1,0	Stopp	UGA	1,0	0,7	1,6
Stopp	UAG	0,1	0,5	0,8	Tryptophan (W)	UGG	10,7	10,4	13,2
Asparagin (N)	AAU	21,9	35,7	17,0	Serin (S)	AGU	7,2	14,2	12,1
Asparagin (N)	AAC	24,4	24,8	19,1	Serin (S)	AGC	16,6	9,8	19,5
Lysin (K)	AAA	33,2	41,9	24,4	Arginin (R)	AGA	1,4	21,3	12,2
Lysin (K)	AAG	12,1	30,8	31,9	Arginin (R)	AGG	1,6	9,2	12,0
Histidin (H)	CAU	15,8	13,6	10,9	Arginin (R)	CGU	21,1	6,4	4,5
Histidin (H)	CAC	13,1	7,8	15,1		CGC	26,0	2,6	10,4
Glutamin (Q)	CAA	12,1	27,3	12,3		CGA	4,3	3,0	6,2
Glutamin (Q)	CAG	27,7	12,1	34,2		CGG	4,1	1,7	11,4

Codon Adaption Index (CAI)

Der Codon Adaption Index (CAI, „Codon-Adaptions-Index“) beschreibt, wie gut die Codons eines heterolog exprimierten Gens der Codonverwendung des Wirtsorganismus entsprechen. Ein CAI von 1,0 wäre optimal, ein CAI > 0,9 ist sehr gut, d. h., er erlaubt einen hohen Expressionslevel.

Weblinks

Einzelnachweise

↑ Ekaterini Kotsopoulou, V. Narry Kim, Alan J. Kingsman, Susan M. Kingsman, Kyriacos A. Mitrophanous: A Rev-Independent Human Immunodeficiency Virus Type 1 (HIV-1)-Based Vector That Exploits a Codon-Optimized HIV-1gag-pol Gene. In: Journal of Virology. Band 74, Nr. 10, 15. Mai 2000, S. 4839–4852, doi:10.1128/JVI.74.10.4839-4852.2000, PMID 10775623.
↑ C. Gustafsson, S. Govindarajan, J. Minshull: Codon bias and heterologous protein expression. In: Trends in Biotechnology. Band 22, Nummer 7, Juli 2004, S. 346–353, doi:10.1016/j.tibtech.2004.04.006, PMID 15245907.
↑ V. Presnyak, N. Alhusaini, Y. H. Chen, S. Martin, N. Morris, N. Kline, S. Olson, D. Weinberg, K. E. Baker, B. R. Graveley, J. Coller: Codon optimality is a major determinant of mRNA stability. In: Cell. Band 160, Nummer 6, März 2015, S. 1111–1124, doi:10.1016/j.cell.2015.02.029, PMID 25768907, PMC 4359748 (freier Volltext).
↑ Eva Maria Novoa, Lluís Ribas de Pouplana: Speeding with control: codon usage, tRNAs, and ribosomes. In: Trends in Genetics. Band 28, Nr. 11, November 2012, ISSN 0168-9525, S. 574–581, doi:10.1016/j.tig.2012.07.006.
↑ GENETIC CODE REDUNDANCY AND ITS INFLUENCE ON THE ENCODED POLYPEPTIDES. In: Computational and Structural Biotechnology Journal. Band 1, Nr. 1, 1. April 2012, ISSN 2001-0370, S. e201204006, doi:10.5936/csbj.201204006, PMID 24688635, PMC 3962081 (freier Volltext).
↑ Daten aus der Codon Usage Database, die ihrerseits die NCBI-GenBank-Daten nutzt.

[1] Ekaterini Kotsopoulou, V. Narry Kim, Alan J. Kingsman, Susan M. Kingsman, Kyriacos A. Mitrophanous: A Rev-Independent Human Immunodeficiency Virus Type 1 (HIV-1)-Based Vector That Exploits a Codon-Optimized HIV-1gag-pol Gene. In: Journal of Virology. Band 74, Nr. 10, 15. Mai 2000, S. 4839–4852, doi:10.1128/JVI.74.10.4839-4852.2000, PMID 10775623.

[PMID15245907-2] C. Gustafsson, S. Govindarajan, J. Minshull: Codon bias and heterologous protein expression. In: Trends in Biotechnology. Band 22, Nummer 7, Juli 2004, S. 346–353, doi:10.1016/j.tibtech.2004.04.006, PMID 15245907.

[PMID25768907-3] V. Presnyak, N. Alhusaini, Y. H. Chen, S. Martin, N. Morris, N. Kline, S. Olson, D. Weinberg, K. E. Baker, B. R. Graveley, J. Coller: Codon optimality is a major determinant of mRNA stability. In: Cell. Band 160, Nummer 6, März 2015, S. 1111–1124, doi:10.1016/j.cell.2015.02.029, PMID 25768907, PMC 4359748 (freier Volltext).

[4] Eva Maria Novoa, Lluís Ribas de Pouplana: Speeding with control: codon usage, tRNAs, and ribosomes. In: Trends in Genetics. Band 28, Nr. 11, November 2012, ISSN 0168-9525, S. 574–581, doi:10.1016/j.tig.2012.07.006.

[5] GENETIC CODE REDUNDANCY AND ITS INFLUENCE ON THE ENCODED POLYPEPTIDES. In: Computational and Structural Biotechnology Journal. Band 1, Nr. 1, 1. April 2012, ISSN 2001-0370, S. e201204006, doi:10.5936/csbj.201204006, PMID 24688635, PMC 3962081 (freier Volltext).

[6] Daten aus der Codon Usage Database, die ihrerseits die NCBI-GenBank-Daten nutzt.

[1]

[2]

[3]

[4]

[5]

[6]

Navigation