Gene Design

Which codon

Código genético – AGA o CGT – ¡Ésa es la cuestión!

En el código genético, 18 de los 20 aminoácidos que constituyen la secuencia primaria de una proteína son codificados por varios codones. Sin embargo, los diferentes codones son utilizados con una frecuencia desigual en diferentes especies, mostrando una clara tendencia para ciertos codones. Además, los subconjuntos de codones utilizados se relacionan con el nivel de expresión del ARNm y por lo tanto con la producción proteíca. Es generalmente aceptado que los codones utilizados con mayor frecuencia corresponden a las reservas más abundantes de ARNt. Por lo tanto, utilizarlos previene la escasez de ARNt, acelera la traducción e incrementa de manera dramática la expresión heteróloga.

Contenido de GCs

La expresión genética está regulada por la compleja interacción de actividad transcripcional, la disponibilidad de ARNt y la estabilidad del ARNm. El tercer factor, entre otros, puede ser influenciado por la composición nucleotídica, específicamente, el contenido de GCs. Konu et al. (J Mol Evol, 2002) descubrió que los niveles de expresión de cada RNAm se relacionan con la presencia de G o C en la tercera posición en codones de ratones y ratas. CG or atLa influencia general del contenido de GCs en tasas de expresión han sido observadas también en insectos (Shieldset et al., 1988), levaduras (Woo et al., 2002; Outchkourov et al. 2002; Gurkan et al., 2003), plantas (Perlak et al. 1991; Strizhov et al. 1996) así como en varios genes en mamíferos (Graf et al 2000, Graf et al 2006).

Estruturas del ARNm

Reduce secondary structureEs comunmente aceptado que la formación de complejos y estructuras secundarias estables en el ARNm pueden bloquear el inicio de la traducción asi como el proceso traduccional en general (p.e. Wilkstrom et al 1992, Gross et al 1990; Chang et al 1995; ...). A pesar de que resulta complicado predecir estructuras secundarias en moléculas de ARN, es relativamente sencillo evitarlas al no utilizar regiones repetidas invertidas.

Motivos específicos del Hospedero

Independientemente del hospedero de expresión que usted utilice, las secuencias silvestres no están diseñadas en la mayoría de los casos para un nivel máximo de expresión. Esto es especialmente cierto para sistemas heterólogos de expresión. Elimine secuencias de tipo Shine-Dalgarno, sitios de corte y empalme, señales de poliadenilación, u otros motivos en cis dentro del marco de lectura abierto de la secuencia silvestre. Inicie un proyecto, defina el patrón de secuencia que usted quiere eliminar y minimice la incidencia de dicho patrón.La secuencia Shine-Dalgarno por ejemplo (5'-AGGAGGU-3') ayuda a reclutar el ribosoma al ARNm para iniciar la síntesis de la proteína. Si por ejemplo, un gen de mamífero es transferido a E. coli para expresión heteróloga de la proteína, secuencias Shine-Dalgarno dentro del marco de lectura abierto silvestre pueden influír de manera negativa los niveles de expresión de la proteína de interés.