Gene Design

Which codon

L'utilisation des codons - AGA ou CGT - C'est toute la question!

Le code génétique est dégénéré, ainsi, 18 des 20 acides aminés constituant la séquence primaire des protéines sont représentés par plus d'un codon. Cependant, les divers codons possibles sont utilisés à des fréquences inégales chez différentes espèces, démontrant une nette préférence pour certains codons. Il est rapidement devenu clair que l'utilisation spécifique de certains codons en fonction des espèces était corrélée au taux de production de l'ARNm et donc à celui de la protéine. Il est suggéré que les codons les plus fréquemment utilisés sont ceux pour lesquels le pool d'ARNt est le plus abondant. Ainsi, leur utilisation permet d'éviter l'épuisement des stocks d'ARNt, d'accélérer la traduction et d'augmenter souvent considérablement l'expression de protéines hétérologues.

Le contenu en GC

L'expression d'un gène résulte de l'équilibre complexe entre l'activité transcriptionelle, la disponibilité des ARNt et la stabilité de l'ARNm. Ce dernier facteur, entre autres, peut être influencé par la composition de l'ARNm en nucléotides et, plus particulièrement, par le contenu en GC. Konu et ses collaborateurs (J Mol Evol, 2002) ont montré que le niveau d'expression de l'ARNm est corrélé à la présence des bases C ou G en troisième position des codons chez la souris et le rat. CG or atL'influence du contenu global en GC sur les taux d'expression des gènes a aussi été observée chez les insectes (Shields et al.,1988), la levure (Woo et al., 2002; Outchkourov et al., 2002; Gurkan et al., 2003) et plusieurs mammifères (Graf et al., 2000; Graf et al., 2006).

Les structures de l'ARNm

Reduce secondary structureIl est communément admis que des structures secondaires complexes et stables de l'ARNm peuvent bloquer l'initiation de la traduction ou son déroulement (e.g. Wilkstrom et al., 1992; Gross et al., 1990; Chang et al., 1995; ...). Bien qu'il soit très difficile de prédire les structures secondaires au sein d'un ARNm, il est relativement simple d'empêcher leur formation en évitant les séquences inversées répétées.

Motifs spécifiques de l'hôte

Quel que soit l'hôte choisi pour l'expression de la protéine, dans la plupart des cas, les séquences sauvages d'origine ne sont pas adaptées pour obtenir un niveau d'expression maximale. Ceci est particulièrement vrai dans la cas de systèmes d'expression hétérologues. Nous vous conseillons de supprimer les séquences de Shine-Dalgarno, les sites d'épissage, les signaux de poly-adénylation ou tout autre motif agissant en cis dans le cadre ouvert de lecture d'origine.Par exemple, la séquence de Shine-Dalgarno (5'-AGGAGGU-3') contribue au recrutement des ribosomes sur l'ARNm afin d'initier la traduction. Ainsi, si un gène de mammifère est transféré chez E. coli dans le cadre d'une expression hétérologue de protéine, la présence de séquences de Shine Dalgarno peut diminuer le niveau d'expression de la protéine.