Producción de proteínas

Central dogma depicting transcription from DNA code to RNA code to the proteins in the second step covering the production of protein. que describe la transcripción del código de ADN al código de ARN para las proteínas en el segundo paso que cubre la producción de proteínas.]] La producción de proteínas es el proceso biotecnológico de generar una proteína específica. Suele lograrse mediante la manipulación de la expresión génica en un organismo de forma que exprese grandes cantidades de un gen recombinante. Esto incluye la transcripción del ADN recombinante a ARN mensajero (ARNm), la traducción del ARNm a cadenas polipeptídicas, que finalmente se pliegan en proteínas funcionales y pueden dirigirse a localizaciones subcelulares o extracelulares específicas[1]

Los sistemas de producción de proteínas (en la jerga del laboratorio también se denominan "sistemas de expresión") se utilizan en las ciencias de la vida, la biotecnología y la medicina. La investigación en biología molecular utiliza numerosas proteínas y enzimas, muchas de las cuales proceden de sistemas de expresión; en particular, la ADN polimerasa para la PCR, la transcriptasa inversa para el análisis del ARN, las endonucleasas de restricción para la clonación y para fabricar proteínas que se examinan en el descubrimiento de fármacos como dianas biológicas o como fármacos potenciales en sí mismos. Los sistemas de expresión también tienen importantes aplicaciones en la fermentación industrial, sobre todo en la producción de productos biofarmacéuticos, como la insulina humana para tratar la diabetes, y en la fabricación de enzimas.

Sistemas de producción de proteínas

Los sistemas de producción de proteínas comúnmente utilizados incluyen los derivados de bacterias,[2]levadura,[3][4]baculovirus / insecto,[5]​ células de mamífero[6][7]​ y más recientemente hongos filamentosos como Myceliophthora thermophila.[8]​ Cuando se producen productos biofarmacéuticos con uno de estos sistemas, las impurezas relacionadas con el proceso denominadas proteínas de la célula huésped también llegan al producto final en cantidades mínimas.[9]

Sistemas basados en células

Los sistemas de expresión más antiguos y más utilizados están basados en células y pueden definirse como la "combinación de un vector de expresión, su ADN clonado y el huésped para el vector que proporcionan un contexto para permitir la función del gen extraño en una célula huésped, es decir, producir proteínas a un alto nivel".[10][11]​ La sobreexpresión es un nivel anormal y excesivamente alto de expresión génica que produce un fenotipo pronunciado relacionado con el gen.[12][13]

Hay muchas formas de introducir ADN extraño en una célula para su expresión, y se pueden usar muchas células hospedadoras diferentes para la expresión; cada sistema de expresión tiene distintas ventajas y desventajas. Los sistemas de expresión normalmente se denominan por el anfitrión y la fuente de ADN o el mecanismo de entrega del material genético. Por ejemplo, los huéspedes comunes son bacterias (como E. coli, B. subtilis ), levaduras (como S. cerevisiae[4]​ ) o líneas celulares eucariotas. Las fuentes de ADN y los mecanismos de administración comunes son virus (como baculovirus, retrovirus, adenovirus ), plásmidos, cromosomas artificiales y bacteriófagos (como lambda ). El mejor sistema de expresión depende del gen implicado, por ejemplo, a menudo se prefiere Saccharomyces cerevisiae para proteínas que requieren una modificación postraduccional significativa. Se usan líneas de células de insectos o mamíferos cuando se requiere un corte y empalme de ARNm similar al humano. Sin embargo, la expresión bacteriana tiene la ventaja de producir fácilmente grandes cantidades de proteína, lo que es necesario para la cristalografía de rayos X o los experimentos de resonancia magnética nuclear para la determinación de la estructura.

Dado que las bacterias son procariotas, no están equipadas con toda la maquinaria enzimática para realizar las modificaciones postraduccionales o el plegamiento molecular necesarios. Por ello, las proteínas eucariotas multidominio expresadas en bacterias no suelen ser funcionales. Además, muchas proteínas se vuelven insolubles en forma de cuerpos de inclusión que son difíciles de recuperar sin desnaturalizantes agresivos y el consiguiente y engorroso repliegue de la proteína.

Para hacer frente a estos problemas, se han desarrollado sistemas de expresión que utilizan múltiples células eucariotas para aplicaciones que requieren que las proteínas estén conformadas como en los organismos eucariotas o más cerca de ellos: las células de plantas (por ejemplo, el tabaco), de insectos o de mamíferos (por ejemplo, los bovinos) se transfectan con genes y se cultivan en suspensión e incluso como tejidos u organismos enteros, para producir proteínas completamente plegadas. Sin embargo, los sistemas de expresión in vivo de mamíferos tienen un bajo rendimiento y otras limitaciones (tiempo, toxicidad para las células huésped, etc.). Para combinar las características de alto rendimiento/productividad y escalabilidad de las proteínas de las bacterias y las levaduras, y las características epigenéticas avanzadas de los sistemas de plantas, insectos y mamíferos, se desarrollan otros sistemas de producción de proteínas utilizando eucariotas unicelulares (es decir, células de "Leishmania" no patógenas).

Sistemas bacterianos

Escherichia coli
E. coli, uno de los huéspedes más populares para la expresión de genes artificiales.

E. coli es uno de los hospedadores de expresión más utilizados y el ADN normalmente se introduce en un vector de expresión plasmídico. Las técnicas para la sobreexpresión en E. coli están bien desarrolladas y funcionan aumentando el número de copias del gen o aumentando la fuerza de unión de la región promotora para ayudar a la transcripción.

Por ejemplo, una secuencia de ADN para una proteína de interés podría clonarse o subclonarse en un plásmido de alto número de copias que contiene el promotor lac (a menudo LacUV5 ), que luego se transforma en la bacteria E. coli . La adición de IPTG (un análogo de lactosa ) activa el promotor lac y hace que las bacterias expresen la proteína de interés.

Las cepas de E. coli BL21 y BL21 (DE3) son dos cepas comúnmente utilizadas para la producción de proteínas. Como miembros del linaje B, carecen de proteasas lon y OmpT, lo que protege las proteínas producidas de la degradación. El profago DE3 que se encuentra en BL21 (DE3) proporciona la ARN polimerasa de T7 (impulsada por el promotor LacUV5), lo que permite utilizar vectores con el promotor T7 en su lugar.[14]

Corynebacterium

Las especies no patógenas de Corynebacterium grampositiva se utilizan para la producción comercial de varios aminoácidos. La especie C. glutamicum se utiliza ampliamente para producir glutamato y lisina,[15]​ componentes de los alimentos humanos, los piensos y los productos farmacéuticos.

La expresión del factor de crecimiento epidérmico humano funcionalmente activo se ha llevado a cabo en C. glutamicum,[16]​ demostrando así un potencial para la producción a escala industrial de proteínas humanas. Las proteínas expresadas pueden dirigirse a la secreción a través de la vía secretora general (Sec) o la vía de translocación de arginina gemela (Tat).[17]

A diferencia de las bacterias gramnegativas, la Corynebacterium grampositiva carece de lipopolisacáridos que funcionan como endotoxinas antigénicas en humanos.

Pseudomonas fluorescens

La bacteria no patógena y gramnegativa Pseudomonas fluorescens se utiliza para la producción de alto nivel de proteínas recombinantes, normalmente para el desarrollo de bioterapias y vacunas. P. fluorescens es un organismo metabólicamente versátil, que permite el cribado de alto rendimiento y el rápido desarrollo de proteínas complejas. P. fluorescens es más conocido por su capacidad de producir rápidamente y con éxito altos títulos de proteínas activas y solubles.[18]

Sistemas eucariotas

Levaduras

Los sistemas de expresión que utilizan S. cerevisiae o Pichia pastoris permiten la producción estable y duradera de proteínas que se procesan de manera similar a las células de mamíferos, con alto rendimiento, en medios de proteínas químicamente definidos.

Hongos filamentosos

Los hongos filamentosos, especialmente Aspergillus y Trichoderma, pero también más recientemente Myceliophthora thermophila C1[8]​ se han desarrollado en plataformas de expresión para la detección y producción de diversas enzimas industriales . El sistema de expresión C1 muestra una morfología de baja viscosidad en cultivo sumergido, lo que permite el uso de medios complejos de crecimiento y producción.

Células infectadas con baculovirus

Las células de insecto infectadas por baculovirus[19]​ (cepas Sf9, Sf21, High Five) o las células de mamífero[20]​ (HeLa, HEK 293) permiten la producción de proteínas glicosiladas o de membrana que no pueden producirse mediante sistemas fúngicos o bacterianos.[19]​ Es útil para la producción de proteínas en gran cantidad. Los genes no se expresan continuamente porque las células huésped infectadas acaban lisándose y muriendo durante cada ciclo de infección.[21]

Expresión de células de insectos no líticas

La expresión no lítica en células de insecto es una alternativa al sistema de expresión lítica por baculovirus. En la expresión no lítica, los vectores se transfectan de forma transitoria o estable en el ADN cromosómico de las células de insecto para la posterior expresión génica.[22][23]​ A continuación, se realiza la selección y el cribado de los clones recombinantes.[24]​ El sistema no lítico se ha utilizado para obtener un mayor rendimiento proteico y una expresión más rápida de los genes recombinantes en comparación con la expresión de células infectadas por baculovirus.[23]​ Las líneas celulares utilizadas para este sistema incluyen: Sf9, Sf21 de células de Spodoptera frugiperda, Hi-5 de células de Trichoplusia ni y células de Schneider 2 y células de Schneider 3 de células de Drosophila melanogaster.[22][24]​ Con este sistema, las células no se lisan y se pueden utilizar varios modos de cultivo.[22]​ Además, las series de producción de proteínas son reproducibles.[22][23]​ Este sistema da un producto homogéneo.[23]​ Un inconveniente de este sistema es el requisito de un paso de cribado adicional para seleccionar clones viables.[24]

Los sistemas de expresión de Leishmania tarentolae (no puede infectar a los mamíferos) permiten la producción estable y duradera de proteínas con alto rendimiento, en medios químicamente definidos. Las proteínas producidas exhiben modificaciones postraduccionales completamente eucariotas, incluida la glicosilación y la formación de enlaces disulfuro.

Sistemas de mamíferos

Los sistemas de expresión de mamíferos más comunes son las células de ovario de hámster chino (CHO) y de riñón embrionario humano (HEK).[25][26][27]

Sistemas sin células

La producción de proteínas sin células se realiza in vitro utilizando ARN polimerasa, ribosomas, ARNt y ribonucleótidos purificados. Estos reactivos pueden producirse por extracción de células o a partir de un sistema de expresión celular. Debido a los bajos niveles de expresión y al elevado coste de los sistemas libres de células, los sistemas basados en células son más utilizados[28]

Véase también

Referencias

  1. «Protein production and purification». Nature Methods 5 (2): 135-46. February 2008. PMC 3178102. PMID 18235434. doi:10.1038/nmeth.f.202. 
  2. «Recombinant protein expression in Escherichia coli». Current Opinion in Biotechnology 10 (5): 411-21. October 1999. PMID 10508629. doi:10.1016/s0958-1669(99)00003-8. 
  3. «Recombinant protein expression in Pichia pastoris». Molecular Biotechnology 16 (1): 23-52. September 2000. PMID 11098467. doi:10.1385/MB:16:1:23. 
  4. a b «Protein production in Saccharomyces cerevisiae for systems biology studies». Methods in Systems Biology 500. 2011. pp. 197-212. ISBN 9780123851185. doi:10.1016/B978-0-12-385118-5.00011-6. 
  5. «Baculovirus as versatile vectors for protein expression in insect and mammalian cells». Nature Biotechnology 23 (5): 567-75. May 2005. PMC 3610534. PMID 15877075. doi:10.1038/nbt1095. 
  6. «Transient transfection of CHO-K1-S using serum-free medium in suspension: a rapid mammalian protein expression system». Protein Expression and Purification 40 (2): 237-43. April 2005. PMID 15766864. doi:10.1016/j.pep.2004.07.015. 
  7. «A bicistronic baculovirus vector for transient and stable protein expression in mammalian cells». Analytical Biochemistry 380 (1): 146-8. September 2008. PMID 18541133. doi:10.1016/j.ab.2008.05.020. 
  8. a b Visser, Hans; Joosten, Vivi; Punt, Peter J.; Gusakov, Alexander V.; Olson, Phil T.; Joosten, Rob et al. (June 2011). «Development of a mature fungal technology and production platform for industrial enzymes based on a Myceliophthora thermophila isolate, previously known as Chrysosporium lucknowense C1». Industrial Biotechnology 7 (3): 214-223. doi:10.1089/ind.2011.7.214. 
  9. Wang, Xing; Hunter, Alan K.; Mozier, Ned M. (15 de junio de 2009). «Host cell proteins in biologics development: Identification, quantitation and risk assessment». Biotechnology and Bioengineering (en inglés) 103 (3): 446-458. ISSN 0006-3592. PMID 19388135. doi:10.1002/bit.22304. 
  10. «Definition: expression system». Online Medical Dictionary. Centre for Cancer Education, University of Newcastle upon Tyne: Cancerweb. 13 de noviembre de 1997. Consultado el 10 de junio de 2008. 
  11. «Expression system - definition». Biology Online. Biology-Online.org. 3 de octubre de 2005. Consultado el 10 de junio de 2008. 
  12. «overexpression». Oxford Living Dictionary. Oxford University Press. 2017. Archivado desde el original el 20 de octubre de 2018. Consultado el 18 de mayo de 2017. «The production of abnormally large amounts of a substance which is coded for by a particular gene or group of genes; the appearance in the phenotype to an abnormally high degree of a character or effect attributed to a particular gene.» 
  13. «overexpress». NCI Dictionary of Cancer Terms. National Cancer Institute at the National Institutes of Health. 2 de febrero de 2011. Consultado el 18 de mayo de 2017. «overexpress
    In biology, to make too many copies of a protein or other substance. Overexpression of certain proteins or other substances may play a role in cancer development.»
     
  14. Jeong, H; Barbe, V; Lee, CH; Vallenet, D; Yu, DS; Choi, SH; Couloux, A; Lee, SW et al. (11 de diciembre de 2009). «Genome sequences of Escherichia coli B strains REL606 and BL21(DE3).». Journal of Molecular Biology 394 (4): 644-52. PMID 19786035. doi:10.1016/j.jmb.2009.09.052. 
  15. Brinkrolf K, Schröder J, Pühler A, Tauch A (September 2010). «The transcriptional regulatory repertoire of Corynebacterium glutamicum: reconstruction of the network controlling pathways involved in lysine and glutamate production». Journal of Biotechnology 149 (3): 173-82. PMID 19963020. doi:10.1016/j.jbiotec.2009.12.004. 
  16. Date M, Itaya H, Matsui H, Kikuchi Y (January 2006). «Secretion of human epidermal growth factor by Corynebacterium glutamicum». Letters in Applied Microbiology 42 (1): 66-70. PMID 16411922. doi:10.1111/j.1472-765x.2005.01802.x. 
  17. «Comparative analysis of twin-arginine (Tat)-dependent protein secretion of a heterologous model protein (GFP) in three different Gram-positive bacteria». Applied Microbiology and Biotechnology 76 (3): 633-42. September 2007. PMID 17453196. doi:10.1007/s00253-007-0934-8. 
  18. «Reliable protein production in a Pseudomonas fluorescens expression system». Protein Expression and Purification 81 (2): 157-65. February 2012. PMID 21968453. doi:10.1016/j.pep.2011.09.010. 
  19. a b Altmann F, Staudacher E, Wilson IB, März L (February 1999). «Insect cells as hosts for the expression of recombinant glycoproteins». Glycoconjugate Journal 16 (2): 109-23. PMID 10612411. S2CID 34863069. doi:10.1023/A:1026488408951. 
  20. Kost TA, Condreay JP (October 1999). «Recombinant baculoviruses as expression vectors for insect and mammalian cells». Current Opinion in Biotechnology 10 (5): 428-33. PMID 10508635. doi:10.1016/S0958-1669(99)00005-1. 
  21. «Select what you need: a comparative evaluation of the advantages and limitations of frequently used expression systems for foreign genes». Journal of Biotechnology 127 (3): 335-47. January 2007. PMID 16959350. doi:10.1016/j.jbiotec.2006.07.012. 
  22. a b c d Dyring, Charlotte (2011). «Optimising the drosophila S2 expression system for production of therapeutic vaccines». BioProcessing Journal 10 (2): 28-35. doi:10.12665/j102.dyring. 
  23. a b c d Olczak M, Olczak T (December 2006). «Comparison of different signal peptides for protein secretion in nonlytic insect cell system». Analytical Biochemistry 359 (1): 45-53. PMID 17046707. doi:10.1016/j.ab.2006.09.003. 
  24. a b c McCarroll L, King LA (October 1997). «Stable insect cell cultures for recombinant protein production». Current Opinion in Biotechnology 8 (5): 590-4. PMID 9353223. doi:10.1016/s0958-1669(97)80034-1. 
  25. a b «Mammalian cell protein expression for biopharmaceutical production». Biotechnology Advances 30 (5): 1158-70. 1 de septiembre de 2012. PMID 21968146. doi:10.1016/j.biotechadv.2011.08.022. 
  26. a b c d «Better and faster: improvements and optimization for mammalian recombinant protein production». Current Opinion in Structural Biology. New constructs and expression of proteins / Sequences and topology 26: 39-43. June 2014. PMC 4766836. PMID 24721463. doi:10.1016/j.sbi.2014.03.006. 
  27. «Recombinant protein production from stable mammalian cell lines and pools». Current Opinion in Structural Biology. New constructs and expression of proteins • Sequences and topology 38: 129-36. June 2016. PMID 27322762. doi:10.1016/j.sbi.2016.06.005. 
  28. «Engine out of the chassis: cell-free protein synthesis and its uses». FEBS Letters 588 (2): 261-8. January 2014. PMC 4133780. PMID 24161673. doi:10.1016/j.febslet.2013.10.016. 

Otras lecturas