cap. 1. Regulación de la Expresión Genética
Autor:
Ricardo Antonio Giuliani
El gen es la unidad básica de almacenamiento, transmisión y expresión de información biológica. Dicha información se encuentra codificada en secuencias ordenadas de nucleótidos de Acido Desoxiribo Nucleico (DNA). Se trata de unidades estructurales de DNA que codifican Acido Ribo Nucleico (RNA) Ribosomal (rARN), ARN de transferencia (tARN), ARN mensajero (mARN) o Micro RNA (miRNA).
Los genes no son simplemente codificadores de proteínas sino regiones del ADN que producen copias específicas de ARN funcional.
Estructura del DNA
El Acido Desoxiribonucleico (DNA) resulta del encadenado de unidades llamadas nucleótidos, formadas por un azúcar (desoxiribosa) con radicales fosfato en posiciones 5’ y 3’ y una base púrica de doble anillo (Adenina o Guanina) o pirimidínica de anillo simple (Timina o Citosina). Las hebras de ADN se construyen mediante uniones fosfodiester azúcar fosfato (5’-3’) y se asocian en pares complementarios, mediante uniones no covalentes entre bases púricas y pirimidínicas.
En biología a las células carentes de núcleo se les llama Procariotas y a las células que tienen núcleo Eucariotas. En los Procariotas el DNA no se encuentra compartamentalizado en el núcleo como ocurre con los Eucariotas. El genoma de los Procariotas se reparte entre un complejo DNA/Proteína carente de envoltura nuclear (Nucleoide) y estructuras satelitales de DNA (Plásmidos) donde también
se alojan genes importantes.
El polímero de DNA se compone de dos hebras arregladas de manera helicoidal, donde los azúcares desoxiribosa y sus fosfatos se ubican en el exterior y las bases en el interior. La estabilidad termodinámica de la doble hebra helicoidal de DNA depende de fuertes uniones hidrógeno entre bases púricas y pirimidínicas.
Las bases respetan estrictas reglas de apareamiento establecidas por Watson y Crick: Adenina con Timina y Citosina con Guanina. El apareamiento de bases resulta de dos uniones hidrógeno en AT y de tres uniones hidrógeno en GC. La fuerza de la asociación entre ambas hebras resulta en parte de la longitud global del DNA y de la cantidad de pares GC. Las regiones donde se ubican los promotores (promoters) tienen secuencias TATAAT (TATA-Box) de menor atracción interhebra y más fácil separación. Esto facilita el acceso de Factores Transcripcionales al Promotor.
La fuerza de atracción interhebra puede medirse por el calor necesario para vencer las uniones hidrógeno (valor Tm). Cuando todos los pares de bases de una doble hélice de DNA se disocian, ambas hebras quedan separadas en dos moléculas enteramente independientes. Las hebras vuelven a integrarse por complementaridad en doble hélice cuando baja la temperatura. Este es el principio básico utilizado en las técnicas de Polimerase Chain Reaction (PCR).
Secuencias 5’ a 3’ en Hebra de DNA
La estructura de doble hebra complementaria facilita la reparación del ADN, porque la hebra sana sirve de molde para la reconstrucción de la hebra dañada.
La extensa diversidad y complejidad biológica existente pudo ser desarrollada y documentada a partir del alfabeto de cuatro letras del ADN.
Hay algunos virus que solo poseen DNA de hebra simple, pero en general en biología el DNA adopta la conformación doble helicoidal.
¿Porqué Timina en DNA y Uracilo en RNA?
La Timina resulta de la metilación de Uracilo, un proceso energéticamente bastante costoso pero de enorme utilidad biológica, porque la Timina brinda fuerte estabilidad al genoma. Por otra parte, la Citosina está expuesta a rápida desaminación y transformación a Uracilo. Ergo, si el DNA utilizara Uracilo para escribir el código genético, las especies y sus individuos estarían sometidos a un alto grado de mutaciones y la vida sería prácticamente inviable.
Los transcriptos RNA sí pueden aprovechar la economía que ofrece el Uracilo respecto de la Timina, porque a diferencia del DNA, el RNA tiene vida efímera y por consiguiente bajo riesgo de mutagénesis.
Exones, Intrones
Los conceptos Intron y Exon fueron acuñados por Walter Gilbert en 1978, para distinguir las regiones del gen que se expresan (expressed region) de aquellas que no se expresan (intragenic region).
Estas definiciones fueron hechas originalmente para transcriptos codificantes de proteínas, pero luego fueron aplicadas a las secuencias de RNA removibles por splicing desde transcriptos primarios de rRNA y tRNA. También fueron utilizados para aquellas moléculas de RNA que se originan en diferentes regiones del genoma y pueden luego integrarse, mediante “tras-splicing”, en una sola molécula.
Las secuencias codificantes (exones) se encuentran intercaladas con las no codificantes (intrones). En los extremos 5’ y 3’ del gen se ubican secuencias de nucleótidos no traducibles a RNA (UTR).
Las uniones entre intrones y exones repiten cortas secuencias de nucleótidos, que permanecen intactas en cada replicación celular intra e inter-individuos y por eso se dice que permanecen evolutivamente “bien conservadas”. Lo mismo ocurre con los exones que también reproducen inter e intraindividuo secuencias bien conservadas de nucleótidos.
Los intrones en cambio son secuencias pobremente conservadas, de variable longitud y extremos autocomplementarios. Por eso en el proceso de corte de intrones y empalme de exones (splicing) reaccionan conformando anillos de escisión.
Esta característica de los intrones facilita el intercambio de exones y la generación de diversas proteínas a partir de un mismo gen.
Se han encontrado intrones tanto en genes de mARN, tARN y rARN eucariotas como en genes de cloroplastos, mitocondrias y fagos de E. Coli. La única especie que carece de intrones es la Eubacteria. En genes evolutivamente relacionados se observan estructuras similares y preservación de la posición de algunos intrones. Se han descrito genes como el de la Subunidad II de la Citocromo
Oxidasa de la mitocondria de las plantas, que tienen un intron en una especie y carecen de él en otra especie.
La cantidad y tamaño de los intrones varía extensamente: dos genes pueden tener igual extensión pero diferente número y tamaño de intrones. Un caso paradigmático es la DHFR que tiene 6 exones desplegados en 2000 bases pero llega con sus intrones a 31000 bases.
Marco Abierto de Lectura / Open Reading Frame (ORF)
En Biología se entiende por marco de lectura a la secuencia de tres nucleótidos (codon) contiguos y no superponibles, sea en DNA como en RNA. Se denomina marco abierto de lectura u Open Reading Frame (ORF), a las secuencias que pueden transcribirse a RNA primario.
Cualquier “marco de lectura” comienza con un codon de iniciación (metionina) y termina con un codon stop. El Codon Stop se conoce también como “codon non sense” porque no aparece en la proteína resultante. Hay tres versiones de codon stop: TAG, TAA y TGA y estas pasan al transcripto RNA como UAG, UAA y UGA.
La Secuencia Codificante culmina en la concatenación por corte y empalme de exones (splicing) y mRNA traducible a proteínas o polipéptidos.
En Procariotas no hay intrones, por consiguiente las regiones codificantes y ORF coinciden, mientras que en Eucariotas, donde encontramos intrones intercalados con exones, el marco abierto de lectura u ORF incluye a la Secuencia Codificante o secuencia de exones y a los intrones que no codifican péptidos.
DNA no codificante
Los Exones codificantes de proteínas ocupan tan sólo el 1.5 % del total del DNA existente. La mayor parte del Genoma tiene aspecto de “DNA Chatarra” sin embargo es muy probable que en ese DNA no codificante radique gran parte del sistema regulador del genoma.
La presencia de semejante cantidad de DNA no codificante en los genomas eucarióticos y las grandes diferencias de tamaño (“valor C”) entre especies, representa uno de los enigmas más grandes de la biología. El DNA no codificante provee mecanismos para la creación, modificación y recombinación
de genes y probablemente sea importante para controlar el ritmo de la evolución humana.
Sense y Antisense
El DNA tiene arreglo de hebras en antiparalelo y las secuencias de cada hebra son complementarias. Las enzimas leen el DNA en dirección 3’ a 5’. Sólo una de las hebras puede transcribir DNA en mRNA “traducible” a proteína, es decir que solo una de ellas puede tener sentido (“sense”) biológico.
Un transcripto mRNA “sense” es necesariamente complementario de la hebra DNA que le dio origen, por eso a esta ultima se le llama “antisense”.
Dicho en otras palabras, el ARN “traducible” o “sense” será siempre una réplica complementaria de una hebra DNA “antisense”.
Es importante señalar que cualquiera de las dos hebras puede codificar y esto depende de la ubicación del Promoter que es el que determinará cual de las dos será antisense.
La secuencia de la hebra complementaria a la hebra DNA “antisense” recibe el nombre “sense” porque reproduce la secuencia de bases del transcripto RNA “sense”.
Entonces el nombre “antisense” se aplica a la corta hebra de DNA o RNA que resulta “complementaria” a la molécula de mRNA ”sense” capaz de traducir una proteína especifica.
La idea de producir oligodeoxinucleótidos “antisense” que puedan unirse por complementaridad y de esta manera inhibir mRNA “sense” fue propuesta hace casi cincuenta años. El progreso en síntesis automática de DNA hizo posible el desarrollo de hebras RNA-antisense para su uso en regulación, silenciamiento o expresión genética. Estas ideas han alcanzado fases de experimentación clínica
particularmente en el campo oncológico.
Cromosomas
En realidad el término Cromosoma (Cr) no responde a una definición demasiado precisa. De hecho los Plasmidos circulares de los Procariotas son también considerados Cromosomas.
En Eucariotas cada Cr resulta de una molécula singular de DNA enroscada en nucleosomas (NS), que son estructuras proteicas similares a un carretel.
El NS constituye la unidad anatómica de la Cromatina y está formado por un octámero de proteínas básicas, de alta conservación evolutiva, llamadas histonas (H2a, H2b, H3 y H4). Cada NS acepta 1.65 vueltas de DNA y abarca 146 pares de bases (pb). Entre cada nucleosoma hay DNA espaciador con 50 pb.
De esto resulta un extenso rosario de nucleosomas, que se enroscan y superenroscan hasta adquirir el aspecto compacto de bastones, portadores de una estructura medial llamada centrosoma.
Los Cr de Eucariotas se tiñen fuertemente y pueden verse con claridad por microscopía óptica durante la Metafase.
Cromatina
Se entiende por cromatina a la versión no condensada de DNA que resulta del
complejo entre DNA y nucleoproteínas. En forma condensada adquiere el aspecto
de bastones que caracteriza a los cromosomas en Metafase.
La actividad transcripcional confiere a la cromatina un aspecto más laxo que se describe como “Eucromatina”. Por el contrario el silencio transcripcional genera la morfología de compactación llamada “Heterocromatina”.
Cuando la cromatina adquiere la forma clásica de un Cromosoma, la compactación es tal que el DNA resulta inaccesible para transcripción genética. En ese momento los Cr se distinguen fácilmente por microscopía óptica y adquieren el aspecto de cuatro brazos, unidos a nivel del centrómero, a raíz de la división del material nuclear en cromátides hijas. Los brazos cortos se denominan “p” (“petit”) y los largos “q” por la letra que le sigue a la p en el alfabeto latino.
Con frecuencia la activación o el silenciamiento genético se acompaña de relocalización nuclear y esto sugiere que la organización espacial de la cromatina puede ser importante para la regulación de la expresión genética.
Centrómeros
El Centrómero es el sitio que mantiene unidas a las cromátides hijas durante la meiosis y mitosis. Cada Centrómero representa una estructura proteica a la que se pueden ligar microtúbulos. En los Centrómeros se distinguen secuencias repetidas de DNA y una formación multiproteica central llamada Cinetocoro que sirve de anclaje a los microtúbulos durante la Anafase.
Telomeros
Los extremos de los Cr(s) se llaman Telómeros y se caracterizan por secuencias repetitivas de DNA. Dichas formaciones compensan la replicación incompleta del DNA a nivel de los extremos de cada Cr. Las enzimas que duplican el cromosoma y su DNA no pueden llegar hasta los extremos. El Telómero funciona como “amortiguador” descartable: se consume durante la división celular y se recompone mediante una Transcriptasa Reversa llamada “Telomerasa”. Los Telómeros protegen a los Cr(s) de la fusión y rearreglo entre sí. Normalmente las células que consumen sus Telómeros son automáticamente destruidas. En la mayoría de los eucariotas multicelulares la telomerasa solo permanece activa en las células germinales. El acortamiento progresivo de los Telómeros, en el curso de las sucesivas replicaciones celulares, tendría roles tanto en el proceso del envejecimiento como en el desarrollo del cáncer. Los Telómeros de Eucariotas terminan normalmente en proyecciones 3’ DNA de simple cadena. En humanos los Telómeros pueden alcanzar muchos Kilobases de largo y por lo general comprenden ristras sucesivas de 6-8 pb ricas en Guanina. Han sido identificadas diversas proteínas ligantes de estas proyecciones DNA 3’terminales.
Recombinación Genética
Recombinación genética es el proceso de rotura y empalme entre moléculas de DNA o RNA. La recombinación de material genético es un fenómeno habitual durante la meiosis, donde se registra un intercambio entre pares y regiones homólogas de Cromosomas (Cr)s. Por eso es que los hijos tienen Cr(s) con diferente mapeo de alelos genéticos que el de sus progenitores e incluso pueden tener nuevas quimeras alélicas. Las recombinaciones genéticas son instrumentadas por enzimas específicas llamadas “recombinasas”. Entre dichas recombinasas se cuenta con RAD51 que funciona tanto en mitosis como meiosis y DMC1 que es específica para la meiosis. Durante la meiosis se produce entrecruzamiento de información genética entre los pares de cromosomas homólogos heredados de los padres: sitios homólogos entre dos cromátides se mezclan entre sí. Es probable que el proceso de
recombinación comprometa regiones de ADN no codificante, para evitar afectar el material sensible de los exones.
También puede darse la recombinación entre segmentos cromosómicos no homólogos.
El Sistema Inmune Adaptativo utiliza Recombinasas específicas, codificadas por genes RAG1 y RAG2, para recombinación segmentos de cada categoría: Variable, Joint y Diversity. Es precisamente gracias a la recombinación genética que es posible desarrollar el extenso repertorio de reconocimiento inmune que caracteriza al Sistema Inmune Adaptativo.
La industria farmacéutica ha desarrollado numerosos agentes terapéuticos mediante el uso de técnicas de recombinación genética. Muchos de estos productos han pasado a integrar el armamentarium terapéutico moderno en diversas enfermedades humanas.
Genes Superpuestos / Overlapping Genes (OG)
Los genes Superpuestos u “OG” son genes adyacentes que comparten ciertas regiones codificantes por encontrarse parcialmente superpuestas. En otras palabras, un mismo tramo de DNA codifica para porciones de dos proteínas diferentes. Este fenómeno fue originalmente descrito en procariotas, eucariotas, mitocondrias y virus pero existe la posibilidad de encontrarse también en humanos. Para que los OG puedan funcionar la señal de inicio de la transcripción para uno de ellos debe encontrarse
dentro del segundo gen cuyo codon de iniciación debe hallarse corriente arriba. Por otra parte, durante la traducción (RNA), el codon stop del segundo gen debería ser ciego al codon stop del primero de ellos. La lectura en tripletes del código genético admite tres marcos de lectura diferentes y esto resulta particularmente útil en transcriptos de genes superpuestos: en uno de los marcos posibles el ribosoma no registra el codon stop del segundo gen. El fenómeno de superposición de genes
permite producir más proteínas a partir de una misma región de ADN.
Polimerasas
Las enzimas que se utilizan para copiar polímeros de ADN en secuencias complementarias de ARN o ADN reciben el nombre de Polimerasas, tienen especificidad de substrato y sólo pueden leer hebras simples de ADN.
Las enzimas que polimerizan ADN y ARN obedecen también a las reglas de apareamiento de Watson y Crick. Siguiendo este concepto, si usamos una hebra de ADN o ARN como molde, la copia que surgirá respetará el principio de complementaridad.
Por ejemplo, de una hebra de ADN 5’TTAGGC3’ resultará una copia ADN 3’AATCCG5’ o ARN 3’AAUCCG5’ Los extremos 3’ y 5’ de las hebras de ADN Y ARN son químicamente diferentes
y existe polaridad en la secuencia de bases: la misma secuencia de bases leída de 3’ a 5’ tiene un significado biológico diferente respecto de la lectura opuesta de 5’ a 3’.
Todas las Polimerasas, sea de ADN o ARN, distinguen entre terminales 3’ y 5’ de un ácido nucleico, leen las secuencias de ADN sólo en dirección 3’ a 5’ y construyen Polímeros de ARN o ADN agregando bases en dirección 5’ a 3’.
ADN Polimerasas (ADNP)
La DNA Polimerasa (DNAP) cataliza la polimerización de una hebra “hija” de DNA acorde con el molde provisto por la hebra madre. La hebra hija será complementaria de la hebra madre. La DNAP es una holoenzima dado que requiere de Ion Magnesio para el desempeño de su función. La DNAP solo puede agregar nucleótidos a grupos 3’-OH “libres” pre-existentes y para esto es preciso que el
aparato transcripcional instale un Primer sobre la hebra a copiar. Dicho Primer está constituido por dos nucleótidos iniciales RNA seguidos por uno o dos nucleótidos DNA y la enzima a cargo de su síntesis lleva el nombre de Primasa. A partir de dicho Primer se sucederá el agregado de nucleótidos siguiendo el molde de la hebra DNA madre, siempre en dirección 5’ a 3’. Por otra parte, una enzima llamada Helicasa debe proceder a abrir la doble hélice de DNA, de lo contrario nada de lo
anterior puede llevarse a cabo.
La estructura de la subunidad catalítica de las ADNP varía muy poco entre una y otra especie y por eso se dice que son moléculas evolutivamente bien conservadas.
“Función Corrector de Pruebas” (Proofreading) en DNAP
Algunas ADNP tienen la capacidad de corregir errores de síntesis en el ADN recién sintetizado. Cuando la ADNP reconoce una Base erróneamente instalada revierte su dirección en un par de Bases, extirpa la misma en dirección 3’ a 5’ mediante su actividad de exonucleasa, re-inserta la base correcta y luego prosigue con el proceso replicativo.
Transcriptasa Reversa (TR)
Los Retrovirus codifican una ADNP muy específica llamada Transcriptasa Reversa que requiere ARN para funcionar y tiene la capacidad de sintetizar ADN a partir de ARN. El ADN resultante carece de Intrones y se le llama ADN complementario.
Familias de ADNP
Se han descrito hasta ahora 7 familias de ADNP: A, B, C, D, Y, X y TR.
Las ADNP de Familia A agrupan polimerasas replicativas y de reparación. A esta familia pertenecen las polimerasas de reparación involucradas en los fenómenos de escisión, reparación y procesamiento de los fragmentos de Okazaki que se generan durante la síntesis de la hebra rezagada.
La Familia B incluye ADNP mayormente replicativas e incluye a las ADNP α, β, ε y ζ. Estas enzimas están involucradas en la síntesis de ambas hebras (líder y rezagada), se caracterizan por un alto grado de precisión y tienen fuerte actividad de exonucleasas.
Las Familias C y D se encuentran en Bacterias. La Familia X incluye a las bien conocidas Polimerasa eucariótica pol β y Terminal Deoxinucleotidil Transferasa (TdT). Esta última se expresa solamente en tejido linfoide e interviene en la recombinación V(D)J, incrementando la diversidad mediante
inserción de nucleótidos “n”.
Las ADNP de la Familia Y se caracterizan por tener baja fidelidad sobre moldes indemnes y capacidad replicativa sobre DNA dañado. Por eso estas enzimas son conocidas como Polimerasas Translesionales.
Finalmente la Familia de Transcriptasas Reversas (TR) se describe en eucariotas sólo a nivel de los telómeros (telomerasas).
RNA Polimerasas (RNAP)
Estas proteínas permiten construir hebras de RNA a partir de moldes de DNA o RNA. A este proceso se le llama “transcripción” porque copia la información que cobija el DNA en RNA y de esta manera puede transferir información genética al citoplasma. Es una nucleotidil transferasa que construye polímeros de RNA.
Solo puede leer en dirección 3’ a 5’ y requieren de un primer para poder iniciar su actividad, adicionando ribonucleótidos a grupos 3’OH libres.
Las RNAP son enzimas esenciales que se encuentran en todo tipo de organismo, están formadas por múltiples cadenas de polipéptidos y alcanzan una masa de más de 500 daltons.
La holoenzima RNAP completa se compone de 6 subunidades. En su estructura se distingue un surco donde encajan con precisión los 20 Angstroms de ancho de la doble hebra de DNA. Para unirse al DNA la RNAP cuenta con un factor “sigma” que le confiere gran afinidad por las regiones promoters.
Mientras la RNAP se encuentra inactiva no flota libremente, permanece ligada a sitios de baja afinidad. Cuando es requerida se desplaza a las regiones promoters y adquiere plena capacidad funcional.
Control de la Transcripción
La RNAP está sometida a fuertes y complejos mecanismos regulatorios capaces de generar una extensa diversidad en patrones de expresión genética. Esto permite a la Célula adaptarse a los cambios ambientales, ejercer roles especiales dentro de un organismo y preservar los procesos metabólicos básicos para la supervivencia. En la Escherechia Coli más de 100 Factores regulan la actividad de la RNAP. La RNAP sólo puede iniciar la transcripción cuando reconoce una secuencia específica llamada Promoter y genera a partir de allí una copia complementaria a la hebra “molde” de DNA. Al proceso de adición de nucleótidos al RNA se le llama “elongación” y el producto puede alcanzar hasta 2.4 millones de nucleótidos, como ocurre con el gen distrofina. Finalmente el transcripto es liberado cuando la RNAP localiza un codon stop.
La RNAPI transcribe genes que codifican RNA Ribosomal (rRNA). La RNAPII transcribe genes que codifican RNA primario/mensajero y Micro-RNAs. La RNAPIII transcribe genes que codifican RNA de Transferencia (tRNA) y también miRNAs
A diferencia de la DNAP la RNAP tiene actividad de helicasa, por consiguiente no requiere de una enzima adicional para dicha función.
Splicing
El RNA primario es copia complementaria de la secuencia de exones e intrones escrita en la hebra “antisense” del gen. Luego de terminada la transcripción el ARN primario es sometido a un proceso de escisiones de intrones y empalmes (splicing) de exones.
Spliceosoma
La transformación del RNA primario en RNA mensajero se produce en el núcleo y está a cargo de un ensamble entre RNA y múltiples partículas de ribonucleoproteínas.
En este complejo llamado Spliceosoma, que es exclusivo de eucariotas, los intrones son escindidos y los exones recombinados y empalmados. A partir de un mismo RNA primario pueden generarse una o más versiones de ARN mensajero acorde con la cantidad de exones que el Spliceosoma incluya en el producto final.
Los prokariotas carecen de intrones porque son más simples y no tienen núcleo.
Variantes de Splicing o Splicing Alternativo
A partir del transcripto primario de ARN es posible producir desde un mismo gen diferentes proteínas. Este fenómeno resulta de empalmes o splicing alternativo de exones, ha sido descrito en al menos 40 genes diferentes y puede ocurrir en diversos tipos y estadios evolutivos de una célula o tejido. Las variantes de splicing constituyen una de las fuentes más importantes de diversidad genética en eucariotas y explican la extensa diversidad del sistema inmune adaptativo. Según el Human Genome Project la cantidad total de genes llega a 30.000 contrastando con las apreciaciones
históricas del orden de 100.000. La diferencia se explica en parte por el fenómeno de splicing alternativo y en parte porque cada gen tiene al menos dos isoformas.
Promoter
El Promotor cobija los sitios de anclaje (Response Elements) para Factores Transcripcionales y RNA Polimerasa II (RNAP-II) y desde allí regula la expresión del gen. El Promotor actúa en concierto con otros factores regulatorios como Silencers, Enhancers e Insulators.
Dentro del Promotor se distinguen dos tipos básicos de amarre para factores transcripcionales: el Core Promoter y Sitios Distales. Para señalar la localización de una secuencia relacionada con el gen se utilizan los signos (-) y (+) respecto del (CI): por ejemplo -40 significa a cuarenta pb del CI en dirección 5’.
El Core Promoter se ubica en posición -25 a -30 y cobija una secuencia de siete pb (TATAAAT) conocida como TATA box. Este es el sitio específico de anclaje para el factor transcripcional TATA Binding Protein (TBP). El TBP y 14 proteínas asociadas al mismo constituyen el ensamble TFIID que a su vez integra el Complejo de Preiniciación RNA Polimerasa II (RNAPII). Dicho complejo contribuye a posicionar a la RNAPII sobre el CI del gen.
Se estima que el TATA box se encuentra en solo un 10 a 20% de los Promoters humanos y por esto se piensa que la TBP no sería la única proteína involucrada en el posicionamiento de la RNAPII.
El factor TBP interviene en el proceso de separación de la doble hebra de DNA, induce su plegamiento en 80° y facilita la aproximación del Promoter a reguladores como el Enhacer, que puede estar ubicado a miles de pares de bases de distancia.
El TBP se une al DNA a nivel Carboxiterminal, pero en su Aminoterminal posee una larga cola de glutaminas, que modula la interacción del TBP con el DNA y afecta la velocidad de formación del Complejo Transcripcional.
La transcripción es un proceso finamente regulado y cada uno de los factores transcripcionales (TFIIA, TFIIB, TFIIF) resulta de la interacción de muchas subunidades.
Corriente Arriba del Core Promoter (hacia 5’) se extienden otras secuencias a lo largo de 200 pb Promoter. Estas despliegan afinidad por factores transcripcionales específicos para cada etapa de la vida celular y de cada tejido en particular.
La combinación de sitios promotores singulares con factores transcripcionales específicos, determina el momento y el lugar preciso para la expresión de ciertos genes. En realidad los Promotores carecen del grado de precisión que se ve en secuencias como el codon stop, porque la naturaleza usa la variación de los promotores para el control de los niveles de expresión de diversos genes.
Enhancers
Algunos Factores Transcripcionales (FT) reconocen secuencias de ADN ubicadas a miles de pares de bases del gen y desde allí actúan sobre el Promoter incrementando la velocidad de transcripción. A dichas secuencias se les llama Enhancers dado que sirven de anclaje a Proteínas Aceleradoras de la Expresión (FT) de genes específicos. En realidad un Enhancer puede encontrarse dentro del mismo gen o también alejado del mismo a miles de pares de bases en dirección 5’ o 3’. Es probable que estas Proteínas de Unión a Enhancers tengan un dominio de reconocimiento de Enhancer y otro de interacción con los Factores Transcripcionales ligados al Promoter. Para que pueda ejercerse una influencia tan importante, desde secuencias de ADN tan alejadas, es preciso que se forme un plegamiento de ADN que dibuja la forma de un lazo.
Silenciadores
Se trata de secuencias de ADN que también pueden estar ubicadas a miles de pares de bases del gen que controlan. A diferencia de las regiones Enhancer estas regiones tienen afinidad por factores que reprimen la transcripción.
Horqueta de Replicación o “Replication Fork”
La extensa doble hebra helicoidal de DNA tiene el aspecto de un cable de teléfono super-enroscado y apretado alrededor de núcleos octaméricos de histonas.
Las Polimerasas no pueden leer DNA de doble hebra y por eso durante el proceso replicativo trabajan asociadas a un complejo de enzimas y proteínas que des-enrollan y abren la doble hélice de DNA. La adición de nucleótidos sigue siempre la dirección 5’ a 3’.
Pero las hebras de DNA sólo se abren para la expresión o replicación genética y luego vuelven a cerrarse y enroscarse. Por eso en los sitios de copiado el DNA adopta el aspecto de una horqueta, como si fuera una Y. Dicha formación es conocida como Replication Fork.
En el mencionado Replication Fork se reconoce una hebra líder de síntesis continua y una hebra rezagada que se construye en base a fragmentos discontinuos llamados fragmentos de Okazaki. En eucariotas dichos fragmentos tienen 200 pares de bases (pb), longitud equivalente a una vuelta de
hélice.
Una enzima llamada Primasa se encarga de insertar un Primer al inicio de cada fragmento de Okazaki o hebra líder. Dicho Primer cuenta con dos nucleótidos iniciales de RNA. La DNA Polimerasa necesita dicho Primer para poder iniciar su trabajo.
Las enzimas Primasa y Helicasa trabajan integradas a un complejo llamado Primosoma. Los primers de RNA son eliminados por enzimas especiales de reparación del DNA y la muesca resultante es llenada mediante la acción de las enzimas ligasa y polimerasa.
En las replicaciones del DNA eucariota intervienen al menos dos tipos de DNA-polimerasas: DNA-Poly Alfa para la hebra rezagada y DNA-Poly delta para la hebra líder.
Como se ve en las figuras adjuntas cada hebra de DNA sigue necesariamente direcciones opuestas de replicación. Pero mediante el recurso de los fragmentos de Okazaki el complejo enzimático puede avanzar en la misma dirección, reproduciendo ambas hebras de DNA de manera casi simultánea
y a gran velocidad.
Helicasas
Las Helicasas son enzimas que separan temporariamente las dos hebras de DNA y permiten la síntesis de hebras hijas o RNA. La RNA Polimerasa tiene actividad intrínseca de Helicasa mientras que la DNA Polimerasa requiere de una subunidad Helicasa específica. En conjunto con la DNA Primasa la Helicasa desnaturaliza al DNA mediante hidrólisis de Adenosin Tri Fosfato
(ATP) y se desplaza a lo largo de una de las hebras, desenrollando el DNA que encuentra a su paso.
Topoisomerasas
Las enzimas Topoisomerasas sirven para mantener tanto la transcripción como la replicación del ADN. Se unen al ADN corriente abajo del tramo helicoidal abierto, a fin de prevenir una deformación excesiva de su doble hélice. Las Topoisomerasas son enzimas que alteran el “supercoiling” (super-espiralado) de la doble hélice de ADN. La Topoisomerasa I corta transitoriamente una hebra y la Topoisomerasa II corta ambas hebras del ADN para relajar el espiral y extender la molécula de ADN. La regulación del “supercoiling” es crítica para las tareas de replicación y transcripción: el ADN debe desenrrollarse para facilitar el acceso de la maquinaria
enzimática involucrada en dichos procesos. La Topoisomerasa III interviene en la regulación de la recombinación y la Topoisomerasa IV regula el proceso de segregación de los cromosomas recientemente replicados.
DNA Ligasas
Las DNA ligasas catalizan la formación de enlaces fosfodiester 5’-3’ (covalentes) entre nucleótidos y se usan para unir cadenas de ADN o introducir fragmentos de ADN. Un ej. es la T4 DNA ligasa que requiere ATP como cofactor. El ligado de moléculas de DNA puede realizarse de múltiples maneras: entre dos cadenas distintas de DNA (intermolecular) o entre extremos de una misma cadena de DNA,
generando un círculo de DNA.
Transcripción
El proceso de transcripción resulta en una hebra de RNA primario que es complementaria a la hebra antisense del DNA. El RNA primario es luego sometido a un proceso de corte y empalme donde los intrones son eliminados y los exones empalman en secuencias contínuas de exones. Este proceso es conocido como splicing (empalme) y se desarrolla en el núcleo.
El DNA codificante está armado en secuencias de tres pares de bases llamadas codones, que se leen a partir de un “sitio de iniciación”, que indica a la RNA Polimerasa II cual debe ser el 1er nucleótido a tomar como inicio de la transcripción.
La secuencia de bases determina la especificidad de un codon y dicha secuencia cambia en función de tres posibles opciones de marco de lectura. Supongamos que los primeros cinco nucleótidos fueran ATACCG: si la Polimerasa iniciara la lectura en A se generaría ATA como primer codon y este codificaría Isoleucina, pero si la iniciara en T dicho codón cambiaría por TAC y este codificaría Tirosina.
Cada codón reconoce al menos un aminoácido y existen 64 combinaciones posibles entre las 4 bases existentes. Sin embargo hay tres codones stop que indican el punto donde termina la transcripción (UAG, UAA Y UGA).
Excluyendo estos últimos quedan 61 grupos de tres bases para 20 Amino Acidos. Por otra parte el codon AUG, cuando está acompañado por la secuencia de consenso (Kozak box), cercano al terminal 5’ del mRNA, sirve como codon de iniciación, señalando el primer AA a ser incorporado (Metioniona).
Por eso la mayoría de las proteínas tienen a la Metionina como primer AA. Algunas pierden la Metionina como consecuencia de arreglos postraduccionales.
Redundancia en Codones y tARN
Muchos codones codifican para un mismo aminoácido (AA) porque en realidad son las dos primeras bases las que determinan su especificidad. Mirando detenidamente la carta de correlaciones se ve que los codones que codifican para un mismo AA varían por lo general en la tercer base.
Por esta diversidad en Codones codificantes de un mismo AA se dice que el código genético es degenerado y redundante. También hay redundancia a nivel de tARN porque se han descrito 36 tARN para 20 AA.
En realidad quedan 61 codones para 20 AA pero existen 21 AA. Esto se debe a la Prolina que se transforma en Hidroxiprolina en etapa postranscripcional.
Una consecuencia práctica de esta redundancia es que algunos errores en el código genético sólo ocasionan mutaciones silentes o a lo sumo errores que no afectan las propiedades hidrofílicas o hidrofóbicas de un AA. También es cierto que a veces una mutación singular puede provocar severas alteraciones morfológicas y funcionales, como ocurre con la mutación de Glu6 (hidrofílica)
a Val6 (hidrofóbica) en la Beta Globina, que reduce sensiblemente la solubilidad de las cadenas de globina y provoca los desórdenes propios de la sickle-cell-disease.
El ADN viral constituye una excepción a la regla porque algunas secuencias de su genoma pueden leerse en ambas direcciones. De esta manera codifican una proteína cuando son leídas de 5’ a 3’ en una de sus hebras y otra proteína cuando siguen el curso opuesto sobre la otra hebra.
De todas maneras muchos virus tienen ADN de una sola hebra lo cual implica un alto grado de exposición a mutaciones y cambios epigenéticos. También conlleva la ventaja de su mayor adaptabilidad y del menor costo de mantenimiento que implica un sistema de hebra simple.
RNA Primario
La información contenida en el gen es transcripta a copias de ARN primario y este es luego sometido a procesos de escisión de intrones y empalmes (splicing) de exones. De este proceso, que se lleva a cabo en el núcleo surge el RNA mensajero, que es trasladado al citoplasma e incorporado a ribosomas para lectura y expresión de proteínas.
En el RNA el azúcar tiene un OH- en C2 y la base pirimidínica Timina está reemplazada por Uracilo. El RNA se presenta bajo forma de hebra única en eucariotas y doble en procariotas.
RNA Mensajero
La vida media del RNA mensajero es muy corta en eubacterias (1-5 minutos) y variable en eucariotas. En Procariotas la traducción ocurre casi al mismo tiempo que la transcripción porque su RNA no requiere de procesamientos postranscripcionales.
En Eucariotas el RNA debe ser procesado, editado, transportado fuera del núcleo e incorporado a ribosomas. La vida media del mARN en eucariotas depende de su estabilidad y esta depende en parte de la existencia o no de señales inductoras de rápida degradación. Dichas señales suelen anidar en la región no traducible 3’ UTR. Después de un tiempo el mRNA es degradado a nucleótidos mediante RNAasas específicas.
5’ Cap
De manera casi simultánea con el inicio de la transcripción el extremo 5’ del RNA primario recibe el nucléotido 7-metilguanosina (5’ Cap). El ligado de 5’ Cap se produce mediante un Complejo Sintetizador de Cap que está asociado a la RNA Polimerasa.
La síntesis de 5’ Cap resulta de una reacción bioquímica que se desarrolla en varias etapas. El grupo metilo en posición N-7 agregado a la guanina le provee gran estabilidad al RNA, en particular lo protege del ataque de enzimas nucleofílicas. Esta modificación es crítica para el reconocimiento y adecuada adherencia al Ribosoma, pero también podría tener importancia en los procesos de splicing y transporte.
Poliadenilación
Luego de completada la transcripción la cadena de RNA primario es cortada mediante la acción de un complejo endonucleasa asociado a RNA Poly II. El Sitio de Corte está caracterizado por la presencia de una secuencia AAUAAA cercana al mismo. Luego de haberse producido el corte, una Poliadenil Polimerasa le agrega entre 80 y 250 residuos de adenosina al extremo 3’ libre del mARN. Esta cola de Poli Adeninas contribuye a la terminación de la transcripción, estabiliza el mARN por neutralización de exonucleasas, y facilita la exportación del núcleo al citoplasma.
El reconocimiento de la secuencia AAUAAA es crítico para poder colgar la cola de Poli Adeninas al ARN, tan es así que una mutación a este nivel (AAUAAA por AAUAAG), como ocurre en el caso del gen de la alfa 2 globina humana, puede provocar deficiencias en hemoglobinas.
Edición
Una vez completado el proceso de splicing es posible someter al mARN a ulteriores correcciones o “ediciones”, mediante la inducción de cambios en su composición de nucleótidos. Un ejemplo en humanos es el caso del mARN de la Apolipoproteína B que puede ser editada en ciertos tejidos pero no en otros. La edición permite producir una proteína más corta mediante la introducción de un Stop Codon (por ejemplo).
Traducción
Hemos visto que los procesos de Transcripción y Traducción ocurren en compartimientos separados: la Transcripción en el núcleo y la Traducción en el Citoplasma.
Para la transcripción es preciso que el mARN sea exportado a través del poro nuclear.
Una vez fuera del núcleo es incorporado a Ribosomas Flotantes en el Citosol o a Ribosomas adheridos a membranas del Reticulo Endoplásmico.
Ribosomas
En el Nucleolo se concentra la producción de RNA Ribosomal (rRNA) y los genes que codifican rRNA se ubican en cinco Cromosomas: 13, 14,15, 21 y 22. Por eso es que son diez los centros generadores de Nucleolos.
Un Ribosoma es una organela compuesta de rARN y Proteínas Ribosomales.
Estas estructuras resultan del ensamble de dos subunidades de rARN con mARN y diversas Ribonucleoproteínas. El ribosoma se arma para la Traducción de una molécula específica de mARN y se desarma una vez terminada su tarea. Estas organelas pueden Flotar en el Citosol llevando la producción de proteínas a sitios predestinados o pueden trabajar adheridos a las membranas del Retículo Endoplásmico o del Núcleo.
Los Ribosomas tienen una actividad enzimática (Ribozimas) que parece remanente de épocas biológicas previas al ADN. En eucariotas dichas estructuras suman 80 Sv y se componen de una subunidad de 40Sv y otra de 60 Sv.
Es importante recordar que las unidades Svedberg (Sv) representan el nivel de sedimentación de partículas sometidas a ultra-centrífugación, Las Unidades Sv no pueden sumarse. De hecho la suma de las subunidades Ribosomales debería dar 100 pero el Ribosoma tiene 80 unidades Sv. Lo mismo ocurre con el tamaño de las subunidades del Proteosoma u otras organelas expresadas en unidades Sv.
La Síntesis Proteica comienza en el Codon de Iniciación cerca del terminal 5’ del RNA, con la adherencia de la subunidad pequeña rRNA 40S y el complejo iniciador queda completo cuando Metionina-tRNA ubica el codon AUG en el mRNA. Dicho complejo recluta ahora la unidad grande rRNA 60S que tiene tres sitios de unión conocidos como “A”, “P” y “E”. Mediante el sitio P se ubica sobre la Metionina y desde el sitio A convoca al siguiente AA-tRNA. Una vez que el AA-tRNA entrante ubica el codon vecino al codon AUG se produce la unión peptídica entre Metionina y el AA
entrante. Luego el sitio E convoca una Metionina para regenerar un Met-tRNA y liberarlo, el sitio P se traslada al AA de reciente ingreso y queda libre el siguiente triplete o codon para un nuevo AA-tRNA. De esta manera se va construyendo la proteína y cuando el Ribosoma llega al codon stop el proceso termina con la liberación de su producto terminado. Cada Ribosoma termina su tarea con la producción de su proteína.
Factores Eucarioticos de Iniciación y la Síntesis Proteica
Los Factores Eucarióticos de Iniciación (eIF) son proteínas que intervienen en la traducción del mRNA a proteínas. Los elFs participan en diversos procesos: formación del complejo de iniciación con 5’mRNA y complejo con MetioninatRNA, búsqueda del codon de iniciación en la hebra de mRNA, ubicaión del sitio de unión entre el tRNA y el AUG (codon de iniciación) ligado de la subunidad 60S para crear la subunidad 80S.
eIF4 (eIF4F)
Se han descrito varias proteínas elF y cada una de ellas, de manera individual o integradas en complejos, participa de la traducción del mRNA a proteínas a nivel del Ribosoma. elF4G es una proteína estructural que participa del complejo elF4F.
elF4A es una helicasa de RNA que contribuye a resolver problemas de estructura secundaria en el RNA. elF4E se une al 5’cap del mRNA al inicio de la transcripción.
elF4B tiene dos dominios de unión al RNA uno para mRNA y otro para la porción 18S de la subunidad ribosomal pequeña. elF2 es una proteína ligante de GTP que tiene afinidad específica hacia Met-tRNA iniciador: es responsable de atraerlo hacia el sitio P del complejo pre-iniciador. Una vez ubicada el Met-tRNA sobre el codon AUG elF2 promueve la hidrólisis de GTP a GDP y se disocia del ribosoma. Dicha señal permite también la disociación de elF3, elF1 y elF1A facilitando así la unión de la subunidad grande al complejo ribosomal.
Ciertas kinasas abocadas a la regulación de la síntesis proteica fosforilan eIF-2/GDP y así bloquean la regeneración de eIF-2/GTP. Cuando eIF-2/GDP está fosforilado sufre un cambio conformacional que impide su interacción con eIF-2B y por eso no puede cambiar GDP por GTP.
Conclusión: la fosforilación de eIF-2/GDP bloquea la síntesis de Ribosomas y esto bloquea la Síntesis Proteica.
Islas Citosina-Fosfato-Guanina (CpG)
CpG significa Cistosín-Nucleótido seguido Guanidin-Nucleótido y la “p” señala al grupo fosfato que permite dicha unión. Se escribe así para no confundir con la interacción entre bases (CG) de hebras complementarias.
En muchos organismos eucarióticos las Citosinas de los dinucleótidos CpG son Metiladas a 5-metilcitosina, mediante DNA-Metiltransferasas. De hecho en mamíferos esto ocurre con el 70% a 80% de las Citosinas de los CpG dinucleótidos.
La gran vulnerabilidad mutacional de las metilcitosinas explica que en una hebra de DNA humano la secuencia CpG se reduzca al 1%. Sin embargo hay regiones del DNA donde la concentración de CpG llega al 4 a 6%, un 60% más alta respecto del resto del genoma (1%). A estas zonas del DNA ricas en CpG se les denomina “Islas CpG”.
Muchos genes de mamíferos tienen Islas CpG asociadas al Codon de Iniciación.
Este incremento en la concentración de CpG podría estar relacionado con un decremento en la actividad de metilación de Citosinas.
Las Islas CpG son regiones genómicas que contienen alta frecuencia de CpG dinucleótidos, típicamente 300 a 3000 pb de largo. Estas se encuentran dentro o cercanas al 70% de los Promoters humanos.
Acorde con un extenso estudio sobre las secuencias completas de los cromosomas 21 y 22, las regiones del DNA de más de 500 pb que contengan >55% de CpG son probablemente Islas CpG asociadas a las regiones 5’ de los genes.
Cuando la expresión genética está activada los dinucleótidos CpG de las Islas CpG asociadas a Promoters No aparecen metilados.
Las secuencias CpG que ocurren dentro de la región codificante Si pueden estar metiladas.
Aparentemente hay diversos tipos de Islas CpG
Las Islas con multicopias de CpG metiladas se localizan frecuentemente cercanas a los extremos teloméricos, como ocurre asimismo con los tramos CpG no islas, que también se encuentran fuertemente metilados.
Aparentemente la metilación desempeña algún rol en la preservación de la integridad cromosomal. De hecho se ha observado que la ADN metiltransferasa es esencial para la establidad genómica.
Uno de los aspectos más intrigantes respecto de los aspectos funcionales de los estados epigenéticos de las islas CpG es el control de la expresión de dominios.
Como ejemplos valen: 1) la estrecha aposición de las islas CpG sobre los genes imprinted (marcados) y 2) la concentración de las singulares islas CpG no metiladas en los promotores del 50-60% de todos los genes humanos.
Todo esto indicaría que la protección contra la metilación de novo probablemente haya involucrado selección funcional basada en patrones de expresión genética. La resistencia a la metilación de novo de muchas de las singulares Islas CpG recuerda cómo previenen los “insulators” el acceso de los Silencers a los Promoters. Muchas Islas CpG interactúan con la proteína Zinc Finger CTCF organizadora de las funciones “insulator”.
Una visión alternativa al rol del las Islas No metiladas o diferencialmente metiladas invoca la protección contra Silencers y Enhancers como contribución a la regulación transcripcional.
Islas CpG en Cáncer
Estas Islas CpG parecen ser muy inestables en cáncer y esto crea mosaicismo epigenético.
Las Islas CpG que normalmente están NO metiladas, con frecuencia aparecen metiladas en cáncer y silencian genes aledaños a las mismas. Pero también puede ocurrir a la inversa y la des-metilación de islas CpG puede activar genes de manera no programada.
Resumiendo conceptos sobre Islas CpG
En los últimos tiempos se han distinguido diversos tipos o grupos de Islas CpG caracterizables en función de su localización genómica y status epigenético.
Es claro además que el satus de metilación del genoma es algo bastante dinámico que se recompone en función de diferentes estadios durante el desarrollo y en el curso de la transformación maligna.
Insulators
Hemos dicho que enhancers y silencers representan sitios de anclaje para Factores Transcripcionales que activan o reprimen genes ubicados a miles de pares de bases del gen “target” (blanco u objetivo). Esto implica el riesgo de activación o represión de otros genes ubicados en las inmediaciones. Para prevenir estos errores biológicos la vida diseñó los “Insulators”. Los límites entre regiones de ADN
funcional se encuentran demarcados por “secuencias especializadas de cromatina” (SCS) de 42 pb a 2 Kb de largo.
Los experimentos de clonación en eucariotas suelen resultar en cierto grado de variabilidad en la expresión genética. Esto se debe a la naturaleza azarosa de las inserciones genéticas: el nuevo gen puede quedar instalado en regiones de cromatina abierta (activa) o cerrada (inactiva) y en función de esto expresarse o no.
Cuando el gen a insertar está delimitado por “insulators” el efecto posicional queda neutralizado y puede expresarse con independencia de su ubicación. Los insulators facilitan el des-empaquetamiento de la cromatina en el sitio del injerto y el acceso de los Factores Transcripcionales a promoters y enhancers del gen.
En definitiva, los insulators contribuyen a mantener la independencia de cada sitio funcional y evitan interferencias con genes aledaños.
Todos los insulators se caracterizan por tener secuencias CCCTC y a las proteínas afines a la misma se les llama CTCF por “Factores de Unión a CTC”. Las proteínas CTCF tienen 11 dominios “Zinc Finger” y bloquean la activación del gen.
Modelo Tridimensional de Regulación Genética
Recientes hallazgos sugieren que el modelo linear de expresión genética debería ser reemplazado por un modelo tridimensional. Acorde con estas ideas elementos regulatorios distales pueden interactuar físicamente en sentido positivo (cis) o negativo (trans) con los genes que se encuentran bajo su control. Lo más sorprendente es que elementos regulatorios ubicados en un cromosoma pueden regular de manera directa genes localizados en otro cromosoma. Esto explica la presentación preferencial de ciertas traslocaciones cromosomales en ciertos cánceres.
¿Cuales serían los factores a cargo de la organización nuclear y las interacciones de largo alcance? Un candidato potencial parece ser el CTCF, un factor transcripcional de expresión ubicua, que tiene múltiples funciones dependientes de contexto. CTCF puede actuar como proteína bloqueadora de enhancers, puede unirse a elementos aledaños de un gen activado e intervenir como factor transcripcional activador o silenciador. CTCF puede funcionar como organizador del genoma, puede regular la expresión genética mediante inducción de plegamientos cromosomales de largo alcance.
Un ejemplo paradigmático es el caso del gen Insulin-Like-Growth-Factor-2 (IGF2) que posee una secuencia insulator entre el enhancer y el promoter tanto en el gen de origen paterno como materno. Las secuencias ricas en Citosina son neutralizables por metilación, los CTCF no pueden actuar y el
gen resulta activado por el enhancer. En este caso el gen IGF2 del padre es neutralizable por metilación pero el de la madre no y como resultado solamente puede expresarse el gen IGF2 paterno.
Genes con Expresión Monoalélica
En Cromosomas somáticos los genes se activan de manera simultánea en ambos locus parentales y el producto resultante es expresión de ese balance. Sin embargo en tejidos somáticos diploides existe un creciente registro de genes caracterizados por expresión monoalélica. Entre estos están incluidos los genes del Cromosoma X inactivo (Barr), los Imprinted (marcados), ciertos genes que codifican factores linfoides específicos y subunidades de receptores olfatorios y los genes de los receptores T y B (Ig).
En el caso de los genes de receptores B y receptores T la expresión debe ser monoalélica, porque en cada célula los receptores antigénicos deben ser monoespecíficos. Si se expresaran los dos alelos de cadena pesada y cuatro alelos de cadena liviana, los linfocitos producirían receptores de especificidad diversa y no podrían producirse anticuerpos monoclonales. Por eso en cada linfocito los receptores resultan del rearreglo de sólo un locus de cadena pesada y solo un locus de cadena liviana.
Imprinting Genómico
Este fenómeno fue originalmente descrito en el insecto Pseudococcus Nipae: en las hembras todos los cromosomas son activos mientras que en los machos, a partir de la sexta división celular solo permanece activa la mitad de sus pares cromosómicos. De esta manera, funcionalmente la hembra es diploide y el macho es haploide.
Este fenómeno, que se denominó “imprinting genómico”, aparece en mamíferos como inequidad funcional entre dos alelos (copias) parentales.
En las células somáticas de los organismos diploides cada gen autonómico se encuentra representado por dos copias o alelos, cada una de ellas heredada de uno de sus progenitores. En el 99% de los casos se expresan ambos genes de manera simultánea, pero una pequeña proporción (<1%) de
estos genes recibe la marca del silenciamiento (imprinting) y en estos casos sólo uno de ellos se expresa.
Un ejemplo paradigmático es el caso del Insulin-like growth factor 2 (IGF2/Ihf2) que solo se expresa funcionalmente en el alelo de origen paterno.
De alguna manera el fenómeno del Imprinting garantiza la inviabilidad de la Partenogénesis en Mamíferos, es decir que garantiza el requerimiento de gametos femeninos y masculinos para la preservación de la descendencia e integridad de la especie. En mamíferos no existen casos de partenogénesis gracias al fenómeno del imprinting.
El imprinting es un proceso dinámico porque en cada generación es posible borrar y re-establecer el imprint. Se trata de un fenómeno “epigenético” porque afecta la estructura pero no la secuencia del DNA. En las células germinales el imprint es borrado y luego regenerado, acorde con el sexo del portador. El imprinting se re-establece en el óvulo o en el espermatozoide y se instrumenta mediante metilación del DNA y modificación de las histonas.
Su transmisión como agregados de genes imprinted, les permite compartir elementos reguladores como RNAs no codificantes, regiones diferencialmente metiladas (DMRs) y regiones controladoras del imprinting.
Las DMRs corresponden a regiones ricas en nucleótidos de Citosina y Guanina, donde las Citosinas aparecen Metiladas en una de las copias y en la otra no.
Contrariamente a lo que se habría esperado en este caso la Metilación no necesariamente significa silenciamiento.
La mayoría de los genes imprinted en mamíferos desempeña roles en el control del crecimiento y desarrollo embriogénico, pero hay algunos que intervienen en etapas postnatales de desarrollo.
Enfermedades humanas relacionadas con el fenómeno del Imprinting
Las leyes de Mendel establecen que ambos alelos se expresan por igual y brindan una expresión balanceada de genes paternos y maternos. Pero los locus genéticos sometidos a imprinting no respetan las leyes mendelianas.
Varios Síndromes y Enfermedades Humanas se originan en vulnerabilidades propias de los locus sometidos a imprinting: Enfermedad Trofoblástica Gestacional, Teratomas, Síndrome de Beckwith-Wiedemann, Síndrome de Prader-Willi, Síndrome de Agelman, Síndrome de Silver-Russell, Diabetes
Neonatal Transitoria, Déficit Socio-Cognitivos del Síndrome de Turner y Múltiples Neoplasias.
En condiciones normales los locus con genes marcados (imprinted) tienen carga genética haploide, porque sólo expresan uno de los dos alelos. La preservación de los locus sometidos a imprinting es crítica para la vida.
La carencia de varios genes no marcados en el Cromosoma 15 paterno provoca Síndrome de Prader-Willi y la carencia de un gen no marcado en el Cr 15 materno ocasiona Síndrome de Angelman.
El fracaso del imprinting en células somáticas puede tener implicancias oncogénicas. En el Tumor de Wilms y muchos casos de Cáncer de Colon están presentes ambas copias de Igf2, cuando en realidad debería estar expresada sólo la copia paterna.
Factores Transcripcionales
Básicos
Los Factores Transcripcionales (FT) son estructuras multiproteicas que promueven la unión al DNA de la RNA Polimerasa (RNA Poly) y la aproximan al Sitio de Iniciación de la Transcripción. Sin FT las células no podrían regular con eficiencia la velocidad de la expresión genética.
La unión del factor transcripcional TBP al TATA-box provoca una fuerte distorsión morfológica sobre el DNA que facilita la apertura de sus hebras. Las secuencias sucesivas de los pares de Adenina-Timina son menos estables que otras secuencias de nucleótidos. La separación de las hebras expone las regiones codificantes y las hace accesibles a las RNA Polimerasas.
En eucariotas la proteína TBP integra un complejo multiproteico llamado TFII-D que significa: Factor Trtanscripcional D para la RNA Poly II. En el TFII-D, además de la TBP intervienen otros factores que ayudan a estabilizar el ensamble con el ADN.
Cuatro factores promueven la unión de la RNA Poly II al Promoter: TFII-B,-F,-E y -H (en ese órden). Dado que cada uno de estos FT resulta del ensamble de diversos polipéptidos individuales, se estima que el complejo en su conjunto abarca no menos de 25 proteínas interactivas y críticas para el éxito del proceso transcripcional.
Una vez ubicada en el Sitio de Iniciación la RNA Poly debe comenzar su tarea transcripcional y para ello debe liberarse del complejo de FTs. Esto se logra mediante cooperación entre los FTII-E y H que fosforilan e inducen el cambio conformacional que requiere la RNA Poly para liberarse del mencionado complejo.
Al conjunto de FT vinculados al TATA box se les conoce como FT básicos, porque son los que ubican a la RNA Poly sobre el Sitio de Iniciación y son utilizados por casi todos los genes.
Específicos
Los FT básicos arriba descritos son imprescindibles para que se inicie la transcripción pero no determinan el ritmo transcripcional.
Cada gen debe ser transcripto acorde con las exigencias vitales de cada célula. Los genes que codifican Hemoglobina están sometidos a ritmos de expresión mucho más veloces que los genes que codifican proteínas de menor requerimiento funcional.
Para marcar la velocidad con que debe transcribirse cada gen en particular en cada momento de la vida de una célula se necesitan Factores Genéticos Específicos.
Las Hormonas no son FT en sí mismas pero forman complejos con receptores y luego se unen al DNA para modificar el ritmo transcripcional de genes específicos.
Ciertos Factores de Crecimiento y determinadas proteínas pueden ejercer también efectos similares.
Cada gen o grupo de genes está sujeto a delicados sistemas de controles transcripcionales articulados por varias docenas de factores específicos.
Activadores y Represores
Algunos Factores Reguladores (FR) de la expresión Genética son Activadores y otros son Represores. Los Activadores se ligan a secuencias de DNA llamadas Enhancers y los Represores a Sitios Silenciadores.
Dado que Enhancers y Silencers están ubicados en la misma hebra de DNA que el gen bajo su control, se dice que son elementos “Cis”, porque están del mismo “lado” (latín). Los factores que se unen a dichas secuencias se llaman “Trans” porque provienen de otros lugares del genoma.
Muchos Factores Específicos se unen al Promoter fuera del TATA box pero cercano al Sitio de Iniciación. Otros lo hacen dentro del gen mismo o también a cientos o miles de pb del mismo en dirección 5’ o 3’. A pesar de esto, como el DNA es una estructura super-enroscada a la manera de un cable telefónico, dichas secuencias quedan ubicadas físicamente muy cerca del promoter.
Los Factores Específicos pueden alterar la velocidad de unión entre el promoter y los factores básicos o perturbar la velocidad de liberación de la RNA Poly del complejo transcripcional (acelerando o frenando).
Algunos factores pueden alterar físicamente la estructura del DNA facilitando o no el acceso de ciertos FT al DNA. Ya hemos mencionado que el DNA está enroscado y super-enroscado alrededor de núcleos de histonas. Este ordenamiento conspira contra la expresión genética. Ciertos FT pueden influir de manera directa relajando la estructura del DNA facilitando el ingreso de factores específicos de genes.
FT y Dominios de Unión al DNA
La estructura del DNA es bastante simple y brinda pocas alternativas de interacción con dominios peptídicos. Por eso, a pesar de la gran diversidad de FT existentes, sus dominios de unión al DNA se limitan a un pequeño racimo de variables morfológicas.
Helix-turn-helix motif
Este dominio o motivo se compone de una corta sección alfa hélice (similar a un resorte), un asa de aminoácidos lineares y otra alfa hélice. La primer hélice se adapta al surco mayor de la doble hélice del DNA. Las cadenas laterales de los AA toman contacto con las partes expuestas de los nucleótidos. La forma y cargas de uno complementa al otro facilitando la unión entre el dominio
HtH y el DNA. Las proteínas homeóticas, que desempeñan tareas críticas para la regulación del desarrollo tanto en moscas como en hombres, utilizan motivos HtH modificados.
Zinc-finger motif
El motivo Zinc Finger es una secuencia de AA que tiene la apariencia de un dedo.
Esta imagen surge de la interacción entre un átomo de Zinc y cuatro AA clave: cuatro Cisteinas o dos Cisteinas y dos Histidinas. En las proteínas que tienen dominios Zinc
Finger el resto de los AA es muy variable. A este grupo pertenecen los esteroides, incluyendo
testosterona y estrógenos, que ejercen profundos efectos en el desarrollo.
Leucine Zipper
Este dominio surge de la interacción entre dos hélices alfa, cada una perteneciente a uno de los dos monómeros que integran este tipo de Factor Transcripcional. Funciona a la manera de una Cremallera o Zipper (en inglés) por las uniones hidrofóbicas que se generan entre las leucinas de cada espiral alfa. Cada vuelta de hélice abarca 3.6 AA y cada 7 AA hay una Leucina. Estas quedan posicionadas una bajo otra, a distancias regulares y enfrentadas entre sí desde cada hélice alfa. La fuerte interacción hidrofóbica Inter.-leucinas así generada atrae ambos monómeros helicoidales a la manera de una cremallera: de aquí surge el nombre Leucine Zipper.
Se trata de un motivo estructural que se encuentra en diversas proteínas reguladoras de la transcripción. myc, fos, jun, AP-1, CREB, and Gcn4. En diversas expresiones oncológicas se han registrado mutaciones o sobre-expresiones de FTs Leucine Zipper.
Basic-helix-loop-helix (bHLH)
Este motivo estructural está compuesto por dos hélices alfa unidas mediante un loop (asa) y tiene aminoácidos básicos que facilitan su unión al DNA. Una de las hélices es más corta y el asa que la une a la más larga le confiere un alto grado de flexibilidad, que facilita su dimerización por plegado y empaquetamiento contra la otra hélice. La hélice larga posee los AA básicos que promueven su unión a secuencias consenso CACGTG (E-box).
Ejemplos: C-Myc, Myo D, HIF y BMAL1-Clock. Muchos de los Factores Transcripcionales bHLH son heterodiméricos lo cual abre una amplio rango de combinaciones posibles y constituye un importante mecanismo de regulación de la transcripción.
Estos FT suelen ser importantes para el desarrollo y actividad de la célula. El BMAL1-Clock integra el núcleo del complejo transcripcional que regula el ciclo circadiano. Otros genes bHLH como c-Myc y HIF-1, importantes en metabolismo y crecimiento celular, pueden sufrir mutaciones.
CCAAT / enhancer-binding proteins (C/EBPs)
Otro de los elementos básicos del Promoter es la secuencia CCAAT. El CAT-box se ubica a 50-150 pb en dirección 5’ respecto del SI. Esta secuencia CAT es reconocida por la proteína CCAAT-box/Enhancer Binding Protein (C/EBP). Las C/EBPs comprenden una familia de FTs con homologías estructurales y funcionales. La similitud entre los miembros de la familia C/EBP sugiere una historia evolutiva de duplicaciones genéticas con fuertes presiones inductoras de diversificación. Como resultado surgen estas variaciones en especificidad por tejidos y capacidad de transactivación.
Desde que fuera clonado el primer miembro de esta familia hace ya una década, han sido descritos cinco miembros más. Estas proteínas interactúan entre sí y con miembros de otras familias de FT para regular la transcripción del ARN mensajero. En trabajos recientes sobre animales transgénicos se confirmó la importancia de la familia C/EBP para el desarrollo del tejido normal, la proliferación
celular y la diferenciación funcional. Como muchos otros FTs estos también tienen un dominio de activación, una región básica de unión al ADN y un dominio de dimerización rico en leucinas (Leucine Zipper).
El concepto Antisense como estrategia farmacológica
Desde hace casi 30 años se trabaja en el desarrollo de ácidos nucleicos de secuencias complementarias antisense para silenciar la expresión de DNA. La propia naturaleza emplea estrategias antisense para regular genes. Ya han sido diseñados antisense (cortas hebras de DNA o RNA) como terapéutica para la enfermedad de Chron, algunos virus y ciertas enfermedades hematológicas. Hay dos maneras de detener la expresión genética: a nivel transcripcional y a nivel traduccional. En el primer caso la idea es diseñar un antisense que pueda actuar sobre un corto tramo de DNA creando un segmento de triple hélice sobre un gen o sobre sus elementos DNA control. De esta manera quedaría bloqueada la lectura del código genético. En el segundo caso la hebra antisense podría hibridizar con un mRNA específico trabando su lectura a nivel ribosomal.
Para que estos segmentos de DNA antisense puedan funcionar es necesario que tengan una vida media prolongada y esto implica protegerlos de la acción de ciertas enzimas nucleofílicas. Una manera de hacerlos más resistentes a enzimas es la instalación de puentes fosfotioato entre las bases (puentes de sulfuro). Con esta modificación es posible prolongar su vida media de horas a varios días.
Por otra parte, los radicales fosfato confieren a los ácidos nucleicos alta carga negativa. Esto implica pobre solubilidad en lípidos y dificultad para atravesar la doble capa fosfolipídica de la membrana. Sin embargo es posible superar este obstáculo mediante encapsulación lipídica (liposomas).
Remodelación de la Cromatina y expresión Genética
La Cromatina del Núcleo Eucariotico resulta de ensambles dinámicos entre DNA genómico e Histonas u otras Proteínas Cromosomales (No-Histonas).
El empaquetamiento de los complejos DNA-Proteínas presenta un rango jerárquico que va desde Nucleosomas y Fibras de Cromatina de 30 nm hasta la compactación cromosomal en Metafase.
En la Cromatina de Interfase se distinguen áreas más oscuras de DNA compacto o Heterocromatina y áreas más claras de DNA laxo o Eucromatina.
Hay dos tipos de Heterocromatina: Constitutiva y Facultativa
La versión Constitutiva permanece siempre compacta, tiene DNA no genómico, incluye DNA telomérico y centromérico y algunas otras regiones cromosomales. Por ejemplo, en la mayor parte del cromosoma Y se registra Heterocromatina Constitutiva.
La variante Facultativa resulta de inactivación de genes y compactación transitoria de Cromatina en el curso del ciclo celular de ciertas células.
Se entiende por Eucromatina regiones menos compactas del DNA cromosomal con genes en actividad y fácil acceso de factores transcripcionales. En la Eucromatina el DNA está anclado a la matriz nuclear mediante secuencias de DNA ricas en Adenina y Timina, llamadas SAR por Scaffold Attachment Regions. Entre los SAR se ven dominios estructurales conformados por rulos de cromatina de 30 nm y 40 a 120 Kb de largo. Estas regiones parecen coincidir con regiones de expresión genética. La DNAasa-I es utilizada como marcador de expresión genética activa porque requiere de unión al DNA para ejercer su actividad enzimática y no puede acceder a las regiones silentes típicas del DNA compacto. Los dominios estructurales arriba mencionados son sensibles a DNAasa-I pero no siempre contienen genes en actividad. No obstante, en general, las regiones sensibles a la DNAasa-I suelen coincidir con genes en actividad. También se encuentran Sitios de Hipersensibilidad a la DNAasa-I (SHA) corriente arriba de cada gen y es a este nivel donde se ensamblan los Complejos Iniciadores de la Transcripción (CIT). Los SHA marcan el sitio de
ensamble de CIT sólo cuando un gen ha sido activado. Los genes son activados o desactivados mediante apertura o cierre del nucleosoma al ingreso de complejos transcripcionales.
Los Nucleosomas representan la unidad básica de empaquetamiento de complejos entre DNA e Histonas u otras proteínas cromosomales.
Las Histonas se encuentran únicamente en eucariotas, tienen alta proporción de aminoácidos con carga positiva (lisinas y argininas) y gran afinidad por el DNA que es de carga negativa. Las Histonas rara vez se disocian del DNA y por eso ejercen gran influencia en las reacciones que se producen a nivel cromosomal. Se reconocen histonas nucleosomales y no nucleosomales.
Las Histonas nucleosomales son pequeñas proteínas de 102-135 AA responsables de enroscar el DNA en unidades de empaquetamiento llamadas “nucleosomas”.
El nucleosoma es una pequeña partícula octamérica de 11 nm compuesta de dos copias de cada tipo de histona nucleosomal: H2A, H2B, H3 y H4. La doble hélice de DNA se enrosca 1.65 veces en cada nucleosoma, pero no todo el DNA se encuentra enroscado de la misma manera. Los nucleosomas son a su vez empaquetados en súper-estructuras muy regulares ordenadas por Histonas H1.
Diversos cambios estructurales y funcionales de la cromatina dependen de procesos de acetilación, metilación, fosforilación o ubicuitinización de histonas.
Una de las reacciones mejor estudiadas es la acetilación sobre residuos Lisina en las colas aminoterminales que protuyen de los octámeros de Histonas. La acetilación reduce la afinidad Histonas-DNA y disminuye la interacción entre nucleosomas individuales. De esta manera la estructura del Nucleosoma se relaja y permite el acceso de Factores Transcripcionales y otras Proteínas afines al DNA.
Sólo se registra acetilación de Histonas en regiones transcripcionalmente activas (Eucromatina). Las Histona-Acetil-Transferasas (HAT) fueron identificadas en 1997. La proteína eucariota p300/CBP es una HAT que desempeña un rol bien definido en la activación de diversos genes. Las HAT actúan en complejos multiproteicos específicos para diferentes Histonas y pueden también acetilar ciertos
factores transcripcionales.
Pero además las colas de Histonas presentan sitios de unión para metilos, fosfatos y ubicuitina, moléculas que también pueden modificar la estructura de la cromatina.
La formación de cromosomas durante la metafase parece resultar de fosforilación de H3 y Linker de histonas.
En general la metilación de residuos Lisina suele provocar efectos inhibitorios de la transcripción, como ocurre con la desfuncionalización de uno de los Cromosomas X en la mujer. Sin embargo las metilaciones sobre el aminoterminal de H3 puede provocar apertura (Lisina-4) o cierre (Lisina-9) de la estructura de cromatina.
La ubicuitinización de Histonas, como ocurre con la H2B interviene en la regulación del ciclo celular. Como hemos visto en el capítulo sobre Ciclo Celular, los procesos de Ubicuitinización suelen tener efectos agonistas salvo cuando conducen a lisis proteosomal.
Este amplio rango de modificaciones estructurales y funcionales sobre Octámeros de Histonas, permite componer un verdadero “Código de Histonas”. Este funciona a la manera de un conmutador telefónico, activando o desactivando grupos de genes, acorde con las necesidades y momentos evolutivos de la Célula.
Los Nucleosomas sufren también modificaciones no covalentes que provocan Remodelación o Reposicionamiento del Nucleosoma dentro de una corta región del genoma. Esto implica cambios estructurales que facilitan el acceso de proteínas transcripcionales a los sitios de unión al DNA, duplicación del tamaño del nucleosoma e incremento en la sensibilidad a la DNAasa del DNA asociado.
También puede desplazarse el Nucleosoma a lo largo del DNA o bien ser Transferido a una región cercana dentro de la misma molécula de DNA. Las proteínas de Remodelación integran grandes complejos proteicos.
El complejo Swi/Snf abarca 11 proteínas pero ninguna de ellas tiene afinidad por el DNA, por consiguiente debe ser reclutado al núcleo por otras proteínas.
Dado que se han registrado interacciones HAT/Swi/Snf es probable que algunas de estas remodelaciones ocurran en el contexto de acetilación de Histonas. Probablemente Swi/Snf haría blanco sobre grupos muy limitados de genes.
Silenciamiento del Genoma
El Silenciamiento genético es tan importante como la Activación. Una de las maneras de lograrlo es mediante la des-acetilación de lisinas en las colas amino-terminales de Histonas. Pero también la Metilación del ADN reprime la expresión genética.
La relación entre Histona Des-Acetilasas (HDAC) y silenciamiento
genético, fue descubierta en 1996. También las HDAC integran complejos multiproteicos.
Las HDAC suelen asociarse a la proteína Retinoblastoma y se encargan de inhibir la expresión de varios genes necesarios para la proliferación celular. De hecho las mutaciones que afectan a RbAp46 Y RbA48 promueven la transformación neoplásica. Hay complejos con actividad HDAC, como Sin3 y NuRD, que se unen al ADN metilado.
Las ADN-metiltransferasas pueden modificar el ADN mediante la transformación de Citosinas en Metil-Citosinas. En vertebrados la metilación de Citosinas del Genoma llega al 10 %. Hay dos tipos de metilación: de novo y de mantenimiento.
La metilación de mantenimiento asegura que las dos moléculas hijas del ADN puedan retener el mismo patrón de metilación que la molécula progenitora. Esto quiere decir que la metilasa de mantenimiento sólo puede metilar la secuencia citosina-guanina en la hebra hija, cuando la hebra progenitora tiene guanina-citosina metilada. La metilasa de mantenimiento permanece indiferente si en la hebra progenitora no hay citosina metilada.
La metilación de novo agrega metilos en posiciones totalmente nuevas provocando cambios de metilación en regiones localizadas del genoma. La metilación resulta en represión de la actividad genética.
Los genes en actividad se ubican en regiones no metiladas.
Micro-RNAs o miRNAs
Hace quince años Lee et al descubrieron un gen (lin-4) codificante de una pequeña secuencia de RNA de doble cadena, que podía reprimir la traducción a nucleoproteína del mRNA lin-14.
Era la primera vez que se registraba un fenómeno semejante: un gen codificaba un pequeño fragmento de RNA de doble cadena, cuya función era reprimir la actividad del producto mRNA de otro gen.
Siete años después se describía el segundo gen de este tipo y a comienzos del 2008, se calculaba que en una célula de mamífero podrían llegar a encontrarse hasta 50000 genes codificantes de miRNA.
Estos productos genéticos recibieron el nombre de microRNAs (miRNA) porque su tamaño oscila entre 21 y 23 nucléotidos de largo. Se trata de estructuras de RNA de doble cadena, codificadas por secuencias de DNA (genes) que no transcriben mRNA y por consiguiente no traducen a proteínas. En lugar de esto, dichos genes transcriben microRNA primario (pri-miRNA), este material es luego
transformado en pre-miRNA y finalmente en miRNA.
Los miRNAs maduros son moléculas parcialmente complementarias a una o más moléculas de mRNA y su tarea principal es modular o reprimir la expresión genética a nivel postranscripcional. Los miRNAs adoptan la forma de un “broche de pelo” o “hairpin” que resulta del plegado sobre sí misma de una hebra de RNA.
Se dice que el DNA de simple cadena adopta forma de hairpin cuando dos secuencias palindrómicas se aparean entre sí. Lo mismo ocurre con los miRNAs.
Los genes que codifican el transcripto original (pri-miRNA) son mucho más largos que el miRNA maduro. El pri-miRNA tiene 5’cap y 3’polyA y es convertido a pre-miRNA, una estructura RNA de 70 nucleótidos de largo. Esta transformación tiene lugar en el núcleo y es llevada a cabo por un “Complejo Microprocesador” integrado por una nucleasa (Drosha) y una proteína ligante de RNA de doble cadena (Pasha). Todo esto tiene lugar en el núcleo.
---C G---
C G
T A
G C
C G
X X
X X
X X
X
El pre-miRNA pasa entonces al citoplasma y es allí transformado en miRNA (maduro) por una endonucleasa (Dicer) y este inicia la formación del complejo silenciador inducido por RNA (RISC).
Un dato interesante es que los miRNA pueden surgir tanto de hebras sense como antisense como de intrones.
El pre-miRNA es cortado por la endonucleasa Dicer y esto separa la doble cadena del pre-miRNA en dos pequeñas hebras separadas entre sí. Solo una de ellas, la “hebra guía”, es seleccionada por una RNAsa del RISC llamada “argonauta” y pasa a integrar dicho complejo. La otra hebra llamada “pasajera” es degradada por RISC.
Una vez integrada al RISC la hebra guía se une por complementariedad de bases con su mRNA específico y este es degradado por las mencionadas RNAsas (argonautas) del RISC.
Los miRNAs intervienen en regulación de la expresión genética a nivel postranscripcional y para este propósito el miRNA debe tener complementaridad de bases con uno o más mRNAs. Los miRNAs de los animales suelen ser complementarios con un sitio de 3’UTR. Recordemos que UTR significa región no traducible de DNA. La formación de mRNA de doble hélice con miRNA induce por lo general su degradación. También puede bloquear la traducción a proteínas del mRNA sin provocar su degradación.
Los miRNAs pueden también inducir activación por unión a promoters. A este fenómeno se lo ha denominado activación genética por RNA de pequeño tamaño.
La actividad de los miRNAs puede ser bloqueada mediante Morfolino oligo o 2’-O-Metil RNA oligo. Pueden bloquearse pasos madurativos de miRNAs o directamente su interacción con sus mRNAs. Obviamente esto representa todo un campo para la farmacología moderna.
Obviamente el tema de los miRNAs tanto en diagnóstico como tratamiento es de interés en todos los campos de la biología: plantas, animales y humanos.
Hasta el momento se han descrito en humanos más de 200 microRNAs con funciones regulatorias insuficientemente estudiadas. Sin embargo ya se ha demostrado que un cluster de microRNAs, el policistron mir-17-92, suele estar significativamente amplificado en Linfomas No Hodgkin B humanos y Leucemias Agudas de estirpe linfoide.
Los miRNAs regulan diversos procesos biológicos, incluyendo desarrollo y crecimiento celular, apoptosis y hematopoyesis.
En Leucemias Agudas de estirpe linfoide se encontraron aumentados los niveles de expresión de miR-331 y miR-128b. El miR-331 provoca la degradación o inhibición del mRNA de SOCS1 que es inhibidor de STAT, un conocido mediador de proliferación y sobrevida celular. Ergo la sobre-producción de miR-331 deja sin regulación al STAT y esto genera activación de la proliferación celular. En pacientes con Leucemia Linfocítica Crónica seha demostrado también sobre regulación en la producción de miRNAs: miR-331, miR-29a, miR-195, miR-34a y miR-29c.
LITERATURA SUGERIDA
- Alberts B, Johnson A, Lewis J, Raff M, Roberts K, Walter P. 2002. Molecular Biology of The Cell. Forth Edition.
- Watson JD, Baker TA, Bell SP, Gann A, Levine M, Losick R. 2003. Molecular Biology of the Gene. Fifht Edition.
- Brown TA, 2002. Genomes, Second Edition. BIOS Scientific Publishers Ltd.
- Benz EJ, Wagner A, Berliner N. 2005. Anatomy and Physiology of the Gene. In Hematology, Basic Principles and Practice, Hoffman R, Benz EJ, Shattil SJ, Furie B, Cohen HJ, Silberstein LE, McGlave P. Fourth Edition.
- Lekstrom-Himes J and Xanthopoulos KG. Oct 1998. Minireviw. Biological Role of the CCAAT/Enhancer-Binding Protein Family of Transcription Factors. J Biol Chem Vol 273, (44) 28545-28548. Imprinting
- Kierszenbaum AL. Nov.2002. Genomic imprinting and epigenetic reprogramming: unearthing the garden of forking paths. Mol Reprod Dev, 63 (3): 329-34.
- Ohlson R and Kanduri C. 2002. New Twists on the Epigenetics of CpG Islands. Genome Res Vol 12 (4) 525-526.
- Slagboom PE, Meulenbelt I. 2002. Organisation of the human genome and our tools for identifying disease genes. Biological Psychology 61, 11-31.
- Crooke ST. 1998. An overview of progess in antisense therapeutics, Antisense Nucelic Acid Drug Dev 8:115.
- Kingston RE and NArlikar GJ. 1999. ATP-dependent remodeling and acetylation as regulators of chromatin fluidity. Genes Dev. 13 (18) 2339-2352.
- Kornberg RD. 2001. The Eucaryotic Gene Transcription Machinery. Biol.Chem. 392, pp 1103-1107.
*capitulo extraído del libro: El Sistema Inmune: Genética, Biología Molecular, Clínica, Farmacología / Autores: Ricardo Antonio Giuliani y Eleno Martínez Aquino - 1a. Ed. - Ciudad Autónoma de Buenos Aires, Argentina.
Eritroferon S.R.L., 2011.
ISBN 978-987-27121-0-5
Ricardo Antonio Giuliani
El gen es la unidad básica de almacenamiento, transmisión y expresión de información biológica. Dicha información se encuentra codificada en secuencias ordenadas de nucleótidos de Acido Desoxiribo Nucleico (DNA). Se trata de unidades estructurales de DNA que codifican Acido Ribo Nucleico (RNA) Ribosomal (rARN), ARN de transferencia (tARN), ARN mensajero (mARN) o Micro RNA (miRNA).
Los genes no son simplemente codificadores de proteínas sino regiones del ADN que producen copias específicas de ARN funcional.
Estructura del DNA
El Acido Desoxiribonucleico (DNA) resulta del encadenado de unidades llamadas nucleótidos, formadas por un azúcar (desoxiribosa) con radicales fosfato en posiciones 5’ y 3’ y una base púrica de doble anillo (Adenina o Guanina) o pirimidínica de anillo simple (Timina o Citosina). Las hebras de ADN se construyen mediante uniones fosfodiester azúcar fosfato (5’-3’) y se asocian en pares complementarios, mediante uniones no covalentes entre bases púricas y pirimidínicas.
En biología a las células carentes de núcleo se les llama Procariotas y a las células que tienen núcleo Eucariotas. En los Procariotas el DNA no se encuentra compartamentalizado en el núcleo como ocurre con los Eucariotas. El genoma de los Procariotas se reparte entre un complejo DNA/Proteína carente de envoltura nuclear (Nucleoide) y estructuras satelitales de DNA (Plásmidos) donde también
se alojan genes importantes.
El polímero de DNA se compone de dos hebras arregladas de manera helicoidal, donde los azúcares desoxiribosa y sus fosfatos se ubican en el exterior y las bases en el interior. La estabilidad termodinámica de la doble hebra helicoidal de DNA depende de fuertes uniones hidrógeno entre bases púricas y pirimidínicas.
Las bases respetan estrictas reglas de apareamiento establecidas por Watson y Crick: Adenina con Timina y Citosina con Guanina. El apareamiento de bases resulta de dos uniones hidrógeno en AT y de tres uniones hidrógeno en GC. La fuerza de la asociación entre ambas hebras resulta en parte de la longitud global del DNA y de la cantidad de pares GC. Las regiones donde se ubican los promotores (promoters) tienen secuencias TATAAT (TATA-Box) de menor atracción interhebra y más fácil separación. Esto facilita el acceso de Factores Transcripcionales al Promotor.
La fuerza de atracción interhebra puede medirse por el calor necesario para vencer las uniones hidrógeno (valor Tm). Cuando todos los pares de bases de una doble hélice de DNA se disocian, ambas hebras quedan separadas en dos moléculas enteramente independientes. Las hebras vuelven a integrarse por complementaridad en doble hélice cuando baja la temperatura. Este es el principio básico utilizado en las técnicas de Polimerase Chain Reaction (PCR).
Secuencias 5’ a 3’ en Hebra de DNA
La estructura de doble hebra complementaria facilita la reparación del ADN, porque la hebra sana sirve de molde para la reconstrucción de la hebra dañada.
La extensa diversidad y complejidad biológica existente pudo ser desarrollada y documentada a partir del alfabeto de cuatro letras del ADN.
Hay algunos virus que solo poseen DNA de hebra simple, pero en general en biología el DNA adopta la conformación doble helicoidal.
¿Porqué Timina en DNA y Uracilo en RNA?
La Timina resulta de la metilación de Uracilo, un proceso energéticamente bastante costoso pero de enorme utilidad biológica, porque la Timina brinda fuerte estabilidad al genoma. Por otra parte, la Citosina está expuesta a rápida desaminación y transformación a Uracilo. Ergo, si el DNA utilizara Uracilo para escribir el código genético, las especies y sus individuos estarían sometidos a un alto grado de mutaciones y la vida sería prácticamente inviable.
Los transcriptos RNA sí pueden aprovechar la economía que ofrece el Uracilo respecto de la Timina, porque a diferencia del DNA, el RNA tiene vida efímera y por consiguiente bajo riesgo de mutagénesis.
Exones, Intrones
Los conceptos Intron y Exon fueron acuñados por Walter Gilbert en 1978, para distinguir las regiones del gen que se expresan (expressed region) de aquellas que no se expresan (intragenic region).
Estas definiciones fueron hechas originalmente para transcriptos codificantes de proteínas, pero luego fueron aplicadas a las secuencias de RNA removibles por splicing desde transcriptos primarios de rRNA y tRNA. También fueron utilizados para aquellas moléculas de RNA que se originan en diferentes regiones del genoma y pueden luego integrarse, mediante “tras-splicing”, en una sola molécula.
Las secuencias codificantes (exones) se encuentran intercaladas con las no codificantes (intrones). En los extremos 5’ y 3’ del gen se ubican secuencias de nucleótidos no traducibles a RNA (UTR).
Las uniones entre intrones y exones repiten cortas secuencias de nucleótidos, que permanecen intactas en cada replicación celular intra e inter-individuos y por eso se dice que permanecen evolutivamente “bien conservadas”. Lo mismo ocurre con los exones que también reproducen inter e intraindividuo secuencias bien conservadas de nucleótidos.
Los intrones en cambio son secuencias pobremente conservadas, de variable longitud y extremos autocomplementarios. Por eso en el proceso de corte de intrones y empalme de exones (splicing) reaccionan conformando anillos de escisión.
Esta característica de los intrones facilita el intercambio de exones y la generación de diversas proteínas a partir de un mismo gen.
Se han encontrado intrones tanto en genes de mARN, tARN y rARN eucariotas como en genes de cloroplastos, mitocondrias y fagos de E. Coli. La única especie que carece de intrones es la Eubacteria. En genes evolutivamente relacionados se observan estructuras similares y preservación de la posición de algunos intrones. Se han descrito genes como el de la Subunidad II de la Citocromo
Oxidasa de la mitocondria de las plantas, que tienen un intron en una especie y carecen de él en otra especie.
La cantidad y tamaño de los intrones varía extensamente: dos genes pueden tener igual extensión pero diferente número y tamaño de intrones. Un caso paradigmático es la DHFR que tiene 6 exones desplegados en 2000 bases pero llega con sus intrones a 31000 bases.
Marco Abierto de Lectura / Open Reading Frame (ORF)
En Biología se entiende por marco de lectura a la secuencia de tres nucleótidos (codon) contiguos y no superponibles, sea en DNA como en RNA. Se denomina marco abierto de lectura u Open Reading Frame (ORF), a las secuencias que pueden transcribirse a RNA primario.
Cualquier “marco de lectura” comienza con un codon de iniciación (metionina) y termina con un codon stop. El Codon Stop se conoce también como “codon non sense” porque no aparece en la proteína resultante. Hay tres versiones de codon stop: TAG, TAA y TGA y estas pasan al transcripto RNA como UAG, UAA y UGA.
La Secuencia Codificante culmina en la concatenación por corte y empalme de exones (splicing) y mRNA traducible a proteínas o polipéptidos.
En Procariotas no hay intrones, por consiguiente las regiones codificantes y ORF coinciden, mientras que en Eucariotas, donde encontramos intrones intercalados con exones, el marco abierto de lectura u ORF incluye a la Secuencia Codificante o secuencia de exones y a los intrones que no codifican péptidos.
DNA no codificante
Los Exones codificantes de proteínas ocupan tan sólo el 1.5 % del total del DNA existente. La mayor parte del Genoma tiene aspecto de “DNA Chatarra” sin embargo es muy probable que en ese DNA no codificante radique gran parte del sistema regulador del genoma.
La presencia de semejante cantidad de DNA no codificante en los genomas eucarióticos y las grandes diferencias de tamaño (“valor C”) entre especies, representa uno de los enigmas más grandes de la biología. El DNA no codificante provee mecanismos para la creación, modificación y recombinación
de genes y probablemente sea importante para controlar el ritmo de la evolución humana.
Sense y Antisense
El DNA tiene arreglo de hebras en antiparalelo y las secuencias de cada hebra son complementarias. Las enzimas leen el DNA en dirección 3’ a 5’. Sólo una de las hebras puede transcribir DNA en mRNA “traducible” a proteína, es decir que solo una de ellas puede tener sentido (“sense”) biológico.
Un transcripto mRNA “sense” es necesariamente complementario de la hebra DNA que le dio origen, por eso a esta ultima se le llama “antisense”.
Dicho en otras palabras, el ARN “traducible” o “sense” será siempre una réplica complementaria de una hebra DNA “antisense”.
Es importante señalar que cualquiera de las dos hebras puede codificar y esto depende de la ubicación del Promoter que es el que determinará cual de las dos será antisense.
La secuencia de la hebra complementaria a la hebra DNA “antisense” recibe el nombre “sense” porque reproduce la secuencia de bases del transcripto RNA “sense”.
Entonces el nombre “antisense” se aplica a la corta hebra de DNA o RNA que resulta “complementaria” a la molécula de mRNA ”sense” capaz de traducir una proteína especifica.
La idea de producir oligodeoxinucleótidos “antisense” que puedan unirse por complementaridad y de esta manera inhibir mRNA “sense” fue propuesta hace casi cincuenta años. El progreso en síntesis automática de DNA hizo posible el desarrollo de hebras RNA-antisense para su uso en regulación, silenciamiento o expresión genética. Estas ideas han alcanzado fases de experimentación clínica
particularmente en el campo oncológico.
Cromosomas
En realidad el término Cromosoma (Cr) no responde a una definición demasiado precisa. De hecho los Plasmidos circulares de los Procariotas son también considerados Cromosomas.
En Eucariotas cada Cr resulta de una molécula singular de DNA enroscada en nucleosomas (NS), que son estructuras proteicas similares a un carretel.
El NS constituye la unidad anatómica de la Cromatina y está formado por un octámero de proteínas básicas, de alta conservación evolutiva, llamadas histonas (H2a, H2b, H3 y H4). Cada NS acepta 1.65 vueltas de DNA y abarca 146 pares de bases (pb). Entre cada nucleosoma hay DNA espaciador con 50 pb.
De esto resulta un extenso rosario de nucleosomas, que se enroscan y superenroscan hasta adquirir el aspecto compacto de bastones, portadores de una estructura medial llamada centrosoma.
Los Cr de Eucariotas se tiñen fuertemente y pueden verse con claridad por microscopía óptica durante la Metafase.
Cromatina
Se entiende por cromatina a la versión no condensada de DNA que resulta del
complejo entre DNA y nucleoproteínas. En forma condensada adquiere el aspecto
de bastones que caracteriza a los cromosomas en Metafase.
La actividad transcripcional confiere a la cromatina un aspecto más laxo que se describe como “Eucromatina”. Por el contrario el silencio transcripcional genera la morfología de compactación llamada “Heterocromatina”.
Cuando la cromatina adquiere la forma clásica de un Cromosoma, la compactación es tal que el DNA resulta inaccesible para transcripción genética. En ese momento los Cr se distinguen fácilmente por microscopía óptica y adquieren el aspecto de cuatro brazos, unidos a nivel del centrómero, a raíz de la división del material nuclear en cromátides hijas. Los brazos cortos se denominan “p” (“petit”) y los largos “q” por la letra que le sigue a la p en el alfabeto latino.
Con frecuencia la activación o el silenciamiento genético se acompaña de relocalización nuclear y esto sugiere que la organización espacial de la cromatina puede ser importante para la regulación de la expresión genética.
Centrómeros
El Centrómero es el sitio que mantiene unidas a las cromátides hijas durante la meiosis y mitosis. Cada Centrómero representa una estructura proteica a la que se pueden ligar microtúbulos. En los Centrómeros se distinguen secuencias repetidas de DNA y una formación multiproteica central llamada Cinetocoro que sirve de anclaje a los microtúbulos durante la Anafase.
Telomeros
Los extremos de los Cr(s) se llaman Telómeros y se caracterizan por secuencias repetitivas de DNA. Dichas formaciones compensan la replicación incompleta del DNA a nivel de los extremos de cada Cr. Las enzimas que duplican el cromosoma y su DNA no pueden llegar hasta los extremos. El Telómero funciona como “amortiguador” descartable: se consume durante la división celular y se recompone mediante una Transcriptasa Reversa llamada “Telomerasa”. Los Telómeros protegen a los Cr(s) de la fusión y rearreglo entre sí. Normalmente las células que consumen sus Telómeros son automáticamente destruidas. En la mayoría de los eucariotas multicelulares la telomerasa solo permanece activa en las células germinales. El acortamiento progresivo de los Telómeros, en el curso de las sucesivas replicaciones celulares, tendría roles tanto en el proceso del envejecimiento como en el desarrollo del cáncer. Los Telómeros de Eucariotas terminan normalmente en proyecciones 3’ DNA de simple cadena. En humanos los Telómeros pueden alcanzar muchos Kilobases de largo y por lo general comprenden ristras sucesivas de 6-8 pb ricas en Guanina. Han sido identificadas diversas proteínas ligantes de estas proyecciones DNA 3’terminales.
Recombinación Genética
Recombinación genética es el proceso de rotura y empalme entre moléculas de DNA o RNA. La recombinación de material genético es un fenómeno habitual durante la meiosis, donde se registra un intercambio entre pares y regiones homólogas de Cromosomas (Cr)s. Por eso es que los hijos tienen Cr(s) con diferente mapeo de alelos genéticos que el de sus progenitores e incluso pueden tener nuevas quimeras alélicas. Las recombinaciones genéticas son instrumentadas por enzimas específicas llamadas “recombinasas”. Entre dichas recombinasas se cuenta con RAD51 que funciona tanto en mitosis como meiosis y DMC1 que es específica para la meiosis. Durante la meiosis se produce entrecruzamiento de información genética entre los pares de cromosomas homólogos heredados de los padres: sitios homólogos entre dos cromátides se mezclan entre sí. Es probable que el proceso de
recombinación comprometa regiones de ADN no codificante, para evitar afectar el material sensible de los exones.
También puede darse la recombinación entre segmentos cromosómicos no homólogos.
El Sistema Inmune Adaptativo utiliza Recombinasas específicas, codificadas por genes RAG1 y RAG2, para recombinación segmentos de cada categoría: Variable, Joint y Diversity. Es precisamente gracias a la recombinación genética que es posible desarrollar el extenso repertorio de reconocimiento inmune que caracteriza al Sistema Inmune Adaptativo.
La industria farmacéutica ha desarrollado numerosos agentes terapéuticos mediante el uso de técnicas de recombinación genética. Muchos de estos productos han pasado a integrar el armamentarium terapéutico moderno en diversas enfermedades humanas.
Genes Superpuestos / Overlapping Genes (OG)
Los genes Superpuestos u “OG” son genes adyacentes que comparten ciertas regiones codificantes por encontrarse parcialmente superpuestas. En otras palabras, un mismo tramo de DNA codifica para porciones de dos proteínas diferentes. Este fenómeno fue originalmente descrito en procariotas, eucariotas, mitocondrias y virus pero existe la posibilidad de encontrarse también en humanos. Para que los OG puedan funcionar la señal de inicio de la transcripción para uno de ellos debe encontrarse
dentro del segundo gen cuyo codon de iniciación debe hallarse corriente arriba. Por otra parte, durante la traducción (RNA), el codon stop del segundo gen debería ser ciego al codon stop del primero de ellos. La lectura en tripletes del código genético admite tres marcos de lectura diferentes y esto resulta particularmente útil en transcriptos de genes superpuestos: en uno de los marcos posibles el ribosoma no registra el codon stop del segundo gen. El fenómeno de superposición de genes
permite producir más proteínas a partir de una misma región de ADN.
Polimerasas
Las enzimas que se utilizan para copiar polímeros de ADN en secuencias complementarias de ARN o ADN reciben el nombre de Polimerasas, tienen especificidad de substrato y sólo pueden leer hebras simples de ADN.
Las enzimas que polimerizan ADN y ARN obedecen también a las reglas de apareamiento de Watson y Crick. Siguiendo este concepto, si usamos una hebra de ADN o ARN como molde, la copia que surgirá respetará el principio de complementaridad.
Por ejemplo, de una hebra de ADN 5’TTAGGC3’ resultará una copia ADN 3’AATCCG5’ o ARN 3’AAUCCG5’ Los extremos 3’ y 5’ de las hebras de ADN Y ARN son químicamente diferentes
y existe polaridad en la secuencia de bases: la misma secuencia de bases leída de 3’ a 5’ tiene un significado biológico diferente respecto de la lectura opuesta de 5’ a 3’.
Todas las Polimerasas, sea de ADN o ARN, distinguen entre terminales 3’ y 5’ de un ácido nucleico, leen las secuencias de ADN sólo en dirección 3’ a 5’ y construyen Polímeros de ARN o ADN agregando bases en dirección 5’ a 3’.
ADN Polimerasas (ADNP)
La DNA Polimerasa (DNAP) cataliza la polimerización de una hebra “hija” de DNA acorde con el molde provisto por la hebra madre. La hebra hija será complementaria de la hebra madre. La DNAP es una holoenzima dado que requiere de Ion Magnesio para el desempeño de su función. La DNAP solo puede agregar nucleótidos a grupos 3’-OH “libres” pre-existentes y para esto es preciso que el
aparato transcripcional instale un Primer sobre la hebra a copiar. Dicho Primer está constituido por dos nucleótidos iniciales RNA seguidos por uno o dos nucleótidos DNA y la enzima a cargo de su síntesis lleva el nombre de Primasa. A partir de dicho Primer se sucederá el agregado de nucleótidos siguiendo el molde de la hebra DNA madre, siempre en dirección 5’ a 3’. Por otra parte, una enzima llamada Helicasa debe proceder a abrir la doble hélice de DNA, de lo contrario nada de lo
anterior puede llevarse a cabo.
La estructura de la subunidad catalítica de las ADNP varía muy poco entre una y otra especie y por eso se dice que son moléculas evolutivamente bien conservadas.
“Función Corrector de Pruebas” (Proofreading) en DNAP
Algunas ADNP tienen la capacidad de corregir errores de síntesis en el ADN recién sintetizado. Cuando la ADNP reconoce una Base erróneamente instalada revierte su dirección en un par de Bases, extirpa la misma en dirección 3’ a 5’ mediante su actividad de exonucleasa, re-inserta la base correcta y luego prosigue con el proceso replicativo.
Transcriptasa Reversa (TR)
Los Retrovirus codifican una ADNP muy específica llamada Transcriptasa Reversa que requiere ARN para funcionar y tiene la capacidad de sintetizar ADN a partir de ARN. El ADN resultante carece de Intrones y se le llama ADN complementario.
Familias de ADNP
Se han descrito hasta ahora 7 familias de ADNP: A, B, C, D, Y, X y TR.
Las ADNP de Familia A agrupan polimerasas replicativas y de reparación. A esta familia pertenecen las polimerasas de reparación involucradas en los fenómenos de escisión, reparación y procesamiento de los fragmentos de Okazaki que se generan durante la síntesis de la hebra rezagada.
La Familia B incluye ADNP mayormente replicativas e incluye a las ADNP α, β, ε y ζ. Estas enzimas están involucradas en la síntesis de ambas hebras (líder y rezagada), se caracterizan por un alto grado de precisión y tienen fuerte actividad de exonucleasas.
Las Familias C y D se encuentran en Bacterias. La Familia X incluye a las bien conocidas Polimerasa eucariótica pol β y Terminal Deoxinucleotidil Transferasa (TdT). Esta última se expresa solamente en tejido linfoide e interviene en la recombinación V(D)J, incrementando la diversidad mediante
inserción de nucleótidos “n”.
Las ADNP de la Familia Y se caracterizan por tener baja fidelidad sobre moldes indemnes y capacidad replicativa sobre DNA dañado. Por eso estas enzimas son conocidas como Polimerasas Translesionales.
Finalmente la Familia de Transcriptasas Reversas (TR) se describe en eucariotas sólo a nivel de los telómeros (telomerasas).
RNA Polimerasas (RNAP)
Estas proteínas permiten construir hebras de RNA a partir de moldes de DNA o RNA. A este proceso se le llama “transcripción” porque copia la información que cobija el DNA en RNA y de esta manera puede transferir información genética al citoplasma. Es una nucleotidil transferasa que construye polímeros de RNA.
Solo puede leer en dirección 3’ a 5’ y requieren de un primer para poder iniciar su actividad, adicionando ribonucleótidos a grupos 3’OH libres.
Las RNAP son enzimas esenciales que se encuentran en todo tipo de organismo, están formadas por múltiples cadenas de polipéptidos y alcanzan una masa de más de 500 daltons.
La holoenzima RNAP completa se compone de 6 subunidades. En su estructura se distingue un surco donde encajan con precisión los 20 Angstroms de ancho de la doble hebra de DNA. Para unirse al DNA la RNAP cuenta con un factor “sigma” que le confiere gran afinidad por las regiones promoters.
Mientras la RNAP se encuentra inactiva no flota libremente, permanece ligada a sitios de baja afinidad. Cuando es requerida se desplaza a las regiones promoters y adquiere plena capacidad funcional.
Control de la Transcripción
La RNAP está sometida a fuertes y complejos mecanismos regulatorios capaces de generar una extensa diversidad en patrones de expresión genética. Esto permite a la Célula adaptarse a los cambios ambientales, ejercer roles especiales dentro de un organismo y preservar los procesos metabólicos básicos para la supervivencia. En la Escherechia Coli más de 100 Factores regulan la actividad de la RNAP. La RNAP sólo puede iniciar la transcripción cuando reconoce una secuencia específica llamada Promoter y genera a partir de allí una copia complementaria a la hebra “molde” de DNA. Al proceso de adición de nucleótidos al RNA se le llama “elongación” y el producto puede alcanzar hasta 2.4 millones de nucleótidos, como ocurre con el gen distrofina. Finalmente el transcripto es liberado cuando la RNAP localiza un codon stop.
La RNAPI transcribe genes que codifican RNA Ribosomal (rRNA). La RNAPII transcribe genes que codifican RNA primario/mensajero y Micro-RNAs. La RNAPIII transcribe genes que codifican RNA de Transferencia (tRNA) y también miRNAs
A diferencia de la DNAP la RNAP tiene actividad de helicasa, por consiguiente no requiere de una enzima adicional para dicha función.
Splicing
El RNA primario es copia complementaria de la secuencia de exones e intrones escrita en la hebra “antisense” del gen. Luego de terminada la transcripción el ARN primario es sometido a un proceso de escisiones de intrones y empalmes (splicing) de exones.
Spliceosoma
La transformación del RNA primario en RNA mensajero se produce en el núcleo y está a cargo de un ensamble entre RNA y múltiples partículas de ribonucleoproteínas.
En este complejo llamado Spliceosoma, que es exclusivo de eucariotas, los intrones son escindidos y los exones recombinados y empalmados. A partir de un mismo RNA primario pueden generarse una o más versiones de ARN mensajero acorde con la cantidad de exones que el Spliceosoma incluya en el producto final.
Los prokariotas carecen de intrones porque son más simples y no tienen núcleo.
Variantes de Splicing o Splicing Alternativo
A partir del transcripto primario de ARN es posible producir desde un mismo gen diferentes proteínas. Este fenómeno resulta de empalmes o splicing alternativo de exones, ha sido descrito en al menos 40 genes diferentes y puede ocurrir en diversos tipos y estadios evolutivos de una célula o tejido. Las variantes de splicing constituyen una de las fuentes más importantes de diversidad genética en eucariotas y explican la extensa diversidad del sistema inmune adaptativo. Según el Human Genome Project la cantidad total de genes llega a 30.000 contrastando con las apreciaciones
históricas del orden de 100.000. La diferencia se explica en parte por el fenómeno de splicing alternativo y en parte porque cada gen tiene al menos dos isoformas.
Promoter
El Promotor cobija los sitios de anclaje (Response Elements) para Factores Transcripcionales y RNA Polimerasa II (RNAP-II) y desde allí regula la expresión del gen. El Promotor actúa en concierto con otros factores regulatorios como Silencers, Enhancers e Insulators.
Dentro del Promotor se distinguen dos tipos básicos de amarre para factores transcripcionales: el Core Promoter y Sitios Distales. Para señalar la localización de una secuencia relacionada con el gen se utilizan los signos (-) y (+) respecto del (CI): por ejemplo -40 significa a cuarenta pb del CI en dirección 5’.
El Core Promoter se ubica en posición -25 a -30 y cobija una secuencia de siete pb (TATAAAT) conocida como TATA box. Este es el sitio específico de anclaje para el factor transcripcional TATA Binding Protein (TBP). El TBP y 14 proteínas asociadas al mismo constituyen el ensamble TFIID que a su vez integra el Complejo de Preiniciación RNA Polimerasa II (RNAPII). Dicho complejo contribuye a posicionar a la RNAPII sobre el CI del gen.
Se estima que el TATA box se encuentra en solo un 10 a 20% de los Promoters humanos y por esto se piensa que la TBP no sería la única proteína involucrada en el posicionamiento de la RNAPII.
El factor TBP interviene en el proceso de separación de la doble hebra de DNA, induce su plegamiento en 80° y facilita la aproximación del Promoter a reguladores como el Enhacer, que puede estar ubicado a miles de pares de bases de distancia.
El TBP se une al DNA a nivel Carboxiterminal, pero en su Aminoterminal posee una larga cola de glutaminas, que modula la interacción del TBP con el DNA y afecta la velocidad de formación del Complejo Transcripcional.
La transcripción es un proceso finamente regulado y cada uno de los factores transcripcionales (TFIIA, TFIIB, TFIIF) resulta de la interacción de muchas subunidades.
Corriente Arriba del Core Promoter (hacia 5’) se extienden otras secuencias a lo largo de 200 pb Promoter. Estas despliegan afinidad por factores transcripcionales específicos para cada etapa de la vida celular y de cada tejido en particular.
La combinación de sitios promotores singulares con factores transcripcionales específicos, determina el momento y el lugar preciso para la expresión de ciertos genes. En realidad los Promotores carecen del grado de precisión que se ve en secuencias como el codon stop, porque la naturaleza usa la variación de los promotores para el control de los niveles de expresión de diversos genes.
Enhancers
Algunos Factores Transcripcionales (FT) reconocen secuencias de ADN ubicadas a miles de pares de bases del gen y desde allí actúan sobre el Promoter incrementando la velocidad de transcripción. A dichas secuencias se les llama Enhancers dado que sirven de anclaje a Proteínas Aceleradoras de la Expresión (FT) de genes específicos. En realidad un Enhancer puede encontrarse dentro del mismo gen o también alejado del mismo a miles de pares de bases en dirección 5’ o 3’. Es probable que estas Proteínas de Unión a Enhancers tengan un dominio de reconocimiento de Enhancer y otro de interacción con los Factores Transcripcionales ligados al Promoter. Para que pueda ejercerse una influencia tan importante, desde secuencias de ADN tan alejadas, es preciso que se forme un plegamiento de ADN que dibuja la forma de un lazo.
Silenciadores
Se trata de secuencias de ADN que también pueden estar ubicadas a miles de pares de bases del gen que controlan. A diferencia de las regiones Enhancer estas regiones tienen afinidad por factores que reprimen la transcripción.
Horqueta de Replicación o “Replication Fork”
La extensa doble hebra helicoidal de DNA tiene el aspecto de un cable de teléfono super-enroscado y apretado alrededor de núcleos octaméricos de histonas.
Las Polimerasas no pueden leer DNA de doble hebra y por eso durante el proceso replicativo trabajan asociadas a un complejo de enzimas y proteínas que des-enrollan y abren la doble hélice de DNA. La adición de nucleótidos sigue siempre la dirección 5’ a 3’.
Pero las hebras de DNA sólo se abren para la expresión o replicación genética y luego vuelven a cerrarse y enroscarse. Por eso en los sitios de copiado el DNA adopta el aspecto de una horqueta, como si fuera una Y. Dicha formación es conocida como Replication Fork.
En el mencionado Replication Fork se reconoce una hebra líder de síntesis continua y una hebra rezagada que se construye en base a fragmentos discontinuos llamados fragmentos de Okazaki. En eucariotas dichos fragmentos tienen 200 pares de bases (pb), longitud equivalente a una vuelta de
hélice.
Una enzima llamada Primasa se encarga de insertar un Primer al inicio de cada fragmento de Okazaki o hebra líder. Dicho Primer cuenta con dos nucleótidos iniciales de RNA. La DNA Polimerasa necesita dicho Primer para poder iniciar su trabajo.
Las enzimas Primasa y Helicasa trabajan integradas a un complejo llamado Primosoma. Los primers de RNA son eliminados por enzimas especiales de reparación del DNA y la muesca resultante es llenada mediante la acción de las enzimas ligasa y polimerasa.
En las replicaciones del DNA eucariota intervienen al menos dos tipos de DNA-polimerasas: DNA-Poly Alfa para la hebra rezagada y DNA-Poly delta para la hebra líder.
Como se ve en las figuras adjuntas cada hebra de DNA sigue necesariamente direcciones opuestas de replicación. Pero mediante el recurso de los fragmentos de Okazaki el complejo enzimático puede avanzar en la misma dirección, reproduciendo ambas hebras de DNA de manera casi simultánea
y a gran velocidad.
Helicasas
Las Helicasas son enzimas que separan temporariamente las dos hebras de DNA y permiten la síntesis de hebras hijas o RNA. La RNA Polimerasa tiene actividad intrínseca de Helicasa mientras que la DNA Polimerasa requiere de una subunidad Helicasa específica. En conjunto con la DNA Primasa la Helicasa desnaturaliza al DNA mediante hidrólisis de Adenosin Tri Fosfato
(ATP) y se desplaza a lo largo de una de las hebras, desenrollando el DNA que encuentra a su paso.
Topoisomerasas
Las enzimas Topoisomerasas sirven para mantener tanto la transcripción como la replicación del ADN. Se unen al ADN corriente abajo del tramo helicoidal abierto, a fin de prevenir una deformación excesiva de su doble hélice. Las Topoisomerasas son enzimas que alteran el “supercoiling” (super-espiralado) de la doble hélice de ADN. La Topoisomerasa I corta transitoriamente una hebra y la Topoisomerasa II corta ambas hebras del ADN para relajar el espiral y extender la molécula de ADN. La regulación del “supercoiling” es crítica para las tareas de replicación y transcripción: el ADN debe desenrrollarse para facilitar el acceso de la maquinaria
enzimática involucrada en dichos procesos. La Topoisomerasa III interviene en la regulación de la recombinación y la Topoisomerasa IV regula el proceso de segregación de los cromosomas recientemente replicados.
DNA Ligasas
Las DNA ligasas catalizan la formación de enlaces fosfodiester 5’-3’ (covalentes) entre nucleótidos y se usan para unir cadenas de ADN o introducir fragmentos de ADN. Un ej. es la T4 DNA ligasa que requiere ATP como cofactor. El ligado de moléculas de DNA puede realizarse de múltiples maneras: entre dos cadenas distintas de DNA (intermolecular) o entre extremos de una misma cadena de DNA,
generando un círculo de DNA.
Transcripción
El proceso de transcripción resulta en una hebra de RNA primario que es complementaria a la hebra antisense del DNA. El RNA primario es luego sometido a un proceso de corte y empalme donde los intrones son eliminados y los exones empalman en secuencias contínuas de exones. Este proceso es conocido como splicing (empalme) y se desarrolla en el núcleo.
El DNA codificante está armado en secuencias de tres pares de bases llamadas codones, que se leen a partir de un “sitio de iniciación”, que indica a la RNA Polimerasa II cual debe ser el 1er nucleótido a tomar como inicio de la transcripción.
La secuencia de bases determina la especificidad de un codon y dicha secuencia cambia en función de tres posibles opciones de marco de lectura. Supongamos que los primeros cinco nucleótidos fueran ATACCG: si la Polimerasa iniciara la lectura en A se generaría ATA como primer codon y este codificaría Isoleucina, pero si la iniciara en T dicho codón cambiaría por TAC y este codificaría Tirosina.
Cada codón reconoce al menos un aminoácido y existen 64 combinaciones posibles entre las 4 bases existentes. Sin embargo hay tres codones stop que indican el punto donde termina la transcripción (UAG, UAA Y UGA).
Excluyendo estos últimos quedan 61 grupos de tres bases para 20 Amino Acidos. Por otra parte el codon AUG, cuando está acompañado por la secuencia de consenso (Kozak box), cercano al terminal 5’ del mRNA, sirve como codon de iniciación, señalando el primer AA a ser incorporado (Metioniona).
Por eso la mayoría de las proteínas tienen a la Metionina como primer AA. Algunas pierden la Metionina como consecuencia de arreglos postraduccionales.
Redundancia en Codones y tARN
Muchos codones codifican para un mismo aminoácido (AA) porque en realidad son las dos primeras bases las que determinan su especificidad. Mirando detenidamente la carta de correlaciones se ve que los codones que codifican para un mismo AA varían por lo general en la tercer base.
Por esta diversidad en Codones codificantes de un mismo AA se dice que el código genético es degenerado y redundante. También hay redundancia a nivel de tARN porque se han descrito 36 tARN para 20 AA.
En realidad quedan 61 codones para 20 AA pero existen 21 AA. Esto se debe a la Prolina que se transforma en Hidroxiprolina en etapa postranscripcional.
Una consecuencia práctica de esta redundancia es que algunos errores en el código genético sólo ocasionan mutaciones silentes o a lo sumo errores que no afectan las propiedades hidrofílicas o hidrofóbicas de un AA. También es cierto que a veces una mutación singular puede provocar severas alteraciones morfológicas y funcionales, como ocurre con la mutación de Glu6 (hidrofílica)
a Val6 (hidrofóbica) en la Beta Globina, que reduce sensiblemente la solubilidad de las cadenas de globina y provoca los desórdenes propios de la sickle-cell-disease.
El ADN viral constituye una excepción a la regla porque algunas secuencias de su genoma pueden leerse en ambas direcciones. De esta manera codifican una proteína cuando son leídas de 5’ a 3’ en una de sus hebras y otra proteína cuando siguen el curso opuesto sobre la otra hebra.
De todas maneras muchos virus tienen ADN de una sola hebra lo cual implica un alto grado de exposición a mutaciones y cambios epigenéticos. También conlleva la ventaja de su mayor adaptabilidad y del menor costo de mantenimiento que implica un sistema de hebra simple.
RNA Primario
La información contenida en el gen es transcripta a copias de ARN primario y este es luego sometido a procesos de escisión de intrones y empalmes (splicing) de exones. De este proceso, que se lleva a cabo en el núcleo surge el RNA mensajero, que es trasladado al citoplasma e incorporado a ribosomas para lectura y expresión de proteínas.
En el RNA el azúcar tiene un OH- en C2 y la base pirimidínica Timina está reemplazada por Uracilo. El RNA se presenta bajo forma de hebra única en eucariotas y doble en procariotas.
RNA Mensajero
La vida media del RNA mensajero es muy corta en eubacterias (1-5 minutos) y variable en eucariotas. En Procariotas la traducción ocurre casi al mismo tiempo que la transcripción porque su RNA no requiere de procesamientos postranscripcionales.
En Eucariotas el RNA debe ser procesado, editado, transportado fuera del núcleo e incorporado a ribosomas. La vida media del mARN en eucariotas depende de su estabilidad y esta depende en parte de la existencia o no de señales inductoras de rápida degradación. Dichas señales suelen anidar en la región no traducible 3’ UTR. Después de un tiempo el mRNA es degradado a nucleótidos mediante RNAasas específicas.
5’ Cap
De manera casi simultánea con el inicio de la transcripción el extremo 5’ del RNA primario recibe el nucléotido 7-metilguanosina (5’ Cap). El ligado de 5’ Cap se produce mediante un Complejo Sintetizador de Cap que está asociado a la RNA Polimerasa.
La síntesis de 5’ Cap resulta de una reacción bioquímica que se desarrolla en varias etapas. El grupo metilo en posición N-7 agregado a la guanina le provee gran estabilidad al RNA, en particular lo protege del ataque de enzimas nucleofílicas. Esta modificación es crítica para el reconocimiento y adecuada adherencia al Ribosoma, pero también podría tener importancia en los procesos de splicing y transporte.
Poliadenilación
Luego de completada la transcripción la cadena de RNA primario es cortada mediante la acción de un complejo endonucleasa asociado a RNA Poly II. El Sitio de Corte está caracterizado por la presencia de una secuencia AAUAAA cercana al mismo. Luego de haberse producido el corte, una Poliadenil Polimerasa le agrega entre 80 y 250 residuos de adenosina al extremo 3’ libre del mARN. Esta cola de Poli Adeninas contribuye a la terminación de la transcripción, estabiliza el mARN por neutralización de exonucleasas, y facilita la exportación del núcleo al citoplasma.
El reconocimiento de la secuencia AAUAAA es crítico para poder colgar la cola de Poli Adeninas al ARN, tan es así que una mutación a este nivel (AAUAAA por AAUAAG), como ocurre en el caso del gen de la alfa 2 globina humana, puede provocar deficiencias en hemoglobinas.
Edición
Una vez completado el proceso de splicing es posible someter al mARN a ulteriores correcciones o “ediciones”, mediante la inducción de cambios en su composición de nucleótidos. Un ejemplo en humanos es el caso del mARN de la Apolipoproteína B que puede ser editada en ciertos tejidos pero no en otros. La edición permite producir una proteína más corta mediante la introducción de un Stop Codon (por ejemplo).
Traducción
Hemos visto que los procesos de Transcripción y Traducción ocurren en compartimientos separados: la Transcripción en el núcleo y la Traducción en el Citoplasma.
Para la transcripción es preciso que el mARN sea exportado a través del poro nuclear.
Una vez fuera del núcleo es incorporado a Ribosomas Flotantes en el Citosol o a Ribosomas adheridos a membranas del Reticulo Endoplásmico.
Ribosomas
En el Nucleolo se concentra la producción de RNA Ribosomal (rRNA) y los genes que codifican rRNA se ubican en cinco Cromosomas: 13, 14,15, 21 y 22. Por eso es que son diez los centros generadores de Nucleolos.
Un Ribosoma es una organela compuesta de rARN y Proteínas Ribosomales.
Estas estructuras resultan del ensamble de dos subunidades de rARN con mARN y diversas Ribonucleoproteínas. El ribosoma se arma para la Traducción de una molécula específica de mARN y se desarma una vez terminada su tarea. Estas organelas pueden Flotar en el Citosol llevando la producción de proteínas a sitios predestinados o pueden trabajar adheridos a las membranas del Retículo Endoplásmico o del Núcleo.
Los Ribosomas tienen una actividad enzimática (Ribozimas) que parece remanente de épocas biológicas previas al ADN. En eucariotas dichas estructuras suman 80 Sv y se componen de una subunidad de 40Sv y otra de 60 Sv.
Es importante recordar que las unidades Svedberg (Sv) representan el nivel de sedimentación de partículas sometidas a ultra-centrífugación, Las Unidades Sv no pueden sumarse. De hecho la suma de las subunidades Ribosomales debería dar 100 pero el Ribosoma tiene 80 unidades Sv. Lo mismo ocurre con el tamaño de las subunidades del Proteosoma u otras organelas expresadas en unidades Sv.
La Síntesis Proteica comienza en el Codon de Iniciación cerca del terminal 5’ del RNA, con la adherencia de la subunidad pequeña rRNA 40S y el complejo iniciador queda completo cuando Metionina-tRNA ubica el codon AUG en el mRNA. Dicho complejo recluta ahora la unidad grande rRNA 60S que tiene tres sitios de unión conocidos como “A”, “P” y “E”. Mediante el sitio P se ubica sobre la Metionina y desde el sitio A convoca al siguiente AA-tRNA. Una vez que el AA-tRNA entrante ubica el codon vecino al codon AUG se produce la unión peptídica entre Metionina y el AA
entrante. Luego el sitio E convoca una Metionina para regenerar un Met-tRNA y liberarlo, el sitio P se traslada al AA de reciente ingreso y queda libre el siguiente triplete o codon para un nuevo AA-tRNA. De esta manera se va construyendo la proteína y cuando el Ribosoma llega al codon stop el proceso termina con la liberación de su producto terminado. Cada Ribosoma termina su tarea con la producción de su proteína.
Factores Eucarioticos de Iniciación y la Síntesis Proteica
Los Factores Eucarióticos de Iniciación (eIF) son proteínas que intervienen en la traducción del mRNA a proteínas. Los elFs participan en diversos procesos: formación del complejo de iniciación con 5’mRNA y complejo con MetioninatRNA, búsqueda del codon de iniciación en la hebra de mRNA, ubicaión del sitio de unión entre el tRNA y el AUG (codon de iniciación) ligado de la subunidad 60S para crear la subunidad 80S.
eIF4 (eIF4F)
Se han descrito varias proteínas elF y cada una de ellas, de manera individual o integradas en complejos, participa de la traducción del mRNA a proteínas a nivel del Ribosoma. elF4G es una proteína estructural que participa del complejo elF4F.
elF4A es una helicasa de RNA que contribuye a resolver problemas de estructura secundaria en el RNA. elF4E se une al 5’cap del mRNA al inicio de la transcripción.
elF4B tiene dos dominios de unión al RNA uno para mRNA y otro para la porción 18S de la subunidad ribosomal pequeña. elF2 es una proteína ligante de GTP que tiene afinidad específica hacia Met-tRNA iniciador: es responsable de atraerlo hacia el sitio P del complejo pre-iniciador. Una vez ubicada el Met-tRNA sobre el codon AUG elF2 promueve la hidrólisis de GTP a GDP y se disocia del ribosoma. Dicha señal permite también la disociación de elF3, elF1 y elF1A facilitando así la unión de la subunidad grande al complejo ribosomal.
Ciertas kinasas abocadas a la regulación de la síntesis proteica fosforilan eIF-2/GDP y así bloquean la regeneración de eIF-2/GTP. Cuando eIF-2/GDP está fosforilado sufre un cambio conformacional que impide su interacción con eIF-2B y por eso no puede cambiar GDP por GTP.
Conclusión: la fosforilación de eIF-2/GDP bloquea la síntesis de Ribosomas y esto bloquea la Síntesis Proteica.
Islas Citosina-Fosfato-Guanina (CpG)
CpG significa Cistosín-Nucleótido seguido Guanidin-Nucleótido y la “p” señala al grupo fosfato que permite dicha unión. Se escribe así para no confundir con la interacción entre bases (CG) de hebras complementarias.
En muchos organismos eucarióticos las Citosinas de los dinucleótidos CpG son Metiladas a 5-metilcitosina, mediante DNA-Metiltransferasas. De hecho en mamíferos esto ocurre con el 70% a 80% de las Citosinas de los CpG dinucleótidos.
La gran vulnerabilidad mutacional de las metilcitosinas explica que en una hebra de DNA humano la secuencia CpG se reduzca al 1%. Sin embargo hay regiones del DNA donde la concentración de CpG llega al 4 a 6%, un 60% más alta respecto del resto del genoma (1%). A estas zonas del DNA ricas en CpG se les denomina “Islas CpG”.
Muchos genes de mamíferos tienen Islas CpG asociadas al Codon de Iniciación.
Este incremento en la concentración de CpG podría estar relacionado con un decremento en la actividad de metilación de Citosinas.
Las Islas CpG son regiones genómicas que contienen alta frecuencia de CpG dinucleótidos, típicamente 300 a 3000 pb de largo. Estas se encuentran dentro o cercanas al 70% de los Promoters humanos.
Acorde con un extenso estudio sobre las secuencias completas de los cromosomas 21 y 22, las regiones del DNA de más de 500 pb que contengan >55% de CpG son probablemente Islas CpG asociadas a las regiones 5’ de los genes.
Cuando la expresión genética está activada los dinucleótidos CpG de las Islas CpG asociadas a Promoters No aparecen metilados.
Las secuencias CpG que ocurren dentro de la región codificante Si pueden estar metiladas.
Aparentemente hay diversos tipos de Islas CpG
Las Islas con multicopias de CpG metiladas se localizan frecuentemente cercanas a los extremos teloméricos, como ocurre asimismo con los tramos CpG no islas, que también se encuentran fuertemente metilados.
Aparentemente la metilación desempeña algún rol en la preservación de la integridad cromosomal. De hecho se ha observado que la ADN metiltransferasa es esencial para la establidad genómica.
Uno de los aspectos más intrigantes respecto de los aspectos funcionales de los estados epigenéticos de las islas CpG es el control de la expresión de dominios.
Como ejemplos valen: 1) la estrecha aposición de las islas CpG sobre los genes imprinted (marcados) y 2) la concentración de las singulares islas CpG no metiladas en los promotores del 50-60% de todos los genes humanos.
Todo esto indicaría que la protección contra la metilación de novo probablemente haya involucrado selección funcional basada en patrones de expresión genética. La resistencia a la metilación de novo de muchas de las singulares Islas CpG recuerda cómo previenen los “insulators” el acceso de los Silencers a los Promoters. Muchas Islas CpG interactúan con la proteína Zinc Finger CTCF organizadora de las funciones “insulator”.
Una visión alternativa al rol del las Islas No metiladas o diferencialmente metiladas invoca la protección contra Silencers y Enhancers como contribución a la regulación transcripcional.
Islas CpG en Cáncer
Estas Islas CpG parecen ser muy inestables en cáncer y esto crea mosaicismo epigenético.
Las Islas CpG que normalmente están NO metiladas, con frecuencia aparecen metiladas en cáncer y silencian genes aledaños a las mismas. Pero también puede ocurrir a la inversa y la des-metilación de islas CpG puede activar genes de manera no programada.
Resumiendo conceptos sobre Islas CpG
En los últimos tiempos se han distinguido diversos tipos o grupos de Islas CpG caracterizables en función de su localización genómica y status epigenético.
Es claro además que el satus de metilación del genoma es algo bastante dinámico que se recompone en función de diferentes estadios durante el desarrollo y en el curso de la transformación maligna.
Insulators
Hemos dicho que enhancers y silencers representan sitios de anclaje para Factores Transcripcionales que activan o reprimen genes ubicados a miles de pares de bases del gen “target” (blanco u objetivo). Esto implica el riesgo de activación o represión de otros genes ubicados en las inmediaciones. Para prevenir estos errores biológicos la vida diseñó los “Insulators”. Los límites entre regiones de ADN
funcional se encuentran demarcados por “secuencias especializadas de cromatina” (SCS) de 42 pb a 2 Kb de largo.
Los experimentos de clonación en eucariotas suelen resultar en cierto grado de variabilidad en la expresión genética. Esto se debe a la naturaleza azarosa de las inserciones genéticas: el nuevo gen puede quedar instalado en regiones de cromatina abierta (activa) o cerrada (inactiva) y en función de esto expresarse o no.
Cuando el gen a insertar está delimitado por “insulators” el efecto posicional queda neutralizado y puede expresarse con independencia de su ubicación. Los insulators facilitan el des-empaquetamiento de la cromatina en el sitio del injerto y el acceso de los Factores Transcripcionales a promoters y enhancers del gen.
En definitiva, los insulators contribuyen a mantener la independencia de cada sitio funcional y evitan interferencias con genes aledaños.
Todos los insulators se caracterizan por tener secuencias CCCTC y a las proteínas afines a la misma se les llama CTCF por “Factores de Unión a CTC”. Las proteínas CTCF tienen 11 dominios “Zinc Finger” y bloquean la activación del gen.
Modelo Tridimensional de Regulación Genética
Recientes hallazgos sugieren que el modelo linear de expresión genética debería ser reemplazado por un modelo tridimensional. Acorde con estas ideas elementos regulatorios distales pueden interactuar físicamente en sentido positivo (cis) o negativo (trans) con los genes que se encuentran bajo su control. Lo más sorprendente es que elementos regulatorios ubicados en un cromosoma pueden regular de manera directa genes localizados en otro cromosoma. Esto explica la presentación preferencial de ciertas traslocaciones cromosomales en ciertos cánceres.
¿Cuales serían los factores a cargo de la organización nuclear y las interacciones de largo alcance? Un candidato potencial parece ser el CTCF, un factor transcripcional de expresión ubicua, que tiene múltiples funciones dependientes de contexto. CTCF puede actuar como proteína bloqueadora de enhancers, puede unirse a elementos aledaños de un gen activado e intervenir como factor transcripcional activador o silenciador. CTCF puede funcionar como organizador del genoma, puede regular la expresión genética mediante inducción de plegamientos cromosomales de largo alcance.
Un ejemplo paradigmático es el caso del gen Insulin-Like-Growth-Factor-2 (IGF2) que posee una secuencia insulator entre el enhancer y el promoter tanto en el gen de origen paterno como materno. Las secuencias ricas en Citosina son neutralizables por metilación, los CTCF no pueden actuar y el
gen resulta activado por el enhancer. En este caso el gen IGF2 del padre es neutralizable por metilación pero el de la madre no y como resultado solamente puede expresarse el gen IGF2 paterno.
Genes con Expresión Monoalélica
En Cromosomas somáticos los genes se activan de manera simultánea en ambos locus parentales y el producto resultante es expresión de ese balance. Sin embargo en tejidos somáticos diploides existe un creciente registro de genes caracterizados por expresión monoalélica. Entre estos están incluidos los genes del Cromosoma X inactivo (Barr), los Imprinted (marcados), ciertos genes que codifican factores linfoides específicos y subunidades de receptores olfatorios y los genes de los receptores T y B (Ig).
En el caso de los genes de receptores B y receptores T la expresión debe ser monoalélica, porque en cada célula los receptores antigénicos deben ser monoespecíficos. Si se expresaran los dos alelos de cadena pesada y cuatro alelos de cadena liviana, los linfocitos producirían receptores de especificidad diversa y no podrían producirse anticuerpos monoclonales. Por eso en cada linfocito los receptores resultan del rearreglo de sólo un locus de cadena pesada y solo un locus de cadena liviana.
Imprinting Genómico
Este fenómeno fue originalmente descrito en el insecto Pseudococcus Nipae: en las hembras todos los cromosomas son activos mientras que en los machos, a partir de la sexta división celular solo permanece activa la mitad de sus pares cromosómicos. De esta manera, funcionalmente la hembra es diploide y el macho es haploide.
Este fenómeno, que se denominó “imprinting genómico”, aparece en mamíferos como inequidad funcional entre dos alelos (copias) parentales.
En las células somáticas de los organismos diploides cada gen autonómico se encuentra representado por dos copias o alelos, cada una de ellas heredada de uno de sus progenitores. En el 99% de los casos se expresan ambos genes de manera simultánea, pero una pequeña proporción (<1%) de
estos genes recibe la marca del silenciamiento (imprinting) y en estos casos sólo uno de ellos se expresa.
Un ejemplo paradigmático es el caso del Insulin-like growth factor 2 (IGF2/Ihf2) que solo se expresa funcionalmente en el alelo de origen paterno.
De alguna manera el fenómeno del Imprinting garantiza la inviabilidad de la Partenogénesis en Mamíferos, es decir que garantiza el requerimiento de gametos femeninos y masculinos para la preservación de la descendencia e integridad de la especie. En mamíferos no existen casos de partenogénesis gracias al fenómeno del imprinting.
El imprinting es un proceso dinámico porque en cada generación es posible borrar y re-establecer el imprint. Se trata de un fenómeno “epigenético” porque afecta la estructura pero no la secuencia del DNA. En las células germinales el imprint es borrado y luego regenerado, acorde con el sexo del portador. El imprinting se re-establece en el óvulo o en el espermatozoide y se instrumenta mediante metilación del DNA y modificación de las histonas.
Su transmisión como agregados de genes imprinted, les permite compartir elementos reguladores como RNAs no codificantes, regiones diferencialmente metiladas (DMRs) y regiones controladoras del imprinting.
Las DMRs corresponden a regiones ricas en nucleótidos de Citosina y Guanina, donde las Citosinas aparecen Metiladas en una de las copias y en la otra no.
Contrariamente a lo que se habría esperado en este caso la Metilación no necesariamente significa silenciamiento.
La mayoría de los genes imprinted en mamíferos desempeña roles en el control del crecimiento y desarrollo embriogénico, pero hay algunos que intervienen en etapas postnatales de desarrollo.
Enfermedades humanas relacionadas con el fenómeno del Imprinting
Las leyes de Mendel establecen que ambos alelos se expresan por igual y brindan una expresión balanceada de genes paternos y maternos. Pero los locus genéticos sometidos a imprinting no respetan las leyes mendelianas.
Varios Síndromes y Enfermedades Humanas se originan en vulnerabilidades propias de los locus sometidos a imprinting: Enfermedad Trofoblástica Gestacional, Teratomas, Síndrome de Beckwith-Wiedemann, Síndrome de Prader-Willi, Síndrome de Agelman, Síndrome de Silver-Russell, Diabetes
Neonatal Transitoria, Déficit Socio-Cognitivos del Síndrome de Turner y Múltiples Neoplasias.
En condiciones normales los locus con genes marcados (imprinted) tienen carga genética haploide, porque sólo expresan uno de los dos alelos. La preservación de los locus sometidos a imprinting es crítica para la vida.
La carencia de varios genes no marcados en el Cromosoma 15 paterno provoca Síndrome de Prader-Willi y la carencia de un gen no marcado en el Cr 15 materno ocasiona Síndrome de Angelman.
El fracaso del imprinting en células somáticas puede tener implicancias oncogénicas. En el Tumor de Wilms y muchos casos de Cáncer de Colon están presentes ambas copias de Igf2, cuando en realidad debería estar expresada sólo la copia paterna.
Factores Transcripcionales
Básicos
Los Factores Transcripcionales (FT) son estructuras multiproteicas que promueven la unión al DNA de la RNA Polimerasa (RNA Poly) y la aproximan al Sitio de Iniciación de la Transcripción. Sin FT las células no podrían regular con eficiencia la velocidad de la expresión genética.
La unión del factor transcripcional TBP al TATA-box provoca una fuerte distorsión morfológica sobre el DNA que facilita la apertura de sus hebras. Las secuencias sucesivas de los pares de Adenina-Timina son menos estables que otras secuencias de nucleótidos. La separación de las hebras expone las regiones codificantes y las hace accesibles a las RNA Polimerasas.
En eucariotas la proteína TBP integra un complejo multiproteico llamado TFII-D que significa: Factor Trtanscripcional D para la RNA Poly II. En el TFII-D, además de la TBP intervienen otros factores que ayudan a estabilizar el ensamble con el ADN.
Cuatro factores promueven la unión de la RNA Poly II al Promoter: TFII-B,-F,-E y -H (en ese órden). Dado que cada uno de estos FT resulta del ensamble de diversos polipéptidos individuales, se estima que el complejo en su conjunto abarca no menos de 25 proteínas interactivas y críticas para el éxito del proceso transcripcional.
Una vez ubicada en el Sitio de Iniciación la RNA Poly debe comenzar su tarea transcripcional y para ello debe liberarse del complejo de FTs. Esto se logra mediante cooperación entre los FTII-E y H que fosforilan e inducen el cambio conformacional que requiere la RNA Poly para liberarse del mencionado complejo.
Al conjunto de FT vinculados al TATA box se les conoce como FT básicos, porque son los que ubican a la RNA Poly sobre el Sitio de Iniciación y son utilizados por casi todos los genes.
Específicos
Los FT básicos arriba descritos son imprescindibles para que se inicie la transcripción pero no determinan el ritmo transcripcional.
Cada gen debe ser transcripto acorde con las exigencias vitales de cada célula. Los genes que codifican Hemoglobina están sometidos a ritmos de expresión mucho más veloces que los genes que codifican proteínas de menor requerimiento funcional.
Para marcar la velocidad con que debe transcribirse cada gen en particular en cada momento de la vida de una célula se necesitan Factores Genéticos Específicos.
Las Hormonas no son FT en sí mismas pero forman complejos con receptores y luego se unen al DNA para modificar el ritmo transcripcional de genes específicos.
Ciertos Factores de Crecimiento y determinadas proteínas pueden ejercer también efectos similares.
Cada gen o grupo de genes está sujeto a delicados sistemas de controles transcripcionales articulados por varias docenas de factores específicos.
Activadores y Represores
Algunos Factores Reguladores (FR) de la expresión Genética son Activadores y otros son Represores. Los Activadores se ligan a secuencias de DNA llamadas Enhancers y los Represores a Sitios Silenciadores.
Dado que Enhancers y Silencers están ubicados en la misma hebra de DNA que el gen bajo su control, se dice que son elementos “Cis”, porque están del mismo “lado” (latín). Los factores que se unen a dichas secuencias se llaman “Trans” porque provienen de otros lugares del genoma.
Muchos Factores Específicos se unen al Promoter fuera del TATA box pero cercano al Sitio de Iniciación. Otros lo hacen dentro del gen mismo o también a cientos o miles de pb del mismo en dirección 5’ o 3’. A pesar de esto, como el DNA es una estructura super-enroscada a la manera de un cable telefónico, dichas secuencias quedan ubicadas físicamente muy cerca del promoter.
Los Factores Específicos pueden alterar la velocidad de unión entre el promoter y los factores básicos o perturbar la velocidad de liberación de la RNA Poly del complejo transcripcional (acelerando o frenando).
Algunos factores pueden alterar físicamente la estructura del DNA facilitando o no el acceso de ciertos FT al DNA. Ya hemos mencionado que el DNA está enroscado y super-enroscado alrededor de núcleos de histonas. Este ordenamiento conspira contra la expresión genética. Ciertos FT pueden influir de manera directa relajando la estructura del DNA facilitando el ingreso de factores específicos de genes.
FT y Dominios de Unión al DNA
La estructura del DNA es bastante simple y brinda pocas alternativas de interacción con dominios peptídicos. Por eso, a pesar de la gran diversidad de FT existentes, sus dominios de unión al DNA se limitan a un pequeño racimo de variables morfológicas.
Helix-turn-helix motif
Este dominio o motivo se compone de una corta sección alfa hélice (similar a un resorte), un asa de aminoácidos lineares y otra alfa hélice. La primer hélice se adapta al surco mayor de la doble hélice del DNA. Las cadenas laterales de los AA toman contacto con las partes expuestas de los nucleótidos. La forma y cargas de uno complementa al otro facilitando la unión entre el dominio
HtH y el DNA. Las proteínas homeóticas, que desempeñan tareas críticas para la regulación del desarrollo tanto en moscas como en hombres, utilizan motivos HtH modificados.
Zinc-finger motif
El motivo Zinc Finger es una secuencia de AA que tiene la apariencia de un dedo.
Esta imagen surge de la interacción entre un átomo de Zinc y cuatro AA clave: cuatro Cisteinas o dos Cisteinas y dos Histidinas. En las proteínas que tienen dominios Zinc
Finger el resto de los AA es muy variable. A este grupo pertenecen los esteroides, incluyendo
testosterona y estrógenos, que ejercen profundos efectos en el desarrollo.
Leucine Zipper
Este dominio surge de la interacción entre dos hélices alfa, cada una perteneciente a uno de los dos monómeros que integran este tipo de Factor Transcripcional. Funciona a la manera de una Cremallera o Zipper (en inglés) por las uniones hidrofóbicas que se generan entre las leucinas de cada espiral alfa. Cada vuelta de hélice abarca 3.6 AA y cada 7 AA hay una Leucina. Estas quedan posicionadas una bajo otra, a distancias regulares y enfrentadas entre sí desde cada hélice alfa. La fuerte interacción hidrofóbica Inter.-leucinas así generada atrae ambos monómeros helicoidales a la manera de una cremallera: de aquí surge el nombre Leucine Zipper.
Se trata de un motivo estructural que se encuentra en diversas proteínas reguladoras de la transcripción. myc, fos, jun, AP-1, CREB, and Gcn4. En diversas expresiones oncológicas se han registrado mutaciones o sobre-expresiones de FTs Leucine Zipper.
Basic-helix-loop-helix (bHLH)
Este motivo estructural está compuesto por dos hélices alfa unidas mediante un loop (asa) y tiene aminoácidos básicos que facilitan su unión al DNA. Una de las hélices es más corta y el asa que la une a la más larga le confiere un alto grado de flexibilidad, que facilita su dimerización por plegado y empaquetamiento contra la otra hélice. La hélice larga posee los AA básicos que promueven su unión a secuencias consenso CACGTG (E-box).
Ejemplos: C-Myc, Myo D, HIF y BMAL1-Clock. Muchos de los Factores Transcripcionales bHLH son heterodiméricos lo cual abre una amplio rango de combinaciones posibles y constituye un importante mecanismo de regulación de la transcripción.
Estos FT suelen ser importantes para el desarrollo y actividad de la célula. El BMAL1-Clock integra el núcleo del complejo transcripcional que regula el ciclo circadiano. Otros genes bHLH como c-Myc y HIF-1, importantes en metabolismo y crecimiento celular, pueden sufrir mutaciones.
CCAAT / enhancer-binding proteins (C/EBPs)
Otro de los elementos básicos del Promoter es la secuencia CCAAT. El CAT-box se ubica a 50-150 pb en dirección 5’ respecto del SI. Esta secuencia CAT es reconocida por la proteína CCAAT-box/Enhancer Binding Protein (C/EBP). Las C/EBPs comprenden una familia de FTs con homologías estructurales y funcionales. La similitud entre los miembros de la familia C/EBP sugiere una historia evolutiva de duplicaciones genéticas con fuertes presiones inductoras de diversificación. Como resultado surgen estas variaciones en especificidad por tejidos y capacidad de transactivación.
Desde que fuera clonado el primer miembro de esta familia hace ya una década, han sido descritos cinco miembros más. Estas proteínas interactúan entre sí y con miembros de otras familias de FT para regular la transcripción del ARN mensajero. En trabajos recientes sobre animales transgénicos se confirmó la importancia de la familia C/EBP para el desarrollo del tejido normal, la proliferación
celular y la diferenciación funcional. Como muchos otros FTs estos también tienen un dominio de activación, una región básica de unión al ADN y un dominio de dimerización rico en leucinas (Leucine Zipper).
El concepto Antisense como estrategia farmacológica
Desde hace casi 30 años se trabaja en el desarrollo de ácidos nucleicos de secuencias complementarias antisense para silenciar la expresión de DNA. La propia naturaleza emplea estrategias antisense para regular genes. Ya han sido diseñados antisense (cortas hebras de DNA o RNA) como terapéutica para la enfermedad de Chron, algunos virus y ciertas enfermedades hematológicas. Hay dos maneras de detener la expresión genética: a nivel transcripcional y a nivel traduccional. En el primer caso la idea es diseñar un antisense que pueda actuar sobre un corto tramo de DNA creando un segmento de triple hélice sobre un gen o sobre sus elementos DNA control. De esta manera quedaría bloqueada la lectura del código genético. En el segundo caso la hebra antisense podría hibridizar con un mRNA específico trabando su lectura a nivel ribosomal.
Para que estos segmentos de DNA antisense puedan funcionar es necesario que tengan una vida media prolongada y esto implica protegerlos de la acción de ciertas enzimas nucleofílicas. Una manera de hacerlos más resistentes a enzimas es la instalación de puentes fosfotioato entre las bases (puentes de sulfuro). Con esta modificación es posible prolongar su vida media de horas a varios días.
Por otra parte, los radicales fosfato confieren a los ácidos nucleicos alta carga negativa. Esto implica pobre solubilidad en lípidos y dificultad para atravesar la doble capa fosfolipídica de la membrana. Sin embargo es posible superar este obstáculo mediante encapsulación lipídica (liposomas).
Remodelación de la Cromatina y expresión Genética
La Cromatina del Núcleo Eucariotico resulta de ensambles dinámicos entre DNA genómico e Histonas u otras Proteínas Cromosomales (No-Histonas).
El empaquetamiento de los complejos DNA-Proteínas presenta un rango jerárquico que va desde Nucleosomas y Fibras de Cromatina de 30 nm hasta la compactación cromosomal en Metafase.
En la Cromatina de Interfase se distinguen áreas más oscuras de DNA compacto o Heterocromatina y áreas más claras de DNA laxo o Eucromatina.
Hay dos tipos de Heterocromatina: Constitutiva y Facultativa
La versión Constitutiva permanece siempre compacta, tiene DNA no genómico, incluye DNA telomérico y centromérico y algunas otras regiones cromosomales. Por ejemplo, en la mayor parte del cromosoma Y se registra Heterocromatina Constitutiva.
La variante Facultativa resulta de inactivación de genes y compactación transitoria de Cromatina en el curso del ciclo celular de ciertas células.
Se entiende por Eucromatina regiones menos compactas del DNA cromosomal con genes en actividad y fácil acceso de factores transcripcionales. En la Eucromatina el DNA está anclado a la matriz nuclear mediante secuencias de DNA ricas en Adenina y Timina, llamadas SAR por Scaffold Attachment Regions. Entre los SAR se ven dominios estructurales conformados por rulos de cromatina de 30 nm y 40 a 120 Kb de largo. Estas regiones parecen coincidir con regiones de expresión genética. La DNAasa-I es utilizada como marcador de expresión genética activa porque requiere de unión al DNA para ejercer su actividad enzimática y no puede acceder a las regiones silentes típicas del DNA compacto. Los dominios estructurales arriba mencionados son sensibles a DNAasa-I pero no siempre contienen genes en actividad. No obstante, en general, las regiones sensibles a la DNAasa-I suelen coincidir con genes en actividad. También se encuentran Sitios de Hipersensibilidad a la DNAasa-I (SHA) corriente arriba de cada gen y es a este nivel donde se ensamblan los Complejos Iniciadores de la Transcripción (CIT). Los SHA marcan el sitio de
ensamble de CIT sólo cuando un gen ha sido activado. Los genes son activados o desactivados mediante apertura o cierre del nucleosoma al ingreso de complejos transcripcionales.
Los Nucleosomas representan la unidad básica de empaquetamiento de complejos entre DNA e Histonas u otras proteínas cromosomales.
Las Histonas se encuentran únicamente en eucariotas, tienen alta proporción de aminoácidos con carga positiva (lisinas y argininas) y gran afinidad por el DNA que es de carga negativa. Las Histonas rara vez se disocian del DNA y por eso ejercen gran influencia en las reacciones que se producen a nivel cromosomal. Se reconocen histonas nucleosomales y no nucleosomales.
Las Histonas nucleosomales son pequeñas proteínas de 102-135 AA responsables de enroscar el DNA en unidades de empaquetamiento llamadas “nucleosomas”.
El nucleosoma es una pequeña partícula octamérica de 11 nm compuesta de dos copias de cada tipo de histona nucleosomal: H2A, H2B, H3 y H4. La doble hélice de DNA se enrosca 1.65 veces en cada nucleosoma, pero no todo el DNA se encuentra enroscado de la misma manera. Los nucleosomas son a su vez empaquetados en súper-estructuras muy regulares ordenadas por Histonas H1.
Diversos cambios estructurales y funcionales de la cromatina dependen de procesos de acetilación, metilación, fosforilación o ubicuitinización de histonas.
Una de las reacciones mejor estudiadas es la acetilación sobre residuos Lisina en las colas aminoterminales que protuyen de los octámeros de Histonas. La acetilación reduce la afinidad Histonas-DNA y disminuye la interacción entre nucleosomas individuales. De esta manera la estructura del Nucleosoma se relaja y permite el acceso de Factores Transcripcionales y otras Proteínas afines al DNA.
Sólo se registra acetilación de Histonas en regiones transcripcionalmente activas (Eucromatina). Las Histona-Acetil-Transferasas (HAT) fueron identificadas en 1997. La proteína eucariota p300/CBP es una HAT que desempeña un rol bien definido en la activación de diversos genes. Las HAT actúan en complejos multiproteicos específicos para diferentes Histonas y pueden también acetilar ciertos
factores transcripcionales.
Pero además las colas de Histonas presentan sitios de unión para metilos, fosfatos y ubicuitina, moléculas que también pueden modificar la estructura de la cromatina.
La formación de cromosomas durante la metafase parece resultar de fosforilación de H3 y Linker de histonas.
En general la metilación de residuos Lisina suele provocar efectos inhibitorios de la transcripción, como ocurre con la desfuncionalización de uno de los Cromosomas X en la mujer. Sin embargo las metilaciones sobre el aminoterminal de H3 puede provocar apertura (Lisina-4) o cierre (Lisina-9) de la estructura de cromatina.
La ubicuitinización de Histonas, como ocurre con la H2B interviene en la regulación del ciclo celular. Como hemos visto en el capítulo sobre Ciclo Celular, los procesos de Ubicuitinización suelen tener efectos agonistas salvo cuando conducen a lisis proteosomal.
Este amplio rango de modificaciones estructurales y funcionales sobre Octámeros de Histonas, permite componer un verdadero “Código de Histonas”. Este funciona a la manera de un conmutador telefónico, activando o desactivando grupos de genes, acorde con las necesidades y momentos evolutivos de la Célula.
Los Nucleosomas sufren también modificaciones no covalentes que provocan Remodelación o Reposicionamiento del Nucleosoma dentro de una corta región del genoma. Esto implica cambios estructurales que facilitan el acceso de proteínas transcripcionales a los sitios de unión al DNA, duplicación del tamaño del nucleosoma e incremento en la sensibilidad a la DNAasa del DNA asociado.
También puede desplazarse el Nucleosoma a lo largo del DNA o bien ser Transferido a una región cercana dentro de la misma molécula de DNA. Las proteínas de Remodelación integran grandes complejos proteicos.
El complejo Swi/Snf abarca 11 proteínas pero ninguna de ellas tiene afinidad por el DNA, por consiguiente debe ser reclutado al núcleo por otras proteínas.
Dado que se han registrado interacciones HAT/Swi/Snf es probable que algunas de estas remodelaciones ocurran en el contexto de acetilación de Histonas. Probablemente Swi/Snf haría blanco sobre grupos muy limitados de genes.
Silenciamiento del Genoma
El Silenciamiento genético es tan importante como la Activación. Una de las maneras de lograrlo es mediante la des-acetilación de lisinas en las colas amino-terminales de Histonas. Pero también la Metilación del ADN reprime la expresión genética.
La relación entre Histona Des-Acetilasas (HDAC) y silenciamiento
genético, fue descubierta en 1996. También las HDAC integran complejos multiproteicos.
Las HDAC suelen asociarse a la proteína Retinoblastoma y se encargan de inhibir la expresión de varios genes necesarios para la proliferación celular. De hecho las mutaciones que afectan a RbAp46 Y RbA48 promueven la transformación neoplásica. Hay complejos con actividad HDAC, como Sin3 y NuRD, que se unen al ADN metilado.
Las ADN-metiltransferasas pueden modificar el ADN mediante la transformación de Citosinas en Metil-Citosinas. En vertebrados la metilación de Citosinas del Genoma llega al 10 %. Hay dos tipos de metilación: de novo y de mantenimiento.
La metilación de mantenimiento asegura que las dos moléculas hijas del ADN puedan retener el mismo patrón de metilación que la molécula progenitora. Esto quiere decir que la metilasa de mantenimiento sólo puede metilar la secuencia citosina-guanina en la hebra hija, cuando la hebra progenitora tiene guanina-citosina metilada. La metilasa de mantenimiento permanece indiferente si en la hebra progenitora no hay citosina metilada.
La metilación de novo agrega metilos en posiciones totalmente nuevas provocando cambios de metilación en regiones localizadas del genoma. La metilación resulta en represión de la actividad genética.
Los genes en actividad se ubican en regiones no metiladas.
Micro-RNAs o miRNAs
Hace quince años Lee et al descubrieron un gen (lin-4) codificante de una pequeña secuencia de RNA de doble cadena, que podía reprimir la traducción a nucleoproteína del mRNA lin-14.
Era la primera vez que se registraba un fenómeno semejante: un gen codificaba un pequeño fragmento de RNA de doble cadena, cuya función era reprimir la actividad del producto mRNA de otro gen.
Siete años después se describía el segundo gen de este tipo y a comienzos del 2008, se calculaba que en una célula de mamífero podrían llegar a encontrarse hasta 50000 genes codificantes de miRNA.
Estos productos genéticos recibieron el nombre de microRNAs (miRNA) porque su tamaño oscila entre 21 y 23 nucléotidos de largo. Se trata de estructuras de RNA de doble cadena, codificadas por secuencias de DNA (genes) que no transcriben mRNA y por consiguiente no traducen a proteínas. En lugar de esto, dichos genes transcriben microRNA primario (pri-miRNA), este material es luego
transformado en pre-miRNA y finalmente en miRNA.
Los miRNAs maduros son moléculas parcialmente complementarias a una o más moléculas de mRNA y su tarea principal es modular o reprimir la expresión genética a nivel postranscripcional. Los miRNAs adoptan la forma de un “broche de pelo” o “hairpin” que resulta del plegado sobre sí misma de una hebra de RNA.
Se dice que el DNA de simple cadena adopta forma de hairpin cuando dos secuencias palindrómicas se aparean entre sí. Lo mismo ocurre con los miRNAs.
Los genes que codifican el transcripto original (pri-miRNA) son mucho más largos que el miRNA maduro. El pri-miRNA tiene 5’cap y 3’polyA y es convertido a pre-miRNA, una estructura RNA de 70 nucleótidos de largo. Esta transformación tiene lugar en el núcleo y es llevada a cabo por un “Complejo Microprocesador” integrado por una nucleasa (Drosha) y una proteína ligante de RNA de doble cadena (Pasha). Todo esto tiene lugar en el núcleo.
---C G---
C G
T A
G C
C G
X X
X X
X X
X
El pre-miRNA pasa entonces al citoplasma y es allí transformado en miRNA (maduro) por una endonucleasa (Dicer) y este inicia la formación del complejo silenciador inducido por RNA (RISC).
Un dato interesante es que los miRNA pueden surgir tanto de hebras sense como antisense como de intrones.
El pre-miRNA es cortado por la endonucleasa Dicer y esto separa la doble cadena del pre-miRNA en dos pequeñas hebras separadas entre sí. Solo una de ellas, la “hebra guía”, es seleccionada por una RNAsa del RISC llamada “argonauta” y pasa a integrar dicho complejo. La otra hebra llamada “pasajera” es degradada por RISC.
Una vez integrada al RISC la hebra guía se une por complementariedad de bases con su mRNA específico y este es degradado por las mencionadas RNAsas (argonautas) del RISC.
Los miRNAs intervienen en regulación de la expresión genética a nivel postranscripcional y para este propósito el miRNA debe tener complementaridad de bases con uno o más mRNAs. Los miRNAs de los animales suelen ser complementarios con un sitio de 3’UTR. Recordemos que UTR significa región no traducible de DNA. La formación de mRNA de doble hélice con miRNA induce por lo general su degradación. También puede bloquear la traducción a proteínas del mRNA sin provocar su degradación.
Los miRNAs pueden también inducir activación por unión a promoters. A este fenómeno se lo ha denominado activación genética por RNA de pequeño tamaño.
La actividad de los miRNAs puede ser bloqueada mediante Morfolino oligo o 2’-O-Metil RNA oligo. Pueden bloquearse pasos madurativos de miRNAs o directamente su interacción con sus mRNAs. Obviamente esto representa todo un campo para la farmacología moderna.
Obviamente el tema de los miRNAs tanto en diagnóstico como tratamiento es de interés en todos los campos de la biología: plantas, animales y humanos.
Hasta el momento se han descrito en humanos más de 200 microRNAs con funciones regulatorias insuficientemente estudiadas. Sin embargo ya se ha demostrado que un cluster de microRNAs, el policistron mir-17-92, suele estar significativamente amplificado en Linfomas No Hodgkin B humanos y Leucemias Agudas de estirpe linfoide.
Los miRNAs regulan diversos procesos biológicos, incluyendo desarrollo y crecimiento celular, apoptosis y hematopoyesis.
En Leucemias Agudas de estirpe linfoide se encontraron aumentados los niveles de expresión de miR-331 y miR-128b. El miR-331 provoca la degradación o inhibición del mRNA de SOCS1 que es inhibidor de STAT, un conocido mediador de proliferación y sobrevida celular. Ergo la sobre-producción de miR-331 deja sin regulación al STAT y esto genera activación de la proliferación celular. En pacientes con Leucemia Linfocítica Crónica seha demostrado también sobre regulación en la producción de miRNAs: miR-331, miR-29a, miR-195, miR-34a y miR-29c.
LITERATURA SUGERIDA
- Alberts B, Johnson A, Lewis J, Raff M, Roberts K, Walter P. 2002. Molecular Biology of The Cell. Forth Edition.
- Watson JD, Baker TA, Bell SP, Gann A, Levine M, Losick R. 2003. Molecular Biology of the Gene. Fifht Edition.
- Brown TA, 2002. Genomes, Second Edition. BIOS Scientific Publishers Ltd.
- Benz EJ, Wagner A, Berliner N. 2005. Anatomy and Physiology of the Gene. In Hematology, Basic Principles and Practice, Hoffman R, Benz EJ, Shattil SJ, Furie B, Cohen HJ, Silberstein LE, McGlave P. Fourth Edition.
- Lekstrom-Himes J and Xanthopoulos KG. Oct 1998. Minireviw. Biological Role of the CCAAT/Enhancer-Binding Protein Family of Transcription Factors. J Biol Chem Vol 273, (44) 28545-28548. Imprinting
- Kierszenbaum AL. Nov.2002. Genomic imprinting and epigenetic reprogramming: unearthing the garden of forking paths. Mol Reprod Dev, 63 (3): 329-34.
- Ohlson R and Kanduri C. 2002. New Twists on the Epigenetics of CpG Islands. Genome Res Vol 12 (4) 525-526.
- Slagboom PE, Meulenbelt I. 2002. Organisation of the human genome and our tools for identifying disease genes. Biological Psychology 61, 11-31.
- Crooke ST. 1998. An overview of progess in antisense therapeutics, Antisense Nucelic Acid Drug Dev 8:115.
- Kingston RE and NArlikar GJ. 1999. ATP-dependent remodeling and acetylation as regulators of chromatin fluidity. Genes Dev. 13 (18) 2339-2352.
- Kornberg RD. 2001. The Eucaryotic Gene Transcription Machinery. Biol.Chem. 392, pp 1103-1107.
*capitulo extraído del libro: El Sistema Inmune: Genética, Biología Molecular, Clínica, Farmacología / Autores: Ricardo Antonio Giuliani y Eleno Martínez Aquino - 1a. Ed. - Ciudad Autónoma de Buenos Aires, Argentina.
Eritroferon S.R.L., 2011.
ISBN 978-987-27121-0-5