Cas9 (CRISPR associated protein 9) es una enzima endonucleasa de ADN dirigida por un ARN guía que se encuentra asociada con el sistema CRISPR (Repeticiones Palindrómicas Cortas Agrupadas y Regularmente Interespaciadas). Este se trata de un sistema de inmunidad que puede encontrarse en numerosas bacterias, como el Streptococcus pyogenes. Cas9 es capaz de memorizar secuencias de ADN de bacteriófagos invasores o de plásmidos que ataquen a la bacteria para, más tarde, reconocer este ADN, y actuar sobre él, inactivándolo.[1][2] Cas9 realiza este proceso desenrollando el ADN exógeno (actuando como lo haría una helicasa) y comprobando si es complementario a alguna región espaciadora de CRISPR. Si el substrato de ADN es reconocido, Cas9 se adhiere al ADN invasor y lo corta en una determinada región de forma que queda inactivado. En este sentido, el sistema CRISPR-Cas9 es un mecanismo muy similar al mecanismo de interferencia de ARN (ARNi) de eucariotas.
Cas9 | |
---|---|
Estructura cristalina de Cas9 S pyogenes en el complejo con sgRNA y su ADN objetivo en la resolución 2,6 A ˚. (Nishimasu, et al. 2015) | |
Identificadores | |
Organismo | |
Símbolo | cas9 |
Alt. symbols | SPy_1046 |
RefSeq (Prot) | NP_269215.1 |
UniProt | Q99ZW2 |
Otros datos | |
Número EC | 3.1.-.- |
Cromosoma | Genomico: 0.85 - 0.86 Mb |
La proteína Cas9 se ha utilizado en gran medida como una herramienta de ingeniería genómica para inducir la rotura dirigida del ADN de doble cadena. Estas rupturas pueden conducir a la inactivación génica o a la introducción de genes heterólogos a través de unión no homóloga y recombinación homóloga respectivamente en muchos organismos de modelo de laboratorio. Junto con las nucleasas de zinc y las proteínas TALEN, Cas9 se está convirtiendo en una herramienta destacada en el campo de la edición del genoma. Cas9 ha ganado la tracción en los últimos años, ya que puede escindir casi cualquier secuencia complementaria a la guía RNA.[2] Debido a que la especificidad de destino de Cas9 proviene de la ARN guía: la complementariedad de ADN y no modificaciones de la propia proteína (como TALENs y dedos de zinc), la ingeniería Cas9 para dirigir el nuevo ADN es sencillo[3][4] Las versiones de Cas9 que se unen, pero no escinden el ADN cognado puede ser utilizado para localizar transcripcional activador o represores a secuencias de ADN específico con el fin de controlar la activación transcripcional y la represión[5][6] La orientación de Cas9 se ha simplificado mediante la ingeniería de un solo ARN guía quimérico. Los científicos han sugerido que los impulsos genéticos basados en Cas9 pueden ser capaces de editar los genomas de poblaciones enteras de organismos.[7] En 2015, los científicos utilizaron Cas9 para modificar el genoma de embriones humanos por primera vez.[8]
La estructura cristalina de Cas9 se unió al ADN, según lo resuelto por Anders et al en su papel de la naturaleza 2014. Las interpretaciones estructurales se realizaron utilizando el software Quimera de UCSF.
Cas9 presenta una arquitectura bi-lobulada con el ARN guía situado entre el lóbulo alfa-helicoidal (azul) y el lóbulo de la nucleasa (cian, naranja y gris). Estos dos lóbulos están conectados a través de una sola hélice de puente. Existen dos dominios de nucleasa situados en el lóbulo de nucleasa multidominio, el RuvC (gris) que escinde la cadena de ADN no diana y el dominio de nucleasa HNH (cian) que escinde la cadena diana de ADN. De manera interesante, el dominio RuvC está codificado por sitios secuencialmente dispares que interactúan en la estructura terciaria para formar el dominio de escisión RuvC.
Una característica clave del ADN diana es que debe contener un motivo adyacente protospacer (PAM) que consiste en la secuencia de tres nucleótidos-NGG. Este PAM es reconocido por el dominio de interacción PAM (dominio PI, naranja) situado cerca del extremo C-terminal de Cas9. Cas9 experimenta cambios conformacionales distintos entre los Estados Unidos de apo, de ARN de guía y de ARN de guía: enlazados de ADN, que se detallan a continuación. PAM es reconocido por Arg 1333 y Arg 1335 en la ranura principal por una β-horquilla, donde se unen a dG2 y dG3 de PAM.[9]
Cas9 reconoce la arquitectura de tallo-bucle inherente en el locus CRISPR, que media la maduración del CRRNA-tracrRNA ribonucleoprotein complejo.[10] Cas9 en complejo con CRISPR ARN (CRRNA) y trans-activación crRNA (tracrRNA), además, reconoce y degrada la dsDNA objetivo.[11] En la estructura de co-cristal que se muestra aquí, el complejo de CRRNA-tracrRNA se reemplaza por un ARN de guía única quimérico (sgRNA, en rojo) que se ha demostrado que tiene la misma función que el complejo de ARN natural.[12] La base de sgRNA emparejado con ssDNA objetivo está anclado por Cas9 como una arquitectura en forma de T. Esta estructura cristalina de la enzima Cas9 unida a ADN revela cambios conformacionales distintos en el lóbulo alfa-helicoidal con respecto al lóbulo de nucleasa, así como la localización en el dominio HNH. La proteína consiste en un lóbulo de reconocimiento (REC) y un lóbulo de nucleasa (NUC). Debe observarse que todas las regiones excepto el HNH forman estrechas interacciones entre sí y el complejo sgRNA-ssDNA, mientras que el dominio HNH forma pocos contactos con el resto de la proteína. En otra conformación del complejo Cas9 observada en el cristal, el dominio HNH no es visible. Estas estructuras sugieren la flexibilidad conformacional del dominio HNH.
Se han publicado varias estructuras de cristal, incluyendo:
En el complejo sgRNA-Cas9, basado en la estructura cristalina, los dominios REC1, BH y PI tienen contactos importantes con la columna vertebral o las bases en la región de repetición y espaciadora.[18][14] Se han probado varios mutantes Cas9 que incluyen deleción de dominios REC1 o REC2 y mutaciones de residuos en BH. Los mutantes relacionados con REC1 y BH muestran una actividad menor o ninguna en comparación con el tipo salvaje, lo que indica que estos dos dominios son cruciales para el reconocimiento de sgRNA en la secuencia repetida y la estabilización de todo el complejo. Aunque las interacciones entre la secuencia espaciadora y Cas9, así como el dominio PI y región de repetición necesitan estudios adicionales, el co-cristal demuestra clara interfaz entre Cas9 y sgRNA. De hecho, la estructura cristalina reciente de Cas9 unido a ARN de guía única revela que la secuencia de "semilla" de ARN de 10 nucleótidos se preordena en una conformación de forma A para el reconocimiento de ADN diana. Además de las secuencias de semillas preordenadas, la comparación del complejo Cas9-sgRNA con la estructura unida al ADN diana (PDB 4UN3) revela que los sitios que interaccionan con PAM (R1333 y R1335) responsables de la 5'-NGG-3 'PAM Reconocimiento se colocan previamente antes de unirse al ADN diana. En conjunto, estas observaciones estructurales muestran que la región espaciadora del sgRNA, especialmente la región de la semilla, es esencial para desencadenar Cas9 para formar una estructura de reconocimiento de ADN competente que está listo para acoplar secuencias diana de ADN de doble hebra.[16]
El análisis de secuencias anteriores y los estudios bioquímicos han sugerido que Cas9 contiene dominios homólogos de endonucleasa RNasa H y HNH que son responsables de escisiones de dos hebras de ADN diana, respectivamente. Estos resultados son finalmente probados en la estructura. Aunque la baja similitud de secuencias, la secuencia similar a RNasa H tiene un pliegue RuvC (un miembro de la familia RNasa H) y la región HNH se pliega como T4 Endo VII (un miembro de la familia de endonucleasas HNH). Los trabajos anteriores sobre Cas9 han demostrado que el dominio HNH es responsable de la escisión de la secuencia complementaria del ADN diana y RuvC es responsable de la secuencia no complementaria (Westra, et al., 2012; Wiedenheft, et al., 2014).