”Able was I was I saw Elba »: cette déclaration plutôt bombée est une phrase palindrome, en d’autres termes, elle se lit exactement de la même manière en avant qu’en arrière. Le début de la révolution CRISPR a été marqué par la découverte d’un grand nombre de séquences palindromiques répétées dans une région de l’ADN bactérien. Dans ces séquences, les lettres du code génétique, les quatre molécules de base adénine, cytosine, thymine et guanine, sont ordonnées de manière à avoir le même ordre que le deuxième brin d’ADN complémentaire – dans ce cas lu en sens inverse. C’est la propriété qui donne à CRISPR (Répétitions Palindromiques Courtes Régulièrement Espacées) son nom de torsion de la langue.
Contrairement aux palindromes de mots comme « civic » et « tenet », qui ont une signification, les palindromes du dictionnaire génétique n’ont pas de sens et ne peuvent pas être traduits en protéines fonctionnelles. Néanmoins, ils ne sont pas entièrement dénués de sens. Les protéines coupant l’ADN utilisent fréquemment des séquences de palindrome comme séquences de reconnaissance, au cours desquelles elles coupent la molécule d’ADN. Ces séquences peuvent être longues de quatre, six ou huit paires de bases, bien que certaines protéines de coupe nécessitent 20 paires de bases ou plus.
À partir des séquences palindromiques de la région CRISPR, des molécules d’ARN sont transcrites, qui adoptent une disposition très stable (structure secondaire). Ils varient entre 23 et 47 paires de bases de longueur. Des régions variables de longueur similaire peuvent être trouvées entre ces séquences. Ils proviennent du génome de l’ADN étranger qui a pénétré la cellule bactérienne et sont également connus sous le nom d’ADN espaceur.
La région CRISPR comprend un promoteur qui garantit que la région CRISPR peut être lue et traduite en ARN CRISPR (ARNCR). D’autres gènes connus sous le nom de gènes associés à CRISPR (Cas) sont adjacents à celui-ci. Ces gènes fournissent le modèle pour les protéines Cas – à savoir, les enzymes qui coupent le brin d’ADN. Les séquences CRISPR et spacer sont suivies d’une région pour une molécule d’ARN connue sous le nom de tracrRNA, qui guide les molécules de coupe et l’ARNCR vers leurs emplacements cibles sur l’ADN du virus.