“Able was I ere I saw Elba”: questa affermazione piuttosto roboante è una frase palindroma, in altre parole legge esattamente lo stesso avanti che indietro. L’inizio della rivoluzione CRISPR fu segnato dalla scoperta di un gran numero di sequenze palindromiche ripetute in una regione di DNA batterico. In queste sequenze, le lettere del codice genetico, le quattro molecole base adenina, citosina, timina e guanina, sono ordinate in modo tale da avere lo stesso ordine del secondo filamento di DNA complementare-in questo caso letto in direzione opposta. Questa è la proprietà che conferisce a CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) il suo nome di torsione della lingua.
A differenza dei palindromi di parole come ‘civic’ e ‘tenet’, che hanno un significato, i palindromi nel dizionario di genetica non hanno senso e non possono essere tradotti in proteine funzionali. Tuttavia, non sono del tutto privi di significato. Le proteine di taglio del DNA usano frequentemente sequenze palindrome come sequenze di riconoscimento, in cui tagliano la molecola di DNA. Queste sequenze possono essere lunghe quattro, sei o otto coppie di basi, anche se alcune proteine di taglio richiedono 20 o più coppie di basi.
Dalle sequenze palindromiche della regione di CRISPR vengono trascritte molecole di RNA, che adottano una disposizione molto stabile (struttura secondaria). Essi variano tra 23 e 47 coppie di basi di lunghezza. Regioni variabili di lunghezza simile possono essere trovate tra queste sequenze. Hanno avuto origine dal genoma di DNA estraneo che penetrava nella cellula batterica e sono anche noti come DNA distanziatore.
La regione di CRISPR include un promotore che assicura che la regione di CRISPR possa essere letta e tradotta nel CRISPR-RNA (crRNA). Altri geni noti come geni associati a CRISPR (Cas) si trovano adiacenti ad esso. Questi geni forniscono il modello per le proteine Cas-vale a dire, gli enzimi che tagliano il filamento di DNA. Le sequenze CRISPR e spacer sono seguite da una regione per una molecola di RNA nota come tracrRNA, che guida le molecole di taglio e il crRNA alle loro posizioni target sul DNA del virus.