1 Introducción
Arabidopsis thaliana tiene muchos atributos que lo convierten en un sistema modelo muy atractivo para la genómica de plantas. El más importante de ellos es que tiene un genoma nuclear muy pequeño (ns), uno de los más pequeños entre las angiospermas. Hace sesenta años, Sparrow y Miksche (1961) demostraron que la sensibilidad a la radiación y el contenido de ADN están relacionados en las plantas y que la Arabidopsis es altamente resistente a la radiación ionizante, lo que sugiere un genoma muy pequeño. Sparrow, Price and Underbrink (1972) continuó mostrando que A. thaliana tenía el volumen nuclear más pequeño entre las angiospermas probadas. Estudios posteriores, utilizando varios métodos, confirmaron este resultado (para una revisión, véase Meyerowitz, 1994). Leutwiler, Hough-Evans y Meyerowitz (1984) también mostraron que la Arabidopsis tenía una cantidad muy pequeña de ADN repetitivo. En los primeros días de la biología molecular, un genoma sn permitía colocar una biblioteca genómica de bacteriófagos lambda completa en unas pocas placas para detectar secuencias de hibridación (Leutwiler et al., 1984; Meyerowitz & Pruitt, 1985; Pruitt & Meyerowitz, 1986). Esto era mucho más laborioso y costoso en otras especies de plantas con genomas estimados en 4-100 × más grandes y con un ADN repetitivo considerable. Desde entonces se han descubierto genomas nucleares más pequeños en tres taxones de plantas carnívoras, Genlisea margaretae y G. aurea con 63 y 64 Mbp, respectivamente, y Utricularia gibba con 88 Mbp (Greilhuber et al., 2006), pero carecen de la mayoría de los atributos necesarios para ser sistemas modelo de planta.
Arabidopsis tiene muchas otras ventajas sobre otras especies de plantas como modelo botánico. Arabidopsis no solo «tolera la vida en una cámara de crecimiento»(Brendel, Kurtz, & Walbot, 2002), es perfecta para el crecimiento en un entorno de laboratorio. Se puede cultivar en una amplia gama de condiciones, desde macetas hasta placas de petri y tubos de ensayo. La arabidopsis también tiene un tiempo de generación muy corto en comparación con muchas otras especies de plantas, de 6 a 8 semanas. Es autofertilizante, con un número de cromosomas diploides de 10 (cinco pares), y produce un gran número de semillas en cada generación, lo que facilita la realización de exámenes genéticos y el análisis de cualquier variante. Las semillas M2 de una población de solo 3000 plantas M1 se pueden seleccionar con una probabilidad razonable de encontrar un mutante recesivo de interés. Un mapa genético ha sido poblado con mutantes caracterizados. La arabidopsis es susceptible a las técnicas de cultivo de tejidos más conocidas y se puede transformar mediante varios métodos (Lloyd et al., 1986), incluyendo métodos de cultivo no extensibles que hacen práctico hacer pantallas de mutagénesis de inserción de ADN en T (Bechtold & Pelletier, 1998; Clough & Bent, 1998; Feldmann & Marcas, 1987). Hay una amplia variedad de razas terrestres con muchas características morfológicas y fisiológicas diferentes. Muchos de los recursos biológicos, desde las semillas hasta los ARNC, están disponibles a través del Centro de Recursos Biológicos Arabidopsis y el Centro Europeo de Existencias de Arabidopsis (Centro de Semillas de Arabidopsis de Nottingham—NASC). Por último, es miembro de un grupo de plantas de importancia agronómica, la familia de la brassica o mostaza. Sin embargo, la única característica de Arabidopsis que no se puede exagerar es su pequeño tamaño del genoma, como lo demuestran las publicaciones del grupo Meyerowitz en 1984. Estas publicaciones llamaron la atención de muchos biólogos moleculares de todo el mundo sobre esta especie y el tamaño de la comunidad de Arabidopsis explotó en los siguientes 5 años.
La iniciativa para secuenciar el genoma de la Arabidopsis fue propuesta en 1989 por la Dirección de Ciencias Biológicas, del Comportamiento y Sociales (BBS) de la Fundación Nacional de Ciencias (NSF) con una considerable aportación de científicos académicos e industriales. Aunque no se indicó directamente, la agencia quería gastar 1 100 millones para desarrollar un proyecto de genoma equivalente al proyecto del genoma humano del Instituto Nacional de Salud. Se celebró una serie de reuniones y talleres con científicos de los Estados Unidos, Europa, el Japón y Australia con el fin de planificar un marco para el desarrollo de los recursos necesarios para secuenciar el genoma. Como Arabidopsis fue el primer genoma de la planta, y uno de los primeros eucariotas en secuenciarse, había muchas estrategias que elaborar y eficiencias que obtener. Afortunadamente, al igual que con las comunidades de investigación de gusanos y moscas, la comunidad de Arabidopsis fue muy colaborativa. En una publicación de 1990 titulada «A Long-Range Plan for the Multinational Coordinated A. thaliana Genome Research Project» (NSF 90-80) se describió un plan para coordinar la investigación del genoma de la arabidopsis. Dado el estado de la tecnología de secuenciación en ese momento, se estimó que el genoma podría ser secuenciado para el año 2000. Como tal, la comunidad de investigación de Arabidopsis comenzó a establecer los recursos biológicos necesarios para secuenciar el genoma. En 1996, se creó la Iniciativa del Genoma de Arabidopsis (AGI) «para facilitar la cooperación entre proyectos internacionales de secuenciación», de modo que el genoma pudiera ser secuenciado para el año 2004, excepto para las regiones repetitivas de difícil secuenciación, como las regiones organizadoras nucleolares (NORs) y los centrómeros. Con mejoras en las tecnologías de secuenciación y la competencia entre los grupos de secuenciación de Arabidopsis y la industria (a principios de 1998, Ceres, Inc., había firmado un acuerdo con Genset SA para secuenciar el genoma de Arabidopsis), así como grupos de secuenciación de Drosophila y human, el AGI pudo publicar el genoma de Arabidopsis para el año 2000 (La Iniciativa del Genoma de Arabidopsis, 2000), la fecha objetivo original.