1 Inleiding
Arabidopsis thaliana heeft vele attributen die het een zeer aantrekkelijk modelsysteem maken voor plantengenomica. Het belangrijkste hiervan is dat het een zeer klein nucleair (sn) genoom heeft, één van de kleinste onder de angiospermen. Zestig jaar geleden toonden Sparrow en Miksche (1961) aan dat Stralingsgevoeligheid en DNA-inhoud gerelateerd zijn aan planten en dat Arabidopsis zeer resistent is tegen ioniserende straling, wat wijst op een zeer klein genoom. Sparrow, Price en Underbrink (1972) gingen verder om aan te tonen dat A. thaliana het kleinste nucleaire volume onder de geteste angiospermen had. Latere studies, waarbij verschillende methoden werden gebruikt, bevestigden dit resultaat (voor een overzicht, zie Meyerowitz, 1994). Leutwiler, Hough-Evans and Meyerowitz (1984) toonden ook aan dat Arabidopsis een zeer kleine hoeveelheid repetitief DNA had. In de vroege dagen van de moleculaire biologie, maakte een SN genoom het mogelijk om een volledige Lambda bacteriofaag genomic bibliotheek op slechts een paar platen te plaatsten om te screenen voor het hybridiseren van sequenties (Leutwiler et al., 1984; Meyerowitz & Pruitt, 1985; Pruitt & Meyerowitz, 1986). Dit was veel omslachtiger en duurder in andere plantensoorten met genomen geschat op 4-100 × groter en met aanzienlijke repetitieve DNA. Kleinere nucleaire genomen zijn sindsdien ontdekt in drie taxa van vleesetende planten, Genlisea margaretae en G. aurea met respectievelijk 63 en 64 Mbp, en Utricularia gibba met 88 Mbp (Greilhuber et al., 2006), maar ze missen de meeste eigenschappen die nodig zijn om plant modelsystemen te zijn.
Arabidopsis heeft vele andere voordelen ten opzichte van andere plantensoorten als botanisch model. Arabidopsis tolereert niet alleen het leven in een groeikamer (Brendel, Kurtz, & Walbot, 2002)—het is perfect voor groei in een laboratoriumomgeving. Het kan worden gekweekt onder een breed scala van omstandigheden van potten tot Petrischalen tot reageerbuisjes. Arabidopsis heeft ook een zeer korte generatietijd vergeleken met veel andere plantensoorten, 6-8 weken. Het is zelfbevruchtend, met een diploïde chromosoomaantal van 10 (vijf paren), en het produceert een groot aantal zaden elke generatie, waardoor het gemakkelijk is om genetische screens en analyse van alle varianten te doen. De M2 zaden van een populatie van slechts 3000 M1 planten kunnen worden gescreend met een redelijke kans op het vinden van een recessieve mutant van belang. Een genetische kaart is bevolkt met gekarakteriseerde mutanten. Arabidopsis is vatbaar voor de meest bekende weefselkweek technieken en is transformeerbaar door een aantal methoden (Lloyd et al.( Bechtold & Pelletier, 1998; Clough & Bent, 1998; Feldmann & Marks, 1987). Er zijn een grote verscheidenheid aan landrassen met veel verschillende morfologische en fysiologische kenmerken. Veel van de biologische hulpbronnen van zaden tot cDNA ‘ s zijn beschikbaar via het Arabidopsis Biological Resource Center en het European Arabidopsis Stock Centre (Nottingham Arabidopsis Seed Center—NASC). Tot slot is het lid van een landbouwkundig belangrijke groep planten, de brassica of mosterdfamilie. Nochtans, is de één eigenschap van Arabidopsis die niet kan worden overschat zijn kleine genoomgrootte zoals die door publicaties van de Meyerowitz groep in 1984 wordt aangetoond. Deze publicaties brachten deze soort onder de aandacht van vele moleculaire biologen over de hele wereld en de omvang van de Arabidopsis gemeenschap explodeerde in de komende 5 jaar.het initiatief voor de sequentie van het Arabidopsis-genoom werd in 1989 voorgesteld door het Directoraat biologische, gedrags-en Sociale Wetenschappen (BBS) van de National Science Foundation (NSF) met aanzienlijke inbreng van academische en industriële wetenschappers. Hoewel niet direct vermeld, wilde het agentschap $100 miljoen uitgeven om een genoomproject te ontwikkelen dat gelijkwaardig is aan het human genome project van het National Institute of Health. Een reeks vergaderingen en workshops, met wetenschappers uit de Verenigde Staten, Europa, Japan en Australië, werd gehouden om een kader te ontwerpen voor de ontwikkeling van de middelen die nodig zijn om het genoom te sequencen. Aangezien Arabidopsis het eerste installatiegenoom, en één van vroegste eukaryotes was om te worden gerangschikt, waren er vele strategieën uit te werken en efficiency te bereiken. Gelukkig was de Arabidopsis-gemeenschap, net als bij de worm-en vliegonderzoeksgemeenschappen, zeer coöperatief. Een plan om Arabidopsis genoom onderzoek te coördineren werd beschreven in een 1990 publicatie ‘A Long-Range Plan for the Multinational Coordinated A. thaliana Genome Research Project’ (NSF 90-80). Gezien de staat van het rangschikken van technologie op dat moment, werd geschat dat het genoom tegen het jaar 2000 zou kunnen worden gerangschikt. Als zodanig, begon de Arabidopsis onderzoeksgemeenschap de biologische hulpbronnen te vestigen die nodig zijn voor het rangschikken van het genoom. In 1996, werd het Arabidopsis Genome Initiative (AGI) gevormd ‘om samenwerking tussen internationale het rangschikken projecten te vergemakkelijken’ zodat het genoom tegen het jaar 2004 kon worden gesequenced, behalve voor de moeilijk-om-opeenvolgend repetitieve gebieden zoals de nucleolar organiserende gebieden (NORs) en centromeres. Met verbeteringen in sequencing technologieën en concurrentie tussen de Arabidopsis sequencing groepen en de industrie (in begin 1998, Ceres, Inc., had een overeenkomst met genset SA ondertekend om het Arabidopsis genoom te rangschikken), evenals groepen die Drosophila en mens rangschikken, kon de AGI het Arabidopsis genoom tegen 2000 (het Arabidopsis Genoominitiatief, 2000), de oorspronkelijke streefdatum publiceren.