1 Wprowadzenie
Arabidopsis thaliana ma wiele cech, które czynią go bardzo atrakcyjnym systemem modelowym dla genomiki roślin. Najważniejszym z nich jest to, że ma bardzo mały Genom jądrowy (sn), jeden z najmniejszych wśród okrytonasiennych. Sześćdziesiąt lat temu Sparrow i Miksche (1961) wykazali, że wrażliwość na promieniowanie i zawartość DNA są powiązane w roślinach, a Arabidopsis jest wysoce odporny na promieniowanie jonizujące, co sugeruje bardzo mały Genom. Sparrow, Price and Underbrink (1972) wykazali, że A. thaliana miała najmniejszą objętość jądrową wśród badanych okrytonasiennych. Późniejsze badania, przy użyciu różnych metod, potwierdziły ten wynik (dla przeglądu patrz Meyerowitz, 1994). Leutwiler, Hough-Evans i Meyerowitz (1984) również wykazali, że Arabidopsis ma bardzo małą ilość powtarzalnego DNA. We wczesnych dniach biologii molekularnej, Genom sn umożliwił płytkę całej biblioteki genomowej bakteriofagów lambda na zaledwie kilku płytkach w celu przesiewania sekwencji hybrydyzujących (Leutwiler et al., 1984; Meyerowitz & Pruitt, 1985; Pruitt & Meyerowitz, 1986). Było to o wiele bardziej pracochłonne i kosztowne u innych gatunków roślin z genomami szacowanymi na 4-100 × większe i ze znacznym powtarzalnym DNA. Mniejsze genomy jądrowe zostały odkryte w trzech taksonach roślin mięsożernych, Genlisea margaretae i G. aurea z odpowiednio 63 i 64 Mbp oraz Utricularia gibba z 88 MBP (Greilhuber et al., 2006), ale brakuje im większości atrybutów niezbędnych do budowy systemów modelowych.
Arabidopsis ma wiele innych zalet w porównaniu z innymi gatunkami roślin jako model botaniczny. Arabidopsis nie tylko „toleruje życie w komorze wzrostu”(Brendel, Kurtz, & Walbot, 2002)—doskonale nadaje się do wzrostu w warunkach laboratoryjnych. Może być uprawiany w szerokim zakresie warunków od garnków do naczyń Petriego do probówek. Arabidopsis ma również bardzo krótki czas generacji w porównaniu do wielu innych gatunków roślin, 6-8 tygodni. Jest samonapłodniony, ma diploidalną liczbę chromosomów 10 (pięć par) i wytwarza dużą liczbę nasion w każdym pokoleniu, co ułatwia wykonywanie przesiewaczy genetycznych i analizę dowolnych wariantów. Nasiona M2 z populacji zaledwie 3000 roślin M1 mogą być badane z rozsądnym prawdopodobieństwem znalezienia recesywnego mutanta będącego przedmiotem zainteresowania. Mapa genetyczna została wypełniona charakterystycznymi mutantami. Arabidopsis jest podatny na najbardziej znane techniki hodowli tkankowej i można go przekształcić za pomocą wielu metod(Lloyd et al.(Bechtold & Pelletier, 1998; Clough & Bent, 1998; Feldmann & Marks, 1987). Istnieje wiele różnych ras lądowych o wielu różnych cechach morfologicznych i fizjologicznych. Wiele zasobów biologicznych, od nasion do cDNA, jest dostępnych za pośrednictwem Arabidopsis Biological Resource Center i European Arabidopsis Stock Centre (Nottingham Arabidopsis Seed Center-NASC). W końcu należy do grupy roślin o znaczeniu agronomicznym, rodziny kapustowatych lub gorczycowych. Jednak jedyną cechą Arabidopsis, której nie można przecenić, jest jego mały rozmiar genomu, o czym świadczą publikacje grupy Meyerowitza z 1984 roku. Publikacje te zwróciły uwagę na ten gatunek wielu biologów molekularnych na całym świecie, a wielkość społeczności Arabidopsis eksplodowała w ciągu następnych 5 lat.
inicjatywa sekwencjonowania genomu Arabidopsis została zaproponowana w 1989 roku przez Dyrekcję Nauk Biologicznych, behawioralnych i społecznych (BBS) National Science Foundation (NSF) ze znacznym wkładem naukowców akademickich i przemysłowych. Chociaż nie bezpośrednio stwierdzono, Agencja chciała wydać $100 mln do opracowania projektu genomu równoważnego do projektu ludzkiego genomu Narodowego Instytutu Zdrowia. Seria spotkań i warsztatów z udziałem naukowców ze Stanów Zjednoczonych, Europy, Japonii i Australii miała na celu zaplanowanie ram rozwoju zasobów niezbędnych do sekwencjonowania genomu. Ponieważ Arabidopsis był pierwszym genomem roślinnym i jednym z najwcześniejszych sekwencjonowanych eukariotów, należało opracować wiele strategii i uzyskać wydajność. Na szczęście, podobnie jak w przypadku społeczności badawczych robaków i much, społeczność Arabidopsis bardzo współpracowała. Plan koordynacji badań nad genomem Arabidopsis został opisany w publikacji z 1990 roku „A Long-Range Plan for the Multinational Coordinated A. thaliana Genome Research Project” (NSF 90-80). Biorąc pod uwagę stan technologii sekwencjonowania w tym czasie, oszacowano, że genom może być zsekwencjonowany do roku 2000. W związku z tym społeczność badawcza Arabidopsis zaczęła ustalać zasoby biologiczne potrzebne do sekwencjonowania genomu. W 1996, Arabidopsis Genome Initiative (AGI) została utworzona „w celu ułatwienia współpracy między międzynarodowymi projektami sekwencjonowania” tak, że genom może być zsekwencjonowany do roku 2004, z wyjątkiem trudnych do sekwencjonowania powtarzalnych regionów, takich jak nucleolar organizing regions (NORs) i centromeres. Dzięki ulepszeniom technologii sekwencjonowania i konkurencji między grupami sekwencjonującymi Arabidopsis a przemysłem (na początku 1998 r. Ceres, Inc., podpisał umowę z Genset SA na sekwencję genomu Arabidopsis), a także grup sekwencjonujących Drosophila i człowieka, AGI był w stanie opublikować Genom Arabidopsis do 2000 roku (The Arabidopsis Genome Initiative, 2000), pierwotną datę docelową.