2006 började Fei-Fei Li idissla om en ide.
Li, en nyligen präglad datavetenskapsprofessor vid University of Illinois Urbana-Champaign, såg sina kollegor över hela akademin och AI-industrin hamra bort på samma koncept: en bättre algoritm skulle fatta bättre beslut, oavsett data.men hon insåg en begränsning till detta tillvägagångssätt – den bästa algoritmen skulle inte fungera bra om de data som den lärde sig av inte återspeglade den verkliga världen.
hennes lösning: bygg en bättre dataset.
”vi bestämde oss för att vi ville göra något som var helt historiskt oöverträffat”, sa Li och hänvisade till ett litet team som ursprungligen skulle arbeta med henne. ”Vi kommer att kartlägga hela världen av objekt.”
den resulterande datamängden kallades ImageNet. Ursprungligen publicerad 2009 som en forskningsaffisch som fastnat i hörnet av ett konferenscenter i Miami Beach, utvecklades datasetet snabbt till en årlig tävling för att se vilka algoritmer som kunde identifiera objekt i datasättets bilder med den lägsta felfrekvensen. Många ser det som katalysatorn för den ai-boom som världen upplever idag.
Alumner från ImageNet challenge finns i alla hörn av teknikvärlden. Tävlingens första vinnare 2010 fortsatte med att ta ledande roller på Baidu, Google och Huawei. Matthew Zeiler byggde Clarifai baserat på sin 2013 ImageNet-vinst och stöds nu av 40 miljoner dollar i VC-finansiering. I 2014 delade Google den vinnande titeln med två forskare från Oxford, som snabbt knäpptes upp och lades till i sitt nyligen förvärvade DeepMind lab.
Li själv är nu chefsforskare på Google Cloud, professor vid Stanford, och chef för universitetets AI-lab.
idag tar hon scenen på CVPR för att prata om Imagenets årliga resultat för sista gången—2017 var tävlingens sista år. På bara sju år steg den vinnande noggrannheten i att klassificera objekt i datasetet från 71.8% till 97.3%, överträffade mänskliga förmågor och effektivt bevisade att större data leder till bättre beslut.
även när tävlingen slutar tar dess arv redan form. Sedan 2009 har dussintals nya AI-forskningsdataset introducerats i delfält som datorsyn, naturlig språkbehandling och röstigenkänning.
”paradigmskiftet för ImageNet-tänkandet är att medan många människor uppmärksammar modeller, låt oss vara uppmärksamma på data”, sa Li. ”Data kommer att omdefiniera hur vi tänker på modeller.”
Vad är ImageNet?
i slutet av 1980-talet startade Princetonpsykologen George Miller ett projekt som heter WordNet, i syfte att bygga en hierarkisk struktur för det engelska språket. Det skulle vara ungefär som en ordbok, men ord skulle visas i förhållande till andra ord snarare än alfabetisk ordning. Till exempel inom WordNet skulle ordet ”hund” vara kapslad under ”hund”, som skulle vara kapslad under ”däggdjur” och så vidare. Det var ett sätt att organisera språk som förlitade sig på maskinläsbar logik och samlade mer än 155 000 indexerade ord.