Nel 2006, Fei-Fei Li ha iniziato a ruminare su un’idea.
Li, un professore di informatica di recente conio presso l’Università dell’Illinois Urbana-Champaign, ha visto i suoi colleghi in tutto il mondo accademico e l’industria AI martellare via allo stesso concetto: un algoritmo migliore sarebbe prendere decisioni migliori, indipendentemente dai dati.
Ma ha realizzato una limitazione a questo approccio: il miglior algoritmo non funzionerebbe bene se i dati da cui ha imparato non riflettessero il mondo reale.
La sua soluzione: costruire un set di dati migliore.
“Abbiamo deciso che volevamo fare qualcosa che fosse completamente senza precedenti storicamente”, ha detto Li, riferendosi a un piccolo team che inizialmente avrebbe lavorato con lei. “Stiamo andando a mappare l’intero mondo degli oggetti.”
Il set di dati risultante è stato chiamato ImageNet. Originariamente pubblicato nel 2009 come poster di ricerca bloccato in un angolo di un centro conferenze di Miami Beach, il set di dati si è rapidamente evoluto in una competizione annuale per vedere quali algoritmi potrebbero identificare gli oggetti nelle immagini del set di dati con il più basso tasso di errore. Molti lo vedono come il catalizzatore per il boom dell’IA che il mondo sta vivendo oggi.
Gli alumni della sfida ImageNet possono essere trovati in ogni angolo del mondo tecnologico. I primi vincitori del concorso nel 2010 hanno assunto ruoli senior presso Baidu, Google e Huawei. Matthew Zeiler ha costruito Clarifai in base alla sua vittoria ImageNet 2013 ed è ora supportato da funding 40 milioni in finanziamenti VC. Nel 2014, Google ha diviso il titolo vincente con due ricercatori di Oxford, che sono stati rapidamente schioccati e aggiunti al suo laboratorio DeepMind recentemente acquisito.
Li stessa è ora chief scientist presso Google Cloud, professore a Stanford e direttore del laboratorio di intelligenza artificiale dell’università.
Oggi salirà sul palco del CVPR per parlare dei risultati annuali di ImageNet per l’ultima volta—il 2017 è stato l’ultimo anno della competizione. In soli sette anni, la precisione vincente nella classificazione degli oggetti nel set di dati è passata dal 71,8% al 97,3%, superando le capacità umane e dimostrando efficacemente che dati più grandi portano a decisioni migliori.
Anche al termine della competizione, la sua eredità sta già prendendo forma. Dal 2009, decine di nuovi set di dati di ricerca AI sono stati introdotti in sottocampi come la visione artificiale, l’elaborazione del linguaggio naturale e il riconoscimento vocale.
“Il cambio di paradigma del pensiero di ImageNet è che mentre molte persone prestano attenzione ai modelli, prestiamo attenzione ai dati”, ha detto Li. “I dati ridefiniranno il modo in cui pensiamo ai modelli.”
Che cos’è ImageNet?
Alla fine degli anni 1980, lo psicologo di Princeton George Miller ha iniziato un progetto chiamato WordNet, con l’obiettivo di costruire una struttura gerarchica per la lingua inglese. Sarebbe un po ‘ come un dizionario, ma le parole sarebbero mostrate in relazione ad altre parole piuttosto che in ordine alfabetico. Ad esempio, all’interno di WordNet, la parola “cane” sarebbe annidata sotto “cane”, che sarebbe annidata sotto “mammifero” e così via. Era un modo per organizzare il linguaggio che si basava sulla logica leggibile dalla macchina e accumulava più di 155.000 parole indicizzate.