giovedì 5 aprile 2007

Un nuovo algoritmo per l'indicizzazione delle immagini

Uno dei maggiori problemi dei motori di ricerca per immagini come Google Ricerca Immagini o di condivisione come Flickr consiste nel fatto che i file grafici non vengono indicizzati in base al contenuto, ma in base alle descrizioni, siano essi inserite dagli utenti o presenti negli attributi dell'immagini (come nell’attributo ALT). Allo stesso modo, le applicazioni per il desktop search sono del tutto inefficienti quando i file salvati non hanno nomi descrittivi o attributi di alcun genere che possano fornire dettagli sul contenuto.

La situazione comunque sta cambiando, grazie ad un gruppo di ricercatori della University of California -UCSD, di San Diego, che ha messo a punto un insieme di algoritmi, che formano un sistema chiamato Supervised Multiclass Labeling (SML) e capaci di indicizzare delle immagini a partire dal loro contenuto. Il progetto, che ha avuto origine nel 2004 su iniziativa di Gustavo Carneiro nei laboratori del professore Nuno Vasconcelos della Jacobs School of Engineering della già citata università di San Diego, si è sviluppato anche per merito di Antoni Chan, co-autore del paper riguardante la tecnologia. I suoi test si sono svolti grazie alla collaborazione di Google e del suo ricercatore Pedro Moreno su ben tremila macchine linux, dimostrando la validità dell'algoritmo su vasta scala.

Il sistema si basa essenzialmente sulla definizione di classi di immagini, che vengono immagazzinate tramite un processo di apprendimento e che successivamente vengono applicate alle immagini da indicizzare. Più alta sarà la rilevanza per una certa classe, più l'immagine emergerà in base alla parola chiave data. Per avere più informazioni, è disponibile un video in cui lo stesso Vasconcelos parla della tecnologia in oggetto. Per un'introduzione più formale è possibile scaricare il paper originale, un pdf di circa 3 MB, o soltanto l'abstract.

Rispetto alle soluzioni passate, l'accuratezza di SML è di gran lunga superiore a quella di altri algoritmi, ed oltre a indicizzare delle immagini il sistema, questo tipo di labeling è capace anche di dividere un file grafico nelle parti per le quali è stato allenato. Ad esempio, dando in pasto ad un sistema SML una fotografia di un paesaggio, dovrebbe essere possibile avere più file contenenti le montagne, il cielo, i laghi di cui abbiamo precedentemente fornito delle definizioni. Questo ovviamente ha il grande vantaggio di permettere di ricercare delle immagini a partire soltanto da alcuni elementi. Sempre per fare un altro esempio, cercando la foto di una tigre non è detto che dobbiamo trovare per forza un primo piano, ma è possibile cercare un'immagine che risponda anche alla parola chiave "circo" oppure "zoo".

Si tratta senz'altro di una tecnologia interessante che necessita di essere approfondita anche in termini più specifici di quelli mostrati nell'articolo, da cui è tratta questa segnalazione, soprattutto nelle sue applicazioni pratiche.

Nessun commento: