INTERNET/ Le parole chiave per aprire le porte del Web Semantico

- La Redazione

Aggregare e correlare informazioni che si ricercano su internet è l’obiettivo del web semantico, un progetto che grazie alle nuove evoluzioni si avvicina a diventare realtà, come spiega CARLO TORNIAI

Mouse_ComputerR375

Oggi, quando facciamo ricerche su Internet, normalmente puntiamo il nostro browser su un motore di ricerca, scriviamo una serie di parole (keywords) rappresentative di quello che vogliamo cercare, scorriamo la lista dei risultati e apriamo le pagine che ci sembrano contenere quello che stavamo cercando.

I vari motori di ricerca – semplificando – usano “algoritmi” che recuperano le pagine “rilevanti” rispetto alle keywords inserite e ci presentano la lista dei risultati più plausibili. Ma i suddetti algoritmi utilizzano il contenuto delle pagine web che attualmente è “sintattico” e non “semantico”. Cosa vuol dire?

Vuol dire, ad esempio, che attualmente non è disponibile nessun tipo di informazione correlata al contenuto della pagina che permetta ad un motore di ricerca di distinguere tra diversi significati delle keywords. Infatti, quando scorriamo la pagina dei risultati presentati, supponiamo, per la keyword “Jaguar”, siamo noi che “filtriamo” i risultati proposti scegliendo l’appropriato significato di “Jaguar” che stavamo ricercando: la famosa casa produttrice di automobili oppure il Sistema Operativo di Apple.

La situazione diventa ancora più complessa quando vogliamo ricercare contenuti multimediali (video o immagini) dato che in questo caso l’aspetto “sintattico” non è espresso come contenuto testuale. Se mai avete ricercato per curiosità il vostro nome su Google Images, vi sarete probabilmente imbattuti, invece che nella vostra faccia, nelle foto dei vostri amici su Facebook o in qualche altra immagine che è apparsa nella stessa pagina in cui è stato pubblicato il vostro nome. Questo perché attualmente dai motori di ricerca viene usato il contenuto “testuale” delle pagine web per “annotare” o classificare anche il contenuto di video e immagini.

Immaginate invece di avere la possibilità di specificare, in modo “comprensibile” per voi e per i motori di ricerca, il significato del contenuto dell’informazione presente sul Web. I vantaggi sarebbero enormi: dalla possibilità di definire all’inizio della mia ricerca se sono interessato alle auto prodotte dalla Jaguar o al Sistema Operativo della casa di Cupertino, alla possibilità di abilitare i motori di ricerca a presentare informazioni rilevanti o correlati a seconda del significato di quello che sto cercando.

Inoltre, se all’informazione fosse associato un significato comprensibile dai vari “agenti” software (inclusi gli algornitmi dei motori di ricerca) questi ultimi potrebbero aggregare varie sorgenti di informazioni “correlate” a seconda del significato o di altre relazioni (spazio temporali, causali ecc.) aprendo nuove frontiere di fruizione dell’informazione in rete.

Questa visione è quella alla base dell’idea del Web Semantico, secondo la definizione data da Sir Tim Berners Lee (già inventore del World Wide Web): «Il Web Semantico è una estensione dell’attuale Web in cui all’informazione è dato un significato ben preciso che permette a uomini e macchine una migliore cooperazione». (Potete leggere tutto il famoso articolo pubblicato su Scientific American).

Siamo ancora ben lontani dalla realizzazione di questa visione, ma dal 2001 i progressi che sono stati fatti nella definizione e standardizzazione di “linguaggi” e strumenti che permettessero la definizione del significato dell’informazione sono stati enormi. Ho partecipato alla Semantic Technology Conference a San José in giugno dove più di un migliaio di persone (la maggioranza delle quali provenienti dal mondo dell’industria) si sono radunate per discutere lo stato dell’arte nel campo del Web Semantico. L’euforia, tra i vari spaeakers e visitatori era palpabile dato che il Web Semantico sembra finalmente aver rotto le barriere che lo relegavano al mondo prettamente accademico ed essere pronto per li suo debutto nel “mondo reale”. Di seguito alcuni degli highlights della conferenza.

La prima grande evidenza della maturità raggiunta dal Web Semantico è il fatto che Google e Yahoo! (I due maggiori motori di ricerca) stanno supportando gli standard che permettono di aggiungere informazione semantica alle pagine web: stanno già usandoli per “arricchire” la visualizzazione dei risultati e presto useranno il “significato” associato alle pagine web per ordinare risultati della ricerca. Maggiori informazioni sulle iniziative legate al Web Semantico a Yahoo! e a Google.

– Durante il key note di apertura Thomas Tague, di Thomson Reuters ha in maniera magistrale riassunto l’evoluzione del Web sino ad oggi. La prima generazione del Web, il cosiddetto Web 1.0, può essere definito come il Web degli indirizzi (the Web of destinations): sapevamo esattamente dove andare a cercare l’informazione. La generazione successiva, ormai nota come Web 2.0, è il Web attuale ricco di contenuti ma povero di informazione, dove l’utente si “perde” nel mare magno della quantità di risorse. Infine il prossimo “salto” evolutivo, il Web 3.0 (in cui il web semantico e il significato dell’informazione giocheranno un ruolo determinante) dovrà rimediare la frammentazione e il caos di contenuti generati dal Web 2.0 e migliorare l’esperienza degli utenti nel ricercare e accedere l’informazione sul Web.

All’interno della stessa sessione Tom Gruber di Siri ha presentato il suo Assistente Personale Virtuale (Siri Virtual Personal Assistant) che ci aiuterà, tramite il nostro iPhone, a eseguire operazioni quali trovare un ristorante e prenotare una cena, comprare biglietti per il cinema o per un viaggio e così via. Il tutto in modo “naturale”, simulando cioè una sorta di conversazione e utilizzando – con l’aiuto degli strumenti messi a disposizione dall’ iPhone – le informazioni relative al “contesto” dell’utente (dove ci troviamo, qual è la nostra agenda, quali sono le nostre preferenze di cucina e generi di film e così via). Siri è stata una delle cose più interessanti viste alla conferenza a dispetto del fatto che l’uso effettivo di Web Semantico al suo interno è minimale.

Tutti i grandi nomi legati al mondo dei motori di ricerca: Google, Yahoo!, Ask.com, Bing!, Wolfram Alpha e Hakia hanno discusso in un interessantissimo panel lo stato dell’arte e il futuro della “ricerca semantica” dell’informazione e come le tecnologie legate al Web Semantico a breve termine miglioreranno non solo la qualità dei risultati ma anche l’attuale esperienza utente relativa all’informazione sul web.

Rob Larson e Evan Sandhaus hanno evidenziato, nel key note finale, come il Web Semantico sia già una realtà al New York Times dove viene utilizzato per classificare gli articoli dell’immenso “indice” (The Times Annotated Corpus). Questo insieme di annotazioni e catalogazioni verrà reso disponibile al pubblico sottoforma di “Linked Open Data” (letteralmente Dati Aperti e Interconnessi) che è uno dei “paradigmi” della visione del Web Semantico secondo cui esisterà una unica rete interconnessa di dati comprensibili allo stesso modo da software e da persone.

Al di là degli scenari futuribili (ma già abbastanza vicini) se volete farvi un’idea, da semplici utilizzatori del web, di cosa può offrire il Web Semantico ecco alcuni spunti.

Per utenti non tecnici:

Date un occhio a Glue: una estensione per il vostro browser che vi permette, mentre navigate e visitate libri, film e altre risorse di vedere come gli amici dei vostri social networks preferiti li hanno valutati.

Divertitevi a giocare un po’ con tutta una serie di informazioni riguardanti i Presidenti degli Stati Uniti aggregate usando Exhibit.

Date un occhio ai dati contenuti in Freebase, a come sono strutturati, e a interessanti modi per navigarli.

Anche se in superficie non si nota niente, le visualizzazioni e le interazioni tra i dati di queste applicazioni sono permesse dal “retroscena” dove l’ informazione è “semanticamente” definita e organizzata.

Per utenti tecnici interessati a maggiori dettagli:

Iscrivetevi a Freemix per ottenere un account che vi permetterà di “estrarre” dati semantici da svariate risorse: dal foglio Excel alla pagina web.

Approfondite le informazioni a riguardo del supporto al Web Semantico offerto da Google e Yahoo!

Date un occhio all’iniziativa Linked Open Data

(Carlo Torniai)





© RIPRODUZIONE RISERVATA

I commenti dei lettori

Ultime notizie

Ultime notizie