
Trovare ciò che si cerca sul Web, più velocemente e meglio. Ciò grazie ad un sistema che si avvicini al linguaggio umano e che permetta di instaurare una sorta di dialogo con il computer per ottenere le informazioni desiderate. Andando oltre le parole chiave, il futuro della ricerca su Internet si chiama Web Semantico.
“Il Web Semantico è un’estensione del Web corrente in cui le informazioni hanno un ben preciso significato e in cui computer e utenti lavorano in cooperazione”
Tim Berners-Lee, Semantic Web – Scientific American, Maggio 2001.
La situazione del Web attuale
Al giorno d’oggi, maggior parte dei dati e delle informazioni che otteniamo dal Web ci è fornita tramite la forma delle pagine web: documenti HTML connessi tra loro mediante l’uso degli hyperlinks (collegamenti ipertestuali). I testi sono pensati e creati per gli utenti umani, gli unici ad oggi in grado di comprendere a pieno i contenuti delle pagine; gli uomini, infatti, si orientano nel Web grazie alla loro esperienza di navigazione e alla capacità di evocazione che possono avere parole o espressioni chiave. I processori, invece, al di fuori della ricerca tramite keyword e qualche altra eccezione limitata e non significativa, hanno difficoltà ad estrarre qualsiasi significato dai documenti stessi.
Il Web come si presenta oggi, dunque, richiede strumenti di lavoro più progrediti, per facilitare e velocizzare la navigazione attraverso gli innumerevoli documenti e le miriadi di pagine web. Non sempre la rete ci porta dove desideriamo e le difficoltà d’orientamento sono significative quando siamo alla ricerca di qualche cosa e non sappiamo dove e come reperirla. Scorrere una lunga quantità di elenchi cercando l’informazione desiderata è ormai quotidianità, soprattutto quando la ricerca interessa un termine piuttosto comune.
Cos’è il Web Semantico e in cosa si differenzia dal Web attuale?
Il Web Semantico, termine coniato per la prima volta nel 2001 da Tim Berners-Lee, si propone di dare un senso alle pagine web ed ai collegamenti ipertestuali, garantendo la possibilità di cercare solo ciò che è realmente richiesto.
Il Web Semantico, dunque, è associato all’idea di un Web nel quale agiscono strumenti ed applicazioni che imitano i flussi cerebrali interpretando i contenuti e che sono, quindi, in grado di comprendere il significato dei testi presenti in rete e capaci di guidare l’utente direttamente verso l’informazione ricercata. Tali strumenti dovrebbero essere, inoltre, capaci di creare percorsi in base alle informazioni richieste dall’utente, spostarsi di sito in sito collegando logicamente elementi diversi dell’informazione richiesta. In altre parole, il Web Semantico cerca di rendere i contenuti comprensibili anche alle macchine.
Il Web 3.0, infatti, aggiunge alle pagine ed ai contenuti un senso compiuto, un significato che va oltre le parole scritte, che può aiutare ogni motore di ricerca ad individuare ciò che stiamo cercando semplicemente perché è il vero oggetto della nostra ricerca. Tutto questo in virtù di una marcatura dei documenti, di un linguaggio gestibile da tutte le applicazioni e dell’introduzione di vocabolari specifici, ossia insiemi di frasi alle quali possano associarsi relazioni stabilite fra elementi marcati.
Come funziona il Web Semantico
Con l’interpretazione del contenuto dei documenti che il Web Semantico consente, infatti, saranno possibili ricerche molto più evolute delle attuali e altre operazioni specialistiche secondo logiche più elaborate del semplice collegamento ipertestuale. Utilizzando questa tecnologia si può automatizzare la ricerca delle pagine, poiché all’atto della creazione del contenuto delle pagine le informazioni sono definite ed inserite secondo precise regole semantiche. Si ha ragione di ritenere che le macchine potrebbero essere in grado di capire molto, nel caso in cui venga posta una domanda naturale, ovvero simile al parlato.
Si pensi, a titolo di esempio, ad un utente che cerca in rete il nome della squadra vincitrice della Champions League 2015. Ponendo direttamente la domanda, si otterrebbero normalmente documenti che contengono per intero l’espressione «chi è il vincitore della Champions League 2015». Il Web Semantico, invece, può fornire direttamente la risposta, ovvero il nome della squadra vincitrice (cioè il Barcellona).
Sfide e Criticità
La realizzazione ed implementazione del Web Semantico presenta, però, alcune criticità e sfide da tenere in considerazione, quali per esempio vastità, vaghezza, incertezza, eterogeneità semantica e inganno. I programmatori e gli sviluppatori dovranno tenere in considerazione questi problemi, al fine di garantire una buon funzionamento del Web Semantico.
Vastità
Il Web contiene miliardi di pagine e la tecnologia esistente non è in grado di eliminare tutti i termini semanticamente duplicati; qualsiasi sistema di ragionamento automatico dovrà, dunque, considerare e confrontarsi con l’immensa quantità di dati immessi.
Vaghezza
Si tratta di concetti imprecisi come “giovane” o “alto” o “bello”. Il Web è, infatti, vittima anche della vaghezza delle richieste degli utenti, dei concetti rappresentati dai fornitori di contenuti e della corrispondenza dei termini di ricerca usati nella query con i termini usati dai provider.
Incertezza
Si tratta di concetti precisi con valori incerti. Per esempio, un paziente può presentare una serie di sintomi che corrispondono ad un certo numero di differenti diagnosi distinte ciascuna con una diversa probabilità.
Eterogeneità semantica
Con l’avvento di Internet e la diffusione della rete, un numero gigantesco di utenti immette dati a modo suo, sistemandoli nei modi più disparati. Il Web Semantico deve essere in grado di riconoscerli, anche se vengono strutturati in maniera diversa.
Inganno
Si parla di inganno quando il produttore delle informazioni si comporta in modo intenzionalmente fuorviante nei confronti dei potenziali consumatori delle informazioni.
Ricerca e sviluppi futuri
Le possibilità offerte dal Web Semantico sono tante e tali che non si sono ancora approfondite a pieno le sue potenzialità. Per questo, più che di tecnologia, si parla di visione del Web Semantico.
Difficilmente, infatti, il Web assumerà le caratteristiche Web Semantico in breve tempo. Gli strumenti a disposizione sono limitati e il lavoro è oneroso, sia in termini di costi, sia in termini di tempo. Questa proposta ha comunque affascinato molto la comunità informatica tanto che il W3C (World Wide Web Consortium) ha attivato immediatamente un gruppo di lavoro e molte università hanno aperto programmi di ricerca legati a questi temi.
Alla luce di tutto questo interesse suscitato su ricercatori, aziende ed istituzioni, quindi, si può affermare che in un futuro lontano, ma non troppo, i motori di ricerca forniranno informazioni e dati funzionando come il cervello umano e rispondendo alle query degli utenti dopo aver scavato in profondità all’interno dei contenuti online attraverso anche un’analisi semantica.