Deep Internet: quello che i motori di ricerca non dicono

Chiunque di voi abbia mai trovato affascinanti i discorsi sull'antimateria (impossibile da vedere con mezzi normali, ma là fuori, forse più estesa della stessa materia) troverà interessante questa nota: c'è un'Internet "invisibile", o, meglio, "profonda", che i motori di ricerca ignorano, fonte di preziose informazioni e forse più grande, da 400 a 500 volte, delle pagine normalmente indicizzate e accessibili dai principali search engine.



[ZEUS News - www.zeusnews.it - 21-10-2001]

Questa parte di Internet ha un nome, deep Internet, e una causa per esistere: i motori di ricerca non riescono a indicizzare il contenuto di database i cui documento non siano direttamente collegati tramite link a pagine web. Questi database (che includono anche alcuni repertori arcinoti come i cataloghi di Amazon) sono appunto il cuore della deep Internet.

L'esistenza di una deep Internet fa sorgere alcune domande sulla natura dell'informazione disponibile on-line. In primo luogo, essa mette in discussione l'abilità dei motori di ricerca di fornire risultati sulla base di una conoscenza profonda dell'informazione su Internet (sarà anche per questo che di recente il motore di ricerca Google ha messo in secondo piano l'indicazione del numero di pagine contenute nel suo database).

In secondo luogo, essa ci spinge ad interrogarci su quante informazione ci sia on-line. A questa domanda ha cercato di rispondere un progetto dell'Università di Berkeley ("Cal") presentando una stima da brivido: 2 miliardi e mezzo di pagine all'inizio del 2000, con un tasso di crescita di 7,3 milioni di pagine al giorno. Secondo il progetto, la deep Internet conterrebbe non meno di 550 miliardi di documenti connessi on-line (il 95% dei quali accessibili gratuitamente).

In terzo luogo, la deep Internet ci pone davanti il problema di sviluppare nuove strategie e nuovi strumenti di ricerca. A questo hanno già pensato molte aziende produttrici di software che ci offrono i loro sistemi per navigare in questo nuovo oceano di informazione (peccato che questo software siano quasi tutti a pagamento). Tuttavia i software non bastano (anzi rischiano di complicare la vita restituendo troppi risultati): bisogna più che mai pensare a come discernere l'informazione essenziale, non solo da quella irrilevante, ma anche da quella importante o interessante.

Alcuni link:
- How much information project
- The Invisible Web (comprende elenco di tool per la ricerca)
- Bright Planet (prodotti e tutorial per la ricerca nel deep Internet)
- Dragon Deep Internet Search Engine Tool
- Accessibility and Distribution of Information on the Web by Steve Lawrence and Lee Giles

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) sotto o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Commenti all'articolo (0)


La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
Sondaggio
Considerando costi, tempi di realizzazione e possibili conseguenze, su quale fonte di energia alternativa ai combustibili fossili bisognerebbe maggiormente puntare?
Solare
Eolica
Geotermica
Biomasse
Idrogeno
Nucleare
Idroelettrica

Mostra i risultati (5961 voti)
Maggio 2016
Ragioni per usare la modalità aereo quando non sei in aereo
Il ''Service Pack 2'' di Windows 7
TeslaCrypt, arriva la chiave di sblocco universale
Red Ronnie e la Sindrome delle Due Campane
CryptXXX torna a colpire e non c'è antidoto che tenga
Metroweb, Enel e Telecom: come ricomprare ciò che era tuo
CEO di BioViva si inietta virus e si allunga vita di 20 anni
Tre pianeti simili alla Terra distanti pochi anni luce da noi
Lo smartphone economico dell'ex CEO di Apple
Aprile 2016
Badlock, la minaccia è reale: a rischio tutti i Windows e i Linux
L'asciugamani ad aria è un ricettacolo di virus
6 funzionalità interessanti di Android N
Il successo degli ''inculators''
La fibra di Enel sfida Telecom Italia
Arrestati al cinema perché registravano l'audio
Tutti gli Arretrati


web metrics