Introduzione ai Motori di Ricerca
Rielaborazione di informazioni tratte dal sito www.motoridiricerca.it
I Motori di Ricerca sono senz'altro la risorsa principale a disposizione dell'utente per la ricerca di informazioni su Internet.
Ma cosa sono esattamente i motori di Ricerca?
Possiamo dire che sono dei grandi archivi di dati, che contengono delle informazioni dettagliate su un gran numero di pagine Web. Da qui una prima precisazione: nei motori di ricerca sono memorizzati i singoli documenti che compongono un sito Web, ed è quindi possibile che un determinato sito Web sia riportato numerose volte, in relazione al numero di pagine di cui si compone.
L'inserimento delle pagine Web negli archivi dei motori di ricerca, può avvenire in due modi: sia attraverso la registrazione manuale da parte dell'utente (il responsabile del sito ad esempio), sia in modo automatico attraverso un particolare software che riesce a visitare milioni di siti Web al giorno, inserendo le nuove pagine ed aggiornando le informazioni su quelle già censite.
Attraverso tale funzione, i motori di ricerca mantengono un archivio piuttosto aggiornato, anche se nessuno riesce (né riuscirà mai) a classificare l'intero Web. Basti pensare che il numero massimo di pagine censite da AltaVista (il motore con l'archivio più completo) è di 140 milioni, contro una stima di 275 milioni di pagine che sembra compongano in totale il Web.
Per ogni pagina Web censita, i motori di ricerca memorizzano gran parte del testo in essa contenuto, in modo tale che, ad ogni ricerca dell'utente, viene presentata una lista delle pagine Web dove figurano le parole che interessano.
L'utilizzo dei motori di ricerca è molto semplice. Occorre solo digitare le parole relative all'argomento che interessa, ed in pochi secondi si ottiene un elenco di pagine Web che contengono le parole richieste.
Il primo problema in cui ci si imbatte è quello di trovare, nell'ambito dei risultati della ricerca, le pagine che davvero collimano con la richiesta iniziale. E se da una parte il modo con il quale si immettono le parole chiave è determinante (vedi Suggerimenti pratici nell'uso dei motori di ricerca), dall'altro è evidente come fra le pagine Web coerenti con gli interessi della ricerca, siano presentati anche documenti non attinenti.
Riportiamo una citazione che ben descrive questa situazione e che riguarda Internet nel suo complesso. "Internet è come l'unione di tutte le biblioteche del mondo, dove però qualcuno si è divertito a buttare giù tutti i libri dagli scaffali". Vale a dire: di informazioni ce ne sono fin troppe, il problema è trovarle!
In ogni caso un uso adeguato dei motori di ricerca consente di orientarsi in questo mare di informazioni che, vale la pena di ricordarlo, non riguarda solo pagine Web, ma anche i cosiddetti Newsgroup, ossia delle liste di discussione pubbliche su argomenti specifici.
Un'altra caratteristica dei motori di ricerca è che il loro uso è totalmente gratuito, così come la registrazione delle pagine negli archivi, e questo nonostante i massicci investimenti necessari per creare un simile servizio. La ragione sta nel fatto che nelle pagine che vengono presentate all'utente, compaiono degli annunci pubblicitari (i cosiddetti banner) attraverso i quali le società che gestiscono i motori di ricerca traggono i loro ricavi.
Recentemente, oltre ai banner pubblicitari, alcuni motori di ricerca hanno sviluppato altre forme di business mediante degli accordi con aziende specializzate. Il più noto è quello che coinvolge società che vendono libri attraverso il Web; non appena un utente fa una ricerca, viene spinto a spostarsi sul sito del fornitore di libri per verificare se esiste un testo relativo all'argomento della sua ricerca. In questo caso, il motore di ricerca percepisce una commissione sull'eventuale acquisto scaturito per mezzo del suo sito, oltre comunque a dei compensi a titolo di pubblicità.
É opportuno segnalare infine, una tipologia differente di motori di ricerca, le cosiddette directory. L'esempio più noto di directory è rappresentato da Yahoo!, il più popolare sito Web in assoluto. Chiamarlo motore di ricerca è in effetti improprio, in quanto classifica solo i singoli siti, indipendentemente dalle pagine in esso contenute, raggruppandoli per tipologia e permettendo all'utente di effettuare una ricerca partendo da macro-categorie, per poi approfondirla in base ad una struttura "ad albero". Altra differenza di Yahoo! dagli altri motori di ricerca è che l'inserimento di un nuovo sito può avvenire solo manualmente ed è sottoposta a verifica del personale dell'azienda.
Non esiste IL MIGLIOR motore di ricerca, quindi scegliete quelli che vi sembrano più validi, tra quelli più importanti (vedi Principali Motori di Ricerca). Caratteristiche importanti sono la velocità di accesso e l'interfaccia che vi sembra più gradevole e funzionale.
Fate una ricerca partendo da termini o frasi specifiche. Se non trovate ciò che vi interessa, allora usate termini più generici.
Se cercate un nome proprio, ad esempio una città oppure un cognome, usare l'iniziale maiuscola (es.: "San Francisco").
Mettete le frasi tra apici (es.: "motori di ricerca"). In questo modo i motori di ricerca (tranne Excite) cercheranno solo l'esatta sequenza che avete immesso. Le parole inserite tra apici, vi permettono inoltre di cercare anche quei termini che molti motori di ricerca ignorano, come ad esempio gli articoli e le congiunzioni, oppure voci come Internet, Web, WWW, ecc.
L'ordine con il quale inserite i termini per la ricerca, è significativo per quasi tutti i motori di ricerca. Quindi digitate i termini più importanti all'inizio.
Se non trovate quello che state cercando tra i primi 20 o 30 siti, cambiate la ricerca o provate su un altro motore di ricerca.
È difficile suggerire quale motore di ricerca utilizzare in prima battuta. Comunque vale la pena di iniziare da Infoseek, Excite ed AltaVista. Quest'ultimo è meno preciso e completo, ma permette di selezionare la lingua dei siti (tra cui l'italiano) e quindi di fatto può estrarre i siti di una certa nazione nell'ambito del risultato. Se volete analizzare dei siti di una categoria specifica, nessuno meglio di Yahoo! può aiutarvi; tenete presente però che Yahoo! gestisce un numero di siti molto inferiore rispetto agli altri search engine e quindi un occhio agli altri motori è sempre necessario.
Con i "metasearch engine" (detti anche metacrawler) è possibile fare una ricerca contemporanea sui principali motori di ricerca.
Ci sono alcune opzioni nei motori di ricerca che permettono di approfondire una ricerca o di isolare dei termini specifici. Excite ha la funzione "More like this", mentre con Infoseek si possono digitare dei termini da cercare nell'ambito dell'ultima ricerca fatta. "Refine" è invece il flessibile comando per rifinire le ricerche su AltaVista. È però HotBot ad offrire forse il sistema più flessibile, attraverso dei comandi un po' scomodi da digitare e ricordare, ma molto flessibili; ad esempio, la frase "motori di ricerca domain:it within:3/months" va a cercare il termine "motori di ricerca" solo sui siti con dominio IT, modificati o creati negli ultimi 3 mesi. Solo recentemente, HotBot ha migliorato sensibilmente la sua interfaccia, per cui anche i comandi più specifici possono essere attivati attraverso dei comodi menu.
Vi segnaliamo inoltre, alcune interessanti possibilità specifiche di AltaVista. Se ad esempio volete verificare tutti le pagine dove è inserito un link verso un determinato sito, il comando è link:http://www.sito.com (dove al posto di www.sito.com va inserito l'indirizzo Web da cercare). Se invece volete la lista di tutte le pagine Web di un determinato sito inserite su AltaVista, basta scrivere host:www.sito.com (sostituendo a www.sito.com il sito che vi interessa).
Molto comodo è poi l'asterisco, attraverso il quale potete cercare tutte le pagine che contengono una parola di cui conoscete solo l'inizio (ad esempio "ricerc*" troverà ricerche, ricerca, ricercatori, ecc.) oppure l'inizio e la fine (mettendo l'asterisco tra i caratteri).
Infine, se vi occorre selezionare delle immagini specifiche, nulla di meglio del comando "image", che consente di specificare il nome di un particolare file grafico (ad esempio "image:cometa" troverà le pagine che contengono un file grafico di come "cometa")
Per i più frettolosi: se usate Netscape Communicator 4 o Internet Explorer 4, è sufficiente scrivere almeno due parole nella casella Indirizzo (usata normalmente riportare l'indirizzo Web), ed il programma di navigazione le invierà ad un motore di ricerca scelto casualmente tra i più importanti. Con Netscape Communicator 4 inoltre, è sufficiente digitare un punto interrogativo sempre nella casella Indirizzo, per avviare una finestra di ricerca su un motore scelto a caso.
Il motore di ricerca per eccellenza rimane Yahoo!, il primo a comparire sulla scena e tuttora al primo posto tra le preferenze degli utenti. Ad onor del vero, Yahoo! non è un vero e proprio motore di ricerca, bensì una directory, ossia un elenco di siti Web (e quindi non di singole pagine) suddiviso per argomento. Altra peculiarità è che, a differenza dei search engine veri e propri che scandagliano il Web per aggiornare i loro archivi, Yahoo! classifica solo i siti a lui segnalati manualmente attraverso una specifica funzione sul suo sito. Come dicevamo, la strutturazione dei siti su Yahoo! avviene attraverso delle categorie organizzate "ad albero": ciò permette agli utenti di ottenere agevolmente una suddivisione dei siti per tipologia, isolando solo quelli relativi allo specifico argomento di proprio interesse.
Il funzionamento degli altri motori di ricerca è invece differente: questi censiscono i siti Web in base alla rilevanza delle parole contenute in ogni pagina del sito, evidenziando quelle più spesso riportate, che si presume rappresentino l'argomento principale della pagina stessa. Per fare questo, oltre ad inserire i siti segnalati dagli utenti, scandagliano continuamente l'intero Web attraverso degli specifici software (i cosiddetti spider o crawler), acquisendo tutte le pagine non ancora presenti nei loro archivi. Tra i primi ad applicare questa tecnica e tuttora tra i più utilizzati, segnaliamo Lycos ed Excite, cui si è aggiunto più recentemente HotBot il quale, sponsorizzato dal gruppo editoriale Wired (e recentemente acquistato da Lycos), è ritenuto uno dei motori con la migliore base tecnologica.
La Digital è invece la creatrice di AltaVista, un motore di ricerca nato per promuovere i prodotti dell'azienda (tra cui ovviamente dei potenti server Internet), ora acquistata dalla Compaq, e che ha raggiunto una popolarità enorme in pochissimo tempo, anche per merito di un accordo con Yahoo! in base al quale, ogni richiesta che non trovi riscontro su Yahoo!, veniva automaticamente effettuata utilizzando il database di AltaVista. Il fatto che recentemente abbia potenziato la versatilità d'uso e che esistano versioni in molte lingue (tra cui l'italiano), rendono AltaVista un motore dove è indispensabile essere presenti.
Altro punto fermo è senza dubbio Infoseek, richiamabile direttamente anche da Virgilio (il servizio di ricerca italiano più noto) per le ricerche di siti internazionali. Anche per Infoseek è disponibile di recente un'interfaccia completamente in italiano.
Ulteriori possibilità di ricerca lo permettono i siti Arianna e Virgilio.
Ho
fatto una ricerca ed il motore di ricerca non segnala neanche un sito. Come
mai?
Può darsi che effettivamente non esista nessuna pagina Web censita da quel
motore di ricerca che contenga il termine digitato. Dopo aver controllato che
i termini siano corretti, si può provare con forme alternative della parola
oppure spostarsi su un altro motore di ricerca.
Il risultato
della ricerca mi dà oltre un milione di pagine Web. Sono numeri attendibili?
Risultati del genere, sono forniti quando è stata fatta una ricerca di un
termine molto comune, oppure si è digitata più di una parola; in quest'ultimo
caso, infatti, i motori di ricerca estraggono tutte le pagine Web dove compare
anche una sola delle parole immesse, fornendo quindi un numero di pagine
molto elevato.
E se
il risultato è di un milione di pagine, come faccio ad estrarre solo quelle
che mi interessano?
Innanzitutto è bene impostare preventivamente la ricerca per arrivare subito
all'argomento che interessa. Per fare questo, è bene immettere più di un termine,
digitando per primo quello più rilevante. Inoltre, se i termini da cercare sono
legati, è bene metterli tra apici in modo che il motore di ricerca troverà solo
le pagine che riportano esattamente la coppia di parole che interessa. Se ad
esempio, stiamo cercando un negozio di materiale elettrico a Roma, i risultati
migliori si otterranno digitando: Roma "materiali elettrici".
Sto
cercando una ditta in Italia che importa un prodotto americano. Però se digito
il nome del prodotto, mi escono fuori migliaia di siti stranieri. Come faccio
a trovare solo i siti italiani specifici?
Ci sono almeno due soluzioni. Utilizzare AltaVista, scegliendo l'opzione
che limita la ricerca solo alle pagine scritte in italiano. Oppure si possono
utilizzare i motori di ricerca italiani che gestiscono un archivio dei
soli siti nazionali. Ovviamente si può fare una ricerca composta, inserendo
alcune parole italiane (ad esempio "Italia", "importazione",
ecc.) seguite dal nome del prodotto.
Debbo
cercare i siti dove sono riportate delle informazioni di attualità, mentre so
che i motori di ricerca non riescono a censire le pagine Web realizzate di recente.
Come posso fare?
In effetti, i motori di ricerca, catalogano le pagine Web con un certo ritardo
rispetto alla loro realizzazione. Ci sono però alcuni di essi, che hanno una
funzione specifica di ricerca di informazioni recenti: notizie, dati della borsa,
previsioni del tempo, ecc. Tra questi motori di ricerca, segnaliamo Excite,
HotBot e Infoseek.
Come
faccio a sapere se qualcuno ha inserito nelle sue pagine un link al mio sito?
Semplice! Basta cercare il nome del tuo sito, preceduto da "link:".
E se
voglio verificare quali pagine del mio sito sono inserite in un motore di ricerca?
Basta precedere il nome del tuo sito dal comando "host:".
AltaVista
dà la possibilità di tradurre le pagine dei siti Web. Come faccio a tradurre
un sito specifico, magari non inserito in AltaVista?
Semplice: occorre attivare la funzione di traduzione (selezionando l'opzione
Translations) e poi immettere l'indirizzo completo della pagina Web da
tradurre, preceduto da "http://"
Circoscrivere la ricerca analiticamente usando più di un termine, oppure allargare la ricerca con altri motori di ricerca.
Un aiuto per facilitare la ricerca è dato dagli operatori. Uno di questi è l'apice ossia un simbolo da utilizzare quando si ha bisogno di cercare una coppia di parole da considerare come una sola, ad es. "New York".
Sulle ultime versioni di Explorer e Netscape, invece di scrivere l'indirizzo Web per esteso, è sufficiente scrivere una frase di più di due termini ed il browser lancia una ricerca effettuata in base al testo digitato. Questo è un trend che vede aziende come Microsoft o America On Line puntare a far diventare i programmi di navigazione o le interfaccie per il collegamento alla Rete, come una specie di motore di ricerca camuffato. Anche perché si sono accorti che il 50% degli utenti mantiene la pagina iniziale standard del proprio programma di navigazione fornito col computer e di conseguenza usa la relativa funzione di ricerca.
Le ricerche sulla Rete, saranno comunque sempre più complesse: l'aumento vertiginoso della quantità di informazioni e dei documenti disponibili, rende necessaria la nascita di strumenti di ricerca specifici. Già oggi iniziano a comparire dei software specializzati che, nelle versioni più sofisticate, fungono da "agente intelligente" che analizza la rete non solo in base a parole chiave, ma a concetti sempre più perfezionati.
Da segnalare infine la presenza di aziende alle quali è possibile commissionare delle ricerche sulla Rete (la più nota si chiama HumanSearch), e che in futuro saranno sempre più utilizzate.
|
Altavista |
|
|
+Parigi –Lione |
Trova documenti che contengono Parigi ma non Lione |
|
Paris |
Trova solo Paris |
|
paris |
Trova Paris, Paris, PARIS |
|
Mary AND agnellino |
Trova solo i documenti che contengono sia la parola Mary che agnellino. |
|
Mary OR agnellino |
Trova i documenti che contengono o la parola Mary oppure il termine agnellino. |
|
Mary AND NOT agnellino |
Trova i documenti che contengono la parola Mary ma non il termine agnellino. |
|
Mary NEAR agnellino |
Trova i documenti che contengono sia Mary che agnellino (ma questo termine è vicino a Mary entro 10 parole). |
|
Arianna |
|
|
oro OR argento AND platino |
Con tale ricerca si otterranno tutti i documenti che contengono platino e argento (insieme) più i documenti che contengono la parola oro. |
|
oro AND NOT argento |
Si otterranno tutti i documenti che contengono la parola oro ma non quella argento. |
|
"torre pendente" AND "scuola normale superiore" |
Se
si vuole fare una ricerca, combinando non semplici parole, ma gruppi di
parole, è necessario racchiudere queste ultime fra doppi apici("). |
|
Excite |
|
|
È un sistema esclusivo che ti permette ricerche "per concetti". E’ stato programmato per trovare documenti che contengano le parole esatte indicate nella casella di ricerca e per trovare idee strettamente correlate alle parole della richiesta. Ad esempio, digitando: |
|
|
problemi finanziari degli anziani |
Oltre
a trovare i siti che contengono queste esatte parole il motore di ricerca
troverà quelli che trattano delle condizioni economiche dei pensionati e
delle preoccupazioni finanziarie della terza età.
Excite è in grado di capire che esiste un rapporto tra parole e concetti, cioè che il termine anziani è correlato a terza età. |
|
migliore ufficio commerciale |
Si ottengono le pagine contenenti tutte e tre le parole o una di esse, indipendentemente dal loro ordine nella pagina (naturalmente, le prime pagine indicate saranno quelle che contengono tutte e tre le parole |
|
"Manchester United", |
Trova solo le pagine che contengono esattamente quella frase. |
|
+regole +biliardo |
Tutti i documenti trovati da Excite conterranno quella parola. Quindi otterrai dei documenti che si riferiscono alle regole di questo gioco. |
|
regole +biliardo |
Tutti i documenti trovati conterranno la parola "biliardo" ma non necessariamente la parola "regole". |
|
+biliardo -attrezzature -materiale |
|
|
mago AND oz AND film |
|
|
gatto OR gattino |
Per trovare i documenti che contengono la parola "gatto" o "gattino". |
|
animali AND NOT cani |
Per trovare i documenti che contengono la parola "animali" ma non la parola "cani," . |
|
frutta AND (banana OR mela) |
Per trovare i documenti che contengono la parola "frutta" e la parola "banana" o "mela". |
|
InfoSeek |
|
|
Rock Hudson |
Se scrivete con la maiuscola i nomi adiacenti, Infoseek tratterà le parole come un singolo nome o come un titolo. Se non scrivete con la maiuscola un nome o un titolo, verrà trattato come un gruppo generico di parole, e verranno trovati, ad esempio, siti sulla musica rock e sul fiume Hudson insieme a siti sull'attore cinematografico. |
|
Rossini, Giuseppe Verdi |
Se volete cercare più nomi e titoli, utilizzate le virgole per separare le voci della lista. Con l’esempio troverete siti che parlano di Rossini e Giuseppe Verdi. Se non li separate con una virgola, verranno trattati come un singolo nome lungo. Una ricerca su Rossini Giuseppe Verdi non troverà nessun sito sui due compositori. |
|
"computer monitor" computer-monitor |
Utilizzando le virgolette o il trattino potete specificare che le parole vanno cercate secondo l'ordine preciso di inserimento. Altrimenti, Infoseek troverà siti che includono la singola parola "computer" e la singola parola "monitor". (Quando utilizzate il trattino, fate attenzione a non lasciare spazi tra le parole) |
|
+Milano |
Utilizzate il segno "più" (+) prima di una parola che deve apparire necessariamente nei documenti trovati. |
|
guida turistica +Milano |
Per cercare una parola ed aumentare la precisione della vostra ricerca. Non lasciate nessuno spazio tra il segno "più" (+) e la parola che volete trovare. |
|
gatto | siamese |
Cercare documenti che parlano del gatto e quindi (all’interno dei risultati) trovare i documenti in cui compare la parola siamese. |
|
+link:infoseek.com |
Trova le pagine che contengono almeno un link a una pagina con infoseek.com nella sua URL. |
|
site:tin.it |
Cerca le pagine all'interno del sito Web tin.it. Il campo di ricerca site esamina solamente la parte "sito" dell'URL. Quindi, site:tin.it troverà siti come how.tin.it, www.tin.it e mailory.tin.it, ma non troverà nessun sito che terminerà con tin.com. Potete utilizzare il campo di ricerca site per trovare tutte le pagine di un determinato sito. |
|
url:science |
Ritrova le pagine che contengono la parola science ovunque nell'URL della pagina. Troverete pagine con l'URL come http://www.discovery.com/DCO/doc/1012/world/science/science.html. Potete utilizzare il campo di ricerca url: per trovare il numero esatto di pagine contenute nel database di Infoseek. Scrivete semplicemente url:http. Il numero cambia ogni volta che vengono aggiunte o eliminate pagine dal database. |
|
title:Benvenuti |
Trova le pagine che hanno le parole "Benvenuti" nella parte "title" del documento. |
|
Yahoo! |
|
|
"cucina italiana" |
Utilizzare le virgolette per le parole che fanno parte di una frase o di un espressione. |
|
calcio +campionato |
Inserisci un + davanti alle parole che devono essere presenti nei documenti risultanti. |
|
cultura -arte |
Inserisci - davanti alle parole che non devono essere presenti nei documenti risultanti. |
Graziella Seveso & Guido Belletti
http://www.kidlink.org/italiano
Copyright Kidlink 2000, tutti i diritti riservati