17 aprile 2007 - ore 18.15
Una domanda che ci viene posta spesso è: "Come fa Google a sapere quale parte di un sito il webmaster vuole far indicizzare, e quale no?" In realtà chiunque pubblica dei contenuti online ha pieno controllo di quello che può apparire nei risultati di ricerca.
La chiave di tutto sta in un semplice file chiamato robots.txt, che permette ai webmaster di controllare come i motori di ricerca accedono ai loro siti web. Un uso consapevole del file robots.txt permette di avere un elevato controllo su come il tuo sito viene indicizzato e ricercato, anche se non è sempre così semplice ottenere esattamente l’effetto desiderato.
Che cosa fa il file robots.txt?
Il contenuto del web è enorme. E il tuo sito, a confronto, è come un piccolo sacchetto di brustoline... :)
I motori di ricerca come Google leggono tutte queste informazioni e ne creano un indice. Tale indice è come un grosso database, ed è ciò che permette a un motore di ricerca di mostrare la pagina dei risultati, una volta che gli utenti effettuano una ricerca per determinate parole chiave.
Può capitare, però, che nel tuo sito ci siano delle pagine che non vuoi far diventare "ricercabili". In tal caso potrai escludere queste pagine dall’indicizzazione di Google semplicemente aggiungendo il file robots.txt e posizionandolo nella root directory del tuo sito. Tale file conterrà una lista di pagine che i motori di ricerca non dovranno accedere.
Maggiori informazioni sui file robots.txt sono disponibili in questo sito e nel Centro assistenza per webmaster di Google, che contiene inoltre molte informazioni utili, fra le quali:
• Come creare un file robots.txt
• Descrizione di ogni elemento user-agent usato da Google
• Come usare la corrispondenza a un pattern
• Ogni quanto indicizziamo il tuo file robots.txt
Se non sei un webmaster, ma vuoi comunque delle informazioni su come funziona Google, potrai consultare la nostra nuova Guida alle funzioni di Ricerca Web, che ti fornirà una panoramica sulle funzioni di Google e su come sfruttare al meglio la ricerca web.
Buona navigazione! :)
La chiave di tutto sta in un semplice file chiamato robots.txt, che permette ai webmaster di controllare come i motori di ricerca accedono ai loro siti web. Un uso consapevole del file robots.txt permette di avere un elevato controllo su come il tuo sito viene indicizzato e ricercato, anche se non è sempre così semplice ottenere esattamente l’effetto desiderato.
Che cosa fa il file robots.txt?
Il contenuto del web è enorme. E il tuo sito, a confronto, è come un piccolo sacchetto di brustoline... :)
I motori di ricerca come Google leggono tutte queste informazioni e ne creano un indice. Tale indice è come un grosso database, ed è ciò che permette a un motore di ricerca di mostrare la pagina dei risultati, una volta che gli utenti effettuano una ricerca per determinate parole chiave.
Può capitare, però, che nel tuo sito ci siano delle pagine che non vuoi far diventare "ricercabili". In tal caso potrai escludere queste pagine dall’indicizzazione di Google semplicemente aggiungendo il file robots.txt e posizionandolo nella root directory del tuo sito. Tale file conterrà una lista di pagine che i motori di ricerca non dovranno accedere.
Maggiori informazioni sui file robots.txt sono disponibili in questo sito e nel Centro assistenza per webmaster di Google, che contiene inoltre molte informazioni utili, fra le quali:
• Come creare un file robots.txt
• Descrizione di ogni elemento user-agent usato da Google
• Come usare la corrispondenza a un pattern
• Ogni quanto indicizziamo il tuo file robots.txt
Se non sei un webmaster, ma vuoi comunque delle informazioni su come funziona Google, potrai consultare la nostra nuova Guida alle funzioni di Ricerca Web, che ti fornirà una panoramica sulle funzioni di Google e su come sfruttare al meglio la ricerca web.
Buona navigazione! :)

