Best practice per la formattazione degli URL

26 maggio 2008 - ore 19:48



Riprendiamo oggi il nostro appuntamento con i post dedicati alla comunità dei webmaster, presentandovi alcune "best practice" sulla formattazione degli URL, nella speranza di rispondere a molte delle vostre domande.

Gli URL (Uniform Resource Locators) sono comunemente utilizzati per specificare gli indirizzi dei siti e delle pagine Web. Più gli URL sono descrittivi e ben formattati, meglio verranno capiti e ricordati dagli utenti e dai computer, contribuendo a rendere il Web un ambiente pensato prima di tutto per l'utente.

Per esempio, se si cercano informazioni sulla storia delle compagnie aeree, un URL del tipo:

http://it.wikipedia.org/wiki/Compagnia_aerea

vi darà immediatamente un'idea di cosa troverete sulla pagina Web: vi aiuterà a decidere se contiene il tipo di contenuto che state cercando.


Se invece, per lo stesso tipo di ricerca, trovate un URL del tipo:

http://www.esempio.it/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

vi potreste chiedere che cosa voglia dire quella serie di numeri e lettere, decidendo magari che questo tipo di pagina Web non contiene informazioni di vostro interesse.

Gli URL pensati per gli utenti, dunque, permettono una migliore esperienza Web e potrebbero aiutarvi a ricevere più visite sul vostro sito. In tal senso, le parole chiave contenute negli URL possono fornire agli utenti un'utile indicazione sul contenuto delle vostre pagine.

Un altro importante aspetto da prendere in considerazione è la presenza di parametri dinamici negli URL. Infatti, i motori di ricerca potrebbero avere problemi nell'indicizzare gli URL troppo complessi, in particolare quelli contenenti molti parametri.

Per esempio, un URL come:

http://
www.esempio.it/index.php?item=shoe&color=red&size=8

benchè user-friendly, potrebbe generare contenuto duplicato sul vostro sito. Infatti, gli URL che contengono parametri dinamici tendono a creare molti URL non necessari, che puntano ad un contenuto identico o molto simile.


La presenza di contenuto duplicato sul vostro sito potrebbe essere dovuta a diversi fattori, come spieghiamo nel nostro Centro Assistenza Webmaster. In particolare, ciò può capitare nel caso di URL dinamici come i risultati di ricerca (per esempio: http://www.esempio.it/searchresults.html?sid=a1b4d3c22e16a63e5ac3b894ee41806c).

Per fare in modo che Googlebot non passi da questi URL, è possibile usare un file robot.txt. Anche le sessioni ID negli URL (come http://www.example.com/index.php?id=2445&template=example) possono generare una grande quantità di duplicati; per evitare il problema, è possibile usare i cookies al posto delle sessioni ID.

Per quanto riguarda la punteggiatura degli URL, è utile sapere che Googlebot, quando indicizza i contenuti, spezza le parole in base alla punteggiatura: quindi, usandola, si fornisce un'importante informazione al robot. Da notare che i trattini (dash) sono considerati da Googlebot come elementi di punteggiatura, mentre gli underscore non lo sono. In ogni caso, dato che la nostra tecnologia è in continua evoluzione, questo potrebbe cambiare in futuro.

Potreste infine chiedervi se vi sia un beneficio nell'usare i sottodomini piuttosto che le sottocagorie o viceversa. Google non fa distinzioni in maniera significativa fra sottodomini e sottocategorie, quindi il nostro suggerimento è di usare la soluzione che meglio soddisfa le vostre esigenze e quelle dei vostri utenti.

Se usate i nostri Strumenti per Webmaster, ricordate che le sottocategorie verranno automaticamente verificate dopo che avrete controllato il dominio di primo livello, mentre i sottodomini dovranno essere verificati a parte.
Posta un commento