Contenuto duplicato. Questa definizione racchiude solamente una piccola parte della questione in oggetto. Si comincia a scrivere di questo argomento, e le persone cominciano a chiedere chiarimenti in proposito. In particolare, capita ancora di ascoltare molti webmaster che si domandano come possano incappare in questa “penalizzazione del contenuto duplicato“.
Cerchiamo di chiarire questo concetto una volta per tutte: non esiste qualcosa che sia identificabile come una “penalità del contenuto duplicato”. Quantomeno, non esiste con il significato che molte persone le danno quando ne parlano.
Ci sono alcune penalità per un sito che abbia lo stesso contenuto di un altro portale. Questo avviene, per esempio, se si estrapolano contenuti da siti già esistenti per poi ripubblicarli, o se si ripubblicano dei contenuti già esistenti senza aggiungere nulla di nuovo. Queste tecniche sono chiaramente bandite (e scoraggiate) dalle seguenti linee guida per i Webmaster:
* Evitare di creare pagine multiple, sottodomini, o domini che abbiano sostanzialmente contenuti duplicati.
* Evitare tecniche che manchino di originalità come ad esempio programmi affiliati che non abbiano contenuti originali.
* Se il vostro sito partecipa ad un programma di affiliazione, assicuratevi che esso sia in grado di proporre veramente dei valori aggiuntivi. Dovete, quindi, fornire contenuti unici e rilevanti che, prima di tutto, motivino gli utilizzatori a visitare il vostro sito.
(Si noti che, se l’azione del prelevare contenuti da altri siti è scoraggiata, avere un sito che subisca da altri questo genere di trattamento è una cosa differente; leggete questo post se il vostro problema è quello di vedere i vostri contenuti prelevati ingiustamente.)
Comunque, la maggior parte dei possessori di siti web di cui capita di ascoltare le lamentele a proposito della questione dei contenuti duplicati, non prendono in esame il problema di cui sopra né dinamiche relative ai domain farms, essi si riferiscono piuttosto a situazioni in cui ci si può ritrovare ad avere sullo stesso dominio delle URL multiple che riconducono agli stessi contenuti. Come ad esempio www.example.com/skates.asp?color=black&brand=riedell e www.example.com/skates.asp?brand=riedell&color=black. Avere questo tipo di contenuto duplicato all’interno del vostro sito può probabilmente influire in modo negativo sulle sue prestazioni, ma ciò non porta ad avere una penalità. Quello che segue è uno stralcio estrapolato da un articolo dedicato alla questione dei contenuti duplicati:
La presenza di contenuti duplicati su un dato sito non costituisce terreno per interventi di penalizzazione sul sito stesso fino a che non si dimostri che il fine ultimo di questi contenuti duplicati è quello di essere ingannevole e di manipolare i risultati del motore di ricerca. Se il vostro sito è affetto da problematiche inerenti a contenuti duplicati, e nel caso decideste di non seguire la succitata lista di consigli utili, è possibile realizzare un ottimo lavoro scegliendo solo una versione di quei contenuti da mostrare all’interno dei risultati di ricerca.
La tipologia di duplicazione non propriamente maliziosa è molto comune, ed è specialmente dovuta al fatto che spesso il CMS non viene utilizzato come dovrebbe. Quindi, quando alcuni sostengono che avere questo tipo di contenuti duplicati abbia un’influenza negativa sul vostro sito, non è perché siate esposti ad una probabile sanzione, ma perché tale problematica è dovuta al modo in cui i siti web ed i motori di ricerca funzionano.
La maggior parte dei motori di ricerca si sforza di diversificare il più possibile; essi vorrebbero proporre dieci risultati di ricerca differenti su una stessa pagina, e non dieci URL differenti che hanno tutte il medesimo contenuto. A tal fine, Google cerca di filtrare tutti i documenti duplicati in modo da rendere la ricerca degli utilizzatori meno ridondante. Potete trovare maggiori ragguagli a tal proposito in questo post, in cui si dice:
1. Quando vengono identificati contenuti duplicati, come delle variazioni dovute ai parametri delle URL, si deve procedere ad unire le diverse URL in un unico raggruppamento.
2. Si seleziona, poi, quella che si ritiene essere la URL “migliore” affinché essa rappresenti il raggruppamento all’interno dei risultati di ricerca.
3. Si procede, poi, con l’unificare le proprietà delle URL all’interno del raggruppamento con la URL rappresentativa, in termini ad esempio di link popularity.
Ciò che segue è quello che può darvi dei problemi in quanti webmaster:
- Per quanto concerne la fase 2, l’idea che Google ha circa l’URL “migliore”, potrebbe non coincidere con la vostra. Se desiderate controllare quale delle due URL www.example.com/skates.asp?color=black&brand=riedell o www.example.com/skates.asp?brand=riedell&color=black viene mostrata nei risultati di ricerca, è probabile che voi intendiate mitigare la duplicazione dei contenuti. Un modo per far capire quale delle due URL preferite è quello di includere l’URL prescelta all’interno della mappa del vostro sito.
- In relazione alla fase 3, se non è possibile individuare tutti i duplicati di una data pagina, non vi è la possibilità di unificare tutte le loro proprietà. Ciò potrebbe indebolire il potere di indicizzazione di questo contenuti disseminandoli attraverso URL multiple.
Nella maggior parte dei casi Google realizza un buon lavoro nel gestire questo tipo di duplicazioni. Comunque, potreste anche voler considerare contenuti che si sta procedendo a duplicare attraverso domini diversi. In particolare, se si decide di costruire un sito il cui fine prevede in modo specifico la duplicazione di contenuti ciò rappresenta un’ipotesi su cui è bene riflettere due volte nel caso in cui il vostro sistema di business sia destinato a dipendere dal movimento delle ricerche, a meno che non riusciate ad aggiungere una gran quantità di valori aggiuntivi per gli utilizzatori. Per esempio, a volte capita di sentir dire da alcuni affiliati di Amazon.com che essi si ritrovano ad avere delle difficoltà nell’indicizzare contenuti che provengono unicamente da Amazon stesso.
Questo forse accade perché Google intende impedire loro di vendere “Everyone Poops“? No. Amazon possiede un gran numero di autority per quanto riguarda il commercio online (probabilmente molte di più di quante ne possa avere un tipico affiliato di Amazon), e l’utilizzatore medio di Google preferisce molto probabilmente ottenere le informazioni originali direttamente da Amazon, nonostante il sito affiliato abbia aggiunto una quantità significativa di contenuti addizionali.
In fine, considerate l’effetto che tale duplicazione può avere sulla larghezza di banda del vostro sito. I contenuti duplicati possono vanificare il lavoro del crawler del motore di ricerca: quando Googlebot scopre la presenza di dieci URL sul vostro sito si vede costretto a dover leggere ognuna di queste URL prima di capire quali abbiano gli stessi contenuti (e ciò prima che si possa avere la possibilità di raggrupparle nel modo descritto in precedenza). Maggiori sono le risorse e il tempo che Googlebot impiega per identificare i vari contenuti duplicati attraverso le URL multiple, meno sarà il tempo che gli rimarrà per leggere il resto dei contenuti del vostro sito.
Riassumendo: avere dei contenuti duplicati può ledere al vostro sito attraverso vari modi, ma, a meno che voi non stiate duplicando volontariamente, è poco probabile che uno di questi modi si possa tradurre in una sanzione. Questo significa che:
– Solitamente non è necessario che presentiate una richiesta di riesame quando state innocentemente pulendo alcuni contenuti duplicati.
– Se siete un webmaster ad un livello compreso tra il principiante e l’intermedio, probabilmente non avete bisogno di investire troppa energia nel preoccuparvi del problema dei contenuti duplicati poichè la maggior parte dei motori di ricerca è già in grado di gestirli.
– Potete aiutare i vostri colleghi webmaster evitando di perpetuare il mito delle sanzioni relative ai contenuti duplicati! Le soluzioni per i contenuti duplicati sono interamente sotto il vostro controllo. Questi sono dei buoni punti di partenza.
Tradotto da: https://developers.google.com/search/blog/2008/09/demystifying-duplicate-content-penalty