Trovare, Verificare e Analizzare i Contenuti Duplicati in un Sito Ecommerce

La duplicazione dei contenuti è uno dei problemi che maggiormente affligge i SEO e i webmaster, da tenere d’occhio per evitare penalizzazioni sui motori di ricerca.

Quando un contenuto è effettivamente duplicato?

Ovvero quando si dice di un contenuto che è “duplicato”,  piuttosto che copiato o altri sinonimi?

Google, ad esempio, considera duplicato un contenuto quando l’intero testo o sue notevoli parti sono identiche ad un altro articolo meno recente, e/o apparentenente a un sito più autorevole.

Insomma, abbiamo un ottimo motivo per non copiare.

I gestori di un ecommerce o di un sito web è bene che producano contenuti freschi ed originali, informativi e ben ottimizzati: le ragioni sono evidenti. Non di rado, però, ci si limita ad un “taglia e cuci” o addirittura a un copia e incolla di contenuti già presenti sulla rete, con il rischio di pesanti penalizzazioni al proprio sito.

Google ed altri motori di ricerca tendono ad evitare i contenuti duplicati per una semplice ragione; non proporre agli utenti le stesse informazioni. Essi, dunque, filtreranno o penalizzaranno quei siti che si affidano ai contenuti duplicati, giudicati come non rilevanti perchè ripetitivi.

Duplicazione e buone pratiche per l’ecommerce

Non tutti i contenuti duplicati ci penalizzano. Ma, l’esperto insegna, meglio evitare la duplicazione alla radice. Uno dei rischi a cui siamo esposti è quello di avere contenuti duplicati all’interno del nostro stesso sito, ad esempio lo stesso testo che si ripete in due pagine diverse. Pensiamo ad esempio alla versione stampabile di una nostra pagina web, che Google “legge” come ulteriore pagina del sito. Per non rischiare penalizzazioni, possiamo utilizzare il nofollow e quindi escludere quella pagina dalle SERP, facendo in modo che non sia visitata dagli spider.

Se poi intendiamo utilizzare testi di altri, anche quando autorizzati, è sempre meglio modificarli un po’, oppure inserire dei link alla fonte ed evitare la citazione dell’intero testo.

Eì il caso delle schede di prodotti per ecommerce, che possono prevedere l’utilizzo di un testo standard da ripetere in diverse pagine. Un’ottima alternativa ai contenuti duplicati è in questo caso la content curation: integrare porzioni di testo altrui (inserite come citazioni, e quindi con il link all’originale) con approfondimenti, citazioni, ulteriori link, video e via di seguito.

Attenzione anche alle traduzioni automatiche: è altamente sconsigliato tradurre un testo da un’altra lingua all’italiano con Google Translate e poi caricarlo sul proprio sito: Google potrebbe accorgersene!

Strumenti e tool per rilevare contenuti duplicati

Anche in ambito duplicazione il web fornisce diversi utilissimi tool, gratuiti o a pagamento.

Il primo strumento è proprio Google. Basta inserire una porzione di testo del nostro contenuto tra virgolette “…..”, e vedremo su Google quante pagine e siti la riportano.

Lo strumento antiduplicazione più famoso di chiama Copyscape: è a pagamento, ma può verificare velocemente quante pagine “gemelle” esistono per ogni singola URL sul web.

Solo per Windows, Xenu link sleuth si scarica gratis e individua, oltre ai link non funzionanti del sito web, anche eventuali titoli e contenuti duplicati.

Simile a Copyscape è infine Virante.org, che offre un Duplicated Content Tool free al 100%.

Contenuti duplicati, una breve guida per sapere cosa fare

Se hai letto con attenzione la prima parte del nostro focus, dovresti aver capito quanto sia importante creare delle pagine con contenuti distinti rispetto alle altre. E dovresti anche aver intuito quanto sia importante cercare di assicurarsi che non ci siano contenuti duplicati!

Insomma, potreste pensare ad ogni pagina web che hai creato come a un prodotto con un contenuto unico nel suo genere e con uno stile straordinario e personalizzato (e forse lo sono), ma forse potresti essere sorpreso nell’apprendere che in molte situazioni, le pagine web condividono il loro contenuto con altri URL.

Qualcuno ha rubato il testo? Hai bisogno di contattare Google per far rimuovere il contenuto duplicato dai risultati di ricerca? Forse si. Ma, con ogni probabilità, la pagina con contenuto duplicato è nata in maniera non volontaria, a causa di una scelta fatta da te o dal tuo webmaster. Ma qual è il pericolo di duplicare i contenuti?

Che cos’è il contenuto duplicato?

Innanzitutto, un po’ di definizioni, anche banali. Proprio come ti sembra, i contenuti duplicati sono contenuti che appaiono su più di un URL online. Come ci ricorda la stessa Google, i contenuti duplicati si riferiscono generalmente a blocchi sostanziali di contenuti all’interno, o tra domini, che corrispondono completamente ad altri contenuti o sono piuttosto simili.

Contrariamente a quanto si possa pensare, non c’è certezza sul modo e sulla profondità della penalizzazione di Google sui contenuti duplicati. Alcuni ritengono che i contenuti duplicati siano una tagliola definitiva sulla bontà del proprio progetto, altri invece ritengono che in realtà Google non penalizzi i contenuti duplicati perché è ben conscia del fatto che gli stessi contenuti duplicati non vengono solitamente creati con intento negativo, e non desidera pertanto penalizzare i webmaster “innocenti” per qualcosa che hanno creato in maniera inconsapevole.

In realtà, la verità sta nel mezzo o, meglio, non è qualcosa di così facilmente sintetizzabile, fermo restando che quella dei contenuti duplicati è una pericolosa tentazione che dobbiamo cercare di evitare.

Di fatti, il pericolo di duplicare i contenuti potrebbe non essere così chiaro come alcuni immaginano, e ci sono alcuni problemi evidenti di SEO legati alla condivisione di contenuti con un altro URL.

Qual è allora il pericolo di duplicare i contenuti?

Ci sono due ragioni principali per cui i proprietari di siti web dovrebbero diffidare dei contenuti duplicati, e che vanno al di là della presunta o effettiva penalizzazione che il motore di ricerca potrebbe realizzare.

In primo luogo, Google sa che quando le persone cercano qualcosa online, sperano di trovare diversi risultati unici, quindi cerca di non presentare più versioni multiple dello stesso contenuto. Invece, cerca di filtrare i contenuti duplicati raggruppando le pagine con contenuti duplicati in un cluster e scegliendo l’URL “migliore” da presentare all’utente. In alcuni casi, Google potrebbe non scegliere l’URL che si ritiene essere effettivamente migliore. Per questo motivo, le pagine con contenuti duplicati possono avere difficoltà a classificarsi.

In secondo luogo, quando altri siti si collegano al tuo contenuto, dovranno anche scegliere tra le pagine con contenuti duplicati. Questo diluirà l’equità del link perché i link in entrata puntano a più pagine invece che a una sola. Inoltre, poiché i link in entrata sono un fattore di ranking, questo può influenzare anche il SEO di una pagina.

Dunque, quando molte persone parlano di “penalizzazione”, in realtà si riferiscono a quanto sopra abbiamo brevemente riassunto!

Come si duplicano i contenuti?

Secondo alcune autorevoli ricerche, oggi giorno oltre il 20% del contenuto presente online è in realtà un contenuto duplicato. Ma perché così tanti contenuti vengono copiati e incollati sul web?

Le ragioni sono evidentemente molto diverse. In primo luogo, è possibile che i contenuti vengano intenzionalmente duplicati, con copia e incolla su un altro sito web.

È altresì possibile che alcuni parametri possano creare involontariamente contenuti duplicati, o ancora che il sito web abbia versioni separate per HTTP e HTTPS o WWW e non-WWWW.

Insomma, le varie motivazioni che possono essere addotte per giustificare la presenza di una così elevata incidenza di contenuti duplicati sono davvero tante e, in fin dei conti, non sono facilmente riassumibili. Una cosa però è certa: se il fenomeno dei contenuti duplicati interessa anche il nostro sito, occorre agire in maniera attiva e cercare di risolverlo positivamente, prima di subire gli aspetti più negativi.

Come risolvere i problemi di contenuto duplicato?

Il problema principale che deriva dal contenuto duplicato è che Google non sa quale URL visualizzare nella pagina dei risultati, e, dunque, la soluzione principale è quella di specificare quale pagina sia “migliore” o più corretta. Ci sono diversi modi per farlo.

In primo luogo, si può creare un reindirizzamento 301: impostando un redirect 301 dalla pagina duplicata alla pagina originale, è possibile aggirare completamente il contenuto duplicato. Invece di pagine multiple in competizione tra loro, si avrà una pagina che dovrebbe avere un ranking più alto a causa della maggiore rilevanza e popolarità.

Si può inoltre utilizzare l’attributo rel=, un facile e conosciuto strsumento HTML che dice ai motori di ricerca che la pagina specificata dovrebbe essere trattata come una copia di un URL specificato. Così, quando Google si imbatte in esso, applicherà tutti i link, le metriche dei contenuti e altro ancora all’URL specificato.

Si potrebbe altresì cercare di applicare il tag dei meta robot. Quando questo tag viene aggiunto all’intestazione HTML di una pagina duplicata, quella pagina sarà esclusa dall’indice di un motore di ricerca. I link sulla pagina verranno comunque scansionati, il che è una buona cosa – Google mette in guardia contro la restrizione della scansione su pagine con contenuti duplicati, perché se si bloccano i bot di Google, non possono consolidare i segnali di quelle pagine.

Ulteriore alternativa è quella di utilizzare la console di ricerca di Google Search. Se si dispone di più strutture URL per il proprio sito Web, è possibile impostare il dominio preferito utilizzando Google Search Console. È inoltre possibile specificare quali parametri URL devono essere scansionati. Si noti che questi rimedi funzionano solo su Google, non su altri motori di ricerca come Bing di Microsoft.

Scorrendo ancora le principali armi di reazione, possiamo certamente cercare di mantenere i collegamenti i più coerenti possibile. Quando colleghi internamente le pagine del tuo sito web, assicurati di utilizzare sempre l’URL “migliore” del contenuto che è stato duplicato. Inoltre, quando pubblichi contenuti altrove, usa sempre l’URL “migliore” mentre crei i link.

E se qualcuno duplica il tuo contenuto?

A volte le persone copiano deliberatamente contenuti da altri siti per manipolare il loro SEO o per aumentare il loro traffico. Si tratta di un problema molto diffuso: se Google percepisce questo tipo di comportamento ingannevole e dannoso, interviene. Il sito con contenuti duplicati può diminuire nel ranking o essere rimosso dall’indice.

Se ritieni che un altro sito stia pubblicando il tuo contenuto (e violando la legge sul copyright), puoi contattare l’host di quel sito per richiedere la rimozione del contenuto. È inoltre possibile richiedere a Google di rimuovere la pagina dai risultati della ricerca.

Conclusioni

Mentre continui a creare contenuti unici e di alta qualità, ricordati di fare attenzione ai contenuti duplicati. Controlla che Google indicizzi la pagina corretta e non aver paura di avvisare Google se trovi qualcun altro che si posiziona in cima alla classifica dei tuoi contenuti!

Speriamo con questi brevi spunti di averti fornito alcuni suggerimenti pratici per poter migliorare il tuo rapporto con i contenuti duplicati. Se hai bisogno di altre informazioni o vuoi saperne ancora di più, puoi scriverci per un primo contatto utile, oppure puoi parlarne con la nostra community utilizzando lo spazio che trovi qui sotto. Raccontaci la tua esperienza e fornisci un feedback che possa essere utile a tutti i nostri lettori!

Lascia un commento

Il tuo indirizzo email non verrà pubblicato

CLOSE

 ►►

Fermati!

Scarica

Gratis ora!

UN REGALO PER TE!

 

Compila i campi di seguito e scarica il tuo regalo gratis!

↓↓↓↓↓↓↓↓↓↓↓↓