John Smith
You have 4 new messages
You have 4 new messages
Uno dei problemi più comuni nella SEO tecnica riguarda i contenuti duplicati e semi-duplicati. Si tratta di pagine accessibili tramite più URL che presentano testi uguali o molto simili. Per l’utente può sembrare un dettaglio trascurabile, ma per i motori di ricerca significa spreco di risorse di crawling (crawl budget) e confusione nell’indicizzazione, con potenziali effetti negativi su ranking e user experience.
La soluzione principale a questo problema è l’utilizzo del tag canonical, che consente di dichiarare quale sia la versione preferita di una risorsa. In questa guida vedremo:
che cosa si intende per contenuti duplicati;
come funziona il canonical e in cosa si distingue da altre direttive SEO;
come implementarlo correttamente;
i casi più frequenti di duplicazione generati dai CMS;
esempi pratici e verifiche con Google Search Console.
Si ha duplicazione quando lo stesso contenuto risulta accessibile da una pluralità di URL (Uniform Resource Locator). In presenza di contenuti non identici ma comunque molto simili si parla, invece, di contenuti semi-duplicati (es. un parametro di filtro che cambia solo l’ordine dei prodotti o schede di varianti prodotto che presentano piccole variazioni di testo, magari in relazione al solo colore).
I motori di ricerca hanno l’obiettivo di offrire alla propria utenza risultati di qualità e a tal fine dedicano ingenti risorse per l’identificazione, l’analisi e l’indicizzazione – ossia lo stoccaggio “organizzato” delle informazioni delle pagine web in un enorme database. Dalla loro prospettiva, scansionare e indicizzare più volte la stessa risorsa solo perché risulta raggiungibile da una varietà di indirizzi rappresenta un evidente spreco di risorse, in alcun modo ripagato da un valore aggiunto per l’utenza.
Anche dalla prospettiva di chi produce i contenuti, la duplicazione non è un fatto positivo: i segnali di ranking e le proprietà di indicizzazione, infatti, finiscono per risultare diluiti tra le diverse versioni della risorsa, fatto che incide negativamente sulla sua capacità di acquisire visibilità nei risultati di ricerca e intercettare traffico qualificato. Può anche accadere che la duplicazione non condizioni solo la visibilità del contenuto, ma anche l’esperienza di navigazione dell’utente, come nel caso in cui il motore indicizzi la versione PDF di una pagina web.
Per risolvere il problema della duplicazione esistono due possibilità:
eliminarla, ad esempio impostando una redirezione permanente (301) tra la versione www e non www degli URL di una property, o tra quella con o senza slash finale
gestirla con uno strumento messo a disposizione dai motori di ricerca che consente di indicare la versione corretta: il meta link canonical
L’eliminazione dei contenuti duplicati resta la soluzione preferibile, perché offre certezza di risultato e consente anche una migliore gestione del budget di scansione che i motori dedicano al nostro sito. Purtroppo, però, non è una via sempre percorribile, perché esistono molti casi in cui la possibilità di una proliferazione di URL con contenuti identici o molto simili è sostanzialmente inevitabile.
Quando la duplicazione non può essere eliminata, è possibile provare a gestire il problema utilizzando il meta link canonical, un tag che permette di indicare ai motori la versione
“originale” o “preferita” dell’URL che identifica la risorsa, di modo che possano considerare solo quella e consolidare su essa le proprietà di indicizzazione di tutte le versioni non canoniche. In questo modo, il motore risparmia risorse e l’utente si ritrova con una pagina “forte” sotto il profilo del ranking, in luogo di una pluralità di duplicati “deboli”.
Il meta link canonical valorizzato con l’indirizzo “canonico” della risorsa principale ha questo aspetto:
<link rel=”canonical” href=”https://www.esempio.it/pagina-preferita” />
È fondamentale capire la differenza tra un “hint” e una direttiva per i motori di ricerca.
Il canonical è uno strong hint: un segnale forte, ma non vincolante. I motori possono decidere di ignorarlo se i segnali raccolti con la scansione contrastano con le sue indicazioni.
Le direttive, invece, sono comandi vincolanti. Esempi sono il meta robots noindex, che impedisce l’indicizzazione di una pagina, o il redirect 301, che sposta in modo permanente un URL verso un altro.
Il canonical, quindi, non elimina le versioni duplicate, ma suggerisce quale preferire. I motori di ricerca tenderanno a seguire l’indicazione se il tag è implementato correttamente e se gli altri segnali non sono in conflitto
Il tag canonical può essere implementato in due modi principali:
Nell’HTML
Aggiungendo il tag <link rel=”canonical” href=”URL”> nella sezione <head> di tutte le versioni del contenuto.
Negli header HTTP
Utile per risorse non HTML (es. PDF). Esempio:
Link: <https://www.esempio.it/pagina>; rel=”canonical”
Usare URL assoluti e corretti (incluso protocollo https).
Inserire un solo canonical per pagina.
Evitare catene o loop di canonical (canonical che punta a pagina canonizzata altrove o che effettua redirezione)
Indicare come canonico un URL indicizzabile evitando, quindi, URL disallowed, rediretto, non disponibile, dotato di noindex, canonicalizzato
Non bloccare via robots.txt le versioni duplicate: il motore di ricerca deve poterle scansionare per leggere il canonical.
Includere il canonical anche nella versione originale della risorsa (self-canonical)
I CMS, specialmente in siti e-commerce o blog complessi, possono generare URL multiple in automatico.
E-commerce: lo stesso prodotto può essere accessibile da diverse categorie (/scarpe/nike e /promo/nike).
Filtri e parametri: i filtri di ricerca creano URL dinamici (?taglia=42, ?colore=rosso).
Pagine stampabili e PDF: versioni alternative della stessa pagina HTML.
Parametri di tracciamento: spesso aggiunti da tool di marketing (?utm_source=facebook)
Esempi di URL duplicati:
https://esempio.it/categoria/prodotto
https://esempio.it/offerte/prodotto
https://www.esempio.it/prodotto?utm_source=facebook
https://esempio.it/prodotto/stampa
https://esempio.it/prodotto.pdf
Senza un’adeguata gestione delle duplicazioni, il motore di ricerca potrebbe scegliere da solo quale versione indicizzare, con possibili conseguenze negative per SEO e UX.
Un esempio comune in cui il canonical tag diventa essenziale è quando lo stesso contenuto è disponibile in più formati, come una pagina HTML e una sua versione PDF scaricabile. L’obiettivo è comunicare a Google che la versione principale e da indicizzare è quella HTML, che offre una migliore esperienza di navigazione.
HTML (pagina web):
<head>
<title>Articolo</title>
<link rel=”canonical” href=”https://esempio.it/articolo” />
</head>
PDF (HTTP header):
HTTP/1.1 200 OK
Link: <https://esempio.it/articolo>; rel=”canonical”
Content-Type: application/pdf
In questo modo Google capirà che la versione da mostrare è quella HTML, non il PDF.
Vantaggi: migliore UX, coerenza delle metriche di analytics, niente cannibalizzazione SEO.
Nella sezione “Pagine” della Google Search Console, possono comparire avvisi come:
Questi report possono aiutare a identificare duplicate content e a verificare a livello macro la funzionalità dei nostri interventi di canonicalizzazione.
Pagina duplicata senza URL canonico selezionato dall’utente
Pagina duplicata, Google ha scelto una pagina canonica diversa da quella specificata dall’utente
Pagina alternativa con tag canonical appropriato”
Lo strumento “Controllo URL” (URL Inspection Tool) è essenziale per diagnosticare lo stato di una singola pagina. Inserendo un URL, si può verificare:
quale canonical è dichiarato;
quale canonical Google ha effettivamente scelto.
Esistono anche altri strumenti utili quali plugin SEO (es. Yoast per WordPress), estensioni browser e crawler SEO (Screaming Frog, Oncrawl, Botify etc…) che permettono di controllare rapidamente i canonical su larga scala.
I contenuti duplicati rappresentano un problema reale e comune che può compromettere la visibilità di un sito e complicare la gestione delle metriche. Il canonical tag è lo strumento chiave per gestirli in modo efficace, a patto di ricordarsi che agisce come un segnale e non una direttiva assoluta.
Implementarlo correttamente — sia in HTML che via HTTP header — permette di:
consolidare i segnali SEO su un unico URL;
offrire una migliore esperienza utente, mostrando la versione più adatta del contenuto;
garantire coerenza nei dati di analytics;
ottimizzare il crawl budget.
Verificare con regolarità in Google Search Console e mantenere un’architettura del sito pulita aiuta a evitare problemi e a garantire che le versioni canoniche siano correttamente recepite dai motori di ricerca.
In sintesi: la canonicalizzazione non è un optional, ma un pilastro della SEO tecnica moderna.
Se non sai come gestire i contenuti duplicati del tuo sito o ti risulta complesso, ricorda che con Ismartframe è possibile risolvere ogni problema in modo pratico e veloce, senza attività di sviluppo complesse e costose!