Naast een sitemap om aan te geven waar de content staat is misschien dit wel de beste oplossing om zelf gemaakt dubbele content te elimineren. Namelijk door gebruik te maken van "Canoncial URL tag". Deze tag helpt de webmasters en zoekmachines met de juiste webpagina te openen waar de orginale content staat.
Het is voor zoekmachines belangrijk, omdat bijvoorbeeld Google een hekel heeft aan dubbele content. Als je op je site de mogelijkheid hebt om met twee verschillende URL’s naar de zelfde content te gaan, dan ziet google een van de twee als publicatie. Terwijl dat helemaal niet de bedoeling is van de webmaster.
Bijvoorbeeld op een overzichtspagina waar je een de producten kan sorteren. Als je naar domein.com/overview gaat dan staat de producten op alfabet gesorteerd. En als je dan via domein.com/overview/z-a gaat dan begint de lijst met de z en eindigt met a. Je merkt al het zijn twee verschillende url’s terwijl op de webpagina’s wel de zelfde content staat (Dan misschien in andere volgorde, maar dat maakt voor zoekmachines niet uit).
Een ander voorbeeld wat je minder verwacht is bijvoorbeeld een dynamische blog. In de url moet iets staan wat herkenbaar is voor de database. Dat kan het beste een nummer zijn, alleen dat is niet SEO vriendelijk en daarom voegen ze achter dat nummer ook de titel van het artikel. Echter dat wordt niet mee genomen om het artikel op te halen, dus daar kan je als gebruik ook zelf wat toevoegen en/of weghalen. Als dan via zo’n "verkeerde" link de zoekmachine op je website komt, dan ziet hij de zelfde content als op de "officiële" link en dan denkt de zoekmachine dat het een duplicate is terwijl het de zelfde pagina is. En daarom is zo’n "Canoncial URL tag" erg belangrijk.
Daarnaast kan een zoekmachine niet weten welke van de twee de officële tekst is. En welke URL je wilt gebruiken in de zoekresultaten. Daarom is het belangrijk om een "canonical url tag" te gebruiken.
Dit probleem kan je oplossen door in de "head" tag een extra tag toe te voegen die verteld wat de basis URL is.
In het voorbeeld van boven kan het er dan als volgt uit zien:
<!DOCTYPE html>
<html>
<head>
….
<link rel="canonical" href="http://domein.com/overview" />
…..
</head>
<body>
….
</body>
</html>
Wat je ziet is dat je aangeeft dat http://domein.com/overview de plek is waar de officiële content staat en dat op de andere plekken het een kopie is. Hierdoor indexeert de zoekmachine sneller de http://domein.com/overview, dan http:// domein.com/overview/z-a. Echter het is natuurlijk een advies aan de zoekmachine en geen bevel, maar de zoekmachines luisteren 99,9% van de gevallen erna.
Het belangrijkst aan de URL is dat de URL klopt. Dus wij bevelen aan om de URL’s die je gebruikt in een canonical tag altijd te controlleren of je geen 404-error krijgt of iets dergelijks.
Daarnaast kan je de URL zo mooi maken als je zelf wilt. Je kan bijvoorbeeld dit doen:
<link rel="canonical" href=" /overview" />
Dit voorbeeld is echt het minimale wat je moet doen, dus hier geef je aan dat je op de huidige domeinnaam naar de map overview wel. Dus de volgende combinaties zouden dan goed zijn:
Je ziet al er zijn veel varianten wat je kan maken. Wat de zoekmachine doet is de huidige URL die hij bezoekt herschrijven, dus als hij via http://www.domain.com/overview/1 komt dan verandert hij het naar http://www.domain.com/overview
Je merkt al dat je met deze "canonical tag" niet veel kracht uitoefend naar de zoekmachine en dat is jammer. Je kan beter zo exact mogelijk zijn en met jou wensen. Denk aan http:// of https:// en aan wel of geen "www" voor het domainnaam. Deze voorkeuren heb je als het goed is al gemaakt bij het ontwerpen en maken van de website. Waarom zou je dat dan ook niet graag doorgevoerd zien worden in Google?
Als voorbeeld: De Google bot komt via http://www.domain.com/overview/2 binnen op de website. Ik zou heel graag juist de url zonder "www" zien en ik heb een SSL certificaat , dus ik stel mijn "canonical tag" als volgt in:
<link rel="canonical" href=" https://domain.com/overview" />
Wat sommige mensen proberen is om op website A een "cononical url tag" te verwijzen naar website B. Dat ondersteunen zoekmachines niet, omdat dit de doel van de functie voorbij schiet. Het doel van deze tag is namelijk om dubbele content op een website te voorkomen. Denk aan het eerste voorbeeld die ik gaf over het sorteren van een tabel.