Duplicate content

Hvad er duplicate content og hvorfor skal du være bekymret for det?

Direkte oversat betyder duplicate content: Duplikeret indhold eller dobbelt indhold. Rent teknisk betyder det, at der ligger ensartet indhold på flere forskellige sider på nettet. Det kan både være internt på dit website eller på forskellige websites.

Duplicate content

Duplicate content eller duplikeret indhold er sider som er ens eller meget ensartede.

Google opfatter som udgangspunkt hver eneste URL som en selvstændig side på nettet. Hvis disse sider er ens eller ensartet så er det, hvis ikke du tager dine forholdsregler, duplicate content.

Intern duplicate content, altså på din egen hjemmeside, kan skyldes at du genbruger tekster på tværs af sider. F.eks. produktekster, kategoritekster eller profiltekster. Disse skal du søger for at gøre unikke – og ja det er et stort arbejde.

Intern duplicate content kan også skyldes tekniske fejl i det system du bruger eller at din udvikler simpelthen ikke er bekendt med Googles Webmaster Guidelines. Disse problematikker kigger vi på lige om lidt.

Derudover kan der også opstå duplicate content på tværs af forskellige hjemmesider, f.eks. hvis andre kopierer din hjemmesides indhold. Gør de det uden at spørge om lov er det ulovligt og du er i din ret til at sende dem en faktura.

Det kan faktisk også være helt legalt, f.eks. hvis

  • du udgiver et blogindlæg både på din egen side og hos en anden,
  • du benytter produkttekster fra producenten som dine konkurrenter også bruger,
  • du har et RSS feed som andre frit kan hente ind og publicere på deres side.

 

Tekniske problemer der giver duplicate content

Lad mig vise dig nogle typiske eksempler på intern dublicate content:

 

Www og ikke-www

Langt de fleste hjemmesider kan kaldes både med og uden www, men hvis ikke du tager dine forholdsregler for det, så vil det resultere i duplicate content.

Eksempel: Hvis ikke jeg havde taget højde for duplicate content ville skjoldby.com og www.skjoldby.com vise den samme side, nemlig min forside. Hvis du prøver at gå ind på skjoldby.com vil du se at adressen redirecter til www.skjoldby.com.

 

Produktlister med sortering

Rigtig mange webshops har under deres kategorier nogle produktlister hvor du har mulighed for at sortere efter varens navn, pris eller andre ting. Dette er typiske steder hvor der kan opstå duplicate content.

Eksempel: Du sælger sko og har en kategori hvor alle dine sneakers listes under. Den findes på URL’en desejesko.dk/sneakers/. Som standard listes de alfabetisk fra A-Z.

Brugeren vælger så at liste dem omvendt fra Z-A, og så skifter URL’en til: desejesko.dk/sneakers/?Sorting=Alfa&Direction=DESC

Og brugeren kan også vælge at sortere efter pris hvor URL’en ændres til desejesko.dk/sneakers/?Sorting=Price&Direction=ASC og vil han have den faldende ændres URL’en til  desejesko.dk/sneakers/?Sorting=Price&Direction=DESC

Her har vi altså tre forskellige URL’er med samme indhold, blot i en anden rækkefølge. Det er duplicate content.

 

Problematikken gælder også andre steder hvor der indsættes et parameter i query’en, eksempelvis ?SESSIONID.

 

Artikel lister ud fra kategorier eller tags

Skriver du blogindlæg er du sikkert bekendt med kategorier og tags. Kategorier bruges ofte som et overordnet emne for artiklerne, eksempelvis ligger denne artikel under SEO mens jeg også har artikler under PPC og Google+Tags bruges ofte som en form for søgeord. Jeg bruger sjældent tags her på siden men har dog nogle få som eksempelvis Local Search, Penguin og Panda.

Eksempel: Forestil dig nu jeg har lagt de samme artikler ind under flere kategorier. Når du så klikker på disse kategori lister, så vises samme indhold på listen. Kategorilister er som udgangspunkt noget nemmere at holde unikke, det handler blot om ikke at lægge samme artikel ind under flere kategorier.

Problemet er dog ret hyppigt på tags sider. Flere artikler passer måske ind på samme tags, og dermed bliver listerne meget ens, måske helt ens.

 

Printvenlige sider

Hvis du ser en print eller udskriftsknap på en ældre hjemmeside, åbner denne typisk i et nyt vindue med en ny URL. Den printvenlige side er en tro kopi af originalen, måske blot uden menu, sidebar og footer. Dette genererer duplicate content.

På nyere hjemmesider styrer man eventuelle printvenlige sider via stylesheetet.

 

Derfor er duplicate content problematisk

Google vil gerne give brugerne gode unikke resultater, men når det samme indhold er duplikeret på tværs af forskellige sider, kan Google ikke se hvad der er det originale og hvad der ikke er – eller hvad der er mest relevant. Det medfører nogle forskellige problematikker:

Skæv fordeling af linkjuice

Duplicate content kan medføre skæv fordeling af linkjuice til samme side.

Forkert fordeling af pagerank

Google bruger PageRank og linkjuice til at afgøre dine siders vigtighed, men hvis Google ikke kan se om side A1 eller side A2 er originalen medføre det at pagerank og linkjuice fordeles på de forskellige URL’er hvilket går ud over hjemmesidens placeringer.

Rangeringsproblemer

Når Google ikke kan finde ud af hvad der er originalen, kan de heller ikke finde ud af hvilken af side der skal rangeres i søgeresultatet. Det kan dermed blive et mere eller mindre tilfældigt resultat.

Opfattelse af spam

I worst case, men ikke desto mindre en hyppig case, kan duplicate content lede Google til den konklusion, at du forsøger at spamme internettet med det samme indhold. Det kan medføre at din hjemmeside bliver straffet f.eks. med Google Panda update.

 

Tro ikke på Google nå de siger: Don’t worry

Matt Cutts som sidder som chef for Googles spam team lavede i juli 2013 denne video om duplicate content:

Kort fortalt siger Matt Cutts i videoen at du ikke skal bekymre dig om duplicate content, med mindre du bevidst spammer.

Det råd synes ikke du skal lytte til.

Du skal huske på at Google kun består af matematiske algoritmer. Dvs. det er også algoritmer der afgør, om du har duplicate content eller ej. Og hvis du har tricket de forkerte algoritmer så hænger du på den.

Så har du duplicate content på din side, så sørg for at skille dig af med det.

 

Betragtes oversættelser som duplicate content?

Hvis du oversætter dit website fra f.eks. dansk til engelsk, så er der tale om to forskellige tekster. Dette er altså ikke duplicate content. Heller ikke hvis du laver en komplet en-til-en oversættelse eller bruger Google Translate.

 

Kan billeder generere duplicate content?

Nej. Du må gerne bruger de samme billeder på tværs af dit website eller på forskellige websites. Det betragtes det ikke som duplicate content. Duplicate content er alene et tekst problem.

 

Hvis du kunne lide artiklen vil jeg sætte stor pris på et like, et tweet eller et share på LinkedIn. Tak 🙂

Lars Skjoldby er ejeren af Skjoldby & Co. Han har arbejdet professionelt med internettet siden udgangen af 90’erne og har drevet virksomhed på nettet siden år tusinde skiftet. Gennem de sidste 8 år har Lars specialiseret sig i online markedsføring og er ikke bange for at kalde sig SEO specialist.

7 kommentarer til “Hvad er duplicate content og hvorfor skal du være bekymret for det?”

  1. Kenneth

    Hej Lars
    Tak for et godt indlæg. Er selv i sving med at luge ud og optimere mine sider.
    Jeg har en webshop hos bigcartel.com, som egentlig fungerer ganske fint.
    Jeg bruger et personligt domæne shop.kennethrimmgallery.com, men min side ligger også under bigcartel.com.

    Det mener jeg på alle måder er et problem.

    Det er noget jeg tidligere har nævnt, og de har efterfølgende lavet en standard 301 på alle custom domæner, som nu ser ud til at være fjernet.

    De hævder hårdnakket at det ikke skaber SEO problemer, men det lyder ikke sandsyndligt i min ører.

    Hvad er din mening ?

    På forhånd tak.

    Dbh
    Kenneth

    Svar
    • Lars Skjoldby

      Hej Kenneth
      Fedt du kiggede forbi. Jeg har lige kort kigget på din case og det lader til at de benytter sig af rel=canonical til at vise hvilken der er original.

      Eksempel.
      Din kategoriside “black forest” kan både findes på
      http://kennethrimmgallery.bigcartel.com/category/black-forest
      samt på
      http://shop.kennethrimmgallery.com/category/black-forest

      Men i headeren (på begge sider) står denne linje:
      <link rel="canonical" href="http://shop.kennethrimmgallery.com/category/black-forest" />

      Den fortæller at det er siden på shop.kennethrimmgallery.com som er den originale og dermed skabes der ikke duplicate content.

      Når det er sagt så er den bedste måde at løse det på uden tvivl at bruge en 301 redirect. Det gør også at brugere ikke ubevidst kommer til at havne eller linke til kennethrimmgallery.bigcartel.com.

      Dbh
      Lars

      Svar
  2. Kenneth Rimm

    Hej Lars
    Tak for svaret.
    Var også ret sikker på jeg havde de korrekte tags på min shop.
    Har forgæves prøvet at forklare dem at de skal lave en 301, da det mildt sagt er usmart af flere årsager.

    Dbh
    Kenneth

    Svar
  3. Helle

    Hej Lars,
    er det duplicate content at lade en artikel stå både som blog på egen side og som artikel på LinkedIn?

    Svar
    • Lars Skjoldby

      Ja.

      Der findes dog mange eksempler på, at denne form for duplicate content ikke virker skadende. Eksempelvis genudgiver Bolius artikler på Ekstrabladet. Det skal dog siges, at Bolius i forvejen har en stærk autoritet og et stærkt website. Derfor kan de “slippe afsted” med mere.

      Hvis du vil benytte denne strategi, så gør det moderat. Dvs. du må ikke udgive den samme artikel på flere websites. Gør det kun med ganske få artikler. Sørg for at det er HELT tydeligt, at dit website er det originale sted for dit indhold. Sørg for at linke fra LinkedIn indlægget til det originale indlæg på din hjemmeside.

      Hvis du vil være helt sikker, så lav et udsnit af artiklen på LinkedIn og henvis til din hjemmeside for hele artiklen.

      Svar
  4. Esme Emma

    Hej, jeg ved godt din artikel – som er fremragende btw – er nogle år gammel. Men jeg vil alligevel høre dig… Jeg har en rejseblog, hvor jeg skriver om familierejser. Her lægger jeg blandt andet også andre bloggeres indlæg fra rejser ud. Med tilladelse selvfølgelig og med et par linjer i toppen, hvor jeg skriver at dette indlæg er fra den og den blogger, samt et link til personens blog. Er det et problem? Er det duplicate content? Bliver vi begge straffet pga det? Og oftest ændrer jeg også i indlægget – det bliver beskåret, omformuleret visse steder og ændret i rækkefølge på punkter. Så der til sidst måske er 50-75% af det originale indlæg tilbage… Er det så ok? Eller er det stadig duplicate…?

    Svar

Kom og vær med. Skriv en kommentar.

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *