Hvad er duplicate content og hvorfor skal du være bekymret for det?

Direkte oversat betyder duplicate content: Duplikeret indhold eller dobbelt indhold. Rent teknisk betyder det, at der ligger ensartet indhold på flere forskellige sider på nettet. Det kan både være internt på dit website eller på forskellige websites.

Duplicate content eller duplikeret indhold er sider som er ens eller meget ensartede.

Google opfatter som udgangspunkt hver eneste URL som en selvstændig side på nettet. Hvis disse sider er ens eller ensartet så er det, hvis ikke du tager dine forholdsregler, duplicate content.

Intern duplicate content, altså på din egen hjemmeside, kan skyldes at du genbruger tekster på tværs af sider. F.eks. produktekster, kategoritekster eller profiltekster. Disse skal du søger for at gøre unikke – og ja det er et stort arbejde.

Intern duplicate content kan også skyldes tekniske fejl i det system du bruger eller at din udvikler simpelthen ikke er bekendt med Googles Webmaster Guidelines. Disse problematikker kigger vi på lige om lidt.

Derudover kan der også opstå duplicate content på tværs af forskellige hjemmesider, f.eks. hvis andre kopierer din hjemmesides indhold. Gør de det uden at spørge om lov er det ulovligt og du er i din ret til at sende dem en faktura.

Det kan faktisk også være helt legalt, f.eks. hvis

  • du udgiver et blogindlæg både på din egen side og hos en anden,
  • du benytter produkttekster fra producenten som dine konkurrenter også bruger,
  • du har et RSS feed som andre frit kan hente ind og publicere på deres side.

Tekniske problemer der giver duplicate content

Lad mig vise dig nogle typiske eksempler på intern dublicate content:

Www og ikke-www

Langt de fleste hjemmesider kan kaldes både med og uden www, men hvis ikke du tager dine forholdsregler for det, så vil det resultere i duplicate content.

Eksempel: Hvis ikke jeg havde taget højde for duplicate content ville skjoldby.com og www.skjoldby.com vise den samme side, nemlig min forside. Hvis du prøver at gå ind på skjoldby.com vil du se at adressen redirecter til www.skjoldby.com.

Produktlister med sortering

Rigtig mange webshops har under deres kategorier nogle produktlister hvor du har mulighed for at sortere efter varens navn, pris eller andre ting. Dette er typiske steder hvor der kan opstå duplicate content.

Eksempel: Du sælger sko og har en kategori hvor alle dine sneakers listes under. Den findes på URL’en desejesko.dk/sneakers/. Som standard listes de alfabetisk fra A-Z.

Brugeren vælger så at liste dem omvendt fra Z-A, og så skifter URL’en til: desejesko.dk/sneakers/?Sorting=Alfa&Direction=DESC

Og brugeren kan også vælge at sortere efter pris hvor URL’en ændres til desejesko.dk/sneakers/?Sorting=Price&Direction=ASC og vil han have den faldende ændres URL’en til  desejesko.dk/sneakers/?Sorting=Price&Direction=DESC

Her har vi altså tre forskellige URL’er med samme indhold, blot i en anden rækkefølge. Det er duplicate content.

Problematikken gælder også andre steder hvor der indsættes et parameter i query’en, eksempelvis ?SESSIONID.

Artikel lister ud fra kategorier eller tags

Skriver du blogindlæg er du sikkert bekendt med kategorier og tags. Kategorier bruges ofte som et overordnet emne for artiklerne, eksempelvis ligger denne artikel under SEO, mens jeg også har artikler under PPC og Analytics. Tags bruges ofte som en form for søgeord. Jeg bruger sjældent tags her på siden men har dog nogle få som eksempelvis Local Search, Penguin og Panda.

Eksempel: Forestil dig nu jeg har lagt de samme artikler ind under flere kategorier. Når du så klikker på disse kategori lister, så vises samme indhold på listen. Kategorilister er som udgangspunkt noget nemmere at holde unikke, det handler blot om ikke at lægge samme artikel ind under flere kategorier.

Problemet er dog ret hyppigt på tags sider. Flere artikler passer måske ind på samme tags, og dermed bliver listerne meget ens, måske helt ens.

Printvenlige sider

Hvis du ser en print eller udskriftsknap på en ældre hjemmeside, åbner denne typisk i et nyt vindue med en ny URL. Den printvenlige side er en tro kopi af originalen, måske blot uden menu, sidebar og footer. Dette genererer duplicate content.

På nyere hjemmesider styrer man eventuelle printvenlige sider via stylesheetet.

Derfor er duplicate content problematisk

Google vil gerne give brugerne gode unikke resultater, men når det samme indhold er duplikeret på tværs af forskellige sider, kan Google ikke se hvad der er det originale og hvad der ikke er – eller hvad der er mest relevant. Det medfører nogle forskellige problematikker:

Skæv fordeling af linkjuice
Duplicate content kan medføre skæv fordeling af linkjuice til samme side.

Forkert fordeling af pagerank

Google bruger PageRank og linkjuice til at afgøre dine siders vigtighed, men hvis Google ikke kan se om side A1 eller side A2 er originalen medføre det at pagerank og linkjuice fordeles på de forskellige URL’er hvilket går ud over hjemmesidens placeringer.

Rangeringsproblemer

Når Google ikke kan finde ud af hvad der er originalen, kan de heller ikke finde ud af hvilken af side der skal rangeres i søgeresultatet. Det kan dermed blive et mere eller mindre tilfældigt resultat.

Opfattelse af spam

I worst case, men ikke desto mindre en hyppig case, kan duplicate content lede Google til den konklusion, at du forsøger at spamme internettet med det samme indhold. Det kan medføre at din hjemmeside bliver straffet f.eks. med Google Panda update.

Tro ikke på Google nå de siger: Don’t worry

Matt Cutts som sidder som chef for Googles spam team lavede i juli 2013 denne video om duplicate content:

Kort fortalt siger Matt Cutts i videoen at du ikke skal bekymre dig om duplicate content, med mindre du bevidst spammer.

Det råd synes ikke du skal lytte til.

Du skal huske på at Google kun består af matematiske algoritmer. Dvs. det er også algoritmer der afgør, om du har duplicate content eller ej. Og hvis du har tricket de forkerte algoritmer så hænger du på den.

Så har du duplicate content på din side, så sørg for at skille dig af med det.

Betragtes oversættelser som duplicate content?

Hvis du oversætter dit website fra f.eks. dansk til engelsk, så er der tale om to forskellige tekster. Dette er altså ikke duplicate content. Heller ikke hvis du laver en komplet en-til-en oversættelse eller bruger Google Translate.

Kan billeder generere duplicate content?

Nej. Du må gerne bruger de samme billeder på tværs af dit website eller på forskellige websites. Det betragtes det ikke som duplicate content. Duplicate content er alene et tekst problem.

Hvis du kunne lide artiklen vil jeg sætte stor pris på et like, et tweet eller et share på LinkedIn. Tak 🙂

Medlem af FDIH

Skjoldby & Co © 2013-2019 - Vi connecter vores kunder med nye kunder gennem digital marketing
Salgs- og leveringsbetingelser - Cookie- og privatlivspolitik