Hvad er duplicate content og hvorfor du (måske) skal du måske være bekymret for det?

Direkte oversat betyder duplicate content: Duplikeret indhold eller dobbelt indhold. Rent teknisk betyder det, at der ligger ensartet indhold på flere URL’er på nettet. Det kan både være internt på dit website eller på forskellige websites (domæner og subdomæner).

Duplicate content eller duplikeret indhold er sider som er ens eller meget ensartede.

Google opfatter som udgangspunkt hver eneste URL som en selvstændig side på nettet. Hvis disse sider er ens eller meget ensartet, så betegner man det som duplicate content, og du skal tage forholdsregler for at Google og andre søgemaskiner, ikke får problemer med dit website.

Er duplicate content stadig et problem for søgemaskinerne i 2020?

Søgemaskinerne ikke har lige så store problemer med duplicate content, som de havde for 3-4 år siden.

Med mindre der er noget teknisk galt på dit website, som kan rettes på tværs af websitet, er duplicate content sjældent en top prioritet blandt mine SEO-anbefalinger.

Hvorfor kan duplicate content være problematisk?

Kort fortalt er den typiske problematikker:

  • Fejlagtig opfattelse af originalen
  • Opfattelse af indholdsspam
  • Uhensigtsmæssig fordeling af PageRank
  • Opfattelse af spam
  • Rangeringsproblemer

Fejlagtig opfattelse af originalen

Google vil gerne give brugerne gode unikke resultater, men når det samme indhold er duplikeret på tværs af forskellige hjemmesider, kan Google ikke altid se, hvad der er det originale, og hvad der ikke er, hvad der er mest relevant eller hvad der er vigtigst.

Derfor kan den “uoriginale” udgivelse faktisk godt komme til at rangere højere, end den originale udgivelse.

Opfattelse af indholdsspam

Hvis det samme indhold går igen og igen og igen på dit website, kan det i værste fald blive opfattet som spam, som ikke skaber værdi for Googles brugere.

Som sagt: De vil levere unikke resultater og dermed unikt indhold til deres brugere.

Autogeneret indhold kan have denne risiko, men nogle gange er det også en hårfin balance, hvad der skaber værdi og hvad der ikke skaber værdi.

En side som lasso.dk – der autogenerer indhold om virksomhedsændringer baseret på offentlige indbregninger til Erhvervs og Selskabstyrelsen – skaber faktisk en stor værdi. De leverer indholdet på en unik, overskuelig og værdifuld måde, og det er blandt andet med til at give dem nogle gode resultater i søgemaskinerne, selvom meget af indholdet er det samme:

Duplicate content på en god måde

Uhensigtsmæssig fordeling af PageRank

PageRank er stadig en vigtig del af Googles algoritme. En forsimplet måde at forklare den på er, at forestille dig at din sides PageRank er en liter juice.

Linkjuice og PageRank

Hver URL på dit website, skal nu deles om denne liter juice, gennem de links der er på websitet. Nogle URLs, for f.eks. filtre og sorteringsfunktioner på en webshop, har præcis samme indhold, men et hav af forskellige kombinationer og derfor også forskellige URLs.  Hvis disse skal deles om juicen, vil den originale (kanoniske) URL, få mindre juice end egentlig er berettiget til.

Rangeringsproblemer

Disse ting kan i sidste ende give rangeringsproblmer.

Kan jeg blive straffet for duplicate content?

Som udgangspunkt nej, men det afhænger også af den enkelte situation.

Når jeg skriver “som udgangspunkt nej” mener jeg, at Google som sådan ikke straffer dig. De kan have problemer med fortolkning og indekseringen. Der er stor forskel mellem disse to ting:

En straf kan hænge på dit website længe og skal ophæves før du ser en forbedring.
Et problem kan du løse, og mærke effekten af så snart det er læst.

Når du har duplicate content på dit website, kan Google have svært ved at tolke indholdets vigtighed, og det kan give dig problemer med at rangere på det, fordi de ikke kan se, om det er vigtigt.

Er der andre, der har udgivet det samme indhold som dig og bliver de af Google opfattet som mere autoritære, kan de komme til at rangere højere end dig.

Har du f.eks. landingssider, som målretter dine ydelser i forskellige byer, og ændrer du kun bynavnet i teksterne, kan det af Google blive opfatte det som doorway pages. Det fortæller John Mueller fra Google om i dette podcast. Og det kan godt resultere i en straf.

I praksis og i mindre skala har jeg set masser af eksempler på, at denne taktik fungerer ganske fint, og ud fra en lean marketing filosofi, giver denne metode også god mening:

Har du f.eks. 10-20 af den slag sider og har du begrænset tid og ressourcer, så vil jeg anbefale dig, at starte med at bruge samme tekst, og kun ændre bynavnet. Efter en måneds tid eller to, kan du begynde at optimere, ændre og udbygge indholdet på de bedst performende sider.

Har du 100-1000-vis af den slags sider, ville jeg starte med at lave en række forskellige tekstskabeloner, og så ændre variablerne (f.eks. bynavnet) på hver landingsside og så herefter arbejde på at gøre dem unikke.

Med denne tilgang får du indekseret dine sider ud og leve på nettet, og du får noget data ind, du kan bruge til at tage beslutninger ud fra. Det er et langt bedre udgangspunkt, og det giver dig langt mere fart, end hvis du starter med med at skrive unikt indhold.

Men du må bare ikke glemme, at indholdet skal gøres mere unikt på sigt.

Hvornår opstår der duplicate content på din hjemmeside?

Intern duplicate content, altså på din egen hjemmeside, kan som sagt skyldes, at du genbruger tekster på tværs af sider, og oftest er dette produkttekster eller tekster som beskriver dine ydelser.

Det kan være et kæmpe arbejde at gøre disse unikke, så start med de vigtigeste produkter og ydelser.

Intern duplicate content kan også skyldes tekniske fejl, i det system du bruger eller at din udvikler simpelthen ikke er bekendt med Googles Webmaster Guidelines. Disse problematikker kigger vi på lige om lidt.

Derudover kan der også opstå duplicate content på tværs af forskellige hjemmesider, f.eks. hvis andre kopierer din hjemmesides indhold. Gør de det uden at spørge om lov er det ulovligt og du er i din ret til at sende dem en faktura.

Det kan faktisk også være helt legalt, f.eks. hvis

  • du udgiver et blogindlæg både på din egen side og hos en anden,
  • du benytter produkttekster fra producenten som dine konkurrenter også bruger,
  • du har et RSS feed som andre frit kan hente ind og publicere på deres side.

Må jeg genbruge afsnit og kortere beskrivelser på tværs af mit website?

Ja. Det er der som udgangspunkt ingen problemer med. Det kunne være afsnit som:

  • Testimonials og mindre case-stories
  • Call to actions og formularer
  • Beskrivelse af medarbejdere
  • Unique Selling Propositions
  • Arbejdsmetoder og processer
  • Osv.

Men sørg samtidig for, at indholdet før, efter og omkring disse afsnit er unikt.

Hvilke tekniske problemer kan give duplicate content?

Lad mig vise dig nogle typiske eksempler på intern dublicate content:

Www og ikke-www

Langt de fleste hjemmesider kan kaldes både med og uden www, men hvis ikke du tager dine forholdsregler for det, så vil det resultere i duplicate content.

Eksempel på løsningen:

Hvis ikke vi havde taget højde for duplicate content ville skjoldby.com og www.skjoldby.com vise den samme side. Hvis du prøver at gå ind på skjoldby.com vil du se at adressen redirecter til www.skjoldby.com. Og hvis du tjekker lidt dybere, vil du se det er en 301-redirect.

http og https

Langt de fleste hjemmesider kører på https, men de kan også kaldes med http. Problemet og løsningen her kan sammenlignes med www og ikke-www.

Du skal sørge for at 301-redirecte dine http-URLs til https.

Eksempel på løsningen:

Vi 301-redirecter http://www.skjoldby.com/ til https://www.skjoldby.com/ – og det samme gør vi selvfølgelig med alle underliggende URLs.

Produktlister med sortering

Rigtig mange webshops har under deres kategorier nogle produktlister, hvor du har mulighed for at sortere efter varens navn, pris, farve, brand, størrelse eller mange andre ting. Disse filtre er typiske steder, hvor der kan opstå duplicate content, som kan være meget problematiske for søgemaskinerne.

Eksempel på problemet:

Du sælger sko og har en kategori hvor alle dine sneakers listes under. Den findes på URL’en desejesko.dk/sneakers/. Som standard listes de alfabetisk fra A-Z.

Brugeren vælger så at liste dem omvendt fra Z-A, og så skifter URL’en til: desejesko.dk/sneakers/?Sorting=Alfa&Direction=DESC

Og brugeren kan også vælge at sortere efter pris hvor URL’en ændres til desejesko.dk/sneakers/?Sorting=Price&Direction=ASC og vil han have den faldende ændres URL’en til  desejesko.dk/sneakers/?Sorting=Price&Direction=DESC

Her har vi altså tre forskellige URL’er med samme indhold, blot i en anden rækkefølge. Det er duplicate content.

Problematikken gælder også andre steder hvor der indsættes et parameter i query’en, eksempelvis ?SESSIONID.

Denne form for duplicate content kan virkelig give søgemaskinerne hovedpine, fordi de skal crawle en masse forskellige URLS. Det kan også gå ud over dit crawl budget.

Der er ikke en one-size-fits-all anbefaling her, men det kan ofte løses gennem canonical links og i nogle tilfælde også ved at bruge regler i robots.txt.

Artikellister ud fra kategorier, tags, forfattere eller dato

Skriver du blogindlæg, er du sikkert bekendt med kategorier og tags.

Kategorier bruges ofte som et overordnet emne for artiklerne, eksempelvis ligger denne artikel under SEO, mens vi også har artikler under PPC og Analytics.

Tags bruges ofte som en form for søgeord. Vi bruger dem ikke her på bloggen, men de kan godt give mening for nogen.

Eksempel på problemet:

Forestil dig jeg har lagt de samme artikler ind under flere kategorier her på bloggen. Når du så klikker på disse kategorilister, vises samme indhold på hver liste.

Problemet er præcis det samme med tags, forfatter- og datoarkiver.

Eksempler på løsningen:

Den hurtige løsning er at noindexe disse lister. En anden løsning, som kan fungere rigtig fint er, at lave disse lister om til en slags landingssider eller emneuniverser, f.eks. ved at lægge noget unikt indhold rundt omkring artikeluddragene.

Printvenlige sider

Hvis du ser en print eller udskriftsknap på en ældre hjemmeside, åbner denne typisk i et nyt vindue med en ny URL. Den printvenlige side er en tro kopi af originalen, måske blot uden menu, sidebar og footer. Dette genererer duplicate content.

På nyere hjemmesider styrer man eventuelle printvenlige sider via stylesheetet.

Eksempler på løsningen:

Der skal blot sættes noindex på den printvenlige side.

Betragtes oversættelser som duplicate content?

Hvis du oversætter dit website fra f.eks. dansk til engelsk, så er der tale om to forskellige tekster og dette er selvfølgelig ikke duplicate content.

Heller ikke hvis du laver en komplet en-til-en oversættelse eller bruger Google Translate.

Men hvis det samme indhold svarer på to forskellige domæner, og du ikke bruger enten canonical link eller href-lang link, kan det være duplicate content.

Læs mere om international SEO og hreflang link her

Kan billeder generere duplicate content?

Nej. Du må gerne bruger de samme billeder på tværs af dit website eller på forskellige websites. Det betragtes det ikke som duplicate content. Duplicate content er alene et tekst problem.

Medlem af FDIH

Skjoldby & Co © 2013-2020 - Vi connecter vores kunder med nye kunder gennem digital marketing
Salgs- og leveringsbetingelser - Cookie- og privatlivspolitik