Duplicerat innehåll

Definitionen av duplicerat innehåll (duplicate content) är när en text är tillgängliggjord via fler än en URL – att den helt enkelt finns publicerad på flera olika platser på internet. Duplicerat innehåll kan uppstå både genom att en text publiceras på flera olika sajter eller genom att en och samma sajt har flera undersidor på vilka samma text publicerats.

Dessa två typer av duplicerat innehåll – extern och intern duplicering – medför två delvis olika problem för din sökmotoroptimering, men kärnan är densamma: du minskar markant möjligheten att synas i högt upp i sökresultaten.

Externt duplicerat innehåll

Sökmotorerna strävar efter att presentera ett så varierat och högkvalitativt sökresultat som möjligt. Om en text är duplicerad under fler än en domän tvingas därför sökmotorn att ifrågasätta vem som är den ursprungliga författaren och rättmätiga ägaren till innehållet. Den sajt som uppfattas som ägare är vanligtvis den som kommer att synas högt i sökresultatet, medan den andra sajten nedvärderas och i många fall inte syns alls i sökresultatet. Denna typ av filtrering på grund av duplicerat innehåll kom till då en del sajtägare byggde hela nätverk med sajter med duplicerat innehåll, i förhoppning att på ett enkelt vis driva söktrafik.
Duplicerat innehåll
För ”hederliga” sajtägare som inte medvetet kopierar innehåll blir detta vanligtvis ett problem först om du har en stor mängd produktbeskrivningar eller annan information som en extern leverantör har gett till fler än en återförsäljare. Om alla dessa återförsäljare använder en och samma text kommer sökmotorerna värdera vilken sida som är starkast och bidrar med mest värde, vilken kan leda till att din sajt inte syns så högt som den potentiellt skulle kunna göra. Därför kan det i långa loppet vara väldigt lönsamt att skriva unika produkttexter på sin sajt.

Du kan skapa unika produktexter exempelvis genom att skriva en mindre recension eller ett personligt tips kring produkten. Att låta kunder kommentera enskilda produkter kan också vara en idé, då kommentarerna utgör textinnehåll som sökmotorerna kan indexera och på så vis har du helt gratis fått text på sidan som dina konkurrenter inte har.

Internt duplicerat innehåll

Finns en text duplicerad på flera platser på din egen sajt innebär det i ”bästa” fall bara att sidorna konkurrerar med varandra internt och att de därför inte visas så högt upp i sökmotorerna. I värsta fall kan hela – eller delar av – sajten filtreras bort ur sökresultatet. Det sistnämnda har Google skapat ett eget filter för, Panda-filtret, och om du hamnar i detta filter kan du komma att tappa enormt mycket av din söktrafik till sajten.

Duplicerat innehåll på en och samma sajt kan skapas på en rad olika vis. Det mest självklara är att en och samma text används för att beskriva flera olika produkter i ditt sortiment. Säljer du exempelvis cyklar kanske en cykelmodell finns i flera olika utföranden – olika färger eller med olika många växlar. Det är logiskt att dessa olika modeller får samma produkttext.

En annan vanlig orsak till duplicerat innehåll är att sajten ger besökaren möjlighet att sortera innehållet på en kategorisida. Du kanske har en sida med alla damcyklar du säljer och besökaren kan själv sortera i vilken ordning cyklarna ska visas; efter pris, färg eller popularitet. På många sajter innebär de olika sorteringsfunktionerna inte bara att innehållet förändras utan även att URL:en ändras. Däremot uppfattar sökmotorn innehållet som samma även om delar av det sorterats i en annan ordning. Då gäller att vara tydlig för sökmototerna så att de inte indexerar de olika sorteringarna och därmed uppfattar det som att du har väldigt mycket duplicerat innehåll på din sajt.

Ytterligare en variant av duplicerat innehåll är att hela sajten finns tillgängliggjord både med och utan prefixet www. Detta är dels olyckligt på grund av just det duplicerade innehållet, men kanske framförallt då det kan innebära att du förlorar länkkraft från externa länkar då vissa sajtägare väljer att länka till din sajt med www och andra utan.

Det finns några olika sätt på vilka du kan undvika dessa och liknande typer av intern duplicering. Det bästa är naturligtvis att helt enkelt undvika att återanvända samma texter helt och hållet, men ibland behövs extra handpåläggning för att komma runt problemet. Vilken du väljer beror ofta på vilken typ av problem du har och om sidan redan indexerats eller inte:

  • 301 redirect
    301-redirect är en ompekning av en sida till en annan. Är din sajt duplicerad med och utan prefixet www är en 301-redirect att föredra. Du tvingar helt enkelt webbläsaren att gå till den version av sajten du föredrar.

 

  • Meta noindex
    Om du har en sida som du vet innehåller duplicerat innehåll kan du i sidans meta robots-tag ange taggen ”noindex”. Med den talar du om för sökmotorerna att sidans innehåll inte ska indexeras överhuvudtaget. Denna tag tillsammans med canonical-taggen utgör ofta den bästa lösningen om sökmotorerna redan har indexerat sidor som du vill att de ska ta bort ur sitt index. Det ska dock påpekas att det ofta tar flera månader innan Google uppfattar förändringen och agerar på den genom att börja avindexera sidor.

 

  • Canonical
    Canonical är en tag som sökmotorerna har skapat enbart på grund av att många sajtägare har problem med duplicerat innehåll. Med canoincal-taggen talar du om för sökmotorerna att du är medveten om att innehållet är duplicerat och du pekar dem till originalkällan.

 

  • Blockera i robots.txt
    I sajtens robots.txt-fil kan du blockera sökmotorerna från att helt besöka vissa delar på din sajt. Det kan liknas med att du helt enkelt låser dörren till specifika sidor. Här kan du även blockera variabler i URL-strukturen, så är du medveten om att du har problem med duplicerat innehåll genom exempelvis sorteringsfunktioner är det ofta bra att blockera dessa här. Detta bör dock göras innan sökmotorerna haft en möjlighet att besöka sidan och indexerat den – annars kan det dröja väldigt länge innan sidan avindexeras i och med att du har låst ingången till sidan och sökmotorerna därför inte har möjlighet att se om du har lagt till en noindex- eller canonical-tag.

 

  • Avindexera via Google Webmaster Tools
    I Google Webmaster Tools finns möjlighet att manuellt ange en sida för avindexering om den av misstag har indexerats. I skrivande stund kan du antingen göra det manuellt en sida i taget eller en hel katalog åt gången. Har du duplicerat innehåll som följer ett visst mönster är det alltså här möjligt att avindexera många sidor i ett svep, men har du exempelvis fått sorteringsvariabler indexerade och har tusen sidor som du vill ha avindexerade är det enklaste sättet att göra detta genom en kombination av meta- och canonical-taggar.

 

Google utför regelbundet justeringar i indexering och ranking på sajter med duplicerat innehåll som de anser ”visas med avsikt att manipulera sökresultatet”. Detta kan leda till att webbplatsens rankning påverkas negativt eller att webbplatsen helt och hållet tas bort från Googles index så att den inte längre visas i sökresultaten. Det är inte alltid sökmotorn gör rätt bedömning och därför är det viktigt att man är noga med att undvika den typen av problem.