Duplicate content – czym jest powielanie treści i jak sobie z tym radzić?

Duplicate content kojarzy się głównie z zapożyczonym opisem produktu od producenta lub identycznym tekstem przy podobnych towarach z tej samej witryny. Powielanie treści ma jednak niejedno imię, a często doprowadzamy do takiego efektu nieświadomie. Czy wiesz, że nawet linki mogą nosić znamiona duplikatu? Zobacz, czym jest duplicate content, co się do niego zalicza, po co z nim walczyć i jak robić to skutecznie.

 

Duplicate content – co to jest?

Duplicate content, to identyczne treści, które pojawiają się wielokrotnie w ramach jednej domeny lub widnieją również na innych witrynach. Stąd też duplikaty można podzielić na wewnętrzne i zewnętrzne. Często generujemy je nieumyślnie – zawodzą tutaj ustawienia strony. Zdarza się też, że świadomie używamy cudzych tekstów lub wprowadzamy własne publikacje w różne miejsca, czego efektem jest duplikacja.

Warto się tego wystrzegać, ponieważ duplicate content ma wpływ na pozycjonowanie stron internetowych. Google musi ocenić, która podstrona lepiej odpowiada na zapytanie użytkownika. Wyżej w rankingu znajdzie się serwis z wysokim crawl budget, poprawną optymalizacją techniczną, porządnie skonstruowaną mapą witryny oraz dobrym linkowaniem wewnętrznym i zewnętrznym. Dzięki wdrożeniu skutecznych działań SEO są one częściej indeksowane. Roboty wyszukiwarki prawdopodobnie treść sprawdzą tam szybciej i uznają za „oryginalne” źródło.

 

Zewnętrzny duplicate content

Duplicate content zewnętrzny to taki, który widnieje na Twojej stronie oraz znajduje się na zupełnie innym serwisie. Kiedy mamy do czynienia z taką sytuacją? Zapoznaj się z najczęściej występującymi przypadkami.

 

  • Kradzież tekstów

Bez aprobaty właściciela, nie możesz ot tak używać sobie treści znalezionych w internecie. Jeśli chcesz opublikować coś z sieci na swojej stronie możesz udostępnić content wyłącznie w ramach prawa cytatu. Musisz szczególnie uważać na to zagadnienie, jeżeli korzystasz ze zdjęć i opisów producenta. Te często powstają przy współpracy z podwykonawcą i najczęściej podlegają umowie o przekazaniu autorskich praw majątkowych. Firma ma więc utwory na wyłączność. Warto dla pewności uzyskać zgodę na ich rozpowszechnianie.

Jeśli odkryjesz, że ktoś bezprawnie wykorzystuje Twoje treści, koniecznie odezwij się do serwisu z żądaniem ich usunięcia. Takie poczynania zgłosisz też do Google.

 

  • Powielony opis od producenta

Ok, masz pozwolenie na użycie istniejącego już tekstu z karty produktowej. Wiesz, dlaczego nie warto wykorzystywać tej treści w niezmienionej formie?

 

Duplicate content przy książkach to standard w księgarniach internetowych.

https://wegestudio.pl/pl/p/Jadlonomia-po-polsku/638

 

Opis ze strony wydawnictwa jest skopiowany na niektórych witrynach, gdzie książka znajduje się w sprzedaży.

https://marginesy.com.pl/sklep/produkt/133294/jadlonomia-po-polsku?idcat=0# 

 

Z dużym prawdopodobieństwem nie jesteś jedyną osobą, która dostała na to zgodę. Potem okazuje się, że ¾ sklepów internetowych ma to samo na stronie. Magicznym sposobem pierwsze miejsca w Google zajmują najpopularniejsze platformy sprzedażowe i porównywarki lub witryny, które zmieniły opis towaru.

Druga sprawa: konkurujesz z nimi wszystkimi o pozycje. Roboty wyszukiwarki muszą jakoś ocenić podstrony z identycznym tekstem. Okazuje się, że walczysz z ogromnym e-commercem na inne czynniki rankingowe. Odpada Ci jeden z istotniejszych i nietrudnych do uzyskania – unikalna, wyczerpująca i pomocna dla użytkownika treść. 

Opisy ze stron producentów często nie są do końca zoptymalizowane pod kątem SEO lub mają poprawne słowa kluczowe, jednak dla Twojego serwisu te frazy są zbyt konkurencyjne. Zobacz, jak dobierać frazy sprzedażowe do kart produktów, by poprawiać ich widoczność w Google.

 

  • Cytowanie

Gdy wykorzystujesz czyjeś słowa np. we własnych artykułach blogowych, musisz pamiętać, aby dobrze je oznaczyć. Cytowanie większych fragmentów tekstu bez odsyłacza semantycznego może spowodować, iż treść zostanie uznana za duplikat.

 

  • Teksty od copywritera lub agencji

Bez pisemnej umowy o przekazaniu praw autorskich copywriter udziela niewyłącznej licencji, a więc w czystej teorii nadal może odsprzedać kolejnym osobom swój utwór. Koniecznie podpisz ze zleceniobiorcą stosowny dokument, w którego zapisie znajdzie się również punkt o dopuszczalnych polach eksploatacji tekstu. Tylko zatrudnienie na etat powoduje automatyczne przekazanie praw autorskich.

 

  • Duplikacja własnych treści na zewnętrznych portalach

Owszem, sami możemy zrobić sobie krzywdę. Jak? To banalnie proste. Prowadzisz dodatkowo konto na platformie sprzedażowej i wklejasz tam swój odpicowany opis produktu? Twoja treść jest powielona na zewnętrznym portalu. Teraz zgadnij, co znajdziesz wyżej w wynikach wyszukiwania. Własną stronę czy ogromny serwis pracujący nad pozycjonowaniem witryny od wielu lat? Podobnie sprawa się ma z social media. Posty z Facebooka są coraz lepiej odczytywane przez crawlery i indeksowane na konkretne frazy.

 

Przykład duplicate content w postaci opisu produktu na stronie sklepu oraz na Allegro

Duplikacja treści, np. opisu tabletek do zmywarki, na platformach sprzedażowych może osłabić pozycjonowanie Twojej strony w wynikach wyszukiwania.

https://allegro.pl/oferta/finish-quantum-tabletki-do-zmywarki-100szt-7056719427

 

https://niemchem.com/product-pol-3861-Finish-Quantum-Tabletki-do-Zmywarki-100szt-XL-PL.html 

 

Co jeszcze może stać się contentem zduplikowanym na nasze własne życzenie? Artykuł sponsorowany, notatka prasowa... w sumie wszystko co mamy u siebie na stronie, a wyślemy w ramach współpracy do publikacji.

 

Wewnętrzny duplicate content

Tak jak wspomniałam, wewnętrzna duplikacja treści jest najczęściej nieświadomym działaniem. Wynika np. z braku przekierowań i pozostawienia identycznego tekstu na różnych podstronach serwisu. Wiesz, kiedy masz do czynienia z duplikatem? Niektóre formy mogą Cię zaskoczyć.

 

  • Warianty produktu na oddzielnych kartach lub w różnych kategoriach

Opisy produktów są szczególną formą treści, którą możemy powielić zarówno zewnętrznie, jak i wewnętrznie. Jak do tego dochodzi w drugim przypadku? Zwykle dzieje się tak na osobnych kartach dla podobnych produktów. Tego typu duplicate content nie wpływa negatywnie na ocenę naszej strony przez Google, wciąż jednak wyszukiwarka musi się zastanowić, który wynik zasługuje na pokazanie w rankingu i na jakiej pozycji.

 

Przykład dwóch podobnych produktów z takim samym tekstem

Unikalny opis produktu pisany pod SEO pozytywnie wpłynie na Twoją ocenę w Google.

https://www.pikinini.pl/dziecko_w_ogrodzie/domek_dla_motyli_z_rusalka_osetnik-1

 

Jeśli skopiujesz tekst z karty produktu do innego towaru w niezmienionej formie, to pod kolejnym linkiem masz identyczną treść.

https://www.pikinini.pl/dziecko_w_ogrodzie/domek_dla_motyli_z_paziem_krolowej_niebieski-1 

 

Duplikatem może być też produkt przypisany do kilku kategorii. Przy niepoprawnej strukturze towar otrzyma w każdej z nich inny adres URL, co również oznacza powieloną treść.

 

Różne linki prowadzące do tego samego produktu to też jest duplikacja.

https://www.ministerstwogadzetow.com/kubek-pieski.html, https://www.ministerstwogadzetow.com/dom-i-styl-zycia/kubek-pieski.html

 

  • Opis kategorii jako duplicate content

Następny problem zwykle zdarzający się w sklepach internetowych, które mają rozbudowaną ofertę na wiele podstron. Jeśli pozwolisz na pokazywanie opisu przy stronicowaniu, filtrowaniu i sortowaniu kategorii, to Twój tekst będzie się pojawiał wielokrotnie. Lepiej wdrożyć jedno z rozwiązań:

  • ustawić tag no-index dla kolejnych stron,
  • wykorzystać rel="canonical",
  • zostawić opis na 1. stronie z produktami i wyłączyć jego wyświetlanie przy innych okazjach.

 

  • Różne adresy URL prowadzące do tej samej strony

Duplicate content kojarzy się zwykle z samym tekstem pokazanym na stronie internetowej, jednak może on również być kopią podstron pod różnymi linkami.

Przykłady:

przykladowylink.pl i www.przykladowylink.pl

przykladowylink.pl/

www.przykladowylink.pl/strona-glowna 

www.przykladowylink.pl/index.php czy /index.html

http://przykladowylink.pl oraz https://przykladowylink.pl

 

Pamiętaj, że odnośnik z www i bez, to dwie różne wersje strony. Taka sama zasada działa przy http oraz https.

 

https://www.casu.pl/klapki-damskie

https://www.casu.pl/klapki-damskie?p=1

 

Wyżej widzisz za to dwa linki prowadzące do identycznej treści, przy czym w jednym występuje paginacja. To też jest duplicate content.

 

  • Dodatkowe parametry w linkach

Wszelkie dodatkowe parametry w adresach, np. śledzące źródła odwiedzin: utm_source, utm_campaign itd. mogą być indeksowane przez wyszukiwarkę Google. A to znowu oznacza dla Ciebie duplikat.

 

  • Strony testowe, do druku oraz nieprzetłumaczone wersje językowe

Czasem za duplicate content stoi po prostu niedopatrzenie. Zwykle pod postacią opublikowanej wersji strony, która nie powinna ujrzeć światła dziennego. Jeżeli strona do druku występuje pod innym adresem i nie jest wykluczona z indeksacji, to możesz się spodziewać powielonej treści pod różnymi linkami. Do tego jest szansa, że pojawi się ona w wynikach wyszukiwania i będzie ściągać ruch w niechciane przez Ciebie miejsce.

 

  • Oddzielna strona dla wersji mobilnej z taką samą treścią

Mobile rośnie w siłę, a więc wiele firm musiało podjąć decyzję czy robić responsywną, a może mobilną wersję swojej strony internetowej. Jednym z minusów wyboru tej drugiej jest właśnie kopia strony, jeśli nie zastosujemy tagów <link> z odpowiednimi elementami rel.

m.przykladowylink.pl

przykladowylink.pl/mobile

 

  • Różne ID dla sesji użytkownika

Często w sklepach internetowych tworzymy sesje dla użytkowników, dzięki czemu wybrane produkty zostają w ich koszykach. To bardzo wygodne dla internauty, jednak może przysporzyć Ci problemów w postaci zduplikowanej treści, gdy do adresu URL zostaje dodane ID klienta.

 

Jak szukać powielonych treści?

Wszystko zależy tak naprawdę od tego, co chcesz znaleźć. Duplicate content możesz szukać za pomocą wyników wyszukiwania oraz w darmowych narzędziach Google.

 

  • Proste wyszukiwanie identycznych tekstów w sieci – „ ”

Skopiuj fragment i wklej go do wyszukiwarki w cudzysłowie. Google sprawdza maksymalnie 32 słowa, więc jeżeli dodasz ich więcej, to wyrazy powyżej tej liczby zostaną pominięte. Otrzymasz w odpowiedzi wyniki, na których pojawia się dokładnie ten sam tekst.

 

  • Sprawdzenie zaindeksowanych strony serwisu – site:przykładowylink.pl

W ten sposób widzisz w wyszukiwarce wszystkie zaindeksowane podstrony. Co więcej, możesz zmodyfikować nieco komendę, aby znaleźć zduplikowane adresy.

 

site:przykladowylink.pl -inurl:https

 

Wpisz -inurl (minus na początku ma znaczenie), aby wykluczyć z wyszukiwania linki, np. posiadające certyfikaty https. W ten sposób zweryfikujesz, czy na Twoim serwisie nie pozostały strony bez odpowiednich przekierowań.

Za sprawą operatora inurl możesz też poszukać zaindeksowanych adresów z parametrem śledzącym, które również zaliczają się do duplicate content.

 

site:przykladowylink.pl inurl:utm_campaign

 

  • Zaawansowane operatory do wyszukiwania duplicate content w Google

Poszukaj po frazie, czy ktoś korzysta z Twoich treści lub po intext: wpisz fragment, aby sprawdzić same teksty. -site wyklucza Twoją witrynę z wyników.

 

„fraza” -site:przykladowylink.pl

intext:„tekst” -site:przykladowylink.pl

 

Niestety takie rozwiązania mają swoje ograniczenia. Jeśli w tekście znalazły się synonimy lub nieco zmienione słowa czy zdania, to sama wyszukiwarka może nie wyłapać takich stron. Dlatego powstały płatne narzędzia, które są specjalnie przeznaczone do sprawdzania witryn pod tym kątem. Wśród nich można wyróżnić: Copyscape, Screaming Frog, Siteliner, PlagiaShield, Quetext.

 

Duplicate Content w Google Search Console

Duplicate content możesz też znaleźć za pomocą Google Search Console. Wystarczy w bocznym menu w zakładce Indeks wybrać Stan, a wtedy pokażą się statystyki dla Twojej witryny. Sprawdzisz tam wykluczone strony, a ze szczegółów dowiesz się, z jakiego powodu tak się stało. Wyjdzie Ci np. informacja „Duplikat, użytkownik nie oznaczył strony kanonicznej”.

 

Duplikacja treści jest łatwa do wykrycia w Google Search Console. Narzędzie pokazuje, którym stronom brakuje canonicala.

  

Co robić, gdy znajdziesz zduplikowany content?

 

  • Popraw tekst

Na pierwszy miejscu zawsze będzie unikalna treść, dlatego najlepiej napisać ją zupełnie od nowa. Jeśli nie masz za dużo czasu i planujesz wykorzystać np. opis producenta, to postaraj się przeredagować go i dopisać do niego jak najwięcej informacji. Takie zasady tyczą się również wielokrotnie powielonej treści w obrębie Twojego serwisu.

Bez względu na to, czy decydujesz się robić własny tekst, czy wykorzystać istniejący, pamiętaj o optymalizacji pod słowa kluczowe. Na naszym blogu znajdziesz artykuł, w którym pokazujemy jak w prosty sposób podrasować opis od producenta w Asystencie Contentu.

 

  • Wyklucz z indeksacji

Noindex przypisujesz stronom, które nie mają dla Ciebie większego znaczenia. Nie widzisz potrzeby ich indeksowania przez roboty Google, a niestety generują na Twojej stronie duplicate content. Są to na przykład podstrony, które powstają przy nałożeniu filtrów wyszukiwania lub pojawiający się wszędzie regulamin. Możesz to zrobić poprzez meta tag noindex oraz X-Robots-Tag.

Dodaj do kodu HTML wybranej strony w sekcji <head>:

 

<meta name="robots" content="noindex"> 

 

Skonfiguruj zwracanie nagłówka noindex w odpowiedzi HTTP za pomocą:

 

X-Robots-Tag: noindex

X-Robots-Tag: none

 

  • Zastosuj przekierowanie 301

To świetny sposób, aby wykluczyć z użycia wszelkie kopie linków, np. strony głównej. Przekierowanie 301 ma na celu przenosić ruch z jednej wersji URL na inny. Jeśli usuniesz podstronę lub zmienisz prowadzący do niej link, to bez tego przekierowania użytkownik po wejściu na stronę otrzyma błąd 404. Google nie odnajdzie takiego adresu. To wpływa znowu na doświadczenie internauty. Nie będzie zachwycony, gdy zapędzisz go w kozi róg serwisu.

W czystej teorii przekierowanie 301 można również zastosować przy podstronach z produktami. W ten sposób przeprowadzisz ruch na konkretną kartę towaru i pozbędziesz się kłopotu z duplicate content. Przenosisz jednak potencjał SEO na jedną stronę. Lepiej więc zastosować taki trik w przypadku przedmiotów, które wyszły z oferty. Dla podstron z identyczną treścią lepiej zastosować canonicala.

 

  • Użyj linków kanonicznych

Wspomniany już przeze mnie wyżej rel="canonical", to tag, który daje informacje robotom wyszukiwarki. Dzięki niemu wiedzą, którą stronę warto zaindeksować na daną frazę. Kanonizacja odnośników jest automatyczna. Możesz jednak własnoręcznie zasugerować crawlerom, że wybrany przez Ciebie link jest najlepszy. 

Wykorzystaj ten sposób, gdy na różnych adresach URL masz duplicate content i nie chcesz go zmieniać. Świetnym przykładem są produkty dostępne w kilku kolorach (dla przykładu czarny, żółty i brązowy), a dodane na osobnych kartach. Najpierw musisz ustalić, który z nich cieszy się największym powodzeniem wśród klientów. Załóżmy, że będzie to przedmiot w kolorze czarnym. Wtedy wariantom o żółtej i brązowej barwie ustawiasz tag canonical na wybraną wersję.

 

Jak to zrobić?

W sekcji <head> kodu HTML strony dodajesz:

 

<link rel="canonical" href="http://www.przykladowylink.pl/strona.html" />

 

rel="canonical" może być również użyty w nagłówku http.

 

Za sprawą canonicala pozbędziesz się też powielonych treści, które powstałe w wyniku stworzenia wersji mobilnej na subdomenie. Więcej o tym przeczytasz w artykule o konsolidacji duplikatów na developers.google.com.

 

  • Syndykacja treści 

Termin odnosi się sposobu rozpowszechniania tekstów z Twojej strony internetowej na innych portalach. Jest formą promocji wpisów blogowych – wysyłasz artykuły do innych serwisów z oznaczeniem źródła oraz autora. Jeśli planujesz przekazać swoje treści, upewnij się, że będą one odpowiednio podpisane i podlinkowane oraz niecytowane w całości. Dzięki temu Google nie powinien ich uznać za duplicate content.

 

Czy duplikacja treści jest karana przez Google?

Tak naprawdę jest niewiele przypadków, w których witryna zostanie ukarana za duplicate content. Są to np. skrajne próby manipulacji wynikami wyszukiwania. Wtedy istnieje prawdopodobieństwo, że witryna zostanie usunięta z indeksu. Drugą opcją jest zgłoszenie naruszenie praw autorskich do Google.

Dlaczego więc tak wiele się mówi o poprawianiu treści? Ponieważ duplikaty mają wpływ na SEO i pozycjonowanie.

Po Twoich stronach chodzą roboty wyszukiwarki. To jak często i prędko to robią, zależy np. od szybkości serwisu. Jeśli ten działa wolno, to Google nie będzie dodatkowo go przeciążał większą liczby zapytań. Wydłuża to cały proces, a Ty tracisz ruch, bo strony są niewidoczne. Wyszukiwarka ocenia też zapotrzebowanie na indeksację. Co nakłania crawlery na regularne odwiedzanie Twojej strony? Popularność, ale również aktualność i niepowtarzalność treści. Wewnętrzny duplicate content może więc opóźniać działanie Googlebotów. 

Poza tym, miejsce w wynikach wyszukiwania jest ustalane m.in. za sprawą opublikowanych treści. Istnieje nawet szansa, że część powielonych stron nie zostanie w ogóle wyświetlona internautom. W praktyce zdarza się jednak, że np. karty produktów z identycznym tekstem pojawiają się w wyszukiwarce. Crawlery muszą wtedy zdecydować tylko na podstawie innych czynników rankingowych, która strona powinna znaleźć się wyżej.

Przegra ten, kto posiada gorsze oceny. Oczywiście, gdy masz autorski tekst, nadal liczą się pozostałe kryteria. Google lubi jednak unikalne treści i posiadanie ich na stronie zwiększy Twoje szanse na zdobycie wyższej pozycji. Nie powinno nikogo więc dziwić, że od pewnego czasu bardzo duży nacisk kładzie się na content marketing. Postaraj się usunąć duplicate content, aby wyszukiwarka lepiej oceniała cały serwis i poszczególne podstrony.

Autor

Katarzyna Żołna's picture

Katarzyna Żołna

Zajmuje się tworzeniem treści w SEMSTORM. Swoje doświadczenie związane z content marketingiem zdobywała podczas pracy jako specjalista, a następnie koordynator zespołu e-commerce w jednym ze sklepów z branży wyposażenia wnętrz.

Przeczytaj także

Komentarze