skip to Main Content
+48 606 628 628 info@zgred.pl
Elephants 808429 640

Duplikacja treści czyli duplicate content – jak sobie poradzić i czy  w ogóle warto?

Duplikacja treści popularnie zwana duplicate content nierzadko spędza sen z powiek wielu właścicielom stron a tym bardziej seowcom i tym poczatkującym i tym zaawansowanym. Wszyscy wiemy, ze Google nie lubi kopii treści i nierzadko reaguje alergicznie na problemy z tym związane – najczęściej grasuje po serwisie Panda. Jak sobie poradzić z powielaniem treści? Nie ma zawsze jednoznacznej metody, która wprost załatwi problem. Ale czy zawsze warto zwalczać duplikację? Przyjrzyjmy się kilku przypadkom.

Duplikacja treści ze względu na kilka stron głównych

Jest to problem nadal występujący objawiający się indeksowaniem przez wyszukiwarki strony głównej, która występuje pod kilkoma adresami.

Czyli w indeksie może znaleźć się:

  • pl/
  • pl/index.html
  • pl/index.php
  • zgred.pl/index.html
  • … i kilka innych

Rozwiązaniem jest kilka:

  • Nanosimy poprawki w skrypcie – chyba najtrudniejszy element
  • Wykonujemy stosowne przekierowania 301 – tego może być dużo i nie zawsze jest dostęp do ftp
  • Implementujemy rel=”canonical” – wymaga poprawek w skrycpie. Parametr trzeba umiejętnie wdrożyć bo można to spier… znaczy się zepsuć sobie ponownie.

 

Nieprawidłowe wdrożenie certyfikatu SSL

W związku z coraz powszechniejszym wykorzystywaniem certyfikatu SSL, szczególnie w branży e-commerce, właściciele decydują się na zaimplementowanie SSL i przejściu na protokół HTTPS nie tylko na stronach wymagających zaufania (koszyk, rejestracja, płatności etc..) ale w całym serwisie.

Sama implementacja nie stanowi problemu ale zapomina się o tym, że serwis z wdrożonym certyfikatem oraz bez niego to dwie różne witryny dla Google. Stąd też:

  • Po pierwsze: wykonujemy przekierowania 301 z wersji nonSSL na wersję z wdrożonym SSL (podkreślam: 301 a nie jakieś uje muje dzikie węże)
  • Po drugie: w panelu Google Search Console weryfikujemy serwis z wdrożonym HTTPS i ustawiamy domenę preferowaną. Ważne: nie kasujemy z panelu GSC wersji bez SSL.

Uwaga, często poprawy / uaktualnienia wymagają również canonicale użyte wcześniej na stronie – jeśli część z nich była ustawiana ręcznie może zdarzyć się, że wciąż będą wskazywały na adresy z http zamiast z https – w rezultacie tworzy się pętla i problem duplikacji nie znika.

Wersje językowe jako przykład duplikacji treści

Chcąc wyjść poza granice Polski i rozpocząć karierę międzynarodową sprzedając swoje produkty czy usługi poza Polską należy zaimplementować parametr href lang. Tutaj od razu uściślę, że na terenie PL można też zaimplementować wersję anglojęzyczną skierowaną do np. Anglików przebywających na terenie Polski aby serwis zgłaszał im się po angielsku 😊

Wróćmy jednak do HREF LANG. Implementacja wersji językowych może odbyć się na kilka sposobów – zostały one opisane w support’cie Google pod adresem: https://support.google.com/webmasters/answer/182192?hl=pl&ref_topic=2370587

Najgorszym rozwiązaniem jest implementacja przełączania pomiędzy językami za pomocą parametrów. Zawsze w takim przypadku wersja językowa np. polska i angielska nakładają się – to znaczy, że mamy ten sam adres w wersji polskiej i angielskiej – zmienia się tylko treść. Zerknijmy zatem do serwisu: plantulepillows.com

 

Jak widać pod tym samym adresem znajduje się wersja polska i angielska. Dodatkowo niewłaściwie zaimplementowane są wersje językowe wskazujące ten sam adres dla wersji w języku polskim i angielskim.

Rozwiązanie to oczywista oczywistość – trzeba przebudować skrypt i poprawnie zaimplementować href lang. Ważne: razem z href lang musi być obowiązkowo zaimplementowany parametr rel=”canonical”.

Innymi problemami mogą być wersje tego samego języka np. niemieckiego lub angielskiego przeznaczone na różne kraje. Rozwiązaniem jest oczywiście zaimplementowanie odpowiednich flag językowych. Odsyłam do case study wykonanym przez Bartka Góralewicza i jego team Elephate:

 

Jak to ujął Bartek na jednej z konferencji: przetłumaczyłem angielski na angielski i … weszło 😉

 

Te same produkty występujące pod różnymi adresami

Wiele sklepów e-commerce posiada takie same opisy produktów w różnych kategoriach. Nie ma problemu gdy zastosujemy parametr canonical, który wskazuje gdzie leży oryginalny produkt z równie „oryginalnym” opisem. Jednakże nierzadko zabijamy sobie długi ogon na różne produkty z podziałem ze względu na np. kolor, rozmiar.

Jeżeli szukamy np. nazwy produktu plus nazwa firmy to sprawa jest oczywista – można zaprojektować karty produktu z tymi samymi opisami, przełączanymi kolorami i wdrożyć canonical na wersję podstawową. Z punktu widzenia SEO – mamy zaindeksowany produkt oraz nazwę. Z punktu widzenia UX – użytkownik ma wszystko pod ręką.

Przykład: https://pl.ecco.com/pl-PL/product/5638498976/ECCO-COOL-2-0

Zmiana koloru powoduje zmianę adresu URL ale jest wdrożony jeden parametr canonical dla wszystkich kart produktowych jednego typu produktu z różnymi kolorami. Podobne rozwiązania ma Samsung na swojej stronie (podstrony ze smartfonami).

Powyższe rozwiązanie jest często stosowane w sklepach producentów. Zerknijcie do Samsunga – ma wdrożone canonicale na wersję podstawową a inne kolory smartfonów mają canonical na „czarne”.

W przypadku sklepów niefirmowych zmiana adresu URL pociąga za sobą zmianę opisu produktu – przykład:

URL: www.eobuwie.com.pl/sneakersy-ecco-cool-2-0-gore-tex-84251301001-black.html

Specjalnie wybrałem te same produkty aby pokazać różnicę w realizacji.

 

Innym rozwiązaniem może być stworzenie strony pośredniej,  na której można wybierać różne gramatury, smaki produktów z własnym opisem i dopiero na tej pośredniczącej stronie kierować użytkownika do produktów docelowych. Wtedy optymalizacja jest wykonana pod kilka słów kluczowych a strony docelowe już pod konkretne słowa wraz z gramaturami, smakami czy kolorami.

Przykład strony pośredniczącej: www.zooplus.pl/shop/psy/karma_dla_psa_mokra/animonda

Na niebiesko oznaczyłem różne gramatury. Na każdej stronie docelowej mamy różne smaki do wyboru.

 

Paginacja – czyli stronicowanie

W przypadku paginacji zaleca się zastosować dwa parametry: canonical oraz prev/next. Paginacja pozwala na lepsze, szybsze indeksowanie produktów. Pozwala tez sterowac juicy SEO. Niektóre testy pokazują w jaki sposób indeksować i wykonywać stronicowanie aby przynosiło pozytywne rezultaty: https://www.portent.com/blog/seo/pagination-tunnels-experiment-click-depth.htm

Niewłaściwe wykonanie stronicowania może doprowadzić do duplikacji treści pomimo faktu przełączania się między stronami. Google dla stronicowania rekomenduje takie wdrożenie parametru canonical oraz prev/next aby canonical wskazywał „sam na siebie” a prev/next zgodnie z definicją – następną i poprzednią stronę (suport Google pod adresem: https://support.google.com/webmasters/answer/1663744?hl=pl)

Co jednak zrobić kiedy audyt seo wskazuje, aby np. opis kategorii to był długi tekst wykonany pod kątem SEO?

Dobry przykład (przypadkowo wzięty z Internetu) znajdziemy pod adresem: https://www.dobrerowery.pl/rowery-gorskie – na pierwszej stronie stronicowania znajduje się drobny tekst SEO. Jeśli przełączymy się na drugą stronę – tekst znika. I to jest dobre rozwiązanie.

Co zrobić w przypadku, gdy tekst nadal by został? Nie ma problemu gdy on jest dość krótki. W przypadku jest dobrej optymalizacji taki tekst będzie posiadał najmarniej 2500zzs. Tym samym na następnych stronach nie powinien istnieć. Dlatego można zastosować jedne z poniższych rozwiązań:

  • Tekst na drugiej i każdej następnej podstronie jest usuwany
  • Wykonujemy canonical ze wszystkich stron stronicowania na pierwszą stronę
  • Na strony od2 do ostatniej wstawiamy „noindex” do stronicowania
  • … oraz inne możliwe rozwiązania.

Blokowanie stronicowania za pomocą „noindex” oraz canonical nie jest dobre gdyż obcinamy sobie indeksację, juicy seo dla produktów w danej kategorii.

 

Sortowanie, które zawsze miesza

W przypadku sortowania i parametryzacji z tym związanej jedyną rzeczą, którą się stosuje jest canonical na wersję bez parametrów.

Jednakże warto chwile się zastanowić i przeanalizować, czy z sortowania nie można wykonać dodatkowej nowej podstrony, którą można zoptymalizować pod kątem SEO i pozyskać dodatkowy ruch organiczny na jakieś tam słowo kluczowe.

Powielone opisy produktów

Poradzenie sobie z mnogością produktów, które mają ten sam opis jest wiele – można je by mnożyć, bo każdy ma jakieś sensowne rozwiązanie. Wystarczy czasem przejrzeć konkurencję w poszukiwaniu dobrego rozwiązania.

Wiadomo, że najprościej jest wykonać reedycję opisu, napisać opis produktu na 500-1000zzs i cieszyć się oryginalnością. Ale wszystko zawsze jest do czasu aż ktoś skopiuje – wtedy można się przejmować, gdy Nas „przeskoczy”, ale z reguły wtedy jesteśmy już daleko z przodu.

Najczęstszym błędem jest … podpinanie tych samych opisów w sklepie do porównywarek cenowych. Wtedy nie pomoże nam praktycznie nic. Każda porównywarka przeskoczy Nas w wynikach na nazwę produktu. Tutaj jedyną rekomendacją jest stworzenie dwóch opisów – jeden masz swój własny, drugi wysyłasz w świat.

Z punktu widzenia zarządzania dobrym rozwiązaniem jest zastosowanie macierzy BCG.

Źródło: productvision.pl

 

Znając swoja sprzedaż, sezonowość i inne aspekty produktowe jesteśmy w stanie podzielić je na 4 kategorie. Znakami zapytania i kulami u nogi się nie zajmujemy – są to produkty, które słabo się sprzedają lub praktycznie wcale. Na nich się nie zarabia (wtedy wystawia się je na Allegro). Natomiast warto poświęcić chwilę uwagi tym, które są bardzo popularne i mają dużą marżę – czyli zarabiamy. Dla tych produktów warto pochylić się nad opisem. Dzięki temu zbudujemy przewagę konkurencyjną – i mamy rozwiązany, przynajmniej częściowo, problem duplikacji treści.

Pewnego rodzaju rozwiązaniem może być stosowanie na kartach produktów dużej liczby linków wewnętrznych związanych z cross-selling’iem oraz up-selling’iem. Odpowiednio przedstawione inne produkty na karcie danego produktu wraz z kawałkiem opisu produktu linkowanego nie musi powodować duplikacji treści względem wielu setek takich samych opisów na innych sklepach. Ale tutaj dodatkowo należy wyświetlać zajawki tekstów z bloga – kafelki z kawałkiem tekstu z każdego opisu.

Oczywistą oczywistością jest to, że opinie i recenzje budują zawsze content – taki nieunikalny, skopiowany – staje się contentem unikalnym (no może prawie).  Do recenzji czy komentarza zawsze warto zachęcić – czy to w formie mejla z podziękowaniem czy to za dodatkowe bonusy. Ale jak to nie pomoże to czemu by nie napisać swojego? 😉

Pośrednią metodą na radzenie sobie z duplikacją, szczególnie w sklepach, jest wykonanie mocno rozbudowanego opisu kategorii nadrzędnej i wykonanie linkowania wewnętrznego dla dosłownie kilku produktów z treści opisu kategorii. W trakcie procesu pozycjonowania kategoria zawsze jest elementem pozycjonowanym – dzięki temu juicy seo wpływa silnie na produkt ze zduplikowanym opisem.

 

Parametryzacja, linki afiliacyjne

Parametryzacja czy tez program partnerski ze swoimi linkami afiliacyjnymi może doprowadzić do duplikacji treści. Parametry typu UTM mogą być indeksowane przez wyszukiwarki – tym samym będzie zachodzić podejrzenie duplikowania treści pod tymi samymi adresami. Wystarczy w Google wpisać polecenie „inurl:utm_campaign” aby odnaleźć kilka przykładów.

W przypadku linków związanych z programami partnerskimi w indeksie mogą pojawić się adresy związane np. ze stroną główną i po znaku zapytania jakieś parametry np. ref_id.

Rozwiązaniem jest (bardzo rzadkim) zastosowanie znaku „#” (hash) – Google nie indeksuje rzeczy po „#”. Ale tutaj uwaga: w wynikach mobilnych już indeksuje. Tak więc rozwiązaniem jest zastosować odpowiednio wykonany canonical w nagłówku.

Poniżej screen gdzie canonical’a niestety brak ☹

Należy tez pamiętać, że parametry można blokować z poziomu Google Search Console.

Niestety, nie samym Google’m człowiek żyje dlatego też ta opcja nie zawsze się przydaje jeśli docelowo chcemy zaistnieć również w innych wyszukiwarkach typu Bing, Yandex czy inne.

Duże bloki tej samej treści

Problemem mogą być również duże bloki tej samej treści powielane (wyświetlane) np. w sklepach e-commerce na każdej podstronie. Dotyczy to wstawionego tekstu z wymiarami, opisami, regulaminem lub wywoływanego za pomoca okienek popup. Tutaj nie ma dobrego rozwiązania jednakże najpopularniejszym jest wykonanie tego kawałka tekstu w postaci obrazka – jednakże obrazek może być problemem na urządzeniahc mobilnych. Dlatego najlepiej jest wyrzucić to na osobną stronę. Za pierwszym razem klient sprawdzi rozmiary ale za kolejnym no przecież już zna swój rozmiar. No chyba, że efekt jojo lub przytył ;)

 

Podsumowanie

Co o tym sądzicie? Oczywiście na koniec drobna bibliografia:

https://projektmarketing.pl/duplicate-content-powielanie-tresci/ – to warto odwiedzić !!!
https://blog.clearsense.pl/blog/duplicate-content-czym-jest-zjawisko-duplikacji-tresci/
https://makoblog.com/pl/polski-czesc-1-duplicate-content-czym-jest-duplikacja-tresci-i-jak-sie-przed-nia-uchronic/
https://support.google.com/webmasters/answer/66359?hl=pl i to na koniec

1 gwiazdka2 gwiazdki3 gwiazdki4 gwiazdki5 gwiazdek (3 głosów, średnia: 5,00 z 5)

Paweł Gontarek

Paweł Gontarek - Zgred - pasjonat SEO, staram się zrozumieć czym jest i jak działa SEM oraz UX.

Ten wpis ma 19 komentarzy
  1. Nie no Zgredzie…tak zdani nie powinno tu paść „Znakami zapytania i kulami u nogi się nie zajmujemy – są to produkty, które słabo się sprzedają lub praktycznie wcale. Na nich się nie zarabia (wtedy wystawia się je na Allegro)”.
    Jezeli nie zarabiasz na takim produkcie u siebie, to na Allegro tym bardziej.. dolicz sobie te 10% prowizji Allegro…..

    1. Nie zgodzę się. To kwestia w branży. W kilku, z którymi miałem do czynienia takie podejscie się sprawdziło. Kwestia kto jest targetem, grupy docelowe oraz upodobania.

  2. Bardzo dobry tekst, przyjemnie się czyta. Wszystko zebrane w pigułce. Jeśli chodzi o paginację będąc na stronie p=2. Czy stosujesz wtedy tak jak to Google opisał, że prev=1,next=3? Zauważyłem, że stosuję się zamiast p=1 adres podstawowy bez parametru.

  3. Doskonały artykuł. Dodam tutaj, że warto zastanowić się w jakiej postaci Google przechowuje dane o treści na stronie. Wiele wskazuje na to, że analizowana jest treść zredukowana do rdzenia wyrazów i zawierająca cały tekst na stronie, a nie pojedyncze zdania czy akapity. W ograniczonym stopniu (nie tak jak w jez. angielskim) robiona jest desynonimizacja. Oczywiście dla zmylenia przeciwnika w indeksie jest też dokładna kopia treści każdej strony i także ona jest brana pod uwagę w jakimś stopniu. Dlatego jeżeli opis produktu jest ten sam na wielu podstronach, a na każdej podstronie jest dużo innej treści (różne opisy kategorii, promocje itd) to Google może nie traktować tej podstrony jako duplikat treści. Natomiast te opisy przy eobuwie w treści artykułu niby różne ale podobne, dla Googla mogą załapać się jako duplikat treści!

  4. Dzięki za kolejny wartościowy wpis Pawle. Najlepsze jest w tym wszystkim to, iż wielu nieświadomych SEO „czynnych”użytkowników internetu (właścicieli sklepów, blogów etc.) nie jest świadomych duplikacji, a co za tym idzie dlaczego ma tak niekie pozycje.

  5. A jak jest z duplikacją treści gdy mamy dwie witryny na oddzielnych subdomenach: 1. kierowana na USA w GSC, hreflang ustawiony pod en-us, druga kierowana na rynek UK z hreflang en-gb. Opisy produktów, kategorii praktycznie takie same. Będzie kłopot z duplicate czy pchaniem w górę fraz odpowiednio w google.com o google.co.uk?

  6. Strona została dodana do indeksu google tydzień temu ale nie jest widoczna w przypadku frazy z title. Natomiast jak wpiszę tą frazę w cudzysłowiu np. „poszukiwana fraza” to jest na pierwszym miejscu. Domena jest młoda bo ma 1 miesiąc. Nie była/jest pozycjonowana. W treści nie ma tej frazy tylko jest w title. Co w takim razie zrobić w aby strona była w indeksie na tą frazę?

      1. Dodałem do treści frazę i w SC dodałem ponownie do indeksu strone, ale dalej ona jest niewidoczna na ta frazę (nie ma strony w indeksie na nią) a na pozostałe frazy których nie ma w title jest widoczna. Czy to dlatego, że strona jest młoda i żadne linki do niej nie prowadzą i algorytm słabo ją ocenił i częściowo zaindeksował?

        1. Między innymi jest jak piszesz. Ale tez Google nie ma obowiązku indeksować wszystkiego co mu nakazujesz za pomocą GSC. Odczekaj kilka dni. I skup się na pozycjonowaniu zamiast tracić czas na bezwartościowe ruchy.

  7. Jak zwykle zgredzik namieszał w sieci:) No ale od razu do meritum. Pawle piszesz o SSL że dla Google wersja z certyfikatem i bez to są dwie rożne strony. Oczywiście zgodzę się jak najbardziej. Jednak często w panelu admina na hostingach widnieje takie coś jak wymuszanie SSL, więc wchodząc na daną stronę użytkownik i tak jest przymusowo kierowany na wersję SSL. Więc tak również będzie działo się z crawlerem jeśli odwiedzi takową stronkę. Hmm… Tak mi się przynajmniej wydaje :)

    1. Jakie tam zaraz namieszał ;)

      Na ile Mnie się też wydaje z tym jest bardzo różnie. Stąd też wymueszanie SSLa to jedno, a dodanie różnych wersji do GSC to drugie :)

  8. Dzięki za ten artykuł. Fajnie wszystko wyjaśniłeś. Dopiero zaczynam przygodę z SEO, więc był dla mnie bardzo przydatny. Sporo się dowiedziałem.

  9. Dobre przykłady, przyjemnie opisane – jak zwykle :) Temat duplikatów często pomijany lub zrzucany na dalszy plan, a z doświadczenia wiem, że warto zająć się tym od razu.

  10. W zasadzie wszystko tutaj zawarte to podstawy, które raczej każdy powinien znać, ale jednak dobrze, że jest takie podsumowanie, bo doświadczenia wiem, że nawet o oczywistych kwestiach zdarza się zapomnieć ;)

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Back To Top
Przeczytaj poprzedni wpis:
keywords-letters-2041816_640
Jak dobrać słowa kluczowe do pozycjonowania – te i inne przypadki na podstawie kilku serwisów

Analizując serwis pod kątem przeprowadzanego audytu SEO jednym z etapów jest właściwy dobór słów kluczowych. Jak dobrac słowa kluczowe do...

trump-2902949_640
Dlaczego doceniamy współpracę z mikroinfluencerami (i Ty również powinieneś!)

Kilka faktów na temat influence marketingu, o których prawdpodobnie nie pamiętasz;-) W czasach, gdy coraz większa część budżetów reklamowych jest...

Zamknij