Duplikacja treści na stronie internetowej a Google - najważniejsze informacje
Z duplikacją treści mamy do czynienia wówczas, jeśli tę samą treść można znaleźć pod więcej niż jednym adresem URL. Aby zapewnić stronie internetowej wysoką ocenę Google’a, należy naprawić te błędy. Sprawdź, w jaki sposób to zrobić i jakich użyć narzędzi.
W jakich sytuacjach mogą zdarzać się duplikaty?
Powodów może być ich wiele, ale najczęściej dzieje się to gdy:
- w URL pojawiają się dodatkowe parametry (albo alternatywne URL-y) - stanie się to wtedy, kiedy do pierwotnego URL-a www.example/seo-mistakes dodamy jakąś wartość i będziemy mieć www.example/article-on-blog?param=seo-mistakes
- witryna posiada oddzielne wersje np. www.site.com oraz site.com (z prefiksem „www” i bez niego), a te same treści znajdą się w obu wersjach
- w nawiązaniu do powyższego będą istnieć aktywne i widoczne dla wyszukiwarek wersje zarówno pod adresem http: // jak i https: //
- pojawi się na końcu adresu slash “/”, np. www.site.com/ a posiadasz już adres www.site.com
- twoje treści są wykorzystywane na innych stronach i nie zawsze prowadzą do twojego oryginalnego artykułu, co zaś sprawia, że wyszukiwarka ich nie identyfikuje i “widzi” kolejną wersję tego artykułu
Dlaczego duplikacja treści jest taka niekorzystna?
Jest to niekorzystne, ponieważ w takiej sytuacji Google nie będzie wiedzieć, która ze stron powinna być jako pierwsza w rankingach. Wyszukiwarka zostanie “zmuszona” do dokonania wyboru spośród identycznych zawartości - może zatem stać się tak, że oryginalna strona nie będzie tą wybraną dla najlepszych wyników wyszukiwania. Innymi słowy: Google “odmówi” zaszeregowania którejkolwiek z nich albo posłuży się algorytmem w celu rozpoznania strony dla danego zapytania.
Co więc robimy, żeby naprawić te błędy?
W naszej agencji drupalowej pomagamy rozwiązać ten problem poprzez:
- Konfigurację przekierowania 301 ze strony zduplikowanej do strony z treścią oryginalną.
- Użycie atrybutu rel=canonical, który “mówi” wyszukiwarkom, że dana strona powinna być traktowana tak, jakby była kopią określonego adresu URL, a wszystkie linki powinny być przypisane do określonego URL. Atrybut rel=canonical dodajemy wówczas do nagłówka HTML każdej zduplikowanej wersji strony i zastępujemy powyższą część „URL ORYGINALNEJ STRONY” linkiem do oryginalnej (kanonicznej) strony.
- Upewnienie się, że witryna dystrybuująca dodaje z powrotem łącze do oryginalnej treści, a nie do wariacji adresu URL.
I jeszcze jeden istotny detal w tym miejscu (adresowany do e-commerce). Jeśli twoje produkty są oferowane przez resellerów, pamiętaj, aby na innych stronach dostarczyć unikalny opis tychże produktów tak, aby różnił się od tego, który znajduje się na oryginalnej stronie.
Jakich narzędzi użyć, aby sprawdzić duplikaty na stronie internetowej?
Istnieje wiele narzędzi do weryfikacji zawartości strony pod kątem duplikacji. Poniżej wymienię kilka, które zwróciło moją uwagę. Dobrą praktyką jest ich łączenie i analiza swojej witryny z użyciem co najmniej dwóch. Wyniki są wówczas bardziej uwiarygodnione i widać, która zawartość wymaga naprawy w pierwszej kolejności.
Siteliner. To jedno z najbardziej intuicyjnych i łatwych w obsłudze narzędzi, gdzie wyniki prezentowane są w czytelny i zrozumiały sposób. Po wejściu na główną stronę wystarczy wpisać swój adres witryny, aby po krótkiej chwili przejść do analizy. Otrzymujemy wówczas listę adresów URL, w których zachodzi podejrzenie o duplikację treści - lista wzbogacona jest o informację nt ilości słów-duplikatów. Po kliknięciu na URL przechodzimy do dalszej weryfikacji - musimy stwierdzić, czy sugestie Sitelinera są trafne. Do każdego z nas należeć będzie ocena, czy dana zawartość to rzeczywiście duplikat.
Duplichecker. To kolejne ciekawe narzędzie, które wspiera nas od nieco innej strony - weryfikujemy stworzoną, ale jeszcze nieopublikowaną treść, i porównujemy ją z konkretnym adresem URL. Możemy więc załadować plik .docx, a następnie dowiedzieć się, w jakim procentowym stopniu zachodzi podejrzenie o duplikację. Oczywiście, również i w tym przypadku to do nas należeć ostateczna decyzja, czy dokonamy redakcji takiego tekstu, aby zminimalizować zagrożenie dublem. Narzędzie jest przydatne również w sytuacji, kiedy nasza strona zawiera dużo treści, np. na blogu pojawiają się regularnie nowe wpisy różnych autorów i chcemy sprawdzić, czy podobny temat już kiedyś się pojawił. Wystarczy więc w oknie dialogowym np. wkleić akapit z treści, którą planujemy napisać, aby otrzymać informację, czy coś analogicznego już istnieje.
Plagium. W podobny co do funkcjonalności sposób jak wcześniejszy przykład działa Plagiarism Checker. W tym przypadku możemy dowiedzieć się, czy oraz gdzie dana treść jest w Internecie opublikowana. Innymi słowy: mamy szansę zdobyć wiedzę, czy ktoś splagiatował naszą zawartość. W tym celu wystarczy w oknie dialogowym wkleić fragment tekstu, który chcemy sprawdzić. Po chwili otrzymamy listę stron z informacją o stopniu podobieństwa do naszej treści i ilości zduplikowanych fraz. Dzięki temu już na tym etapie możemy ocenić, czy warto się zagłębiać w daną analizę, a jeśli jednak warto, to po naciśnięciu na dany URL zostaniemy przekierowani do podstrony, gdzie jest oznaczony fragment frazy, którą Plagium podejrzewa, że mogła zostać nam skradziona. Wartość dodana? Tak, jeśli natomiast planujemy kampanię reklamującą nasze usługi, możemy sprawdzić, czy na jakichś stronach podobne hasła już nie istnieją…
Wspomniałem, że istnieje wiele tego typu narzędzi. Tak, wymienić mogę jeszcze SEO Review Tools, Duplicate Content Checker, czy Yoast, o którym pisaliśmy odnośnie do konfiguracji SEO pluginu dla drupalowej witryny.
Plagiat i co dalej?
O ile już wiemy, w jaki sposób sprawdzić, czy zawartości w ramach stron, których jesteśmy właścicielem, są ewentualnymi duplikatami, o tyle inaczej sprawa wygląda, kiedy stwierdzamy, że ktoś przywłaszczył sobie naszą treść.
Należy podjąć próbę kontaktu z właścicielem strony, na której pojawiły się nasze treści i poinformować o zaistniałej sytuacji. Dobrą praktyką jest najpierw zadanie pytania - zawsze zachodzi prawdopodobieństwo, że ta osoba mogła nie wiedzieć, że weszła w posiadanie czyjejś intelektualnej własności.
Należy również się zastanowić, czy na pewno żądać usunięcia duplikacji. Może bowiem się okazać, że witryna charakteryzuje się wysoką jakością i warto ów treść tam zachować, podając swoje nazwisko jako autora i link do swojej strony internetowej.
Kiedy jednak nie wiadomo, kto stoi za konkretną witryną, możemy sprawdzić na Whoishostingthis.com, kto hostuje tę witrynę, a następnie firmę hostingową zawiadomić, że witryna wykorzystuje treści chronione prawem autorskim.
Podsumowanie
Po pierwsze: unikalna, niepowtarzalna treść. Jeśli w ten sposób budujesz zawartość swojej witryny, to minimalizujesz wszelką duplikację. Po drugie: bieżąca weryfikacja, o której w tekście pisałem, ale ponadto także cały audyt SEO. Kwestia duplikacji to wprawdzie ważny, ale nie jedyny element wpływający na to, w jaki sposób Google ocenia daną stronę. Zachęcam do lektury tekstu na temat audytu i wdrożenia poprawek SEO, aby zdobyć kompleksową wiedzę odnośnie do tej kwestii. Po trzecie: jeśli zaś Ty chcesz skorzystaj z czyjejś treści zamieszczając np. cytat, pamiętaj o podaniu źródła i ewentualnym przekierowaniu do innej witryny.