Noindex i rel=”canonical” nie można stosować jednocześnie na jednej stronie

Google nie zawsze „idzie” za rel=”canonical”

Wyobraźmy sobie, że w całym serwisie wstawiamy tag kanoniczny prowadzący do strony głównej. Zgodnie z dyrektywą Google powinno cały serwis wyindeksować – poza stroną główną. Ale nie zawsze tak się dzieje, ponieważ Google w tym konkretnym przypadku może uznać, że webmaster się pomylił i pominie tag kanoniczny.

Inny przykład – w raporcie Stanu w Search Console możemy w błędach znaleźć linki przypisane do takiej grupy –  Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik. Jak czytamy w pomocy Google dzieje się tak, gdy

URL jest oznaczony jako kanoniczny dla zestawu stron, jednak wyszukiwarka Google uznała, że inny URL lepiej sprawdzi się jako strona kanoniczna.

Może się tak stać np. w sytuacji, z którą miałem niedawno styczność – webmaster zaimplementował w niektórych stronach podwójne tagi kanoniczne – z których każdy prowadził do innej strony.

Noindex razem z rel=”canonical”

Zdarza się też, że webmaster z jednej strony wskazuje dla danego adresu url tagiem kanonicznym preferowany urt, ale jednocześnie w tym samym adresie zamieszcza zapis noindex – co nie jest spójnym działaniem i powoduje „konsternację” u Googlebota.

Zasadą, opartą na praktyce, jest, że gdy Googlebot widzi dwa adresy url, a jeden z nich zawiera tag kanoniczny, to jest to jasny sygnał dla niego, co jest ważniejsze (który adres ma się pojawić w wynikach wyszukiwania). Tak samo działają inne wskazówki ze strony webmastera – przekierowania, sitemapy – które wzmacniają ten sygnał.

When Google sees two URLs from your site, they look the same, and you tell us your preference clearly, we’ll try to combine them and treat them as one (usually stronger) URL instead of separate ones. Redirects, rel=canonical, internal & external linking, sitemaps, hreflang, etc all tell us your preferences, and the more you can align those, the more we’ll follow them and use them to pick a canonical out of that set (and forward all the signals to the canonical chosen).

Ale webmaster może zakombinować (chcący czy niechcący) „po drodze” i np. ustawić poprawny tag kanoniczny, ale jednocześnie dodać url, na którym zostanie ten tag zamieszczony, do sitemapy. I to już wystarczy, aby Googlebot nie miał jasnego sygnału – co z kolei może sprawić, że robot nie podąży za tagiem kanonicznym.

Pamiętajmy też, że sam tag noindex, nie połączony z innymi wskaźnikami czy zapis disallow w pliku robots.txt nie są jasnymi sygnałami dla kanoniczności. Jeżeli mamy zatem dwie podobne strony i wstawimy na „gorszej” noindex, jednocześnie wskazując tagiem kanonicznym preferowany adres url, to nie oczekujmy od Google, że zawsze zachowa się zgodnie z naszymi oczekiwaniami.

noindex (alone) & robots.txt disallow (in general) are not clear signs for canonicalization. Just having a noindex on a page doesn’t tell us that you want to have it combined with something else, and that signals should be forwarded. A robots.txt disallow is even trickier, we don’t even know if the page matches anything else on your site, so we couldn’t even use it for canonicalization if we wanted to.

Noindex i rel=”canonical” stoją wobec siebie w sprzeczności – i wprawdzie Google powinno sobie poradzić z taką kombinacją w ramach jednej strony, ale lepiej nie ryzykować

This is also where the guide that you shouldn’t mix noindex & rel=canonical comes from: they’re very contradictory pieces of information for us. We’ll generally pick the rel=canonical and use that over the noindex, but any time you rely on interpretation by a computer script, you reduce the weight of your input 🙂

Źródło: Reddit

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *