Kiedy warto stosować noindex?
Noindex używa się na stronach technicznych i pomocniczych, których nikt nie szuka w Google, m.in.:
- koszyk,
- logowanie,
- podziękowanie po zamówieniu,
- wyniki wyszukiwarki wewnętrznej,
- podglądy,
- wersje robocze,
- warianty bez własnej wartości, np. ta sama lista posortowana w inny sposób.
Noindex jest też przydatny w szczególności przy porządkach i migracjach, ponieważ pozwala wycofać starą wersję z wyników i skierować ruch na nowy adres, zwykle razem z przekierowaniem 301 albo spójnym rel="canonical".
Jak poprawnie wdrożyć noindex?
Najważniejszą rzeczą jest to, że robot musi zobaczyć dyrektywę. Jeśli zablokujesz adres w robots.txt, wyszukiwarka nie pobierze treści, więc nie odczyta meta-tagu i adres jest nadal widoczny jako goły URL na podstawie linków zewnętrznych. Bezpieczniej zostawić możliwość crawlowania i dodać noindex na samej stronie.
W HTML wystarczy samo noindex, ale często stosuje się zapis noindex, follow. Jest to jasny sygnał, że robot może podążać za odnośnikami. W przypadku plików nie-HTML (PDF, DOC) dyrektywę dodaje się w nagłówku HTTP. Adresów z noindex nie umieszczaj w mapie witryny. Trzeba też założyć, że efekt nie jest natychmiastowy, a strona zniknie dopiero po kolejnym odwiedzeniu przez robota.
Ustal z góry, które typy stron zawsze mają mieć noindex, a które nigdy, i trzymaj się tego w szablonach. Po większych zmianach przejrzyj raporty (np. pozycje wykluczone z powodu noindex), sprawdź przekierowania i wersje kanoniczne, popraw linkowanie wewnętrzne tak, żeby nie promowało adresów wyłączonych z wyników.
Pamiętaj też o granicy działania tej dyrektywy: noindex reguluje widoczność w wynikach wyszukiwania, nie jest metodą ochrony treści ani sposobem na oszczędzanie budżetu crawlowania. Te kwestie rozwiązuje się dostępem po stronie serwera i architekturą informacji.