Jak to przebiega indeksacja?
Źródłem nowych adresów są:
- linki na stronie,
- mapa witryny,
- przekierowania,
- zgłoszenia w narzędziach dla webmasterów.
Po pobraniu treści wyszukiwarka klasyfikuje dokument, porównuje go z innymi wersjami i decyduje: dodać, odrzucić, czy połączyć sygnały z inną stroną. Jeśli istnieje kilka bliźniaczych wersji (np. ta sama treść z różnymi parametrami w URL-u), do indeksu trafia tylko jedna. Jest to ta strona, którą system uzna za reprezentatywną.
Co przesądza o wpisaniu do indeksu?
Przede wszystkim adres strony musi być dostępny technicznie, tzn. zwracać poprawny status, nie być blokowany w robots.txt i nie mieć znacznika noindex. Sygnały kanoniczne powinny być spójne z linkowaniem wewnętrznym i przekierowaniami; rozjazd między nimi kończy się zapisaniem nie tej wersji albo całkowitym pominięciem.
Istotna jest też treść, która powinna być unikalna i użyteczna. Widoki sortowania, parametry bez wartości, puste warianty produktów czy duplikaty zwykle nie są indeksowane. Przy większych serwisach dochodzi kwestia budżetu indeksowania: im łatwiej robotowi dotrzeć do ważnych stron i im szybciej je przetworzyć, tym szybciej pojawią się w indeksie.
Jak sprawdzić swoją indeksację i co poprawić?
Na początek warto porównać listę kluczowych podstron z tym, co widnieje w wynikach. Operator site da ogólny obraz, dokładniejsze informacje pokaże Search Console i logi serwera. Jeśli ważnych stron brakuje, sprawdź:
- czy nie ma przypadkowego noindex,
- czy link kanoniczny prowadzi do właściwego adresu,
- czy przekierowania nie tworzą pętli,
- czy mapa witryny zawiera wyłącznie adresy, które mają być widoczne w Google.
Strony techniczne (koszyk, wyniki wyszukiwania wewnętrznego, panele logowania) powinny być wyłączone z indeksu, a warianty bez własnej treści – scalone kanonicznie lub dostępne wyłącznie przez filtry. Przy treściach generowanych skryptami upewnij się, że po renderowaniu robot widzi to samo, co użytkownik.