Najbardziej znane mechanizmy wyszukiwawcze cz. II

Przed rejestracją w kolejce do indeksowania należy bezwzględnie sprawdzić, czy strona nie znajduje się już w zasobach Altavisty. Sprawdzenie odbywa się przez wpisanie w okienku wyszukiwania następującego ciągu: rl: www.s zukanadomena .

W razie dokonania znacznych zmian w serwisie można zgłosić go do ponownego zindeksowania (nie jest to jednak konieczne, robot i tak po pewnym czasie trafi do serwisu – jeśli wykryje zmiany, wprowadzi nowe rekordy do bazy danych).

Altavista posiada zaawansowany mechanizm antyspamowy, który eliminuje większość prób oszukiwania jej robotów. Próby manipulacji są zwykle karane niższą pozycją w rankingu lub nawet całkowitym wykluczeniem strony z bazy. Przykłady typowych manipulacji, wykrywanych z łatwością przez oprogramowanie Altavista, podajemy poniżej.

Używanie na stronie wielokrotnie powtarzających się słów kluczowych, szczególnie występujących obok siebie. Używanie popularnych słów kluczowych, które jednak nie są związane z tematyką danej strony.

Stosowanie ukrytego tekstu – którego stopień został celowo zmniejszony lub czcionka jest koloru tła (zabieg ten ma w zamyśle twórców podnosić pozycję strony w rankingu, przy czym tekst taki jest niewidoczny dla użytkownika).

Powielanie treści – próby rejestracji tej samej strony pod różnymi domenami lub tych samych serwisów z różnych serwerów. Używanie generowanych automatycznie stron, których jedynym celem jest przekierowanie użytkownika na stronę docelową (doorway pages).

Tworzenie stron, które zawierają jedynie odnośniki do innej strony. Należy wspomnieć, że Altavista może nie zarejestrować naszej strony nawet wtedy, gdy nie używamy technik spamerskich. Automat posiada bowiem mechanizmy, które uniemożliwiają rejestrowanie określonych typów stron.

Nie będą rejestrowane strony na niestabilnych serwerach, okresowo niedostępne. Rejestracja takich efemeryd jest jak gra w ruletkę – wszystko zależy od tego, czy w momencie wizyty robota strona będzie dostępna (jeśli tak, to zostanie zindeksowana).

Nie są indeksowane serwisy, które wymagają rejestracji – wpisania identyfikatora użytkownika i hasła. Altavista indeksuje natomiast strony, na których rejestracja jest możliwa, ale niekonieczna.

Nie są rejestrowane serwisy, których treść znajduje się w tekstowych bazach danych, jak również strony tworzone dynamicznie (zazwyczaj zawierają znak zapytania w adresie, na przykład strony w php). W takim wypadku najlepszym rozwiązaniem może okazać się stworzenie równoległych, statycznych stron www w języku html.

Nie są również indeksowane treści zawarte w ramkach (indeksowana strona powinna mieć więc również wersję bez ramek). Wyszukiwarka tekstowa nie może zindeksować treści, które są zawarte w plikach multimedialnych (często zdarza się, że część tekstu jest – z przyczyn natury estetycznej – opracowana w formie graficznej: w takim wypadku poleca się powtórzenie treści w znaczniku ALT przyporządkowanym do danego obrazka).

Bez kategorii