Praca wyszukiwarek

Wielu początkujących webmasterów i fanów surfowania po Internecie zastanawia się nad tym, jak działają wyszukiwarki? Podstawowe zasady wyszukiwarek dziś będzie rozważać Kraj Rad.




Nowoczesna wyszukiwarka to cały kompleks złożony z najbardziej skomplikowanych programów i algorytmów działających z zadziwiającą szybkością. Wyobraź sobie, nowe algorytm wyszukiwania Kofeina od Google jest w stanie przetworzyć informacje odpowiadające 3 km arkuszy A4 w zaledwie 1 sekundę!



We wszystkich wyszukiwarkach komponenty oprogramowania można podzielić na pięć głównych grup:



  • "Pająki"

  • "Podróżujące pająki"

  • indeksatory

  • bazy danych

  • systemy wyników



Pająki - pająki (pająki) - przez algorytm ich pracy przypominają przeglądarki, ale nie mają żadnych elementów wizualnych. Pająk ładuje kod html strony za pomocą protokołów http.



Żądanie robota do serwera zawiera polecenie"Get / path / document" i kilka innych poleceń żądań http. Na wniosek pająka dostaje odpowiedzi z serwera jako strumień tekstu zawierającego informację zastrzeżoną o dokumencie i samego dokumentu. Pająk jest częścią modułu indeksującego dla wyszukiwarek.



"Podróżujący pająk" - robot - jest kolejnym elementemmoduł indeksujący. Przeszukiwacz automatycznie przechodzi przez wszystkie hiperlinki znalezione przez pająka na stronie, a tym samym wyszukuje dokumenty, które nie są jeszcze znane wyszukiwarce.



Robot-Indexer (indexer) działa bezpośrednio z zawartością stron ładowanych przez roboty pająkowe. Indeksator przeprowadza morfologiczną, leksykalną analizę stron, dzieląc je na osobne części.



Bazy danych (baza danych) to specjalne oprogramowanie przeznaczone do przechowywania zindeksowanych dokumentów zebranych i zaindeksowanych według komponentów.



Silnik wyników wyszukiwarki - system wydawania wyników jest jednym z najważniejszychskładniki wyszukiwarki. Z systemem wyjściowym, z którym korzysta użytkownik końcowy, wprowadza zapytanie do ciągu wyszukiwania. System wyników wyników na podstawie ponad dwustu różnych kryteriów dokonuje wyboru najbardziej satysfakcjonujących wyników wyszukiwania.



Algorytm takiej selekcji nazywany jest zwykle algorytmem lub mechanizm rankingowy. Aby uniknąć oszustw ze strony webmasterów w celu wywarcia wpływu na wyniki emisji, dokładna wyszukiwarka algorytmów rankingowych jest przechowywana w ścisłej tajemnicy.



Niemniej jednak istnieje szereg znanych kryteriów, które są brane pod uwagę w pracy wyszukiwarek, optymalizując to, że webmaster może "legalnie" wpłynąć na wyniki wyszukiwania. Na przykład Wyszukiwarka analizująca stronę bierze pod uwagę:




  • czy istnieje słowo kluczowe w tytule strony (tytuł)

  • Czy słowo kluczowe pojawia się w adresie URL strony?

  • czy istnieje słowo kluczowe w nagłówkach H1-H6, znaczniki STRONG, B, EM, I

  • jaka jest gęstość słów kluczowych na stronie (Gęstość)

  • Czy słowo kluczowe istnieje w metatagach: słowa kluczowe, opis

  • Czy na stronie znajdują się linki wewnętrzne i zewnętrzne?



Użytkownik współdziała z wyszukiwarką za pośrednictwem serwera wyszukiwania. Otrzymano zapytanie od użytkownikaSerwer przetwarza i przekazuje moduł rankingu jako dane wejściowe do parametru. Z kolei moduł prowadzi przetwarzanie dokumentów, których informacje są przechowywane w bazie danych systemu wyszukiwania i dokonuje oceny stron odpowiadających żądaniom użytkownika.



Następnie system generuje informację tekstową, która jest wyświetlana użytkownikowi w postaci SERP (strony wyników wyszukiwarki) - strony wyników wyszukiwania.



Tak więc, nawet krótki opis głównejzasady pracy systemów wyszukiwania pokazują, jak blisko wszystkie elementy oprogramowania systemu są ze sobą połączone i jak dobrze powinna działać wyszukiwarka i wyraźnie działać, aby zapewnić użytkownikowi najszybsze i najbardziej wiarygodne informacje na temat jego zapytania.



Praca wyszukiwarek
Komentarze 0