Jak działa wyszukiwarka Google?

Lip 27, 2016

Wyszukiwarka internetowa Google została stworzona w 1998 roku przez dwóch studentów Uniwersytetu Stanford Larrego Page’a i Sergeya Brin’a1. Opracowali oni nowy sposób wyszukiwania informacji w globalnej sieci. Obu studentów fascynowała struktura sieci WWW, w której strony połączone są między sobą za pomocą odnośników tworzących klasyczną strukturę grafu2. Cała sieć stanowi największy w historii szkielet, który rozwija się w zawrotnym tempie. Algorytm wyszukiwarki3 został opracowany na podstawie analizy Garfielda oraz innych uczonych odnośnie cytowania publikacji naukowych4. Ich zdaniem doskonałą metodą oceniania prac jest analiza liczby cytatów oraz adnotacji pochodzących z innych źródeł wiedzy czy dokumentów. Publikację można uznać za bardziej interesującą i wartościową dla użytkownika im częściej jest cytowana. Założyciele Google zauważyli zależność, iż cała sieć WWW opiera się na wykorzystaniu cytatów, które umieszczane są za pomocą tekstowych lub graficznych linków.
Internauta poprzez zamieszczenie odnośnika na swojej witrynie do innej strony oddaje na nią głos i wskazuje pozostałym użytkownikom sieci miejsce godne odwiedzenia.
Larry Page stworzył system, który nazwał BackRub, którego zadaniem było wykrywanie linków w sieci WWW oraz pobieranie ich do analizy. Następnie program prezentował adresy sieciowe wraz ze wszystkimi prowadzącymi do niego odsyłaczami. Głównym zamysłem twórców BackRuba było stworzenie nie wyszukiwarki, a pożytecznego instrumentu, który mógłby przynieść nie tylko zyski finansowe, ale i wartość dodaną użytkownikom. W 1996 Larry Page postanowił skierować swojego „robota” po raz pierwszy do sieci Internet, gdzie zaczął podążać za zamieszczonymi odsyłaczami oraz zbierać dane. BackRub został tak napisany, aby można było ustalić rangi oraz znaczenie linków. Jednym z istotnych atrybutów był sam tekst odsyłaczy, dzięki któremu można było określić, co cennego może znaleźć się na linkowanej stronie WWW. Według autora BackRuba dane te były na tyle użyteczne, iż postanowiono na ich podstawie zbudować ranking witryn, co dało początek powstania wyszukiwarki. Na potrzeby metody ustalania rankingu stron został opracowany algorytm PageRank. Algorytm potrafił brać pod uwagę zarówno liczbę odsyłaczy do określonej witryny, jak i liczbę odsyłaczy na każdej z odsyłających stron. Rozwiązanie to było analogiczne do metody zliczania cytatów w publikacjach naukowych. W rankingu na pozycjach wyższych występowały te witryny, które były najpopularniejsze, czyli miały największą liczbę odsyłaczy. Zwracane wyniki BackRuba były bardziej wartościowe od działających wtedy na rynku wyszukiwarek, takich jak AltaVista czy Excite.
Ówczesne mechanizmy wyszukujące opierały swój ranking głównie w oparciu o analizę tekstów zamieszczonych na witrynach, co niejednokrotnie obniżało wartość wyników.
Wraz ze wzrostem liczby powstających w sieci stron, a tym samym liczby odnośników poprawiała się trafność rezultatów podawanych przez wyszukiwarkę BackRub. Fakt stale rozrastającej się sieci zainspirował założycieli do wymyślenia nowej nazwy. Wyszukiwarka została nazwana Google, od terminu googol, oznaczającego w matematyce liczbę składającą się z jedynki i stu zer. Nazwa ma odzwierciedlać ilość zaindeksowanych zasobów oraz prze­wod­nią misję przedsiębiorstwa, której celem jest „uporządkowanie światowych zasobów informacji, aby stały się one powszechnie dostępne i użyteczne”.
Wyszukiwarka Google zyskała olbrzymią popularność, wykorzystywana jest codziennie przez miliony internautów. W samej tylko Polsce miesięcznie witrynę odwiedza ponad 15 milionów użytkowników, co stanowi prawie 92% wszystkich internautów w kraju9. Dzięki temu, że wyszukiwarka ma zasięg globalny, można za jej pomocą przeszukiwać zarówno krajowe jak i zagraniczne zasoby. Google indeksuje nie tylko strony internetowe, ale rów­nież grafikę, filmy video, dokumenty PDF oraz elektroniczne dokumenty biurowe.
Wyszukiwarka do budowania swojej bazy danych wykorzystuje specjalnie napisane programy zwane potocznie robotami lub pajączkami11. Podążają one poprzez sieć poruszając się w kierunku odsyłaczy, analizując treści znalezione na witrynach internetowych. Wszystkie zebrane dane zapisywane są w bazie zwanej modułem indeksującym12. Tam poddawane są wstępnej identyfikacji, gdzie nadawane są stronom rangi, które mówią o przydatności użytkownikom. Dzięki pogrupowaniu informacji internauci mogą przeszukiwać utworzone spisy używając tzw. słów kluczowych (keywords search), które odzwierciedlają intencję użytkowników. Mechanizm wyszukiwarki dopasowuje podawane zapytania do stron, które mogą stanowić odpowiedź. Moduł odpowiedzialny za tą część nosi nazwę procesora zapytań.

google

Cykl życia zapytania Google” Źródło: http://www.google.pl/intl/pl/corporate/tech.html


Stronę wyszukiwarki zawierającą wyniki zapytania można podzielić na trzy zasadnicze grupy (Rysunek 2)1. W części centralnej na samej górze oraz po prawej stronie okna witryny znajdują się linki sponsorowane, które zamieszczane są przez reklamodawców w systemie Google AdWords (pola oznaczone czerwoną ramką). Ta część wyników nazywana jest wynikami płatnymi (paid listing) i obecność w tej części rankingu zależy od zadeklaro­wania odpowiedniej stawki za kliknięcie2. Dla niektórych słów kluczowych wyświetlana jest mapa Google zawierająca listę przedsiębiorstw, które powiązane są z danym zapytaniem (ramka niebieska). Wyszukiwarka przedstawia podmioty gospodarcze, które są zlokalizowane najbliżej miejsca zamieszkania poszukującego informacji. Poniżej mapy znajduje się właściwa już grupa wyników zwana organicznymi lub naturalnymi (organic results)3. Prezentowane są one na podstawie algorytmu oceniającego jakość i przydatność stron. Właściciele wyszukiwarki nie pobierają opłat za znalezienie się witryny w tej części rankingu.
Wyniki zwrócone przez wyszukiwarkę Google dla zapytania „nieruchomości Wrocław”, Źródło: opracowanie własne.

Wyniki zwrócone przez wyszukiwarkę Google dla zapytania „nieruchomości Wrocław”, Źródło: opracowanie własne.


W zależności od popularności danych słów kluczowych wyszukiwarka podaje od kilku do kilkunastu milionów wyników. Wielkość ta mówi o popularności danej grupy słów kluczowych, a tym samym o potencjalnej liczbie konkurencji, z którą reklamodawca będzie musiał konkurować1. Prezentowane są one według ściśle określonego schematu. Jeden wynik to cztery linijki tekstowe. Pierwsza jest tytułem strony, który stanowi bezpośredni odnośnik do witryny. Dwie następne linijki są opisem strony, który najczęściej tworzony jest na podstawie treści na nich zawartych. Ostatnia linijka zawiera adres strony wraz z odsyłaczem do jej kopii oraz datą indeksacji przez robota wyszukiwarki. Standardowo Google wyświetla 10 stron (wyników naturalnych) na każdej podstronie2.
Literatura:
http://sekretygoogle.5m.pl/historia_google.php, dostęp z dnia 08.12.2009.
J. Batelle, Jak Google i konkurencja wywołali biznesową i kulturową rewolucję, PWN, Warszawa 2006.
http://e-mentor.edu.pl/_pdf/ementor19.pdf#page=46, dostęp z dnia 10.05.2010.
P. Kobis, Marketing z Google. Jak osiągnąć wysoką pozycję? Techniki pozycjonowania a SPAM, PWN, Warszawa 2007.
http://www.google.pl/intl/pl/corporate/index.html, dostęp z dnia 07.12.2009.
http://www.audyt.gemius.pl/pages/display/witryny-zasieg, dostęp z dnia 10.12.2009.
B. Danowski, M. Makaruk, Pozycjonowanie i optymalizacja stron WWW. Jak to się robi, HELION, Gliwice 2007.
S. Thurow, Pozycjonowanie w wyszukiwarkach internetowych, Wydawnictwo Helion, Gliwice 2004.
T. Frontczak, Marketing internetowy w wyszukiwarkach, op. cit., str. 36.

Przeczytaj także:

Monitoring pozycji – jak sprawdzić pozycję w Google?

Monitoring pozycji – jak sprawdzić pozycję w Google?

Jeśli prowadzisz kampanię SEO dla strony, to jednym z Twoich kluczowych celów jest uzyskanie jak najlepszej widoczności w SERP-ach na jak największą liczbę słów kluczowych, które najlepiej opisują Twój biznes. Masz jednak ustalone najważniejsze frazy, o najwyższym...

Kim jest socializer?

Kim jest socializer?

Socializer to osoba szczególnie aktywna w komunikacji w Internecie: tak w sferze prywatnej i towarzyskiej, jak i zawodowej. Termin ten bywa jednak rozmaicie rozumiany. Pojęcie to rozpatruje się zwłaszcza w odniesieniu do przemian pokoleniowych: różnic co do tego, jak...

Czy pozycjonowanie stron się opłaca?

Dla kogo jest pozycjonowanie stron? Aby odpowiedzieć na to pytanie, można użyć jednej, ogólnej odpowiedzi. Będzie ona brzmiała „dla wszystkich właścicieli stron internetowych”. Aby jednak bardziej przybliżyć zasadę działania pozycjonowania stron i pokazać, jakie...