Kaip iš tikrųjų veikia „Google“ paieška?

Populiariausia paieškos sistema „Google“ pasižymi dviem dalykais – paieškos kokybe ir greičiu.

Turbūt ne vienam žmogui kyla klausimas, o kaip ta sistema sugeba taip greitai rasti reikiamą informaciją iš milijardų svetainių.

„Google“ atstovas Mattas Cuttsas pristato vaizdo siužetą, kuriame per 8 minutes labai glaustai paaiškina, kaip veikia visas paieškos mechanizmas.

Tiems, kas tingi žiūrėti arba mieliau skaito tekstinę informaciją, pabandysime pateikti svarbiausią esmę. M.Cuttsas pasakoja apie tai, kad visas „Google“ paieškos mechanizmo darbas susideda iš trijų veiksmų:

Interneto turinio „nusiurbimas“
„Nusiurbtų“ dokumentų suindeksavimas
Pagal vartotojo užklausą atrinkimas geriausių dokumentų pagal raktažodžius

Pats „nusiurbimo“ (crawling) procesas pasikeitė nuo „Google“ pradžios ir šiuo metu leidžia labai operatyviai gauti informaciją iš visų naujausių svetainių pasikeitimų – tik Mattas pabrėžė tai, kad greičiau ir dažniau yra kreipiamasi į tas svetaines, kurios turi aukštesnį PageRank ar šiaip turi didesnį „autoritetą“.

Kalbant apie indeksavimą, ši vieta pasirodo yra visai įdomi – „Google“ duomenų bazėje saugomi atskiri žodžiai iš dokumento ir tokiu būdu indeksuojami realiai net ne dokumentai su jų žodžiais, o atvirkščiai – visi žodžiai, o vėliau jau pažymima, kokiuose dokumentuose tie žodžiai yra.

Ir tada, kai vyksta duomenų atrinkimas, naršyklė kreipiasi į arčiausiai jūsų esantį „Google“ serverį, kuris paskirsto užklausą per šimtus kitų serverių ir bando rasti visus dokumentus, kurie atitinka duotus raktažodžius. O vėliau jau prasideda rezultatų rūšiavimas, kuris, pasak Matto, turi net apie 200 įvairių faktorių.

Ir visas šis procesas vyksta per mažiau nei pusę sekundės. Būtent tokiu būdu mes gauname paieškos rezultatus tiesiai į naršyklę operatyviai ir dažniausiai net nesusimąstome, koks sudėtingas ir efektyvus mechanizmas už to stovi.


Šiame straipsnyje: googlepaieškapaieškos sistema

NAUJAUSI KOMENTARAI

Galerijos

Daugiau straipsnių