Rad tražilica

Mnogi početnici webmasteri i obožavatelji internetskog surfanja bave se pitanjem: kako funkcioniraju tražilice? Osnovna načela tražilica danas će razmotriti zemlju Vijeća.




Moderna tražilica je cijeli kompleks koji se sastoji od najsloženijih programa i algoritama koji rade sa zapanjujućom brzinom. Zamislite, novo algoritam pretraživanja Kofein iz Googlea može obrađivati ​​podatke jednako 3 km A4 listova u samo 1 sekundu!



U svim tražilicama, komponente softvera mogu se podijeliti u pet glavnih skupina:



  • „Pauci”

  • "Putujući pauci"

  • inde

  • baza podataka

  • sustavima rezultata



programi pauk - pauci (pauci) - algoritmom svog rada podsjećaju na preglednike, ali nemaju vizualne komponente. Pauk učitava HTML kod stranice pomoću HTTP protokola.



Robotski zahtjev poslužitelju uključuje naredbu"Get / path / document" i neke druge naredbe za http zahtjev. Na ovaj zahtjev, pauk dobiva odgovor od poslužitelja kao tekstualni tok koji sadrži informacije o servisu o dokumentu i samom dokumentu. Pauk je dio indeksnog modula za tražilice.



"Putujući pauk" - alat za indeksiranje - je još jedna komponentaindeksni modul. Alat za indeksiranje automatski kretanje kroz sve hiperveze koje je pronašao pauk na stranici i tako pretražuju dokumente koji još nisu poznati tražilici.



robot indeksiranje (indekser) radi izravno sa sadržajem stranica učitanih od paukovih robota. Indekser provodi morfološku, leksičku analizu stranica, razdvajajući ih u zasebne dijelove.



baze podataka (Baze podataka) su poseban softver za pohranu prikupljene i pronalizovannyh dokumenata komponente indeksiranje modula.



Motor s rezultatima tražilice - sustav izdavanja rezultata jedan je od najvažnijihkomponente tražilice. To je s izlaznim sustavom koji se obrađuje krajnjem korisniku, koji unosi upit u traženi niz. Sustav rezultata rezultata na temelju više od dvjesto različitih kriterija vrši odabir rezultata koji najviše zadovoljavaju ciljeve pretraživanja.



Algoritam takvog odabira obično se naziva algoritam ili mehanizam rangiranja, Da bi se izbjegle prijevare od strane webmastera kako bi utjecale na rezultate izdavanja, točni tražilice algoritma rangiranja čuvaju se u najstrožoj tajnosti.



Ipak, postoje brojni poznati kriteriji koji se uzimaju u obzir u radu tražilica, optimiziranje koje webmaster može "pravno" utjecati na rezultate pretraživanja. Na primjer, Tražilica prilikom analize stranice uzima u obzir:




  • postoji li ključna riječ u naslovu stranice (Naslov)

  • Prikazuje li se ključna riječ u URL-u stranice?

  • postoji li ključna riječ u zaglavljima H1-H6, oznake STRONG, B, EM, I

  • što je gustoća ključnih riječi na stranici (Gustoća)

  • Postoji li ključna riječ u meta tagovima: ključne riječi, opis

  • Postoje li unutarnje i vanjske veze na stranici?



Korisnik komunicira s tražilicom putem poslužitelja za pretraživanje. Primljen je upit za pretraživanje od korisnikaPoslužitelj obrađuje i prosljeđuje modul rangiranja kao ulaz u parametar. S druge strane, modul provodi obradu dokumenata, informacije o kojima se pohranjuju u bazu podataka sustava za pretraživanje, te ocjenjuje stranice koje odgovaraju zahtjevu korisnika.



Zatim sustav generira informacije o tekstu isječka koji se prikazuje korisniku u obliku SERP (Rezultat tražilice) - stranice rezultata pretraživanja.



Dakle, čak i kratak opis glavnenačela rada sustava za pretraživanje pokazuju koliko su sve softverske komponente sustava međusobno međusobno povezane i koliko treba tražilica raditi i jasno raditi kako bi korisniku pružio najbrže i najpouzdanije informacije o njegovom upitu za pretraživanje.



Rad tražilica
komentari 0