Mis on otsingumootor ja kuidas see töötab. Kuidas otsingumootorid töötavad Mis on otsingumootor

Otsingumootor või lihtsalt "otsingumootor" on mootor, mis otsib Interneti-lehti vastavalt kasutaja soovile. Maailma kuulsaim otsingumootor on Google, Venemaal on populaarseim Yandex ja üks vanimaid otsingumootoreid on Yahoo. Otsingumootori arhitektuuris saab eristada otsingumootor- süsteemi tuum, mida esindab tarkvaramoodulite komplekt; andmebaas või indeks, mis salvestab teavet kõigi otsingumootorile teadaolevate Interneti-ressursside kohta; ja saitide komplekt, mis on sisenemispunktid kasutajad süsteemi (www.google.com, www.yandex.ru, ru.yahoo.com jne). Kõik see vastab klassikalisele infosüsteemide kolmetasandilisele arhitektuurile: olemas on kasutajaliides, äriloogika, mida antud juhul esindab otsingualgoritmide realiseerimine, ja andmebaas.

Interneti-otsingu eripära

Internetist otsimine ei erine esmapilgul palju tavalisest infootsingust, näiteks töötlemisest andmebaasi või faili otsimise ülesandest . Seda arvasid ka esimeste Interneti-otsingumootorite arendajad, kuid aja jooksul said nad aru, et eksisid ...

Esimene erinevus Interneti-otsingu ja tavalise vahel on see, et sama andmebaasi otsingualgoritm eeldab, et selle struktuur on otsingumootorile ja päringu autorile ette teada. Internetis see arusaadavatel põhjustel nii ei ole. Internetilehed ei moodusta kataloogistruktuuri, vaid võrku, mis mõjutab ka otsingualgoritme ning internetiavarustesse postitatud andmete vormingut ei kontrolli keegi.

Teine erinevus, mis on esimese tagajärjena, seisneb selles, et taotlust ei esitata mitte parameetriväärtuste kogumina (otsingukriteeriumid), vaid inimese poolt tema loomulikus keeles kirjutatud tekstina. Seega, enne kui hakkate otsima, peate ikkagi aru saama, mida taotleja täpselt soovib. Märgin, et seda ei mõista mitte teine ​​inimene, vaid arvuti.

Kolmas erinevus on vähem ilmne, kuid mitte vähem põhimõtteline: kataloogis või andmebaasis on kõik elemendid võrdsed. Internetis on konkurents ja sellest tulenevalt jagunemine "usaldusväärsemateks teabepakkujateks" ja "infoprügile" lähedasteks allikateks. Nii liigitavad inimesed ressursse ja nende hulka kuuluvad ka otsingumootorid.

Ja lõpetuseks olgu lisatud, et otsinguala on miljardeid lehekülgi, igaüks mitu kilobaiti või rohkemgi. Iga päev lisandub umbes kümme miljonit lehekülge ja sama palju uuendatakse. Kõik see on esitatud erinevates digitaalsetes vormingutes. Kahjuks ei võimalda isegi Interneti otsinguteenuste turu liidrite käsutuses olevad kaasaegsed tehnoloogiad ja ressursid neil kogu seda mitmekesisust "lennult" ja täies mahus töödelda.

Mis on otsingumootor

Kõigepealt on oluline mõista veel ühte ja ilmselt kõige olulisemat erinevust Interneti otsingumootori töö ja mis tahes muu infosüsteemi töö vahel, mis otsib erinevatest kataloogidest ja andmebaasidest. Interneti-otsingumootor ei otsi päringu saamise ajal teavet Internetis leiduva hulgast, vaid püüab moodustada vastuse oma teabesalvestuse põhjal - andmebaasi, mida nimetatakse indeksiks ja kuhu salvestatakse toimik kõigest teadaolevast. sellele ja värskendab seda perioodiliselt. Teisisõnu, otsingumootor ei tööta originaaliga, vaid kehtivate otsinguväärtuste vahemiku projektsiooniga. Kõik viimased muudatused Internetis võivad kajastuma otsingutulemustes alles pärast vastavate lehtede ilmumist indekseeritud- lisati otsingumootori registrisse. Niisiis koosneb esimeses lähenduses olev otsingusüsteem otsingumootorist, andmebaasist või indeksist (indeksist) ja süsteemi sisenemispunktidest.

Nüüd lühidalt sellest, millest otsingumootor koosneb:

  • Ämblik või ämblik (ämblik). Rakendus, mis laadib alla Interneti-ressursside lehti. Ämblik ei “rooma” kuhugi - ta küsib ainult lehtede sisu samamoodi nagu tavaline Interneti-brauser, saates serverisse HTTP päringu ja saades sealt vastuse. Pärast lehe sisu allalaadimist saadetakse see indekseerijale ja roomajale, mida kirjeldatakse allpool.

  • Indekseerija (indekseerija). Indekseerija teostab allalaaditud lehe sisu esmase analüüsi, tõstab esile põhiosad (lehe pealkiri, kirjeldus, lingid, pealkirjad jne) ning lagundab kõik selle otsingu andmebaasi osadeks – paigutab otsingumootori registrisse. Seda protsessi nimetatakse Interneti-ressursside indekseerimine, sellest ka alamsüsteemi enda nimi. Esialgse analüüsi tulemuste põhjal võib indekseerija ka otsustada, et leht ei ole üldse indekseerimist väärt. Sellise otsuse põhjused võivad olla erinevad: lehel pole nime, see on teise registris juba oleva lehe täpne koopia või sisaldab linke seadusega keelatud ressurssidele.

  • Roomik (roomik). Sellel "loomal" kutsutakse üles "roomama" mööda linke, mis on saadaval ämbliku alla laaditud lehel. Roomaja analüüsib teid, mis viivad praeguselt lehelt saidi teistele jaotistele või väliste Interneti-ressursside lehtedele, ja määrab edasise järjestuse, milles ämblik World Wide Web lõimedest mööda läheb. See on roomaja, kes otsib otsingumootori jaoks uusi lehti ja edastab need ämblikule. Roomaja töö on üles ehitatud otsingualgoritmide alusel graafikutel laiuses ja sügavuses.

  • Tulemuste töötlemise ja väljastamise alamsüsteem (Search Engine and Results Engine). Mis tahes otsingumootori kõige olulisem osa. Ettevõtte selle allsüsteemi toimimise algoritme hoiavad arendajad rangelt konfidentsiaalsena, kuna need on ärisaladus. See on otsingumootori osa, mis vastutab otsingumootori vastuse adekvaatsuse eest kasutaja päringule. Siin on kaks põhikomponenti:
    • pingerea alamsüsteem. Ulatus- need on Interneti-saitide lehed vastavalt nende asjakohasusele konkreetse päringu jaoks. Lehekülje asjakohasus- see on omakorda lehe sisu vastavuse määr päringu tähendusele ja otsingumootor määrab selle väärtuse iseseisvalt, tuginedes tohutule hulgale parameetritele. Edetabel on otsingumootori "tehisintellekti" kõige salapärasem ja vastuolulisem osa. Lehe asetust mõjutavad lisaks selle struktuurile ja sisule (sisule) ka: sellele lehele viivate linkide arv ja kvaliteet teistelt saitidelt; saidi enda domeeni vanus; lehte sirvivate kasutajate käitumise olemus ja paljud muud tegurid.

    • Tulemuste väljastamise allsüsteem. Selle alamsüsteemi ülesannete hulka kuulub kasutaja päringu tõlgendamine, selle tõlkimine struktureeritud registripäringute keelde ja otsingutulemuste lehtede moodustamine. Lisaks päringu teksti enda sõelumisele võib otsingumootor arvestada ka:
      • Taotle konteksti, moodustatud kasutaja varem tehtud päringute tähenduse põhjal. Näiteks kui kasutaja külastab sageli autoteemalisi saite, soovib ta vastuseks päringule sõnaga "Volga" või "Oka" tõenäoliselt saada teavet nende kaubamärkide autode kohta, mitte selle kohta, kus venelased sama nimega alustavad oma voolu ja kus nad voolavad jõed. Seda nimetatakse isikupärastatud otsing, kui sama päringu väljund erinevatele kasutajatele on oluliselt erinev.

      • Kasutaja eelistused, mille kohta see (otsingumootor) võib „arvata“, kasutaja valitud linkide sõelumine otsingutulemuste lehtedel. See on veel üks viis päringu konteksti kohandamiseks: kasutaja ütleb oma tegevusega masinale, mida ta täpselt leida tahtis. Reeglina püüavad otsingumootorid otsingutulemustesse lisada lehti, mis on päringu jaoks asjakohased, kuid seotud üsna erinevate eluvaldkondadega. Oletame, et kasutaja tunneb huvi filmide vastu ja valib seetõttu sageli lingid filmide teadaannetega lehtedele, isegi kui need lehed ei ole algse päringu jaoks päris asjakohased. Tema järgmisele päringule vastuse vormistamisel võib süsteem eelistada lehekülgi filmide kirjeldustega, mille pealkirjas on päringu tekstist pärit sõnad.

      • Piirkond, mis on väga oluline kohalikelt tarnijatelt kaupade ja teenuste ostmisega seotud kommertspäringute töötlemisel. Kui olete huvitatud müügist ja allahindlustest ning asute Moskvas, siis tõenäoliselt ei huvita teid üldse, milliseid selleteemalisi tutvustusi Peterburis korraldatakse, kui te seda taotluse tekstis selgesõnaliselt ei maininud. Esiteks peaks otsingutulemustes ilmuma teave Moskva müügi kohta. Seega jagavad kaasaegsed otsingumootorid päringud geost sõltuv ja geosõltumatu. Tõenäoliselt, kui otsingumootor otsustab, et teie päring on geograafiliselt sõltuv, lisab ta sellele automaatselt piirkonnaatribuudi, mida ta proovib teie Interneti-teenuse pakkuja teabe põhjal kindlaks teha.

      • Aeg. Otsingumootorid peavad mõnikord analüüsima, millal lehel kirjeldatud sündmused aset leidsid. Info ju vananeb pidevalt ning kasutaja vajab eelkõige linke viimastele uudistele, jooksvatele prognoosidele ja teadaannetele sündmustest, mis pole veel lõppenud või peaksid tulema. Arusaamine, et lehe asjakohasus sõltub ajast, ja selle võrdlemine päringu sooritamise hetkega, nõuab ka otsingumootorilt parajalt mõistust.

      Järgmisena otsib otsingumootor kõige lähedasema tähenduse võtmepäring indeksis ja genereerib tulemused, sorteerides lingid nende asjakohasuse kahanevas järjekorras. Igal indeksi märksõnal on selle jaoks asjakohastest lehtedest eraldi järjestus. Mitte iga tähtede ja numbrite kombinatsiooni puhul ei käivita süsteem uut võtmepäringut, vaid teeb seda teatud kasutajapäringute sageduse analüüsi põhjal. Otsingumootor võib otsingutulemustes segada ka erinevate märksõnade järjestusi, kui leiab, et kasutaja seda vajab.

Otsingumootori üldpõhimõtted

Peate mõistma, et Interneti-otsinguteenused on väga-väga tulus äri. Te ei pea laskuma üksikasjadesse selle kohta, kuidas sellised ettevõtted nagu Google ja Yandex elavad, kuna suurem osa nende kasumist on tulu kontekstuaalsest reklaamist. Ja kuna Internetist otsimine on äärmiselt tulus äri, siis konkurents selliste ettevõtete vahel on väga tõsine. Mis määrab konkurentsivõime Interneti-otsingu turul? Vastus on otsingumootori tulemuste kvaliteet. On loogiline, et mida kõrgem see on, seda rohkem on süsteemil uusi kasutajaid ja seda väärtuslikum on just selle numbri lehtedele paigutatud kontekstuaalne reklaam. Otsingumootori arendajad kulutavad palju vaeva, et oma otsingutulemusi "puhastada" igasugusest teabeprügist, mida rahvasuus nimetatakse rämpspostiks (rämpspostiks). Täpsemalt selle kohta, kuidas seda tehakse, arutatakse eraldi artiklis, kuid siin annan otsingumootori käitumise üldpõhimõtted, mis on sõnastatud kõigest ülaltoodust järelduste kujul.

  1. Otsingumootor otsib oma ämblike ja roomajate kujul pidevalt Internetti uusi ja värskendab olemasolevaid lehti, kuna ebaolulist teavet hinnatakse madalamalt.

  2. Otsingumootor värskendab perioodiliselt ressursside järjestust vastavalt nende asjakohasusele võtmepäringute jaoks, kuna registrisse ilmub pidevalt uusi lehti. Seda protsessi nimetatakse otsingutulemuste värskendamiseks.

  3. Kuna veebis on tohutult palju teavet ja otsingumootori enda ressursse on piiratud, püüab otsingumootor alati alla laadida ainult (enda arvates) kõige vajalikuma. Selle arsenalis on kõikvõimalikud filtrid, mis lõikavad ära palju ebavajalikku juba indekseerimise etapis või viskavad otsingutulemuste uuendamise tulemuste põhjal registrist välja rämpsposti.

  4. Kaasaegsed otsingumootorid püüavad päringu analüüsimisel arvesse võtta mitte ainult päringu teksti, vaid ka selle keskkonda: kasutaja konteksti ja eelistusi, millest oli varem juttu, aga ka päringu tegemise aega, piirkond ja palju muud.

  5. Konkreetse lehe asjakohasust ei mõjuta mitte ainult selle sisemised parameetrid (struktuur, sisu), vaid ka välised parameetrid, näiteks lingid lehele teistelt saitidelt ja kasutaja käitumine selle vaatamisel.

Otsingumootorite tööd täiustatakse pidevalt. Otsingumootori ideaalne töö (inimese jaoks) on võimalik ainult siis, kui kõik indekseerimist ja järjestamist puudutavad otsused teeb komisjon, kuhu kuulub suur hulk spetsialiste kõigist inimtegevuse valdkondadest ja valdkondadest. Kuna see on ebareaalne, asendatakse selline komisjon ekspertsüsteemide, heuristiliste otsingualgoritmide ja muude tehisintellekti elementidega. Tõenäoliselt võiks kõigi nende alamsüsteemide toimimine anda ka adekvaatsemaid tulemusi, kui oleks võimalik töödelda absoluutselt kõiki neid andmeid, mis on avalikult Internetis kättesaadavad, kuid see on ka praktiliselt võimatu. Ebatäiuslik tehisintellekt ja piiratud ressursid on kaks peamist põhjust, miks otsingutulemused kasutajaid alati ei rõõmusta, kuid seda kõike käsitletakse ajaga. Tänapäeval on minu arvates kõige kuulsamate ja suuremate otsingumootorite töö täielikult kooskõlas nende kasutajate vajaduste ja ootustega.

Müügigeneraator

Lugemisaeg: 13 minutit

Saadame materjali teile:

Sellest artiklist saate teada:

  • Kuidas esimesed otsingumootorid töötasid?
  • Kuidas kaasaegsed otsingumootorid töötavad
  • Millistel põhimõtetel põhineb ühegi otsingumootori töö?
  • Milliseid valemeid otsingumootorid oma töös kasutavad
  • Kuidas saidid järjestatakse
  • Millised on Yandexi otsingumootori põhimõtted?

Enne saidi SEO reklaamimisega tegelemist on oluline uurida otsingumootorite tööpõhimõtteid, et lõpuks soovitud tulemusi saavutada. Need teadmised on kasulikud individuaalse strateegia väljatöötamisel Interneti-ressursi optimeerimiseks teatud märksõnade jaoks ja aitavad viia selle otsingutulemuste tippu.

Millised põhimõtted on esimeste otsingumootorite töö aluseks


Interneti algusaegadel suutis sellega ühenduse luua vaid väike arv kasutajaid. Ka saadaoleva teabe hulk oli piiratud. Sel ajal kasutasid Internetti peamiselt teadusorganisatsioonide töötajad. Internetist teabe otsimine ei olnud nii populaarne kui praegu.

Esimese katse korraldada Interneti kaudu juurdepääsu elektroonilistele andmetele tegi 1994. aastal ilmunud otsingumootor Yahoo!. Ettevõtte arendajad on loonud saitide avatud kataloogi, mille lingid on rühmitatud vastavate teemade järgi. Koos andmebaasis olevate ressursside arvu kasvuga tekkis vajadus lisada kataloogi otsinguvõimalus. See ei olnud meile tuttaval kujul veel otsingumootor, sest see otsis teavet saitide sisemisest andmebaasist, mitte kõigist olemasolevatest Interneti-ressurssidest.

Sellised lingikataloogid olid varem väga populaarsed, kuid tänaseks on need kaotanud oma aktuaalsuse, sest saitide arv kasvab pidevalt. Näiteks suurim kaasaegsetest Interneti-kataloogidest DMOZ (teine ​​nimi on Open Directory Project) sisaldab umbes 5 miljonit saiti, samas kui Google'i otsingumootori andmebaas sisaldab enam kui 8 miljardit linki.

1994. aastal ilmus esimene tõeline WebCrawleri otsingumootor.


1995. aastal loodi veel kaks otsingumootorit: Lycos ja AltaVista. Uusim otsingumootor on juba pikka aega olnud veebipõhise teabeotsingu valdkonnas liidripositsioonil.

1997. aastal töötasid Stanfordi ülikooli tudengid Sergey Brin ja Larry Page välja Google'i otsingumootori, millest on saanud maailma populaarseim otsingumootor.

Ka 1997. aastal alustas tööd Runetis populaarne Yandexi otsingumootor.

Kuidas otsingumootorid tänapäeval töötavad?

Kui te pole programmeerija ja teie elukutsel pole IT-ga mingit pistmist, siis miks peate mõistma, kuidas otsingumootorid töötavad? Fakt on see, et niinimetatud orgaaniline liiklus tuleb ettevõtte veebisaidile otsingumootorite kaudu - need on kasutajad, kes ise leidsid teie Interneti-ressursi Yandexi või Google'i märksõnade abil. Maheliiklus on maitsev tükk (sihtpubliku) pirukast. Mida kõrgem on selle tase, seda suurem on saidi konversioon ja müük.

Selleks, et kasutajad teie Interneti-ressurssi hõlpsalt üles leiaksid, on oluline see õige sisuga täita. Otsingumootorid järjestavad saite olenevalt sisu kvaliteedist, mis mõjutab nende kohta otsingutulemustes. Selgub, et teades, kuidas otsingumootorid Interneti-ressursse indekseerivad, saate nende sisu optimeerida ja TOP-i tõsta.

Teisest küljest saab otsingumootoreid kasutada kasutaja tegevuste analüüsimiseks. Uurida, mida nad otsivad, milline teave, kaubad või teenused on neile praegu olulised. Kui Yandexi statistika järgi on võimalik kujundada pilt Runeti kasutajate tegemistest, siis Google’i järgi on võimalik kujundada pilt globaalsest internetist.


Põhikontseptsioon, millega iga otsingumootor töötab, on otsinguindeks – teatud andmestruktuur, mis kajastab infot dokumentide ja neis olevate märksõnade asukoha kohta.

Paljude otsingumootorite tööpõhimõtted on väga sarnased. Peamine erinevus seisneb lähenemises saidi järjestamisele (viis, kuidas ressursse otsingutulemustes järjestatakse).


Iga päev otsib tohutu hulk kasutajaid otsingumootorite abil erinevat teavet.

Näiteks on populaarsed otsingupäringud:

"Abstrakt kirjutada":


"Osta":


Otsingumootori kiiruse suurendamiseks koosneb otsinguarhitektuur kahest elemendist:

  • põhiotsing;
  • metaotsing.

Põhiotsing- programm, mis otsib oma indeksi osast ja annab kasutajale kõik lingid, mis vastavad otsingupäringule.

Metaasuring- programm, mis päringu töötlemisel määrab kasutaja asukoha ja väljastab valmis otsingutulemuse, kui märksõna on populaarne, aga kui varem selliseid päringuid polnud, siis ühendatakse põhiotsing tööga, mis töötleb masinõppe abil andmebaasis olevaid linke ja väljastab kasutajale nende loendi .

Otsingumootor analüüsib samaaegselt kasutajat ja otsingupäringut ennast vastavalt järgmistele kriteeriumidele:

  • pikkus;
  • määratlus;
  • populaarsust;
  • konkurentsivõime;
  • süntaks;
  • geograafia.

Taotlusi on järgmist tüüpi:

  • navigeerimine;
  • informatiivne;
  • tehinguline;
  • multimeedia;
  • üldine;
  • ametnik.

Pärast seda, kui otsingupäring on parameetrite järgi sõelutud ja liigitatud ühe loetletud tüübi järgi, valib otsingumootor järjestusfunktsiooni.


Otsingumootorid ei avalda teavet otsingupäringute järjestuse kohta, seega on ülaloleval joonisel toodud näide vaid SEO spetsialistide oletused.

Taotluste tüüpide tundmine on vajalik veebisaidi reklaamimise strateegia valimiseks. Näiteks kui kasutaja sisestab üldise päringu, annab otsingumootor talle erinevat tüüpi linke (kommerts-, multimeedia-, teabe- jne). Kui reklaamite samal ajal oma kommertssaiti üldisel soovil ja soovite viia selle otsingutulemuste esikümnesse, siis suure tõenäosusega ei pääse te TOPi, vaid ainult reklaamikohtade arvus. Interneti-ressursid, mis määratakse otsingumootori järjestuse valemiga. Selgub, et üldiste otsingupäringute puhul on saiti otsingutulemuste esimestele ridadele tõsta palju keerulisem kui muud tüüpi päringute puhul.

Yandexi otsingumootor on masinõpet kasutanud alates 2009. aastast. Matrixnet- spetsiaalne algoritm, mis järjestab saidid teatud päringute jaoks.


Selle algoritmi põhiprintsiip on järgmine: hindajate osakond kogub pingerea valemi tõhususe hindamiseks esmast teavet. Selle osakonna töötajad hindavad eksperimentaalse valemi alusel Interneti-ressursside valimit vastavalt teatud parameetritele:

1. Elutähtis- ettevõtte ametlik Interneti-ressurss või mitte. See võib olla veebisait, suhtlusvõrgustiku leht või teave autoriteetsete ressursside kohta.

2. Kasulik(skoor 5) - sait, mis pakub kogu otsingupäringu jaoks vajalikku teavet. Näiteks sisestab kasutaja otsingukasti "bännerkangas". Selleks, et algoritm hindaks ressurssi kasulikuks, peab see sisaldama järgmist teavet:

  • mis on bännerkangas;
  • spetsifikatsioonid;
  • Foto;
  • liigid;
  • hinnakiri;
  • Lisainformatsioon.

Näited päringutest, mis jõuavad otsingutulemuste TOPi:


3. Asjakohane+(skoor 4) – see skoor näitab, et saidil olev teave vastab otsingupäringule.

4. Asjakohane-(skoor 3) – sait ei vasta täielikult otsingupäringule. Näiteks kui päring "galaktika valvurid näitavad", näitab otsingumootor linke filmi käsitlevatele lehtedele, kuid ilma saatekavata või aegunud ajakavaga.

5. Ebaoluline(skoor 2) - sait ei vasta otsingupäringule. Näiteks: kasutaja otsib teavet ühe hosteli kohta ja otsingumootor annab talle hoopis teise hosteli lehe.

Saidi reklaamimiseks üldiste või informatiivsete otsingupäringute jaoks peate selle sisu optimeerima nii, et otsingumootor annaks järjestuse ajal „kasuliku“ hinnangu.

Millel põhineb ühegi otsingumootori tööpõhimõte?


Traditsiooniliselt võimaldab otsingumootor:

Otsingumootori põhimõtted põhinevad kolme põhielemendi koosmõjul. Esiteks otsitakse kasutaja sisestatud kohta märksõnad või fraasid, siis sisse matemaatilise moodustamise protsess tulemused on rühmitatud linkide ja saitide järgi. Ja lõpuks kasutatakse seda teabe lugemiseks valitud Interneti-ressurssidest otsingurobot või muid tööriistu. Peamised praegu populaarsed otsingurobotid:

  • veebiroomaja(teine ​​nimi on "roomaja") - programm, mis "kõnnib" veebis. See külastab ainult neid saite, kus ta leiab otsingupäringus määratule vähemalt minimaalse vaste. Töö algab saadaolevate andmebaaside või registri aadresside loendiga.
  • Indeks."Indeksija" edastab kogu saadud teabe otsinguindeksisse. Seega on viimasel alati värske info leitud saitide ja veebilehtede kohta. Kui värskendused laaditakse alla ressursile või lehele, värskendatakse seda teavet ka registris.
  • Otsingumootor (server) on spetsiaalne tarkvara, mille põhiülesanne on analüüsida otsinguindeksisse kogutud teavet. Otsingumootori algoritm töötab põhimõttel, et toetab ainult Interneti-ressursside lõplikke otsingutulemusi. Otsingumootor ise otsustab, kuidas lehti otsingutulemustes levitada.

Iga otsingumootori eesmärk on pakkuda kasutajale kõige asjakohasemaid ja kasulikumaid saite, mis vastavad otsingupäringule. Tehnilises mõttes nimetatakse seda "vastuse asjakohasuseks". Näiteks veebipoe reklaamimisel on väga oluline sinna postitatud sisu vastavus kasutajate vajadustele. Veebilehe optimeerimine suurendab selle positsiooni otsingutulemustes.

Mõelge Interneti-otsingumootorite põhiomadustele ja nende tööpõhimõtetele:

  • täielikkus- otsingumootori põhiomadus. See arvutatakse kasutaja soovil valitud dokumentide arvu ja otsingupäringule vastavate veebidokumentide koguarvu suhtena. Näiteks Internetis on 200 lehekülge, kus kasutatakse fraasi "kuidas valida külmkapp", otsingumootor tagastas selle päringu jaoks ainult 40, seega on otsingu täielikkus 0,2. Mida kõrgem on täielikkuse skoor, seda tõenäolisem on, et kasutaja leiab selle, mida ta otsis (eeldusel, et see teave on veebis saadaval).
  • Täpsus- otsingumootori teine, kuid mitte vähem oluline omadus. Näitab leitud dokumentide vastavust kasutaja otsingupäringule. Oletame, et meie näites on päringule "kuidas valida külmkappi" 200 lehekülge, neist 80 sisaldab fraasi "kuidas valida külmkappi" ja ülejäänud on lihtsalt eraldi sõnadega (näiteks "kuidas ergonoomiliselt paigutada köögikomplekt ja vali külmkapi koht" ). Sel juhul on otsingu täpsus võrdne: 80 / 200 = 0,4. Mida suurem on otsingu täpsus, seda kiiremini leiab kasutaja vajaliku üles ja seda vähem erinevat “rämpsposti” ta oma teel kohtab.
  • Asjakohasus- Teine oluline otsingumootori parameeter. See kajastab aega, mis on möödunud materjali Internetis avaldamisest kuni selle otsingumootori registribaasi sisestamiseni. Näiteks mõni tund pärast lennuõnnetust otsis suur hulk kasutajaid veebist intsidendi kohta teavet. Hoolimata asjaolust, et esimeste selleteemaliste teadete avaldamisest on möödunud vähe aega, õnnestus otsingumootoritel need indekseerida ja kasutajad said katastroofi üksikasju teada.
  • Kiirus Otsingumootori töö sõltub otseselt selle vastupidavusest koormustele. Näiteks OOO Rambler Internet Holdingu andmetel töötleb otsingumootor iga päev umbes 60 otsingupäringut sekundis. Selle kiiruse tagab iga üksiku kasutaja päringu lühendatud töötlemisaeg.
  • nähtavus tulemuste esitamine muudab otsingumootori kasutajasõbralikuks. Otsingumootor võib otsingupäringu abil leida sadu ja isegi tuhandeid saite. Kui päring pole päris õige, võib isegi otsingutulemuste esimene leht saada lehti, mis ei vasta päris täpselt sellele, mida kasutaja leida soovib. Selle tulemusena on inimene sunnitud saadud loendis teavet filtreerima. Otsingumootori väljastamise lehe eraldi elemendid aitavad teil otsingutulemustes navigeerida. Otsingutulemuste lehel olevaid üksikasjalikke selgitusi, näiteks Yandexi kohta, saab vaadata lingilt http://help.yandex.ru/search/?id=481937.

Selleks, et sait oleks suure tõenäosusega otsingutulemuste esimesel lehel, peate tegema järgmist.

  1. Kasutage ankurlinke, mis suunavad kasutajad temaatiliselt Interneti-saitidelt teie ettevõtte veebisaidile. See suurendab otsingumootori jaoks Interneti-ressursi nähtavust, kuna otsingutulemustesse võib sattuda mitte ainult saidi lingiga tekst, vaid ka selle URL.
  2. Kasutage metasilte koos hästi valitud märksõnadega. See muudab saidi kokkuvõtte ainulaadsemaks ja tõhusamaks.
  3. Rakendage pealkiri Pealkiri.
  4. Koostage saidi semantiline tuum õigesti. Märksõnade levitamisest saidi sisus ei piisa, oluline on teha seda hoolikalt ja märkamatult. Ärge lisage igasse lausesse märksõnu. Otsingumootor võib seda hinnata rämpspostiks.
  5. Kasutage saidi URL-i (selle asukoha aadressi veebis). Aadressi õige kirjapilt mõjutab selle järjestamist otsingumootori poolt.

Kõigi otsingumootorite tööpõhimõtete kohta lihtsate sõnadega

Otsingumootor on kasutajasõbraliku veebiliidesega spetsiaalne programm, mille abil saavad kasutajad kiiresti ja lihtsalt veebist vajalikku infot otsida. Mõelge mis tahes otsingumootori tööpõhimõttele, laskumata üksikasjadesse ja tehnilisse terminoloogiasse.

Selleks, et otsingumootor annaks kasutajale loendi linkidest lehtedele, mis sisaldavad teavet otsingupäringu kohta, peab ta teadma iga saidi kõigi jaotiste sisu sisu. Kuidas otsingumootor neid andmeid kogub?

Internet on spetsiaalne võrk, mis koosneb üksikutest lehtedest, mis on omavahel seotud. Otsingumootor ei pea igasse neist minema, piisab teabe olemasolust kõrgeima reitinguga saitide ja kataloogide kohta, et koguda leheandmeid hilisemaks üleslaadimiseks.

Otsingumootor loob tegelikult indeksi, milles kõigi Interneti-lehtede aadressid on erilisel viisil rühmitatud. Kui veebi on ilmunud uus sait, millele muud ressursid ei viita, on otsingumootoril raske seda leida, et seda indekseerida ja oma andmebaasi lisada.

Pärast seda, kui otsingumootor on loonud lehtede loendi, algab indekseerimisprotsess (nendelt kõigi andmete allalaadimine). Otsingumootor salvestab spetsiaalselt selleks loodud programmide abil uut infot või kirjutab vana üle, kustutades ebaolulise info. Töö Internetis saitide indekseerimisega käib.

Programmid koguvad andmeid ajutisse salvestusruumi. Sinna koguneb neid kuni teatud summani, mille järel käivitatakse uuendusprotsess, mille põhiprintsiip on teabe aktualiseerimine otsingumootori põhiandmebaasis.

Otsingumootori register sisaldab tohutul hulgal lehti. Kui kasutaja sisestab otsinguribale päringu, valib otsingumootor oma andmebaasist asjakohased lingid. Teisisõnu, see koostab loendi saitidest, mille lehtedel on mainitud kasutaja määratud märksõnu.

Kuna otsingumootori sisemine baas on tohutu, võivad otsingutulemused sisaldada kümneid lehti. Kuidas otsingumootor neid järjestab? Millise põhimõtte järgi see määrab, milliseid lehti kasutajale üldse näidata? Kõik lehed on sorteeritud otsingupäringule vastava sisu järgi. Mida täielikum on lehel sisalduv teave, seda lähemal on leht loendi tipule.

Praegu kasutavad otsingumootorid lehtede järjestamiseks SERP-is masinõpet. Selle protsessi toimimise põhimõtet võib vaadelda abstraktsel näitel.

Oletame, et peame õpetama robotit eristama küpseid ja küpseid õunu. Puuvilja omaduste määramise programm keskendub selle omadustele:

  • värv;
  • suurus;
  • kõvadus;
  • suhkrusisaldus;
  • happe sisaldus.


Analüüsiks antakse robotile kaks õuna: valmimata ja valmis. Ta võrdleb neid. Seejärel treenime masinat – näitame, millised õuna omadused on positiivsed, millised negatiivsed. Selgitame, milliste parameetrite kogumi järgi saab vilja liigitada küpseks või mitte.

Seega on meil õunte analüüsimiseks algoritm, millega robot saab neid iseseisvalt sorteerida. Nüüd saate anda mitte kahte vilja, vaid palju rohkem, masin jagab need küpseteks ja küpseteks.

Sarnane tööpõhimõte on omane ka otsingumootori tööle. Seal on spetsialistid, kes õpetavad masinatele sisu sortimise algoritme. Esiteks analüüsivad nad iseseisvalt lehti, mis olid otsingupäringu otsingutulemustes, jagades need asjakohasteks ja ebaolulisteks. Seejärel koolitatakse robot lehti sorteerima.

Lehekülgede asjakohasus on näitaja murdarvu kujul. Igale lehele on määratud erinev asjakohasuse väärtus. Seejärel sorteeritakse kõik ressursid selle näitaja kahanevas järjekorras. Kõige asjakohasemad saidid jõuavad otsingutulemuste TOP-i.

Lisaks põhilisele sortimisalgoritmile kasutavad otsingumootorid erinevaid täiendavaid, mis võivad samuti otsingutulemusi mõjutada. Näiteks saab neid kasutada hoolimatute saitide filtreerimiseks, mis kasutavad reklaamimiseks erinevaid "halli" skeeme.

Otsingumootorite põhiprintsiibid: valemid


Iga otsingumootor kasutab lehtede ja saitide otsimiseks ja järjestamiseks oma ainulaadseid algoritme, kuid kõigi otsingumootorite tööpõhimõtted on samad.

Kasutaja päringule vastava teabe otsimise protsess koosneb mitmest etapist: andmete kogumine Internetis, saitide indekseerimine, märksõnade järgi otsimine ja tulemuste järjestamine. Vaatame iga etappi lähemalt.

  1. Andmete kogumine.

Pärast saidi valmimist peate veenduma, et otsingumootori robotid teavad selle välimusest. Saate paigutada väliseid linke oma Interneti-ressursile või kasutada muid meetodeid. Niipea kui robot saidile siseneb, kogub ta andmeid igalt lehelt. Seda protsessi nimetatakse roomamiseks. Teabe kogumine saidilt toimub mitte ainult pärast selle loomist. Robot sirvib perioodiliselt Interneti-ressurssi, et kontrollida teabe asjakohasust ja värskendada saadaolevaid andmeid.

Nii teie kui ka roboti (roboti) jaoks peaks selline suhtlus olema vastastikku kasulik ja mugav. Teie kui saidi omanik olete huvitatud sellest, et robot teeks oma tööd kiiresti, ilma serverit üle koormamata, kogudes samal ajal andmeid võimalikult täielikult kõigilt lehtedelt. Samuti on oluline, et bot teeks kõik võimalikult kiiresti, et liikuda edasi andmete kogumisele loendis järgmiselt saidilt. Saate omalt poolt kontrollida, kas sait töötab, pole navigeerimisprobleeme, 404 lehekülgi jne.

  1. Indekseerimine.

Isegi kui robot külastas teie saiti rohkem kui korra, ei tähenda see, et Interneti-ressurss muutub kohe otsingumootorile nähtavaks ja ilmub otsingutulemustes. Pärast andmete kogumist on saidi töötlemisprotsessi järgmine etapp selle indekseerimine (iga lehe jaoks ümberpööratud registrifaili loomine). Indeksit on vaja kiireks otsinguks. Reeglina koosneb see tekstist pärit sõnade loendist ja teabest nende kohta (positsioonid tekstis, kaal jne).

Pärast indekseerimise lõpetamist kuvatakse sait ja üksikud lehed kasutajate päringute otsingumootori tulemustes. Tavaliselt ei võta indekseerimisprotsess palju aega.

  1. Otsige teavet.

Selles etapis otsitakse teavet otse kasutajate otsingupäringutega. Esiteks analüüsib otsingumootor päringut, määrab iga märksõna kaalu. Seejärel otsib ta vasteid ümberpööratud indeksite järgi, valib otsingumootori andmebaasis kõik dokumendid, mis vastavad otsingupäringule.

Dokumendi vastavus taotlusele määratakse spetsiaalse valemiga:

sarnasus(Q,D) = SUM(w qk * w dk),

kus simulatsioon (Q, D)- päringu sarnasus K dokument D; w qk- k-nda sõna kaal päringus; w dk- k-nda sõna kaal dokumendis.

Otsingutulemustes kajastuvad dokumendid, mis on kasutaja päringule kõige sarnasemad.

  1. Ulatus.

Viimases etapis rühmitab otsingumootor tulemused nii, et kasutaja näeb kõigepealt linke kõige asjakohasematele lehtedele. Igal otsingumootoril on oma ainulaadne järjestusvalem, mis võtab arvesse järgmiste parameetrite mõju:

  • lehe kaal (tsitaadi indeks, PageRank);
  • domeeni autoriteet;
  • teksti asjakohasus päringu jaoks;
  • välislinkide tekstide asjakohasus päringule;
  • samuti paljud teised pingerea tegurid.

Näiteks kaaluge lihtsustatud järjestamise valemit:

Ra(x) = (m * Ta(x) + p*La(x)) * F(PRa),

Kus Ra(x)- dokumendi lõplik vastavus a nõuda x, Maksu (x)- dokumendi teksti (koodi) asjakohasus a nõuda x, La(x)- muude dokumentide linkide teksti asjakohasus dokumendile a nõuda x, PR- lehe autoriteedi indikaator a, konstantne suhtes X,
F(PRa) on monotoonselt mittekahanev funktsioon ja F(0) = 1, võib eeldada, et F(PRa) = (1 + q * PRa), m, lk, q on mõned koefitsiendid.

Seega mõjutavad lehe kohta otsingutulemustes erinevad tegurid, mis on nii otsingupäringuga seotud kui ka sellega mitte seotud.

Infootsingusüsteemide tööpõhimõte: järjestamise kriteeriumid

Kui soovite, et teie Interneti-ressurss oleks otsingutulemuste esikolmikus või vähemalt kümnes, peate teadma otsingumootorite tööpõhimõtteid ja järjestamise kriteeriume, et saiti pidevalt nende vajadustele vastavaks optimeerida. Selliseid kriteeriume on kaks peamist rühma:

  • Teksti otsingumootori kriteeriumid.

Otsingumootor järjestab sel juhul lehed nende tekstisisu kvaliteedi alusel. Selle saidi komponendi optimeerimine hõlmab semantilise tuumaga töötamist Interneti-ressursi loomise ja täitmise etapis.

Kasutaja päringut töötlev otsingumootor kuvab kõige asjakohasemad tulemused väljaande esimesel lehel. Dokumentide otsimise käigus analüüsib otsingumootor pealkirjafraasi (pealkirja), lehekirjelduse (kirjelduse) täitmise õigsust ja võtmepäringu olemasolu päistes (H1, H2 jne).

  • Mitteteksti otsingumootori kriteeriumid.

Otsingumootor analüüsib neid kriteeriume pärast saidi avaldamist ja indekseerimist. Selle grupi kriteeriumide järgi järjestamise peamine põhimõte ei ole hinnata nende sisu kvaliteeti, vaid välise lingi profiili.

Otsingumootor analüüsib saidile viivate linkide arvu muudest Interneti-ressurssidest, hindab nende usaldusväärsust, vaatab registreerimisi kataloogides. Kui tuua analoogia, siis otsingumootor, nagu pank, kes otsustab ettevõttele laenu väljastada, kogub selle kohta ülevaateid töövõtjatelt, tarnijatelt ja teistelt võlausaldajatelt.

Otsingumootorite tööpõhimõtte tundmine aitab teil luua ja optimeerida veebisaite, mis hõivavad hõlpsalt otsingutulemustes esikoha ja püsivad seal pikka aega, kuna vastavad kasutajate otsingupäringutele.

Yandexi otsingumootori tööpõhimõte

Selliste suurte ja tuntud otsingumootorite nagu Google ja Yandex töö põhineb klastrite süsteemil. Nad koondavad kogu teabe teatud piirkondadesse, mis on seotud konkreetse klastriga. Saitide ja üksikute lehtede indekseerimiseks ning nendelt andmete kogumiseks kasutatakse spetsiaalseid roomamisroboteid. Neid on kahte tüüpi: peamine roomikrobot (mis on loodud andmete kogumiseks regulaarselt uuendatavatest Interneti-ressurssidest) ja roomikrobot (vajalik indekseeritud saitide loendi ja nende indeksite värskendamiseks võimalikult lühikese aja jooksul). Selleks, et Yandexi otsingumootor koguks Internetist teavet võimalikult täielikult, uuendatakse regulaarselt otsingubaasi ja programmikoodi:

  1. Otsinguteabe andmebaasi uuendatakse mitu korda kuus, samas kui kasutajad saavad uuendatud andmeid Interneti-ressurssidest otsingureale päringuid sisestades. Need andmed lisab peamine robotskanner.
  2. Programmikoodi või, nagu programmeerijad seda nimetavad, "mootori" värskendamine on loodud otsima ja kõrvaldama lehekülgi otsingutulemustes järjestavate algoritmide puudusi. Tavaliselt hoiatab Yandex kasutajaid eelseisvate muudatuste eest.

Yandexi otsingumootori peamine eelis, mis selgitab selle populaarsust Runetis, on võimalus leida erinevaid sõnavorme, võttes arvesse vene keele morfoloogilisi tunnuseid. Geo-sihtimine ja otsinguvalem võimaldavad teil saada väljundis kõige täpsema sõnastuse. Yandexil on ka oma ainulaadne lehe ja saidi järjestamise algoritm. Süsteemi vaieldamatuks eeliseks on kasutajate otsingupäringute töötlemise kiirus ja serverite stabiilne töö.

Nagu juba mainitud, vaatab otsingumootor ressursside indekseerimisel dünaamilisi linke, mille olemasolu tõttu võib robot keelduda saidiindeksi määramisest.

Yandex põhineb erinevate laienditega (.pdf, .rtf, .doc, .xls, .ppt jne) dokumentide tekstisisu analüüsil.

Interneti-ressursi indekseerimisel võtab otsingumootor andmeid failist robots.txt, samas kui atribuut Allow ja osa metasilte on toetatud ning metasilte Revisit-After ja Keywords ei võeta arvesse.

Väljalõiked (tekstidokumentide lühikirjeldused) koosnevad otsitaval lehel olevatest fraasidest, seega pole siltide kirjutamine kirjeldusse üldse vajalik, kuid neid saab vajadusel määrata.

Paljude arendajate sõnul määratakse indekseeritud dokumentide kood automaatselt, seega ei mängi kodeeringu metasilt suurt rolli.

Yandex pöörab suurt tähelepanu viimase teabemuudatuse indikaatorile (Last-Modified). Kui server lõpetab nende andmete otsingumootorile edastamise, toimub saidi indekseerimine palju harvemini.

Kui Interneti-ressursil on oma "peeglid" (näiteks http://www.site.ru , http://site.ru , https://www.site.ru), peate veenduma, et otsingumootor pole indekseeritud. Kui see pole võimalik, siis on võimalik sellised saidid kokku liimida, tehes dokumendis robots.txt vastavad muudatused.

Pärast Interneti-ressursi sattumist Yandex.Catalogi liigitab otsingumootor selle saidiks, mis nõuab erilist tähelepanu, mis mõjutab selle reklaamimist. See lihtsustab ka saidi teema määramise protseduuri, mis on kahtlemata pluss, kuna sellel on märkimisväärne väline link.

Yandexi arendajad ei avalda oma robotite IP-aadresse. Sellegipoolest leiate erinevate saitide logifailidest selle otsingumootori robotitele kuuluvaid tekstimärke.

Kõigist otsingurobotidest on kõige olulisem peamine. Saidi tähtsus Yandexi jaoks sõltub selle töö tulemustest lehtede indekseerimisel.

Igal robotil on Interneti-ressursside indekseerimiseks oma ajakava. Erinevate robotite tööaeg iga otsingumootori andmebaasis oleva saidiga ei pruugi ühtida.

Lisaks peamistele robotitele on otsingumootoril täiendavaid roboteid, mis külastavad regulaarselt Interneti-ressursside lehti, et kontrollida nende saadavust. Näiteks on need Yandex.Catalogi ja Yandexi reklaamivõrgu robotid.

Yandexi otsingumootor keskendub järgmistele välise optimeerimise põhinäitajatele:

  1. TCI (Public Subject Citation Index) – näitab saidile ligipääsevate linkide keskmist arvu. See ei mõjuta otseselt pingerea tulemusi, seda kasutatakse positsioonide määramiseks Yandex.Catalog temaatilises rühmas. Kasutatakse Interneti-ressursside reklaamimisel.
  2. WCI (kaalutud tsiteerimisindeks) on spetsiaalne algoritm, mis on loodud saidile viivate välislinkide arvu loendamiseks. See on lehtede järjestamisel otsingumootori järgi ülimalt oluline.
  3. Saidi olemasolu Yandex.Catalogue'is.
  4. Indekseeritud saidi lehtede koguarv.
  5. Interneti-ressursi sisu indekseerimise sagedus.
  6. Saidi linkide olemasolu ja puudumine, saidi olemasolu otsingufiltrites.

Tsiteerimise indeks on temaatilise ja kaalutud tsiteerituse indeksi aluseks.

Tsiteerimise indeks(CI) - tsitaatide (või viidete allikale) arvu näitaja, aitab kindlaks teha, millised vastloodud dokumentidest viitavad varasematele väljaannetele. IC-d kasutatakse nii artiklite kui ka autorite analüüsiks (näiteks teaduskeskkonnas).

Yandexis, nagu ka teistes otsingumootorites, käsitletakse viiteindeksit tagasilinkide arvuna, võtmata arvesse linke järgmistelt saitidelt: modereerimata kataloogid, teadetetahvlid, võrgukonverentsid, serveri statistika lehed, XSS-lingid jne, mille arv võib pidevalt kasvada ilma ressursi omaniku osaluseta.

Tuleks selgitada, et Aporti kataloogis käsitletakse IC-d kaalutud tsiteerindeksina.

Selle indeksi arvutamiseks kasutatakse lingigraafikut: kui saidid on graafi tipud ja lingid teistele saitidele on graafi tippude või servade lingid, siis kuvatakse lingigraafik joonisel näidatud diagrammina:


Kus A, B, ..., F on Yandexi otsingumootori indeksi teatud saidid ja nooled näitavad nendevaheliste linkide suundi (ühe- või kahesuunalised).

Viitamise indeks mängib suurt rolli dokumentide järjestamisel otsingumootori poolt, kuid lõpptulemused sõltuvad enamast kui ainult sellest näitajast.

Arvatakse, et tsiteerindeks iseloomustab väljaande olulisust, kuid samas ei kajasta see saidi lingistruktuuri, mistõttu saab erineva arvu välislinkidega ressursse indekseerida ühtemoodi.

Selle puuduse kõrvaldamiseks kasutatakse kaalutud viiteindeksit, mis ei iseloomusta mitte ainult viitavate ressursside kvantiteeti, vaid ka kvaliteeti. Lingiotsingu ja staatilise lingi populaarsuse kasutamine hõlbustab otsingumootorite tööd, säästes neid erinevast tekstirämpspostist. Google'i otsingumootor kasutab PageRanki, mis on sarnane kaalutud tsitaadiindeksiga.

VCI ja muude järjestust mõjutavate tegurite arvutamiseks kasutatakse võrdlusgraafikut. Saidi omanik saab iseseisvalt hinnata oma Interneti-ressursi VCI-d, kontrollides selle PageRank väärtust mis tahes saadaolevate võrguteenuste abil. Kuid tuleb meeles pidada, et Yandexi register sisaldab ainult venekeelseid dokumente ja ainult mõnda populaarset välismaist dokumenti, seega erineb Yandexi VIC väärtus Google'i PageRankist.


Definitsiooni järgi on Interneti-otsingumootor teabeotsingusüsteem, mis aitab meil veebist teavet leida. See hõlbustab ülemaailmset teabevahetust. Kuid Internet on struktureerimata andmebaas. See kasvab plahvatuslikult ja sellest on saanud tohutu teabehoidla. Internetist teabe otsimine on keeruline ülesanne. Selle ookeaniteabe haldamiseks, filtreerimiseks ja eraldamiseks on vaja tööriista. Otsingumootor teenib seda eesmärki.

Kuidas otsingumootor töötab?

Interneti otsingumootorid on mootorid, mis otsivad ja toovad teavet Internetist. Enamik neist kasutab roomaja indekseerija arhitektuuri. Need sõltuvad nende rajamoodulitest. Indeksoijad, mida nimetatakse ka ämblikeks, on väikesed programmid, mis roomavad veebilehtedel.

Indeksoijad külastavad algset URL-ide komplekti. Nad kaevandavad roomatud lehtedel ilmuvad URL-id ja saadavad selle teabe roomaja moodulisse. Roomaja otsustab, milliseid lehti järgmisena külastada, ja annab need URL-id roomajatele.

Erinevate otsingumootorite käsitletavad teemad varieeruvad sõltuvalt nende kasutatavatest algoritmidest. Mõned otsingumootorid on programmeeritud otsima saite konkreetse teema kohta, samas kui teiste indeksoijad saavad külastada võimalikult palju kohti.

Indekseerimismoodul eraldab teabe igalt külastatud lehelt ja lisab URL-i andmebaasi. Selle tulemuseks on tohutu otsingutabel, alates URL-ide loendist, mis osutab teabelehtedele. Tabelis on näidatud lehed, mida roomamise ajal kaeti.

Analüüsimoodul on teine ​​oluline osa otsingumootori arhitektuurist. See loob kasulikkuse indeksi. Indeksi utiliit võib anda juurdepääsu teatud pikkusega lehtedele või lehtedele, mis sisaldavad teatud arvu pilte.

Roomamise ja indekseerimise käigus salvestab otsingumootor allavõetud lehed. Need salvestatakse ajutiselt lehe salvestusruumi. Otsingumootorid säilitavad külastatavate lehtede vahemälu, et kiirendada juba külastatud lehtede otsimist.

Otsingumootori päringumoodul võtab kasutajatelt vastu otsingupäringuid märksõnade kujul. Pingerea moodul sorteerib tulemused.

Roomaja indekseerija arhitektuuril on palju variatsioone. Need muutuvad hajutatud otsingumootori arhitektuuris. Need arhitektuurid koosnevad kogujatest ja maakleritest. Kogujad koguvad veebiserveritest indekseerimisteavet, maaklerid pakuvad aga indekseerimismehhanismi ja päringu liidest. Maaklerid indekseerivad värskenduse kogujatelt ja teistelt maakleritelt saadud teabe põhjal. Nad saavad teavet filtreerida. Seda tüüpi arhitektuuri kasutavad tänapäeval paljud otsingumootorid.

Otsingumootorid ja lehtede paremusjärjestus

Kui loome otsingumootoris päringu, kuvatakse tulemused kindlas järjekorras. Enamik meist kipub külastama parimaid tellimislehti ja ignoreerima viimaseid. Seda seetõttu, et arvame, et paar ülemist lehte on meie päringu jaoks asjakohasemad. Seega on kõik huvitatud oma lehtede järjestamisest otsingumootori tulemuste esikümnesse.

Otsingumootori päringu liideses loetletud sõnad on märksõnad, mida otsingumootorid küsisid. Need on soovitud märksõnadega seotud lehtede loend. Selle protsessi käigus toovad otsingumootorid need lehed, millel on palju neid märksõnu. Nad otsivad seoseid märksõnade vahel. Arvesse võetakse ka märksõnade asukohta ja neid sisaldava lehe asetust. Lehepealkirjades või URL-ides esinevad märksõnad saavad suurema kaalu. Lehed, millel on neile viitavad lingid, muudavad need veelgi populaarsemaks. Kui paljud teised saidid viitavad lehele, peetakse seda väärtuslikuks ja asjakohasemaks.

On olemas järjestamise algoritm, mida iga otsingumootor kasutab. Algoritm on arvutipõhine valem, mis on loodud kasutaja nõudmisel asjakohaste lehtede pakkumiseks. Igal otsingumootoril võib olla erinev järjestusalgoritm, mis analüüsib mootori andmebaasis olevaid lehti, et määrata otsingupäringutele sobivad vastused. Otsingumootorid indekseerivad erinevat teavet erineval viisil. Selle tulemusel võib konkreetne kahele erinevale otsingumootorile edastatud päring tuua lehti erinevas järjekorras või tuua erinevaid lehti. Veebisaidi populaarsus on asjakohasuse määravad tegurid. Saidi klikkimise populaarsus on teine ​​tegur, mis määrab selle asetuse. See mõõdab saidi külastamise sagedust.

Veebimeistrid püüavad petta otsingumootorite algoritme, et tõsta oma saidi positsiooni SERP-is. Veebisaidi lehtede täitmine märksõnadega või metasiltide kasutamine otsingumootori järjestamise strateegiate petmiseks. Kuid otsingumootorid on piisavalt nutikad! Nad täiustavad oma algoritme, nii et veebihaldurite mahhinatsioonid ei mõjuta otsingutulemusi.

Peate mõistma, et isegi leheküljed pärast paari esimest loendis võivad sisaldada täpselt seda teavet, mida otsisite. Kuid võite olla kindel, et head otsingumootorid toovad teieni alati väga asjakohased lehed parimas järjekorras!

Tänapäeval on kõige populaarsem veebiteenus otsingumootor. Siin on kõik arusaadav, sest need ajad, mil esimeste Interneti-kasutajate esindajad said võrgus uusi üksusi jälgida, on juba ammu möödas.

Infot ilmub ja koguneb nii palju, et inimesel on muutunud väga raskeks leida täpselt seda, mida ta vajaks. Kujutage ette, kuidas oleks otsida Internetist, kui tavakasutaja peaks otsima teavet, millest ma aru ei saa. Ma ei saa täpselt aru, kus, sest käsitsi otsimisega ei leia palju teavet.

Otsingumootor, mis see on?

Hea, kui kasutaja juba teab saite, millel võib vajalikku infot olla, aga mida veel teha? Selleks, et inimese elu internetist vajaliku info leidmisel lihtsamaks teha, leiutati otsingumootorid või lihtsalt otsingumootorid. Otsingumootor täidab ühte väga olulist funktsiooni, ilma milleta poleks Internet samasugune, nagu oleme harjunud seda nägema – see on teabe otsimine võrgust.

Otsingusüsteem- see on spetsiaalne veebisait või muu sait, mis pakub kasutajatele nende nõudmisel hüperlinke lehtedele, saitidele, mis vastavad antud otsingupäringule.

Natuke täpsemini öeldes on see teabe otsimine Internetist, mis toimub tänu tarkvara ja riistvara funktsionaalsele komplektile ning veebiliidesele kasutajatega suhtlemiseks.

Inimeste suhtlemiseks otsingumootoriga loodi veebiliides, see tähendab nähtav ja arusaadav kest. Selline otsingumootori arendajate lähenemine muudab paljude inimeste jaoks otsimise lihtsamaks. Reeglina otsitakse otsingumootorite abil just Internetti, kuid leidub ka otsingumootoreid FTP-serverite, teatud tüüpi kaupade veebis või uudisteabe või muude otsingusuundade otsimiseks.

Otsingut saab teha mitte ainult saitide tekstisisu, vaid ka muud tüüpi teabe kohta, mida inimene saab otsida: pildid, videod, helifailid jne.

Kuidas otsingumootor otsingut teostab?

Otsing ise Internetis, nagu ka veebisaitide sirvimine, on võimalik Interneti-brauseri - brauseri abil. Alles pärast seda, kui kasutaja on otsinguribale oma päringu määranud, tehakse otsing ise otse.

Iga otsingumootor sisaldab tarkvaraosa, millel põhineb kogu otsingumootor, seda nimetatakse otsingumootoriks - see on tarkvarapakett, mis annab võimaluse otsida teavet. Pärast otsingumootoriga ühenduse võtmist, inimese poolt otsingupäringu moodustamist ja selle otsinguribale sisestamist genereerib otsingumootor lehe otsingutulemuste loendiga, otsingumootori järgi kõige asjakohasemad asuvad siin kõrgemal.

Otsingu asjakohasus – otsige kasutaja päringule kõige asjakohasemaid materjale ja nendele hüperlinkide paigutust otsingutulemuste lehel koos täpsemate tulemustega teiste kohal. Tulemuste jaotust nimetatakse saidi järjestamiseks.

Kuidas siis otsingumootor oma materjale väljastamiseks ette valmistab ja kuidas otsimootor teavet otsib? Võrku info kogumist hõlbustab iga otsingumootori jaoks ainulaadne robot või muul moel bot, millel on ka hulk muid sünonüüme nagu roomaja või ämblik ning otsingusüsteemi enda saab jagada kolme etappi. :

Otsingumootori töö esimese etapi võib seostada ülemaailmse võrgu saitide skannimisega ja veebilehtede koopiate kogumisega oma serveritesse. See moodustab tohutu hulga teavet, mida pole veel töödeldud ja mis ei sobi otsingutulemuste jaoks.

Otsingumootori töö teine ​​etapp taandub varem, esimeses etapis saitidelt saadud teabe korrastamiseks. Toimub selline sorteerimine, mis soosib võimalikult lühikese aja jooksul väga kvaliteetset otsingut, mida kasutajad otsimootorilt tegelikult ootavad. Etappi nimetatakse indekseerimiseks, mis tähendab, et lehed on juba väljastamiseks ette valmistatud ja praegust andmebaasi käsitletakse registrina.

See on kolmas etapp, mis määrab otsingutulemused pärast teie kliendilt päringu saamist päringus määratud märksõnade põhjal või nende lähedal. See aitab kaasa päringu jaoks kõige asjakohasema teabe väljavalimisele ja selle hilisemale väljastamisele. Kuna teavet on palju, teostab otsingumootor järjestuse vastavalt oma algoritmidele.
Parim otsingumootor on see, mis suudab pakkuda materjali, mis vastab kasutaja päringule kõige õigemini. Kuid isegi siin võib esineda tulemusi, mida mõjutasid oma saidi reklaamimisest huvitatud inimesed. Kuigi mitte alati, ilmuvad sellised saidid sageli otsingutulemustes, kuid mitte kaua.

Kuigi paljudes piirkondades on maailma liidrid juba kindlaks tehtud, jätkavad otsingumootorid oma kvaliteetse otsingu arendamist. Mida paremat otsingut nad pakuvad, seda rohkem inimesi seda kasutab.

Kuidas otsingumootorit kasutada?

Mis on otsingumootor ja kuidas see töötab, on juba selge, aga kuidas seda õigesti kasutada? Enamikul saitidel on alati otsinguriba ja selle kõrval on nupp Otsi või Otsi. Otsinguribale sisestatakse päring, mille järel peate vajutama otsingunuppu või, nagu sagedamini, vajutage klaviatuuril sisestusklahvi ja mõne sekundi pärast saate päringu tulemuse nimekirja kujul.

Kuid otsingupäringule õige vastuse saamine ei ole alati võimalik esimesel korral. Selleks, et soovitud otsimine ei muutuks valusaks, peate õigesti koostama otsingupäringu ja järgima allpool kirjeldatud soovitusi.

Koostage otsingupäring õigesti

Järgnevalt on toodud mõned näpunäited otsingumootori kasutamiseks. Teatud nippide ja reeglite järgimine otsingumootoris teabe otsimisel võimaldab soovitud tulemuse palju kiiremini saada. Järgige neid juhiseid.

  1. Sõnade õige kirjutamine tagab maksimaalse vastete arvu soovitud teabeobjektiga (Kuigi tänapäevased otsingumootorid on juba õppinud õigekirjavigu parandama, ei tohiks seda nõuannet tähelepanuta jätta).
  2. Kasutades päringus sünonüüme, saab katta laiema otsinguvahemiku.
  3. Mõnikord võib päringu tekstis sõna muutmine anda parema tulemuse, seega sõnastage päring ümber.
  4. Tooge päringule spetsiifilisus, kasutage fraaside täpseid esinemissagedusi, mis peaksid määrama otsingu põhiolemuse.
  5. Katsetage märksõnadega. Märksõnade ja fraaside kasutamine aitab tuvastada põhipunkti ning otsingumootor annab asjakohasema tulemuse.

Mis on otsingumootor - see pole midagi muud kui võimalus leida huvipakkuvat teavet ja seda tavaliselt täiesti tasuta kasutada, midagi õppida, millestki aru saada või enda jaoks õige järeldus teha. Paljud inimesed ei kujuta enam ette oma elu ilma häälotsinguta, mille puhul ei pea teksti tippima, vaid lihtsalt oma soovi öelda ja mikrofon on siin sisendseadmeks. Kõik see annab tunnistust otsingutehnoloogiate pidevast arengust Internetis ja vajadusest nende järele.

Otsingumootor on konkreetse teabe andmebaas Internetis. Paljud kasutajad usuvad, et niipea, kui nad otsingumootorisse päringu sisestavad, indekseeritakse kohe kogu Internet, kuid see pole sugugi nii. Interneti-skaneerimine toimub pidevalt, paljud programmid, saitide andmed sisestatakse andmebaasi, kus vastavalt teatud kriteeriumidele jaotatakse kõik saidid ja kõik nende lehed erinevatesse loenditesse ja andmebaasidesse. See tähendab, et see on omamoodi andmefail ja otsing ei toimu Internetis, vaid selles failis.

Google on maailma populaarseim otsingumootor.

Lisaks otsingumootorile pakub Google palju lisateenuseid, tarkvara ja riistvara, sealhulgas meiliteenust, Google Chrome'i brauserit, suurimat youtube'i videoteeki ja palju muid projekte. Google ostab enesekindlalt üles palju projekte, mis toovad suurt kasumit. Enamik teenuseid ei ole suunatud otsesele kasutajale, vaid Internetis raha teenimisele ning on integreeritud, keskendudes Euroopa ja Ameerika kasutajate huvidele.

Mail on otsingumootor populaarne peamiselt postiteenuse tõttu.

Lisateenuseid on palju, mille võtmeks on mail Mail, hetkel omab Maili sotsiaalvõrgustik Odnoklassniki, oma võrgustik My World, teenus Money-mail, palju võrgumänge, kolm peaaegu identset erineva nimega brauserit. Kõikidel rakendustel ja teenustel on palju reklaamisisu. Sotsiaalne võrgustik "VKonatkte" blokeerib otsesed üleminekud meiliteenustele, vaieldes suure hulga viirustega.

Vikipeedia.

Wikipedia on otsitav viitesüsteem.

Mittetulunduslik otsingumootor, mis eksisteerib eraannetuste pealt, seetõttu ei täida see lehti reklaamiga. Mitmekeelne projekt, mille eesmärk on luua terviklik viitentsüklopeedia kõigis maailma keeltes. Sellel pole konkreetseid autoreid, seda täidavad ja haldavad vabatahtlikud üle kogu maailma. Iga kasutaja saab nii artiklit kirjutada kui ka redigeerida.

Ametlik leht on www.wikipedia.org.

Youtube on suurim videoteek.

Videomajutus sotsiaalvõrgustiku elementidega, kuhu iga kasutaja saab lisada video. Alates hetkest, kui Google Ink need omandas, pole YouTube'i jaoks eraldi registreerimist vaja, piisab Google'i meiliteenuses registreerumisest.

Ametlik leht on youtube.com.

Yahoo! on maailmas tähtsuselt teine ​​otsingumootor.

On lisateenuseid, millest tuntuim on Yahoo post. Otsingumootori kvaliteedi parandamise osana edastab Yahoo andmeid kasutajate ja nende päringute kohta Microsoftile. Nendest andmetest moodustub ettekujutus kasutajate huvidest, aga ka reklaamisisu turg. Yahoo otsingumootor tegeleb ka teiste ettevõtete absorbeerimisega, näiteks omab Yahoo otsinguteenust Altavista ja Alibaba e-kaubanduse saiti.

Ametlik leht on www.yahoo.com.

WDL on digitaalne raamatukogu.

Raamatukogu kogub digitaalsel kujul kultuuriväärtuslikke raamatuid. Peamine eesmärk on tõsta Interneti kultuurilise sisu taset. Sissepääs raamatukogusse on tasuta.

Ametlik leht on www.wdl.org/ru/.

Bing on Microsofti otsingumootor.

Ametlik veebisait on www.baidu.com.

Otsingumootorid Venemaal

Rambler on "Ameerika-meelne" otsingumootor.

Algselt loodi see meedia Interneti-portaalina. Sarnaselt paljudele teistele otsingumootoritele on sellel pildiotsinguteenused, videofailid, kaardid, ilmateade, uudiste jaotis ja palju muud. Väljaandjad pakuvad ka tasuta brauserit Rambler-Nichrome.

Ametlik leht on www.rambler.ru.

Nigma on intelligentne otsingumootor.

Mugavam otsingumootor paljude filtrite ja sätete olemasolu tõttu. Liides võimaldab teil paremate tulemuste saamiseks otsingusse kaasata või välistada soovitatud sarnaseid väärtusi. Samuti võimaldab see otsingutulemuse saamisel kasutada teiste suuremate otsingumootorite infot.

Ametlik leht on www.nigma.ru.

Aport - kaupade veebikataloog.

Varem kaotas otsingumootor, kuid pärast seda, kui arendused ja uuendused katkestati, kiiresti ja . Hetkel on Aport kauplemisplatvorm, kus esitletakse enam kui 1500 ettevõtte kaupu.

Ametlik leht on www.aport.ru.

Sputnik on riiklik otsingumootor ja Interneti-portaal.

Loodud Rostelecomi poolt. Hetkel on see katsefaasis.

Ametlik veebisait on www.sputnik.ru.

Metabot on arenev otsingumootor.

Metaboti ülesanneteks on luua otsingumootor kõigile teistele otsingumootoritele, luues positsioonid tulemuste väljastamiseks, võttes arvesse kogu otsingumootorite nimekirja andmeid. See tähendab, et see on otsingumootorite otsingumootor.

Ametlik leht on www.metabot.ru.

Otsingumootor on peatatud.

Ametlik leht on www.turtle.ru.

KM - multiportaal.

Algselt oli sait multiportaal, millele järgnes otsingumootori kasutuselevõtt. Otsingut saab teha nii saidil kui ka kõigil jälgitavatel Runeti saitidel.

Ametlik leht on www.km.ru.

Gogo - ei tööta, suunab otsingumootorisse.

Ametlik leht on www.gogo.ru.

Vene multiportaal, mis pole eriti populaarne, vajab täiustamist. Otsingumootor sisaldab uudiseid, telesaadet, mänge, kaarti.

Ametlik leht on www.zoneru.org.

Otsingumootor ei tööta, arendajad soovitavad kasutada otsingumootorit.

Sarnased postitused