Што е пребарувач и како функционира. Како работат пребарувачите Што е пребарувач

Пребарувач или едноставно „пребарувач“ е оној што бара интернет страници во согласност со барањето на корисникот. Најпознатиот пребарувач во светот е Google, најпопуларен во Русија е Yandex, а еден од најстарите пребарувачи е Yahoo. Во архитектурата на пребарувачот, може да се разликува пребарувач- јадрото на системот, претставено со збир на софтверски модули; база на податоци или индекс, кој чува информации за сите интернет ресурси познати на пребарувачот; и збир на сајтови кои се влезни точкикорисници на системот (www.google.com, www.yandex.ru, ru.yahoo.com, итн.). Сето ова одговара на класичната архитектура на три нивоа на информациските системи: има кориснички интерфејс, деловна логика, која во овој случај е претставена со имплементација на алгоритми за пребарување и база на податоци.

Специфики за пребарување на Интернет

На прв поглед, пребарувањето на Интернет не се разликува многу од обичното пребарување на информации, на пример, од обработка до база на податоци или од задачата за наоѓање датотека во . Така мислеа и развивачите на првите пребарувачи на Интернет, но со текот на времето сфатија дека згрешиле ...

Првата разлика помеѓу пребарувањето на Интернет и редовното е тоа што алгоритмот за пребарување за истата база на податоци претпоставува дека неговата структура е однапред позната на пребарувачот и на авторот на барањето. На Интернет, од очигледни причини, тоа не е случај. Интернет страниците не формираат структура на директориуми, туку мрежа, која влијае и на алгоритмите за пребарување, а форматот на податоците објавени на интернет ресурсите не е контролиран од никого.

Втората разлика, како една од последиците на првата, е тоа што барањето не е претставено како збир на вредности на параметри (критериуми за пребарување), туку како текст напишан од лице на неговиот природен јазик. Така, пред да започнете со пребарување, сепак треба да разберете што точно сака барателот. Забележувам дека не е за друг да разбере, туку за компјутер.

Третата разлика е помалку очигледна, но не помалку фундаментална: во каталог или база на податоци, сите елементи се еднакви. Постои конкуренција на Интернет, и, следствено, поделба на „подоверливи даватели на информации“ и извори блиски по статус до „ѓубре од информации“. Така луѓето ги класифицираат ресурсите, а ним им припаѓаат и пребарувачите.

И како заклучок, треба да се додаде дека областа за пребарување е милијарди страници, по неколку килобајти или повеќе. Дневно се додаваат околу десет милиони страници и исто толку се ажурира. Сето ова е претставено во различни дигитални формати. За жал, дури и современите технологии и ресурси со кои располагаат лидерите на пазарот на услуги за пребарување на Интернет не им дозволуваат да ја обработат целата оваа разновидност „на лет“ и во целост.

Што е пребарувач

Пред сè, важно е да се сфати уште една и, веројатно, најзначајната разлика помеѓу работата на пребарувачот на Интернет и работата на кој било друг информациски систем што пребарува во различни директориуми и бази на податоци. Интернет пребарувачот не бара информации меѓу она што е на Интернет во моментот на приемот на барањето, туку се обидува да формира одговор врз основа на сопственото складирање на информации - база на податоци наречена индекс, каде што складира досие од се што е познато. на него и периодично го ажурира. Со други зборови, пребарувачот не работи со оригиналот, туку со проекција на опсегот на валидни вредности за пребарување. Сите најнови промени на Интернет може да се рефлектираат во резултатите од пребарувањето само откако ќе се појават соодветните страници индексирани- додадено на индексот на пребарувачот. Значи, системот за пребарување во првата апроксимација се состои од пребарувач, база на податоци или индекс (индекс) и влезни точки во системот.

Сега накратко за тоа од што се состои пребарувачот:

Пајак или пајак (пајак).Апликација која презема страници на Интернет ресурси. Пајакот не „ползи“ никаде - тој само ја бара содржината на страниците на ист начин како што тоа го прави обичен интернет прелистувач, испраќајќи HTTP барање до серверот и добивајќи одговор од него. Откако ќе се преземе содржината на страницата, таа се испраќа до индексаторот и роботот, кои се опишани подолу.

Индексатор (индексатор).Индексаторот врши почетна анализа на содржината на преземената страница, ги истакнува главните делови (наслов на страницата, опис, врски, наслови итн.) и сето тоа го разложува на делови од базата на податоци за пребарување - го става во индексот на пребарувачот. Овој процес се нарекува индексирање на интернет ресурси, па оттука и името на самиот потсистем. Врз основа на резултатите од првичната анализа, индексирачот исто така може да одлучи дека страницата воопшто не е „достојна“ да се индексира. Причините за таквата одлука може да бидат различни: страницата нема име, е точна копија на друга страница веќе во индексот или содржи врски до ресурси забранети со закон.

Роботач (роботик).Ова „животно“ е повикано да „ползи“ по врските достапни на страницата преземена од пајакот. Роботот ги анализира патеките што водат од тековната страница до другите делови на страницата или до страниците на надворешните интернет ресурси и го одредува понатамошниот редослед по кој пајакот ќе ги заобиколи нишките на World Wide Web. Ролерот е тој што наоѓа нови страници за пребарувачот и ги пренесува на пајакот. Работата на роботот е изградена врз основа на алгоритми за пребарување на графикони во ширина и длабочина.

Подсистем за обработка и издавање резултати (Search Engine и Results Engine).Најважниот дел од секој пребарувач. Алгоритмите за работа на овој потсистем на компанијата се чуваат строго доверливи од страна на програмерите, бидејќи тие се деловна тајна. Токму овој дел од пребарувачот е одговорен за адекватноста на одговорот на пребарувачот на барањето на корисникот. Тука има две главни компоненти:
- потсистем за рангирање. Опсегнување- ова се страниците на интернет-страниците во согласност со нивната релевантност за одредено барање. Релевантност на страницата- ова, пак, е степенот на усогласеност на содржината на страницата со значењето на барањето, а пребарувачот ја одредува оваа вредност независно, врз основа на огромен број параметри. Рангирањето е најмистериозниот и најконтроверзниот дел од „вештачката интелигенција“ на пребарувачот. На рангирањето на страницата, покрај нејзината структура и содржина (содржина), влијаат и: бројот и квалитетот на линковите кои водат до оваа страница од други сајтови; возраста на доменот на самата страница; природата на однесувањето на корисниците кои ја прелистуваат страницата и многу други фактори.
- Подсистем за издавање резултати.Задачите на овој потсистем вклучуваат толкување на корисничко барање, негово преведување на јазикот на структурирани индексни прашања и формирање на страници со резултати од пребарувањето. Покрај парсирањето на самиот текст на барањето, пребарувачот може да земе предвид и:
  - Побарајте контекст, формирана врз основа на значењето на барањата кои претходно ги направил корисникот. На пример, ако корисникот често посетува сајтови за автомобилски теми, тогаш како одговор на барање со зборот „Волга“ или „Ока“, тој веројатно сака да добие информации за автомобили од овие марки, а не за тоа каде Русите од истото име започнува нивниот тек и каде течат реки. Тоа се нарекува персонализирано пребарување, кога излезот за исто барање за различни корисници е значително различен.
  - Кориснички параметри, за што тој (пребарувачот) може да „погоди“, парсирање на врски избрани од корисникотна страниците со резултати од пребарување. Ова е уште еден начин да се прилагоди контекстот на барањето: корисникот, со своите постапки, некако и кажува на машината што точно сакал да најде. Како по правило, пребарувачите се обидуваат да додадат страници во резултатите од пребарувањето кои се релевантни за барањето, но поврзани со сосема различни области од животот. Да речеме дека корисникот е заинтересиран за филмови и затоа често избира врски до страници со најави за филм, дури и ако овие страници не се сосема релевантни за оригиналното барање. При формирањето на одговор на неговото следно барање, системот може да даде предност на страници со описи на филмови во чиј наслов има зборови од текстот на барањето.
  - Регионот, што е многу важно кога се обработуваат комерцијални барања поврзани со купување на стоки и услуги од локални добавувачи. Ако сте заинтересирани за продажба и попусти и се наоѓате во Москва, тогаш најверојатно воопшто не ве интересира какви промоции на оваа тема се одржуваат во Санкт Петербург, ако ова не сте го навеле експлицитно во текстот на барањето. Пред сè, информациите за продажбата во Москва треба да се појават во резултатите од пребарувањето. Така, современите пребарувачи ги делат барањата на гео-зависнии геонезависни. Најверојатно, ако пребарувачот одлучи дека вашето барање е гео-зависно, тогаш автоматски му додава атрибут за регион, кој се обидува да го одреди од информациите за вашиот интернет провајдер.
  - Време. Пребарувачите понекогаш треба да анализираат кога се случиле настаните опишани на страницата. На крајот на краиштата, информациите постојано стануваат застарени, а на корисникот првенствено му требаат линкови до најновите вести, тековни прогнози и најави за настани кои сè уште не завршиле или треба да дојдат во иднина. Да се разбере дека релевантноста на страницата зависи од времето и да се спореди со моментот кога е извршено барањето, исто така бара прилично голема количина на интелигенција од пребарувачот.
  Следно, пребарувачот го бара најблиското значење клучно барањево индексот и генерира резултати со подредување на врските по опаѓачки редослед на нивната важност. Секој клучен збор во индексот има посебно рангирање на страници кои се релевантни за него. Не за секоја комбинација на букви и бројки, системот започнува ново барање за клуч, но тоа го прави врз основа на анализа на зачестеноста на одредени барања од корисниците. Пребарувачот исто така може да измеша рангирање од различни клучни зборови во резултатите од пребарувањето ако смета дека тоа му треба на корисникот.

Општи принципи на пребарувачот

Треба да разберете дека услугите за пребарување на Интернет се многу, многу профитабилен бизнис. Не треба да навлегувате во детали за тоа како живеат компании како Google и Yandex, бидејќи најголемиот дел од нивниот профит е приход од контекстуално рекламирање. И бидејќи пребарувањето на Интернет е исклучително профитабилен бизнис, тогаш конкуренцијата меѓу таквите компании е многу сериозна. Што ја одредува конкурентноста на пазарот за пребарување на Интернет? Одговорот е квалитетот на резултатите од пребарувачот. Логично е дека колку е повисоко, толку повеќе нови корисници има системот и толку е повредно контекстуалното рекламирање поставено на страниците на токму овој број. Програмерите на пребарувачите трошат многу напор за да ги „исчистат“ своите резултати од пребарувањето од секакви информативни ѓубре, популарно наречени спам (спам). Повеќе детали за тоа како е направено ова ќе бидат разгледани во посебна статија, но тука ќе ги дадам општите принципи на однесувањето на пребарувачот, формулирани во форма на заклучоци од сето погоре.

Пребарувачот, во форма на своите пајаци и роботи, постојано го скенира Интернетот за нови и ги ажурира постоечките страници, бидејќи ирелевантните информации се вреднуваат пониско.

Пребарувачот периодично го ажурира рангирањето на ресурсите според нивната важност за клучните прашања, бидејќи постојано се појавуваат нови страници во индексот. Овој процес се нарекува ажурирање на резултатите од пребарувањето.

Поради огромниот обем на информации објавени на World Wide Web и ограничените ресурси на самиот пребарувач, пребарувачот секогаш се обидува да го преземе само најпотребното (според негово мислење). Во својот арсенал има секакви филтри кои отсекуваат многу непотребни веќе во фазата на индексирање или исфрлаат спам од индексот врз основа на резултатите од ажурирањето на резултатите од пребарувањето.

Современите пребарувачи, кога анализираат барање, се обидуваат да го земат предвид не само текстот на самото барање, туку и неговата околина: контекстот и преференциите на корисникот, кои беа споменати претходно, како и времето на барањето, регион и многу повеќе.

Релевантноста на одредена страница е под влијание не само од нејзините внатрешни параметри (структура, содржина), туку и од надворешни параметри, како што се врските до страницата од други страници и однесувањето на корисникот кога ја гледате.

Работата на пребарувачите постојано се подобрува. Идеалната работа на пребарувач (за лице) е можна само ако сите одлуки во врска со индексирањето и рангирањето ќе ги донесе комисија составена од голем број специјалисти од сите области и области на човековата активност. Бидејќи ова е нереално, таквата комисија се заменува со експертски системи, хеуристички алгоритми за пребарување и други елементи на вештачката интелигенција. Веројатно, функционирањето на сите овие потсистеми би можело да даде и посоодветни резултати доколку би можело да се обработат апсолутно сите податоци кои се јавно достапни на Интернет, но и тоа е практично невозможно. Несовршената вештачка интелигенција и ограничените ресурси се двете главни причини зошто резултатите од пребарувањето не секогаш ги радуваат корисниците, но сето тоа се третира со време. Денес, според мене, работата на најпознатите и најголемите пребарувачи е целосно конзистентна со потребите и очекувањата на нивните корисници.

Генератор на продажба

Време на читање: 13 минути

Ние ќе ви го испратиме материјалот:

Од оваа статија ќе научите:

Како работеа првите пребарувачи?
Како работат модерните пребарувачи
На кои принципи се заснова работата на секој пребарувач?
Кои формули ги користат пребарувачите во својата работа
Како се рангираат сајтовите
Кои се принципите на пребарувачот Yandex

Пред да се вклучите во SEO-промоција на страницата, важно е да ги проучите принципите за тоа како работат пребарувачите за да ги постигнете посакуваните резултати на крајот. Ова знаење ќе биде корисно за развој на индивидуална стратегија за оптимизирање на Интернет ресурс за одредени клучни зборови и ќе помогне да се доведе до врвот на резултатите од пребарувањето.

Кои принципи ја засноваат работата на првите пребарувачи

Во раните денови на Интернетот, само мал број корисници можеа да се поврзат на него. Количината на достапни информации исто така беше ограничена. Во тоа време, Интернетот главно го користеа вработените во истражувачките организации. Пребарувањето информации на Интернет не беше толку популарно како што е денес.

Првиот обид да се организира пристап до електронски податоци преку Интернет беше направен од пребарувачот Yahoo!, кој се појави во 1994 година. Програмерите на компанијата создадоа отворен каталог на страници, чии линкови се групирани по релевантни теми. Со растот на бројот на ресурси во базата на податоци, стана неопходно да се додаде опција за пребарување во каталогот. Сè уште не беше пребарувач во формата позната на нас, бидејќи бараше информации на внатрешната база на податоци на страниците, а не на сите постоечки интернет ресурси.

Ваквите директориуми за врски порано беа многу популарни, но денес ја изгубија својата важност, бидејќи бројот на сајтови постојано се зголемува. На пример, најголемиот од современите директориуми на Интернет, DMOZ (друго име е Проект за отворен директориум), вклучува околу 5 милиони сајтови, додека базата на податоци на пребарувачот Google содржи повеќе од 8 милијарди врски.

Во 1994 година се појави првиот вистински пребарувач WebCrawler.

Во 1995 година беа создадени уште два пребарувачи: Lycos и AltaVista. Најновиот пребарувач долго време зазема водечка позиција во областа на пребарувањето информации преку Интернет.

Во 1997 година, студентите од Универзитетот Стенфорд, Сергеј Брин и Лери Пејџ, го развија пребарувачот Google, кој стана најпопуларниот пребарувач во светот.

Исто така, во 1997 година, пребарувачот Yandex, кој е популарен во Runet, започна со работа.

Како работат пребарувачите денес?

Ако не сте програмер и вашата професија нема никаква врска со ИТ, зошто треба да разберете како работат пребарувачите? Факт е дека таканаречениот органски сообраќај доаѓа на веб-страницата на компанијата преку пребарувачите - тоа се корисници кои самите го пронајдоа вашиот интернет ресурс користејќи клучни зборови во Yandex или Google. Органскиот сообраќај е вкусно парче од колачот (целната публика). Колку е повисоко неговото ниво, толку е поголема конверзијата и продажбата на страницата.

Со цел корисниците лесно да го најдат вашиот интернет ресурс, важно е да го пополните со вистинската содржина. Пребарувачите, во зависност од квалитетот на содржината, ги рангираат сајтовите, што влијае на нивното место во резултатите од пребарувањето. Излегува дека знаејќи како пребарувачите ги индексираат ресурсите на Интернет, можете да ја оптимизирате нивната содржина и да ги промовирате на ТОП.

Од друга страна, пребарувачите може да се користат за анализирање на активностите на корисниците. Да проучат што бараат, кои информации, стоки или услуги се релевантни за нив сега. Ако, според статистиката на Yandex, е можно да се формира слика за активностите на корисниците на Runet, тогаш според Google, можно е да се формира слика на глобалниот Интернет.

Основниот концепт со кој работи секој пребарувач е индекс за пребарување - одредена структура на податоци која ги рефлектира информациите за документите и локацијата на клучните зборови во нив.

Принципите на работа на многу пребарувачи се многу слични. Главната разлика лежи во пристапот кон рангирањето на страниците (начинот на кој се нарачуваат ресурсите во резултатите од пребарувањето).

Секојдневно огромен број корисници бараат различни информации користејќи пребарувачи.

На пример, популарните барања за пребарување се:

„Апстракт за пишување“:

"Купи":

За да се зголеми брзината на пребарувачот, архитектурата за пребарување се состои од два елементи:

основно пребарување;
метапребарување.

Основно пребарување- програма која пребарува во својот дел од индексот и му ги дава на корисникот сите врски што одговараат на барањето за пребарување.

Метапребарување- програма која при обработка на барање ја одредува локацијата на корисникот и издава готов резултат од пребарувањето, доколку клучниот збор е популарен, но ако претходно немало такви барања, тогаш основното пребарување е поврзано со работата, кој ги обработува врските во базата на податоци користејќи машинско учење и издава нивна листа на корисникот .

Пребарувачот истовремено го анализира корисникот и самото барање за пребарување според следните критериуми:

должина;
дефиниција;
популарност;
конкурентност;
синтакса;
географија.

Постојат следниве типови на барања:

навигација;
информативни;
трансакциски;
мултимедија;
општо;
официјален.

Откако барањето за пребарување ќе се анализира по параметри и ќе се класифицира според еден од наведените типови, пребарувачот ја избира функцијата за рангирање.

Пребарувачите не откриваат информации за рангирањето на барањата за пребарување, така што примерот на сликата погоре е само претпоставки на специјалисти за оптимизација.

Познавањето на видовите барања е неопходно за да се избере стратегија за промоција на веб-страница. На пример, ако корисникот внесе општо барање, тогаш пребарувачот ќе му даде врски од различни типови (комерцијални, мултимедијални, информативни итн.). Ако во исто време ја промовирате вашата комерцијална страница на општо барање и сакате да ја доведете во првите десет резултати од пребарувањето, тогаш со голема веројатност нема да влезете во ТОП, туку само по бројот на места за комерцијални Интернет ресурси, утврдени со формулата за рангирање на пребарувачот. Излегува дека е многу потешко да се промовира страницата на првите редови во резултатите од пребарувањето за општи прашања за пребарување отколку за други типови.

Пребарувачот Yandex користи машинско учење од 2009 година. Матрикс мрежа- специјален алгоритам кој ги рангира сајтовите за одредени прашања.

Основниот принцип на овој алгоритам е како што следува: Одделот за оценување собира примарни информации за да ја оцени ефективноста на формулата за рангирање. Вработените во овој оддел, врз основа на експериментална формула, оценуваат примерок од Интернет ресурси според одредени параметри:

1. Витално- официјалниот Интернет-ресурс на компанијата или не. Ова може да биде веб-локација, страница на социјална мрежа или информации за авторитативни ресурси.

2. Корисно(оценка 5) - страница која ги обезбедува сите потребни информации за барање за пребарување. На пример, корисникот внесува „ткаенина за банери“ во полето за пребарување. За да може алгоритмот да оцени некој ресурс како корисен, тој мора да ги содржи следните информации:

што е ткаенина за банер;
спецификации;
Фотографија;
видови;
Ценовник;
Дополнителни информации.

Примери за барање што влегува во ТОП на резултатите од пребарувањето:

3. Релевантно+(оценка 4) - овој резултат покажува дека информациите на страницата се совпаѓаат со барањето за пребарување.

4. Релевантни-(оценка 3) - страницата не се совпаѓа целосно со барањето за пребарување. На пример, ако барањето „чувари на галаксијата покажува“ пребарувачот прикажува линкови до страници за филмот, но без распоред на прикажување или со застарен распоред.

5. Неважно(оценка 2) - страницата не одговара на барањето за пребарување. На пример: корисникот бара информации за еден хостел, а пребарувачот му дава страница со сосема друга.

За да промовирате страница за општи или информативни прашања за пребарување, треба да ја оптимизирате нејзината содржина на таков начин што пребарувачот доделува „корисна“ оцена за време на рангирањето.

На што се базира принципот на работа на кој било пребарувач?

Пребарувачот традиционално дозволува:

Принципите на пребарувачот се засноваат на интеракцијата на три главни елементи. Прво, се врши пребарување на внесено од корисникот клучни зборови или фрази, потоа во процесот на математичко формирањерезултатите се групирани по врски и сајтови. И, конечно, се користи за читање информации од избрани интернет ресурси робот за пребарувањеили други алатки. Главните роботи за пребарување кои се моментално популарни:

веб робот(друго име е „роботик“) - програма што „шета“ на Интернет. Ги посетува само оние локации каде што наоѓа барем минимално совпаѓање со она што е наведено во барањето за пребарување. Работата започнува со листа на адреси од достапните бази на податоци или индекс.
Индекс.„Робарот“ ги пренесува сите добиени информации до индексот за пребарување. Така, вториот секогаш има ажурирани информации за пронајдените страници и веб-страници. Ако ажурирањата се преземаат на ресурс или страница, тогаш овие информации се ажурираат и во индексот.
Пребарувач (сервер)е специјален софтвер чија главна функција е да ги анализира информациите собрани во индексот за пребарување. Алгоритмот на пребарувачот работи на принципот на поддршка само на конечните резултати од пребарувањето за Интернет ресурси. Самиот пребарувач одлучува како да ги дистрибуира страниците во резултатите од пребарувањето.

Секој пребарувач има за цел да му обезбеди на корисникот најрелевантните и најкорисните сајтови кои одговараат на барањето за пребарување. Во техничка смисла, ова се нарекува „релевантност на одговорот“. На пример, за промоција на онлајн продавница, од големо значење е кореспонденцијата на содржината објавена на неа со потребите на корисниците. Оптимизацијата на веб-страницата ќе ја зголеми нејзината позиција во резултатите од пребарувањето.

Размислете за главните карактеристики на интернет пребарувачите и принципите на нивната работа:

комплетноста- клучна карактеристика на пребарувачот. Се пресметува како сооднос на бројот на документи избрани по барање на корисникот со вкупниот број на документи на Интернет што одговараат на барањето за пребарување. На пример, има 200 страници на Интернет каде што се користи фразата „како да се избере фрижидер“, пребарувачот врати само 40 за ова барање, па затоа комплетноста на пребарувањето е 0,2. Колку е поголем резултатот за комплетноста, толку е поголема веројатноста дека корисникот ќе го најде она што го бара (под претпоставка дека оваа информација е достапна на Интернет).
Точност- втората, но не помалку важна карактеристика на пребарувачот. Ја прикажува кореспонденцијата на пронајдените документи со барањето за пребарување на корисникот. Да речеме, во нашиот пример има 200 страници за барањето „како да се избере фрижидер“, 80 од нив ја содржат фразата „како да се избере фрижидер“, а останатите имаат само посебни зборови (на пример, „како да се постави ергономски кујнски сет и изберете место за фрижидер“). Во овој случај, точноста на пребарувањето ќе биде еднаква на: 80 / 200 = 0,4. Колку е поголема точноста на пребарувањето, толку побрзо корисникот ќе го најде она што му треба и толку помалку различни „спам“ ќе наиде на патот.
Релевантност- Друг важен параметар на пребарувачот. Тоа го одразува времето поминато помеѓу објавувањето на материјалот на Интернет и неговото влегување во индексната база на пребарувачот. На пример, неколку часа по падот на авионот, голем број корисници пребаруваа на Интернет за информации за инцидентот. И покрај тоа што помина малку време од објавувањето на првите пораки на оваа тема, пребарувачите успеаја да ги индексираат и корисниците можеа да ги дознаат деталите за катастрофата.
БрзинаРаботата на пребарувачот директно зависи од неговата отпорност на оптоварувања. На пример, според ООО Rambler Internet Holding, пребарувач обработува околу 60 барања за пребарување во секунда секој ден. Оваа брзина е обезбедена со намаленото време на обработка на секое поединечно корисничко барање.
видливостпрезентирањето резултати го прави пребарувачот лесен за корисниците. Пребарувачот може да најде стотици, па дури и илјадници локации со барање за пребарување. Ако барањето не е сосема точно, тогаш дури и првата страница од резултатите од пребарувањето може да добие страници што не се совпаѓаат со она што корисникот сака да го најде. Како резултат на тоа, едно лице е принудено да филтрира информации во рамките на добиената листа. Одделни елементи на страницата за издавање на пребарувачот ви помагаат да се движите низ резултатите од пребарувањето. Детални објаснувања на страницата со резултати од пребарувањето, на пример, за Yandex, може да се видат на врската http://help.yandex.ru/search/?id=481937.

За да може страницата да биде на првата страница од резултатите од пребарувањето со голема веројатност, потребно е:

Користете сидро врски што ги пренасочуваат корисниците од тематските интернет-страници на веб-страницата на вашата компанија. Ова ја зголемува видливоста на Интернет-ресурсот за пребарувачот, бидејќи не само текстот со врска до страницата, туку и неговата URL-адреса може да влезе во резултатите од пребарувањето.
Користете мета-тагови заедно со добро избрани клучни зборови. Ова ќе го направи резимето на страницата поуникатно и поефективно.
Примени го насловот Наслов.
Правилно составете го семантичкото јадро на страницата. Не е доволно да се дистрибуираат клучни зборови низ содржината на страницата, важно е тоа да се прави внимателно и ненаметливо. Не вклучувајте клучни зборови во секоја реченица. Пребарувачот може да го оцени ова како спам.
Користете го URL-то на страницата (адресата на нејзината локација на Интернет). Правилното пишување на адресата влијае на нејзиното рангирање од пребарувачот.

За принципите на работа на сите пребарувачи со едноставни зборови

Пребарувачот е специјална програма со веб-интерфејс лесен за корисникот, со кој корисниците можат брзо и лесно да ги бараат потребните информации на Интернет. Размислете за принципот на работа на кој било пребарувач без да навлегувате во детали и техничка терминологија.

За да може пребарувачот да му обезбеди на корисникот список со врски до страници што содржат информации за барањето за пребарување, тој мора да ја знае содржината на содржината на сите делови на секоја локација. Како пребарувачот ги собира овие податоци?

Интернетот е посебна мрежа која се состои од поединечни страници кои се поврзуваат една со друга. Пребарувачот не мора да оди на секој од нив, доволно е да имате информации за сајтови и директориуми со највисоки оценки за да се акумулираат податоци за страницата за подоцнежно поставување.

Пребарувачот, всушност, создава индекс во кој на посебен начин се групирани адресите на сите интернет страници. Ако на Интернет се појави нова локација која не е референтна од други ресурси, тогаш ќе биде тешко за пребарувачот да ја најде за да ја индексира и додаде во својата база на податоци.

Откако пребарувачот ќе создаде листа на страници, започнува процесот на индексирање (работата за преземање на сите податоци од нив). Со помош на програми специјално создадени за оваа намена, пребарувачот снима нови информации или ја препишува старата, бришејќи ги неважните информации. Работата на индексирање на сајтови на Интернет е во тек.

Програмите собираат податоци во привремено складирање. Таму тие се акумулираат до одредена количина, по што се стартува процесот на ажурирање, чиј главен принцип е актуелизирање на информациите во главната база на податоци на пребарувачот.

Индексот на пребарувачот содржи огромен број страници. Кога корисникот внесува барање во лентата за пребарување, пребарувачот избира релевантни врски од својата база на податоци. Со други зборови, тој составува листа на сајтови на чии страници се споменуваат клучните зборови наведени од корисникот.

Бидејќи внатрешната база на пребарувачот е огромна, резултатите од пребарувањето може да содржат десетици страници. Како пребарувачот ги рангира? По кој принцип одредува кои страници да му се прикажат на корисникот на прво место? Сите страници се подредени по содржина што одговара на барањето за пребарување. Колку е поголема комплетноста на информациите содржани на страницата, толку поблиску ќе биде страницата до врвот на листата.

Во моментов, пребарувачите користат машинско учење за да ги рангираат страниците во SERPs. Принципот на работа на овој процес може да се разгледа на апстрактен пример.

Да речеме дека треба да тренираме робот да прави разлика помеѓу зрели и незрели јаболка. Програмата за одредување на својствата на овошјето се фокусира на неговите карактеристики:

боја;
големината;
цврстина;
содржина на шеќер;
содржина на киселина.

За анализа, на роботот му се даваат две јаболка: незрели и подготвени. Ги споредува. Потоа ја тренираме машината - покажуваме кои карактеристики на јаболкото се позитивни, кои негативни. Објаснуваме со кои параметри едно овошје може да се класифицира како зрело или не.

Така, имаме алгоритам за анализа на јаболка, со кој роботот може самостојно да ги сортира. Сега можете да дадете не две плодови, туку многу повеќе, машината ќе ги подели на зрели и незрели.

Сличен принцип на работа е вроден во работата на пребарувачот. Има специјалисти кои се занимаваат со подучување на машините за алгоритми за сортирање содржина. Прво, тие самостојно ги анализираат страниците што беа вклучени во резултатите од пребарувањето за пребарувањето, поделувајќи ги на релевантни и ирелевантни. Потоа роботот е обучен да ги подредува страниците.

Релевантноста на страниците е индикатор во форма на фракционен број. Секоја страница е доделена различна вредност на важност. Тогаш сите ресурси се подредени по опаѓачки редослед на овој индикатор. Најрелевантните сајтови се на врвот на резултатите од пребарувањето.

Покрај главниот алгоритам за сортирање, пребарувачите користат разни дополнителни кои исто така можат да влијаат на резултатите од пребарувањето. На пример, тие можат да се користат за филтрирање на бескрупулозните страници кои користат различни „сиви“ шеми за промоција.

Основни принципи на пребарувачите: формули

Секој пребарувач користи свои уникатни алгоритми за пребарување и рангирање страници и сајтови, но принципите на работа за сите пребарувачи се исти.

Процесот на пребарување на информации кои одговараат на барањето на корисникот се состои од неколку фази: собирање податоци на Интернет, индексирање на сајтови, пребарување по клучни зборови и рангирање на резултатите. Ајде внимателно да ја разгледаме секоја фаза.

Собирање на податоци.

Откако страницата е подготвена, треба да бидете сигурни дека роботите на пребарувачот знаат за нејзиниот изглед. Можете да поставите надворешни врски до вашиот интернет ресурс или да користите други методи. Штом роботот ќе влезе на страницата, ќе собира податоци на секоја страница. Овој процес се нарекува индексирање. Собирањето информации од страницата се случува не само по неговото создавање. Роботот периодично ќе го прелистува интернет ресурсот за да ја провери релевантноста на информациите и да ги ажурира достапните податоци.

И за вас и за ботот (роботот), таквата интеракција треба да биде заемно корисна и удобна. Вие, како сопственик на страницата, сте заинтересирани ботот да си ја врши работата брзо, без преоптоварување на серверот, притоа собирајќи податоци од сите страници што е можно поцелосно. Исто така, важно е ботот да стори сé што е можно побрзо за да продолжи кон собирање податоци од следната локација во неговата листа. Од ваша страна, можете да проверите дали страницата работи, нема проблеми со навигацијата, нема 404 страници итн.

Индексирање.

Дури и ако роботот ја посетил вашата страница повеќе од еднаш, тоа не значи дека Интернет-ресурсот веднаш ќе стане видлив за пребарувачот и ќе се појави во резултатите од пребарувањето. По собирањето на податоците, следната фаза од процесот на обработка на страницата е негово индексирање (создавање датотека со превртен индекс за секоја страница). Индексот е потребен за брзо пребарување. Како по правило, се состои од листа на зборови од текстот и информации за нив (позиции во текстот, тежина, итн.).

По завршувањето на индексирањето, страницата и поединечните страници се појавуваат во резултатите од пребарувачот за прашања за пребарување на корисниците. Обично процесот на индексирање не зазема многу време.

Пребарајте информации.

Во оваа фаза, информациите директно се бараат преку барањата за пребарување на корисниците. Прво, пребарувачот го анализира барањето, ја одредува тежината на секој од клучните зборови. Потоа бара совпаѓања по превртени индекси, ги избира сите документи во базата на податоци на пребарувачот што одговараат на барањето за пребарување.

Усогласеноста на документот со барањето се одредува со посебна формула:

сличност(Q,D) = SUM(w qk * w dk),

каде симулација (Q,D)- сличност со барањето Пдокумент Д; w qk- тежина на к-тиот збор во барањето; дд- тежината на к-тиот збор во документот.

Документите кои се најмногу слични на барањето на корисникот се рефлектираат во резултатите од пребарувањето.

Опсегнување.

Во последната фаза, пребарувачот ги групира резултатите така што корисникот прво ги гледа врските до најрелевантните страници. Секој пребарувач има своја уникатна формула за рангирање, која го зема предвид влијанието на следните параметри:

тежина на страницата (индекс на цитати, ранг на страница);
авторитет на домен;
релевантноста на текстот со барањето;
релевантност на текстовите на надворешните врски до барањето;
како и многу други фактори за рангирање.

На пример, разгледајте ја поедноставената формула за рангирање:

Ра(x) = (m * Та(x) + p*Lа(x)) * F(PRa),

Каде Ra(x)- конечна усогласеност на документот абарање x, Ta(x)- релевантност на текстот (шифрата) на документот абарање x, Ла (x)- релевантност на текстот на врски од други документи до документот абарање x, ПР- индикатор за авторитет на страницата а, постојана во однос на X,
F(PRa)е монотоно неопаѓачка функција и F(0) = 1, може да се претпостави дека F(PRa) = (1 + q * PRa), м, стр, qсе некои коефициенти.

Така, местото на страницата во резултатите од пребарувањето е под влијание на различни фактори кои се поврзани и со барањето за пребарување и не се поврзани со него.

Принципот на работа на системите за пронаоѓање информации: критериуми за рангирање

Ако сакате вашиот интернет ресурс да биде во првите три или барем десет од резултатите од пребарувањето, треба да ги знаете принципите на пребарувачите и критериумите за рангирање со цел постојано да ја оптимизирате страницата за нивните барања. Постојат две главни групи на такви критериуми:

Критериуми за пребарувач на текст.

Пребарувачот во овој случај ги рангира страниците врз основа на квалитетот на нивната текстуална содржина. Оптимизацијата на оваа компонента на страницата вклучува работа со семантичкото јадро во фазата на создавање и пополнување на Интернет-ресурсот.

Пребарувачот, кој го обработува барањето на корисникот, ќе ги прикаже најрелевантните резултати на првата страница од изданието. Во процесот на пребарување на документи, пребарувачот ја анализира исправноста на пополнувањето на насловната фраза (наслов), описот на страницата (опис) и присуството на клучно барање во насловите (H1, H2, итн.).

Критериуми за пребарувач без текст.

Пребарувачот работи на анализа на овие критериуми откако страницата ќе биде објавена и индексирана. Главниот принцип на рангирање според критериумите на оваа група не е да се оценува квалитетот на нивната содржина, туку профилот на надворешната врска.

Пребарувачот го анализира бројот на врски до страницата од други ресурси на Интернет, го оценува нивниот кредибилитет, ги разгледува регистрациите во директориумите. Ако направиме аналогија, тогаш пребарувачот, како банка што одлучува да издаде заем на компанија, собира прегледи за тоа од изведувачи, добавувачи и други доверители.

Знаењето како работат пребарувачите ќе ви помогне да креирате и оптимизирате веб-локации кои лесно ќе ги заземат првите позиции во резултатите од пребарувањето и ќе останат таму долго време, бидејќи одговараат на барањата за пребарување на корисниците.

Принципот на работа на пребарувачот Yandex

Работата на таквите големи и добро познати пребарувачи како Google и Yandex се заснова на систем на кластери. Тие ги групираат сите информации во одредени области, врзани за одреден кластер. За индексирање на страници и поединечни страници и собирање податоци од нив, се користат специјални роботи за гасење. Тие се од два вида: главниот робот-робот (дизајниран да собира податоци од редовно ажурирани интернет ресурси) и робот-робот-робот (потребен за ажурирање на листата на индексирани страници и нивните индекси во најкус можен рок). За да може пребарувачот Yandex да собира информации на Интернет што е можно поцелосно, базата за пребарување и програмскиот код редовно се ажурираат:

Базата на податоци со информации за пребарување се ажурира неколку пати месечно, додека корисниците добиваат ажурирани податоци од интернет ресурси кога внесуваат прашања во линијата за пребарување. Овие податоци ги додава главниот роботски скенер.
Ажурирање на програмскиот код или, како што го нарекуваат програмерите, „моторот“ е дизајниран да ги пронајде и елиминира недостатоците на алгоритмите кои ги рангираат страниците во резултатите од пребарувањето. Yandex обично ги предупредува корисниците за претстојните промени.

Главната предност на пребарувачот Yandex, што ја објаснува неговата популарност во Runet, е способноста да се најдат различни форми на зборови, земајќи ги предвид морфолошките карактеристики на рускиот јазик. Геотаргетирањето и формулата за пребарување ви овозможуваат да ја добиете најпрецизната формулација на излезот. Yandex има и свој уникатен алгоритам за рангирање на страници и страници. Неспорната предност на системот е брзината на обработка на барањата за пребарување на корисниците и стабилната работа на серверите.

Како што веќе споменавме, при индексирање на ресурсите, пребарувачот гледа динамични врски, чие присуство може да предизвика ботот да одбие да го одреди индексот на страницата.

Yandex се заснова на анализа на текстуална содржина во документи со различни екстензии (.pdf, .rtf, .doc, .xls, .ppt, итн.).

Во процесот на индексирање на Интернет ресурс, пребарувачот зема податоци од датотеката robots.txt, додека атрибутот Allow и некои од мета-ознаките се поддржани, а мета-ознаките Revisit-After и Keywords не се земаат предвид.

Снипетите (кратки описи на текстуални документи) се состојат од фрази на страницата што ја барате, така што пишувањето ознаки во описот воопшто не е потребно, но тие можат да се постават доколку е потребно.

Според многу програмери, кодот на индексирани документи се одредува автоматски, така што мета-ознаката за кодирање не игра голема улога.

Yandex посветува големо внимание на индикаторот за последната промена на информациите (Последно изменето). Ако серверот престане да ги пренесува овие податоци на пребарувачот, тогаш индексирањето на страницата ќе се врши многу поретко.

Ако некој интернет ресурс има свои „огледала“ (на пример, http://www.site.ru , http://site.ru , https://www.site.ru ), треба да бидете сигурни дека пребарувачот не е индексиран. Ако тоа не е можно, тогаш е можно да се залепат таквите страници со правење соодветни промени во документот robots.txt.

Откако интернет-ресурсот ќе влезе во Yandex.Catalog, пребарувачот ќе го класифицира како локација што бара посебно внимание, што ќе влијае на неговата промоција. Ова исто така ќе ја поедностави постапката за одредување на темата на страницата, што е несомнено плус, бидејќи ќе има значителна надворешна врска.

Програмерите на Yandex не ги откриваат IP адресите на нивните роботи. Сепак, во датотеките за дневници на различни локации, можете да најдете текстуални ознаки кои припаѓаат на роботите на овој пребарувач.

Најважниот од сите роботи за пребарување е главниот. Значењето на страницата за Yandex зависи од резултатите од неговата работа за индексирање на страници.

Секој робот има свој распоред за индексирање на интернет ресурсите. Времето на работа на различни роботи со секоја од страниците во базата на податоци на пребарувачот може да не се совпаѓа.

Покрај главните роботи, пребарувачот има и дополнителни кои редовно ги посетуваат страниците на интернет ресурсите за да ја проверат нивната достапност. На пример, ова се роботите на Yandex.Catalog и рекламната мрежа Yandex.

Пребарувачот Yandex се фокусира на следниве клучни индикатори за надворешна оптимизација:

TCI (Public Subject Citation Index) - го прикажува просечниот број на врски што пристапуваат до страницата. Не влијае директно на резултатите од рангирањето, се користи за одредување позиции во тематската група Yandex.Catalog. Се користи за промоција на интернет ресурси.
WCI (пондериран индекс на цитати) е специјален алгоритам дизајниран да го брои бројот на надворешни врски до страницата. Тоа е од огромно значење кога се рангираат страниците од пребарувач.
Присуство на страницата во Yandex.Catalogue.
Вкупниот број на индексирани страници на страницата.
Фреквенцијата на индексирање на содржината на Интернет-ресурсот.
Присуството и отсуството на врски од страницата, присуството на страницата во филтрите за пребарување.

Индексот на цитати лежи во основата на тематскиот и пондериран индекс на цитати.

Индекс на цитати(CI) - индикатор за бројот на цитати (или упатувања на изворот), помага да се одреди кој од новосоздадените документи се однесуваат на претходните публикации. ИК се користи и за анализа на статии и автори (на пример, во научна средина).

Во Yandex, како и кај другите пребарувачи, индексот на цитати се смета како број на линкови без да се земат предвид врските од локациите од следниве типови: немодерирани директориуми, огласни табли, мрежни конференции, страници за статистика на серверот, врски XSS итн. чиј број може постојано да се зголемува без учество на сопственикот на ресурсот.

Треба да се разјасни дека во каталогот Aport IC се смета како пондериран индекс на цитати.

За да се пресмета овој индекс, се користи графикон за врски: ако локациите се темиња на графикони, а врските до други локации се врски со темиња или рабови на графиконот, тогаш графикот на врски се појавува како дијаграм прикажан на сликата:

Каде што A, B, ..., F се одредени локации во индексот на пребарувачот Yandex, а стрелките ги означуваат насоките на врските меѓу нив (еднонасочни или двонасочни).

Индексот на цитати игра голема улога во рангирањето на документите од пребарувачот, но конечните резултати зависат од повеќе од овој индикатор.

Се верува дека индексот на цитати го карактеризира значењето на публикацијата, но во исто време не ја одразува структурата на врската на страницата, како резултат на тоа, ресурсите со различен број на надворешни врски може да се индексираат на ист начин.

За да се отстрани овој недостаток, се користи пондериран индекс на цитати, кој го карактеризира не само квантитетот, туку и квалитетот на референтните ресурси. Употребата на пребарување на врски и популарноста на статичните врски ја олеснуваат работата на пребарувачите, заштедувајќи ги од разни текстуални спам. Пребарувачот Google користи PageRank, кој е сличен на пондерираниот индекс на цитати.

За да се пресмета VCI, како и други фактори кои влијаат на рангирањето, се користи референтен график. Сопственикот на страницата може самостојно да го процени VCI на неговиот Интернет ресурс со проверка на неговата вредност на PageRank користејќи која било од достапните онлајн услуги. Но, треба да се има на ум дека индексот Yandex содржи само документи на руски јазик и само неколку популарни документи од странски, така што вредноста на Yandex VIC ќе се разликува од рангирањето на страниците на Google.

По дефиниција, интернет пребарувачот е систем за пронаоѓање информации кој ни помага да најдеме информации на World Wide Web. Ова ја олеснува глобалната размена на информации. Но, интернетот е неструктурирана база на податоци. Расте експоненцијално и стана огромно складиште на информации. Пронаоѓањето информации на Интернет е тешка задача. Постои потреба да се има алатка за управување, филтрирање и извлекување на овие информации за океанот. Пребарувачот служи за оваа цел.

Како работи пребарувачот?

Интернет-пребарувачите се мотори кои пребаруваат и преземаат информации на Интернет. Повеќето од нив користат архитектура на индексирање на роботи. Тие зависат од нивните модули на патеката. Роботелите, исто така наречени пајаци, се мали програми кои лазат веб-страници.

Роботечите го посетуваат почетниот сет на URL-адреси. Тие ги ископуваат URL-адресите што се појавуваат на индексирани страници и ги испраќаат овие информации до модулот на роботот. Ролерот одлучува кои страници следно да ги посети и ги дава тие URL-адреси на роботите.

Темите опфатени од различни пребарувачи варираат во зависност од алгоритмите што ги користат. Некои пребарувачи се програмирани да пребаруваат страници за одредена тема, додека други роботи можат да посетат што е можно повеќе места.

Модулот за индексирање извлекува информации од секоја страница што ја посетува и ја додава URL-то во базата на податоци. Ова резултира со огромна табела за пребарување, од листа на URL-адреси што укажуваат на страници со информации. Табелата ги прикажува страниците што биле покриени за време на ползењето.

Модулот за анализа е уште еден важен дел од архитектурата на пребарувачот. Создава корисен индекс. Употребата за индекс може да дозволи пристап до страници со одредена должина или страници што содржат одреден број слики на нив.

За време на процесот на индексирање и индексирање, пребарувачот ги зачувува страниците што ги презема. Тие се привремено зачувани во складиштето на страницата. Пребарувачите одржуваат кеш на страниците што ги посетуваат за да го забрзаат пребарувањето на веќе посетените страници.

Модулот за пребарување на пребарувачот прима барања за пребарување од корисниците во форма на клучни зборови. Модулот за рангирање ги сортира резултатите.

Архитектурата на индексирање на роботи има многу варијации. Тие се менуваат во дистрибуирана архитектура на пребарувачот. Овие архитектури се состојат од колекционери и брокери. Колекционерите собираат информации за индексирање од веб-сервери додека брокерите обезбедуваат механизам за индексирање и интерфејс за пребарување. Брокерите го индексираат ажурирањето врз основа на информациите добиени од собирачите и другите брокери. Тие можат да филтрираат информации. Многу пребарувачи денес користат ваков тип на архитектура.

Пребарувачи и рангирање на страници

Кога креираме барање во пребарувач, резултатите се прикажуваат по одреден редослед. Повеќето од нас имаат тенденција да ги посетуваат страниците со највисоки нарачки и да ги игнорираат последните. Ова е затоа што мислиме дека првите неколку страници се порелевантни за нашето барање. Значи, секој е заинтересиран да ги рангира своите страници во првите десет резултати од пребарувачот.

Зборовите наведени во интерфејсот за пребарување на пребарувачот се клучни зборови што беа побарани од пребарувачите. Тие се листа на страници поврзани со бараните клучни зборови. Во текот на овој процес, пребарувачите ги враќаат оние страници кои имаат чести појавувања на тие клучни зборови. Тие бараат врски помеѓу клучни зборови. Се зема предвид и локацијата на клучните зборови, како и рангирањето на страницата што ги содржи. На клучните зборови што се појавуваат во насловите на страниците или URL-адресите им се дава поголема тежина. Страниците што имаат врски што укажуваат на нив ги прават уште попопуларни. Ако многу други сајтови се поврзуваат со страница, таа се смета за вредна и порелевантна.

Постои алгоритам за рангирање што го користи секој пребарувач. Алгоритмот е компјутеризирана формула дизајнирана да обезбеди соодветни страници по барање на корисникот. Секој пребарувач може да има различен алгоритам за рангирање кој ги анализира страниците во базата на податоци на моторот за да ги одреди соодветните одговори на барањата за пребарување. Пребарувачите индексираат различни информации на различни начини. Ова има ефект дека одредено барање доставено до два различни пребарувачи може да преземе страници во различни нарачки или да поврати различни страници. Популарноста на веб-страницата се детерминанти на релевантноста. Популарноста со кликнување на страницата е уште еден фактор што го одредува нејзиниот ранг. Ова е мерка за тоа колку често се посетува страницата.

Веб-администраторите се обидуваат да ги измамат алгоритмите на пребарувачите со цел да ја зајакнат позицијата на нивната страница во SERPs. Пополнување на страниците на страницата со клучни зборови или користење на мета-тагови за измамување на стратегиите за рангирање на пребарувачите. Но, пребарувачите се доволно паметни! Тие ги подобруваат нивните алгоритми, така што махинациите на веб-администраторите не влијаат на резултатите од пребарувањето.

Треба да разберете дека дури и страниците по првите неколку во списокот може да ги содржат токму информациите што ги баравте. Но, бидете сигурни дека добрите пребарувачи секогаш ќе ви носат многу релевантни страници во врвен ред!

Најпопуларната веб-услуга денес е пребарувачот. Сè е разбирливо овде, бидејќи оние времиња кога претставниците на првите корисници на Интернет можеа да набљудуваат нови ставки на мрежата одамна поминаа.

Толку многу информации се појавуваат и се акумулираат што на човекот му стана многу тешко да ја најде токму онаа што ќе му треба. Замислете како би било да пребарувате на Интернет ако обичен корисник треба да бара информации што не ги разбирам каде. Не разбирам точно каде, бидејќи нема да најдете многу информации со рачно пребарување.

Пребарувач, што е тоа?

Добро е ако корисникот веќе ги знае сајтовите кои можеби ги имаат потребните информации, но што друго да прави? Со цел да се олесни животот на човекот во пронаоѓањето на потребните информации на Интернет, беа измислени пребарувачи или едноставно пребарувачи. Пребарувачот врши една многу важна функција, без која Интернетот не би бил ист како што сме навикнати да го гледаме - ова е пребарување на информации на мрежата.

Систем за пребарување- ова е специјална веб-страница или, со други зборови, локација која на корисниците им обезбедува хиперврски до страници, страници кои одговараат на дадено барање за пребарување, на нивно барање.

Да бидам малку попрецизен, тоа е пребарувањето на информации на Интернет, кое се врши благодарение на софтверски и хардверски функционален сет и веб-интерфејс за интеракција со корисниците.

За човечка интеракција со пребарувачот, создаден е веб-интерфејс, односно видлива и разбирлива обвивка. Овој пристап на развивачите на пребарувачите го олеснува пребарувањето за многу луѓе. Како по правило, интернетот се пребарува со помош на пребарувачи, но има и пребарувачи за FTP сервери, одредени видови стоки на World Wide Web или информации за вести или други дестинации за пребарување.

Пребарувањето може да се изврши не само на текстуалната содржина на страниците, туку и на други видови информации што може да ги бара лицето: слики, видеа, звучни датотеки итн.

Како се врши пребарувањето од пребарувач?

Самото пребарување на Интернет, исто како и прелистувањето на веб-страниците, е можно со помош на интернет прелистувач - прелистувач. Само откако корисникот ќе го постави своето барање во лентата за пребарување, самото пребарување се врши директно.

Секој пребарувач содржи софтверски дел на кој се базира целиот пребарувач, тој се нарекува пребарувач - ова е софтверски пакет кој обезбедува можност за пребарување на информации. Откако ќе контактирате со пребарувач, ќе формирате барање за пребарување од страна на лице и ќе го внесете во лентата за пребарување, пребарувачот генерира страница со листа на резултати од пребарувањето, најрелевантните, според пребарувачот, се наоѓаат погоре.

Релевантност за пребарување - пребарување на најрелевантните материјали на барање на корисникот и поставување хиперврски на нив на страницата со резултати од пребарувањето со попрецизни резултати над другите. Самата дистрибуција на резултатите се нарекува рангирање на сајтови.

Значи, како пребарувачот ги подготвува своите материјали за издавање и како пребарувачот бара информации? Собирањето информации на мрежата го олеснува робот уникатен за секој пребарувач или на друг начин бот, кој исто така има голем број други синоними како робот или пајак, а самиот систем за пребарување може да се подели во три фази :

Првата фаза од работата на пребарувачот може да се припише на скенирање сајтови на глобалната мрежа и собирање копии од веб-страници на нивните сопствени сервери. Ова формира огромна количина на информации кои сè уште не се обработени и не се соодветни за резултатите од пребарувањето.

Втората фаза од работата на пребарувачот се сведува на ставање ред на информациите добиени порано, во првата фаза, од страниците. Се врши такво сортирање, кое за најкратко време ќе го фаворизира многу висококвалитетното пребарување што корисниците всушност го очекуваат од пребарувачот. Фазата се нарекува индексирање, што значи дека страниците се веќе подготвени за издавање, а моменталната база на податоци ќе се смета за индекс.

Тоа е третата фаза што ги одредува резултатите од пребарувањето, по добивањето барање од вашиот клиент, врз основа на клучните зборови или во близина на клучните зборови наведени во барањето. Ова придонесува за изборот на најрелевантните информации за барањето и неговото последователно издавање. Бидејќи има многу информации, пребарувачот врши рангирање во согласност со неговите алгоритми.
Најдобар пребарувач е оној што може да го обезбеди материјалот што најточно одговара на барањето на корисникот. Но, дури и овде може да има резултати на кои влијаеле луѓе заинтересирани да ја промовираат својата страница, таквите страници, иако не секогаш, често се појавуваат во резултатите од пребарувањето, но не долго.

Иако светските лидери веќе се идентификувани во многу региони, пребарувачите продолжуваат да го развиваат своето квалитетно пребарување. Колку подобро пребарување можат да обезбедат, толку повеќе луѓе ќе го користат.

Како да го користите пребарувачот?

Што е пребарувач и како функционира веќе е јасно, но како правилно да се користи? Повеќето сајтови секогаш имаат лента за пребарување, а до неа е копче Најди или Барај. Во лентата за пребарување се внесува барање, по што треба да го притиснете копчето за пребарување или, како што често се случува, притиснете го копчето Enter на тастатурата и за неколку секунди ќе го добиете резултатот од барањето во форма на листа.

Но, добивањето точен одговор на барањето за пребарување не е секогаш можно од прв пат. Со цел пребарувањето за она што го сакате да не стане болно, мора правилно да составите барање за пребарување и да ги следите препораките опишани подолу.

Правилно составете го барањето за пребарување

Следниве се неколку совети за користење на пребарувачот. Следењето на некои трикови и правила при пребарување на информации во пребарувачот ќе овозможи многу побрзо да го добиете посакуваниот резултат. Следете ги овие упатства:

Правилното пишување на зборовите обезбедува максимален број на совпаѓања со саканиот информативен објект (Иако современите пребарувачи веќе научија како да ги поправаат правописните грешки, овој совет не треба да се занемари).
Со користење на синоними во барањето, може да се покрие поширок опсег на пребарување.
Понекогаш менувањето збор во текстот на барањето може да донесе поголем резултат, затоа преформулирајте го барањето.
Донесете специфичност на барањето, користете точни појави на фрази што треба да ја одредат главната суштина на пребарувањето.
Експериментирајте со клучни зборови. Употребата на клучни зборови и фрази може да помогне да се идентификува главната поента, а пребарувачот ќе врати порелевантен резултат.

Значи, што е пребарувач - ова не е ништо повеќе од можност да најдете информации од интерес и обично да ги користите целосно бесплатно, да научите нешто, да разберете нешто или да го извлечете вистинскиот заклучок за себе. Многумина повеќе не го замислуваат својот живот без гласовно пребарување, во кое не треба да пишувате текст, само треба да го кажете вашето барање, а уредот за внесување овде е микрофон. Сето ова сведочи за постојаниот развој на технологиите за пребарување на Интернет и потребата од нив.

Пребарувачот е база на податоци со конкретни информации на Интернет. Многу корисници веруваат дека штом внесат барање во пребарувач, целиот Интернет веднаш се индексира, но тоа воопшто не е случај. Скенирањето на Интернет се случува постојано, многу програми, податоци за сајтови се внесуваат во база на податоци, каде што, според одредени критериуми, сите страници и сите нивни страници се дистрибуираат во различни списоци и бази на податоци. Тоа е, тоа е еден вид датотека со податоци, а пребарувањето не се одвива на Интернет, туку на оваа датотека.

Google е најпопуларниот пребарувач во светот.

Покрај пребарувачот, Google нуди многу дополнителни услуги, софтвер и хардвер, вклучувајќи ја услугата за пошта, прелистувачот Google Chrome, најголемата видео библиотека на YouTube и многу други проекти. Google самоуверено купува многу проекти кои носат голем профит. Повеќето од услугите не се наменети за директен корисник, туку за заработка на Интернет и се интегрирани со фокус на интересите на европските и американските корисници.

Пошта е пребарувач популарен главно поради услугата за пошта.

Има многу дополнителни услуги, чиј клуч е mail Mail, во моментот Mail ја поседува социјалната мрежа Однокласници, сопствената мрежа My World, услугата Money-mail, многу онлајн игри, три речиси идентични прелистувачи со различни имиња. Сите апликации и услуги имаат многу рекламна содржина. Социјалната мрежа „ВКонаткте“ ги блокира директните транзиции кон услугите за пошта, расправајќи се со голем број вируси.

Википедија.

Википедија е референтен систем што може да се пребарува.

Непрофитен пребарувач кој постои на приватни донации, затоа не ги пополнува страниците со рекламирање. Повеќејазичен проект чија цел е да создаде целосна референтна енциклопедија на сите јазици во светот. Нема конкретни автори, го пополнуваат и управуваат волонтери од целиот свет. Секој корисник може и да пишува и уредува статија.

Официјалната страница е www.wikipedia.org.

Youtube е најголемата видео библиотека.

Видео хостинг со елементи на социјална мрежа, каде што секој корисник може да додаде видео. Од моментот кога беа купени од Google Ink, не е потребна посебна регистрација за YouTube, доволно е да се регистрирате во услугата за пошта на Google.

Официјалната страница е youtube.com.

Yahoo! е вториот најважен пребарувач во светот.

Постојат дополнителни услуги, од кои најпозната е Yahoo mail. Како дел од подобрувањето на квалитетот на пребарувачот, Yahoo пренесува податоци за корисниците и нивните прашања до Microsoft. Од овие податоци се формира идеја за интересите на корисниците, како и пазар за рекламна содржина. Пребарувачот Yahoo, како и, се занимава со апсорпција на други компании, на пример, Yahoo е сопственик на услугата за пребарување Altavista и страницата за е-трговија Alibaba.

Официјалната страница е www.yahoo.com.

WDL е дигитална библиотека.

Библиотеката собира книги од културна вредност во дигитална форма. Главната цел е да се зголеми нивото на културна содржина на Интернет. Пристапот до библиотеката е бесплатен.

Официјалната страница е www.wdl.org/ru/.

Bing е пребарувач од Microsoft.

Официјалната веб-страница е www.baidu.com.

Пребарувачи во Русија

Rambler е „проамерикански“ пребарувач.

Првично беше создаден како медиумски интернет портал. Како и многу други пребарувачи, има услуги за пребарување слики, видео датотеки, мапи, временска прогноза, дел за вести и многу повеќе. Издавачите нудат и бесплатен прелистувач Rambler-Nicrome.

Официјалната страница е www.rambler.ru.

Нигма е интелигентен пребарувач.

Поудобен пребарувач поради присуството на многу филтри и поставки. Интерфејсот ви овозможува да вклучите или исклучите предложени слични вредности во пребарувањето за да добиете подобри резултати. Исто така, кога добивате резултат од пребарувањето, ви овозможува да користите информации од други големи пребарувачи.

Официјалната страница е www.nigma.ru.

Апорт - онлајн каталог на стоки.

Во минатото, пребарувачот, но откако развојот на настаните и иновациите беа прекинати, брзо ја изгуби земјата и . Во моментов, Aport е платформа за тргување, каде се претставени стоки од повеќе од 1500 компании.

Официјалната страница е www.aport.ru.

Спутник е национален пребарувач и интернет портал.

Создаден од Ростелеком. Во моментов е во фаза на тестирање.

Официјалната веб-страница е www.sputnik.ru.

Метабот е пребарувач во развој.

Задачата на Метабот е да создаде пребарувач за сите други пребарувачи, создавајќи позиции за издавање резултати, земајќи ги предвид податоците од целата листа на пребарувачи. Тоа е, тоа е пребарувач за пребарувачи.

Официјалната страница е www.metabot.ru.

Пребарувачот е суспендиран.

Официјалната страница е www.turtle.ru.

КМ - мултипортал.

Првично, страницата беше мулти-портал со последователно воведување на пребарувач. Пребарувањето може да се изврши и во рамките на страницата и на сите следени сајтови на Runet.

Официјалната страница е www.km.ru.

Гого - не работи, се пренасочува на пребарувач.

Официјалната страница е www.gogo.ru.

Рускиот мултипортал, кој не е многу популарен, треба да се подобри. Пребарувачот вклучува вести, ТВ, игри, мапа.

Официјалната страница е www.zoneru.org.

Пребарувачот не работи, програмерите предлагаат користење на пребарувачот.