Какво е търсачка и как работи. Как работят търсачките Какво е търсачка

Търсачка или просто „търсачка“ е тази, която търси интернет страници в съответствие със заявката на потребителя. Най-известната търсачка в света е Google, най-популярната в Русия е Yandex, а една от най-старите търсачки е Yahoo. В архитектурата на търсачката може да се разграничи търсачка- ядрото на системата, представено от набор от софтуерни модули; база данни или индекс, който съхранява информация за всички интернет ресурси, известни на търсачката; и набор от сайтове, които са входни точкипотребители към системата (www.google.com, www.yandex.ru, ru.yahoo.com и др.). Всичко това съответства на класическата тристепенна архитектура на информационните системи: има потребителски интерфейс, бизнес логика, която в този случай е представена от изпълнението на алгоритми за търсене и база данни.

Специфика на търсенето в Интернет

На пръв поглед търсенето в Интернет не се различава много от обикновеното извличане на информация, например от обработката в база данни или от задачата за намиране на файл в . Разработчиците на първите търсачки в интернет също мислеха така, но с течение на времето разбраха, че грешат ...

Първата разлика между търсенето в Интернет и обикновеното е, че алгоритъмът за търсене на една и съща база данни предполага, че нейната структура е предварително известна на търсачката и автора на заявката. В интернет, по обясними причини, това не е така. Интернет страниците не образуват структура на директория, а мрежа, която също засяга алгоритмите за търсене, а форматът на данните, публикувани в интернет ресурси, не се контролира от никого.

Втората разлика, като едно от следствията на първата, е, че заявката се представя не като набор от стойности на параметри (критерии за търсене), а като текст, написан от човек на неговия естествен език. По този начин, преди да започнете да търсите, все пак трябва да разберете какво точно иска заявеният. Отбелязвам, че не е за разбиране от друг, а от компютър.

Третата разлика е по-малко очевидна, но не по-малко фундаментална: в каталог или база данни всички елементи са равни. В интернет има конкуренция и следователно разделяне на по-„надеждни доставчици на информация“ и източници, близки по статус до „информационен боклук“. Така хората класифицират ресурсите, към тях принадлежат и търсачките.

И в заключение трябва да се добави, че областта на търсене е милиарди страници, няколко килобайта или повече всяка. Всеки ден се добавят около десет милиона страници и същият брой се актуализира. Всичко това е представено в различни цифрови формати. За съжаление, дори съвременните технологии и ресурси, с които разполагат лидерите на пазара на услуги за търсене в Интернет, не им позволяват да обработват цялото това разнообразие „в движение“ и напълно.

Какво е търсачка

На първо място, важно е да осъзнаем още една и вероятно най-съществена разлика между работата на търсачката в Интернет и работата на всяка друга информационна система, която търси в различни директории и бази данни. Интернет търсачката не търси информация сред това, което е в интернет в момента на получаване на заявката, а се опитва да формира отговор въз основа на собственото си хранилище за информация - база данни, наречена индекс, където съхранява досие на всичко известно към него и периодично го актуализира. С други думи, търсачката не работи с оригинала, а с проекция на диапазона от валидни търсени стойности. Всички най-нови промени в Интернет могат да бъдат отразени в резултатите от търсенето само след като съответните страници са индексиран- добавя се към индекса на търсачката. И така, системата за търсене в първото приближение се състои от търсачка, база данни или индекс (индекс) и входни точки към системата.

Сега накратко за това от какво се състои търсачката:

Паяк или паяк (паяк).Приложение, което изтегля страници от интернет ресурси. Паякът не „пълзи“ никъде - той само изисква съдържанието на страниците по същия начин, както прави обикновен интернет браузър, като изпраща HTTP заявка до сървъра и получава отговор от него. След като съдържанието на страницата бъде изтеглено, то се изпраща до индексатора и робота, които са описани по-долу.

Индексатор (индексатор).Индексаторът извършва първоначален анализ на съдържанието на изтеглената страница, подчертава основните части (заглавие на страницата, описание, връзки, заглавия и т.н.) и разлага всичко това на секции от базата данни за търсене - поставя го в индекса на търсачката. Този процес се нарича индексиране на интернет ресурси, откъдето идва и името на самата подсистема. Въз основа на резултатите от първоначалния анализ, индексаторът може също да реши, че страницата изобщо не е „достойна“ да бъде индексирана. Причините за такова решение може да са различни: страницата няма име, е точно копие на друга страница, която вече е в индекса, или съдържа връзки към ресурси, забранени от закона.

Пълзещ (пълзящ).Това „животно“ е призовано да „пълзи“ по връзките, налични на страницата, изтеглена от паяка. Роботът анализира пътищата, водещи от текущата страница към други раздели на сайта или към страници на външни интернет ресурси, и определя по-нататъшния ред, в който паякът ще заобиколи нишките на световната мрежа. Роботът е този, който намира нови страници за търсачката и ги предава на паяка. Работата на робота е изградена на базата на алгоритми за търсене на графики в ширина и дълбочина.

Подсистема за обработка и издаване на резултати (Search Engine and Results Engine).Най-важната част от всяка търсачка. Алгоритмите за работа на тази подсистема на компанията се пазят строго поверителни от разработчиците, тъй като са търговска тайна. Именно тази част от търсачката е отговорна за адекватността на отговора на търсачката на заявката на потребителя. Тук има два основни компонента:
- подсистема за класиране. Ранжиране- това са страниците на интернет сайтове в съответствие с тяхната релевантност към конкретно запитване. Уместност на страницата- това от своя страна е степента на съответствие на съдържанието на страницата със смисъла на заявката, а търсачката определя тази стойност независимо, въз основа на огромен брой параметри. Класирането е най-мистериозната и противоречива част от "изкуствения интелект" на търсачката. Класирането на една страница, освен от нейната структура и съдържание (content), се влияе и от: броя и качеството на връзките, водещи към тази страница от други сайтове; възрастта на домейна на самия сайт; естеството на поведението на потребителите, които разглеждат страницата и много други фактори.
- Подсистема за издаване на резултати.Задачите на тази подсистема включват тълкуване на потребителска заявка, нейното превеждане на езика на структурирани индексни заявки и формиране на страници с резултати от търсенето. В допълнение към анализирането на самия текст на заявката, търсачката може също да вземе предвид:
  - Контекст на заявката, образувана въз основа на значението на заявки, направени преди това от потребителя. Например, ако потребител често посещава сайтове по автомобилни теми, тогава в отговор на заявка с думата „Волга“ или „Ока“, той вероятно иска да получи информация за автомобили от тези марки, а не за това къде руснаците на същото име започват течението си и където текат реки. Нарича се персонализирано търсене, когато изходът за една и съща заявка за различни потребители е значително различен.
  - Потребителски предпочитания, за които тя (търсачката) може да „познае“, анализиране на избрани от потребителя връзкина страниците с резултати от търсенето. Това е друг начин за коригиране на контекста на заявката: потребителят чрез своите действия по някакъв начин казва на машината какво точно иска да намери. По правило търсачките се опитват да добавят страници в резултатите от търсенето, които са подходящи за заявката, но са свързани с доста различни сфери на живота. Да приемем, че даден потребител се интересува от филми и затова често избира връзки към страници с анонси за филми, дори ако тези страници не са съвсем подходящи за първоначалното запитване. При формиране на отговор на следващата му заявка системата може да даде предимство на страници с описания на филми, в заглавието на които има думи от текста на заявката.
  - Регион, което е много важно при обработка на търговски запитвания, свързани със закупуване на стоки и услуги от местни доставчици. Ако се интересувате от разпродажби и отстъпки и се намирате в Москва, тогава най-вероятно изобщо не се интересувате какви промоции по тази тема се провеждат в Санкт Петербург, ако не сте посочили изрично това в текста на заявката. На първо място, информацията за продажбите в Москва трябва да се появи в резултатите от търсенето. По този начин съвременните търсачки разделят заявките на геозависимии геонезависим. Най-вероятно, ако търсачката реши, че вашата заявка е геозависима, тогава тя автоматично добавя регионален атрибут към нея, който се опитва да определи от информацията за вашия интернет доставчик.
  - време. Търсачките понякога трябва да анализират кога са се случили събитията, описани на страницата. В крайна сметка информацията постоянно остарява и потребителят се нуждае преди всичко от връзки към последните новини, текущи прогнози и съобщения за събития, които все още не са приключили или трябва да се появят в бъдеще. Разбирането, че уместността на дадена страница зависи от времето, и сравняването й с момента, в който заявката е била изпълнена, също изисква доста интелигентност от търсачката.
  След това търсачката търси най-близкия по смисъл ключова заявкав индекса и генерира резултати чрез сортиране на връзките в низходящ ред според тяхната уместност. Всяка ключова дума в индекса има отделно класиране на страници, които са подходящи за нея. Не за всяка комбинация от букви и цифри системата стартира нова заявка за ключ, но прави това въз основа на анализ на честотата на определени потребителски заявки. Търсачката може също така да смесва класиране от различни ключови думи в резултатите от търсенето, ако прецени, че потребителят има нужда от това.

Общи принципи на търсачката

Трябва да разберете, че услугите за търсене в Интернет са много, много печеливш бизнес. Не е необходимо да навлизате в подробности за това как живеят компании като Google и Yandex, тъй като по-голямата част от техните печалби са приходи от контекстна реклама. И тъй като търсенето в интернет е изключително печеливш бизнес, то конкуренцията между такива компании е много сериозна. Какво определя конкурентоспособността на пазара за търсене в Интернет? Отговорът е качеството на резултатите от търсачката. Логично е, че колкото по-високо е, толкова повече нови потребители има системата и толкова по-ценна е контекстната реклама, поставена на страниците на този брой. Разработчиците на търсачки полагат много усилия, за да „почистят“ резултатите от търсенето си от всякакъв вид информационен боклук, популярно наричан спам (спам). Повече подробности за това как се прави това ще бъдат разгледани в отделна статия, но тук ще дам общите принципи на поведение на търсачката, формулирани под формата на изводи от всичко по-горе.

Търсачката, под формата на нейните паяци и роботи, непрекъснато сканира интернет за нови и актуализира съществуващи страници, тъй като неуместната информация се оценява по-ниско.

Търсачката периодично актуализира класирането на ресурсите според тяхната релевантност към ключовите заявки, тъй като в индекса постоянно се появяват нови страници. Този процес се нарича актуализиране на резултатите от търсенето.

Поради огромните обеми информация, публикувана в световната мрежа и ограничените ресурси на самата търсачка, търсачката винаги се опитва да изтегли само най-необходимото (по нейно мнение). В своя арсенал има всякакви филтри, които отрязват много ненужни още на етапа на индексиране или изхвърлят спам от индекса въз основа на резултатите от актуализирането на резултатите от търсенето.

Съвременните търсачки, когато анализират заявка, се опитват да вземат предвид не само текста на самата заявка, но и нейната среда: контекста и предпочитанията на потребителя, които бяха споменати по-рано, както и времето на заявката, регион и много повече.

Релевантността на дадена страница се влияе не само от нейните вътрешни параметри (структура, съдържание), но и от външни параметри, като връзки към страницата от други сайтове и поведението на потребителите, когато я преглеждат.

Работата на търсачките непрекъснато се подобрява. Идеалната работа на търсачката (за човек) е възможна само ако всички решения относно индексирането и класирането се вземат от комисия, състояща се от голям брой специалисти от всички области и области на човешката дейност. Тъй като това е нереалистично, такава комисия се заменя с експертни системи, евристични алгоритми за търсене и други елементи на изкуствения интелект. Вероятно работата на всички тези подсистеми също би могла да даде по-адекватни резултати, ако беше възможно да се обработват абсолютно всички данни, които са публично достъпни в Интернет, но и това е практически невъзможно. Несъвършеният изкуствен интелект и ограничените ресурси са двете основни причини, поради които резултатите от търсенето не винаги харесват потребителите, но всичко това се лекува с времето. Днес, по мое мнение, работата на най-известните и големи търсачки е напълно съобразена с нуждите и очакванията на техните потребители.

Генератор на продажби

Време за четене: 13 минути

Ние ще ви изпратим материала:

От тази статия ще научите:

Как са работили първите търсачки?
Как работят съвременните търсачки
На какви принципи се основава работата на всяка търсачка?
Какви формули използват търсачките в своята работа
Как се класират сайтовете
Какви са принципите на търсачката Yandex

Преди да се заемете със SEO-промоцията на сайта, важно е да проучите принципите на работа на търсачките, за да постигнете желаните резултати в крайна сметка. Тези знания ще бъдат полезни за разработване на индивидуална стратегия за оптимизиране на интернет ресурс за определени ключови думи и ще помогнат за извеждането му на върха на резултатите от търсенето.

Какви принципи са в основата на работата на първите търсачки

В ранните дни на интернет само малък брой потребители можеха да се свържат с него. Количеството налична информация също беше ограничено. По това време интернет се използва главно от служители на изследователски организации. Търсенето на информация в мрежата не беше толкова популярно, колкото днес.

Първият опит за организиране на достъп до електронни данни през Интернет беше направен от търсачката Yahoo!, която се появи през 1994 г. Разработчиците на компанията са създали отворен каталог от сайтове, връзките към които са групирани по подходящи теми. С нарастването на броя на ресурсите в базата данни се наложи добавянето на опция за търсене в каталога. Това все още не беше търсачка в познатата ни форма, защото търсеше информация във вътрешната база данни от сайтове, а не във всички съществуващи интернет ресурси.

Подобни директории с връзки са били много популярни в миналото, но днес са загубили своята актуалност, тъй като броят на сайтовете непрекъснато се увеличава. Например, най-голямата от съвременните директории в Интернет, DMOZ (друго име е Open Directory Project), включва около 5 милиона сайта, докато базата данни на търсачката Google съдържа повече от 8 милиарда връзки.

През 1994 г. се появява първата истинска търсачка WebCrawler.

През 1995 г. бяха създадени още две търсачки: Lycos и AltaVista. Най-новата търсачка отдавна заема водеща позиция в областта на онлайн извличането на информация.

През 1997 г. студентите от Станфордския университет Сергей Брин и Лари Пейдж разработиха търсачката Google, която се превърна в най-популярната търсачка в света.

Също през 1997 г. търсачката Yandex, която е популярна в Runet, започна работа.

Как работят търсачките днес?

Ако не сте програмист и професията ви няма нищо общо с ИТ, защо ви е да разбирате как работят търсачките? Факт е, че така нареченият органичен трафик идва на уебсайта на компанията чрез търсачките - това са потребители, които сами са намерили вашия интернет ресурс, използвайки ключови думи в Yandex или Google. Органичният трафик е вкусно парче от пая (целевата аудитория). Колкото по-високо е нивото му, толкова по-голяма е конверсията и продажбите на сайта.

За да могат потребителите лесно да намират вашия интернет ресурс, важно е да го напълните с правилното съдържание. Търсачките, в зависимост от качеството на съдържанието, класират сайтовете, което се отразява на мястото им в резултатите от търсенето. Оказва се, че знаейки как търсачките индексират интернет ресурсите, можете да оптимизирате тяхното съдържание и да ги популяризирате в ТОП.

От друга страна, търсачките могат да се използват за анализ на действията на потребителите. Да проучат какво търсят, каква информация, стоки или услуги са подходящи за тях в момента. Ако според статистиката на Yandex е възможно да се формира картина на действията на потребителите на Runet, тогава според Google е възможно да се формира картина на глобалния интернет.

Основната концепция, с която работи всяка търсачка, е индекс за търсене - определена структура от данни, която отразява информация за документите и местоположението на ключовите думи в тях.

Принципите на работа на много търсачки са много сходни. Основната разлика е в подхода към класирането на сайта (начинът, по който ресурсите са подредени в резултатите от търсенето).

Всеки ден огромен брой потребители търсят различна информация с помощта на търсачките.

Например популярните заявки за търсене са:

„Резюме за писане“:

"Купува":

За да се увеличи скоростта на търсачката, архитектурата за търсене се състои от два елемента:

основно търсене;
метатърсене.

Основно търсене- програма, която търси в своята част от индекса и дава на потребителя всички връзки, които отговарят на заявката за търсене.

Метатърсене- програма, която при обработка на заявка определя местоположението на потребителя и издава готов резултат от търсенето, ако ключовата дума е популярна, но ако преди това не е имало такива заявки, тогава основното търсене е свързано с работата, който обработва връзките в базата данни с помощта на машинно обучение и издава списък с тях на потребителя.

Търсачката едновременно анализира потребителя и самата заявка за търсене по следните критерии:

дължина;
определение;
популярност;
конкурентоспособност;
синтаксис;
география.

Има следните видове заявки:

навигация;
информационни;
транзакционен;
мултимедия;
общ;
официален.

След като заявката за търсене бъде анализирана по параметри и класифицирана според един от изброените типове, търсачката избира функцията за класиране.

Търсачките не разкриват информация за класирането на заявките за търсене, така че примерът на фигурата по-горе е само предположения на специалисти по SEO.

Познаването на видовете заявки е необходимо за избор на стратегия за промоция на уебсайт. Например, ако потребител въведе обща заявка, тогава търсачката ще му даде различни видове връзки (търговски, мултимедийни, информационни и др.). Ако в същото време популяризирате търговския си сайт по обща заявка и искате да го поставите в първите десет на резултатите от търсенето, тогава с голяма вероятност няма да влезете в ТОП, а само в броя на местата за реклама Интернет ресурси, определени по формулата за класиране в търсачката. Оказва се, че е много по-трудно да се популяризира сайт на първите редове в резултатите от търсенето за общи заявки за търсене, отколкото за други видове.

Търсачката Yandex използва машинно обучение от 2009 г. Matrixnet- специален алгоритъм, който класира сайтовете по определени заявки.

Основният принцип на този алгоритъм е следният: Отделът за оценка събира първична информация, за да оцени ефективността на формулата за класиране. Служителите на този отдел, въз основа на експериментална формула, оценяват извадка от интернет ресурси според определени параметри:

1. Жизнен- официалният интернет ресурс на компанията или не. Това може да бъде уебсайт, страница в социална мрежа или информация за авторитетни ресурси.

2. Полезно(резултат 5) - сайт, който предоставя цялата необходима информация за заявка за търсене. Например, потребителят въвежда „плат за банери“ в полето за търсене. За да може алгоритъмът да оцени даден ресурс като полезен, той трябва да съдържа следната информация:

какво е банерна тъкан;
спецификации;
Снимка;
видове;
ценова листа;
Допълнителна информация.

Примери за заявка, която попада в ТОП на резултатите от търсенето:

3. Подходящи+(резултат 4) - този резултат показва, че информацията в сайта отговаря на заявката за търсене.

4. Съответни-(резултат 3) - сайтът не отговаря напълно на заявката за търсене. Например, ако заявката "пазители на галактиката показва", търсачката показва връзки към страници за филма, но без график за показване или с остарял график.

5. Без значение(резултат 2) - сайтът не отговаря на заявката за търсене. Например: потребител търси информация за един хостел, а търсачката му дава страница на съвсем различен.

За да популяризирате сайт за общи или информационни заявки за търсене, трябва да оптимизирате съдържанието му по такъв начин, че търсачката да присвоява „полезен“ рейтинг по време на класирането.

На какъв принцип работи всяка търсачка?

Търсачката традиционно позволява:

Принципите на търсачката се основават на взаимодействието на три основни елемента. Първо се извършва търсене на въведени от потребителя ключови думи или фрази, след това в процесът на математическо формиранерезултатите са групирани по връзки и сайтове. И накрая, за четене на информация от избрани интернет ресурси се използва робот за търсенеили други инструменти. Основните роботи за търсене, които са популярни в момента:

уеб робот(друго име е "crawler") - програма, която "ходи" в мрежата. Той посещава само тези сайтове, където намира поне минимално съответствие с това, което е посочено в заявката за търсене. Работата започва със списък с адреси от налични бази данни или индекс.
Индекс.„Работът“ предава цялата получена информация към индекса за търсене. Така последният винаги разполага с актуална информация за намерените сайтове и уеб страници. Ако се изтеглят актуализации на ресурс или страница, тази информация също се актуализира в индекса.
Търсачка (сървър)е специален софтуер, чиято основна функция е да анализира информацията, събрана в индекса за търсене. Алгоритъмът на търсачката работи на принципа да поддържа само крайните резултати от търсенето на интернет ресурси. Търсачката сама решава как да разпредели страниците в резултатите от търсенето.

Всяка търсачка има за цел да предостави на потребителя най-подходящите и полезни сайтове, които отговарят на заявката за търсене. От техническа гледна точка това се нарича „релевантност на отговора“. Например, за популяризирането на онлайн магазин, съответствието на публикуваното в него съдържание с нуждите на потребителите е от голямо значение. Оптимизацията на уебсайта ще увеличи позицията му в резултатите от търсенето.

Помислете за основните характеристики на интернет търсачките и принципите на тяхната работа:

завършеност- ключова характеристика на търсачката. Изчислява се като съотношението на броя документи, избрани по искане на потребителя, към общия брой документи в мрежата, които отговарят на заявката за търсене. Например, в интернет има 200 страници, където се използва фразата „как да изберем хладилник“, търсачката върна само 40 за тази заявка, следователно пълнотата на търсенето е 0,2. Колкото по-висок е резултатът за пълнота, толкова по-вероятно е потребителят да намери това, което търси (ако приемем, че тази информация е достъпна в мрежата).
точност- втората, но не по-малко важна характеристика на търсачката. Показва съответствието на намерените документи със заявката за търсене на потребителя. Да кажем, че в нашия пример има 200 страници за заявката „как да изберем хладилник“, 80 от тях съдържат фразата „как да изберем хладилник“, а останалите просто имат отделни думи (например „как да ергономично поставим кухненски комплект и изберете място за хладилник" ). В този случай точността на търсенето ще бъде равна на: 80 / 200 = 0,4. Колкото по-висока е точността на търсенето, толкова по-бързо потребителят ще намери това, от което се нуждае, и толкова по-малко различен „спам“ ще срещне по пътя си.
Уместност- Друг важен параметър на търсачката. Отразява времето, изминало между публикуването на материала в Интернет и влизането му в индексната база на търсачката. Например, няколко часа след самолетната катастрофа, голям брой потребители потърсиха в мрежата информация за инцидента. Въпреки факта, че е минало малко време от публикуването на първите съобщения по тази тема, търсачките успяха да ги индексират и потребителите успяха да разберат подробностите за бедствието.
СкоростРаботата на търсачката зависи пряко от нейната устойчивост на натоварвания. Например, според OOO Rambler Internet Holding, търсачката обработва около 60 заявки за търсене в секунда всеки ден. Тази скорост се осигурява от намаленото време за обработка на всяка индивидуална потребителска заявка.
видимостпредставянето на резултатите прави търсачката лесна за използване. Търсачката може да намери стотици и дори хиляди сайтове по заявка за търсене. Ако заявката не е съвсем правилна, тогава дори първата страница от резултатите от търсенето може да получи страници, които не отговарят напълно на това, което потребителят иска да намери. В резултат на това човек е принуден да филтрира информация в получения списък. Отделни елементи на страницата за издаване на търсачката ви помагат да навигирате в резултатите от търсенето. Подробни обяснения на страницата с резултати от търсенето, например за Yandex, можете да видите на връзката http://help.yandex.ru/search/?id=481937.

За да бъде даден сайт на първа страница с резултати от търсене с голяма вероятност, трябва:

Използвайте закотвени връзки, които пренасочват потребителите от тематични интернет сайтове към уебсайта на вашата компания. Това увеличава видимостта на интернет ресурса за търсачката, тъй като не само текстът с връзка към сайта, но и неговият URL адрес могат да попаднат в резултатите от търсенето.
Използвайте мета тагове заедно с добре подбрани ключови думи. Това ще направи резюмето на сайта по-уникално и ефективно.
Приложете заглавието Заглавие.
Правилно съставете семантичното ядро на сайта. Не е достатъчно да разпределите ключови думи в съдържанието на сайта, важно е да го направите внимателно и ненатрапчиво. Не включвайте ключови думи във всяко изречение. Търсачката може да оцени това като спам.
Използвайте URL адреса на сайта (адреса на местоположението му в мрежата). Правилното изписване на адреса влияе върху класирането му в търсачката.

За принципите на работа на всички търсачки с прости думи

Търсачката е специална програма с удобен уеб интерфейс, с която потребителите могат бързо и лесно да търсят необходимата информация в мрежата. Помислете за принципа на работа на всяка търсачка, без да навлизате в подробности и техническа терминология.

За да може търсачката да предостави на потребителя списък с връзки към страници, които съдържат информация за заявка за търсене, тя трябва да знае съдържанието на съдържанието на всички раздели на всеки сайт. Как търсачката събира тези данни?

Интернет е специална мрежа, състояща се от отделни страници, които се свързват една с друга. Не е нужно търсачката да влиза във всяка от тях, достатъчно е да има информация за сайтове и директории с най-висок рейтинг, за да натрупа данни за страницата за по-късно качване.

Търсачката всъщност създава индекс, в който адресите на всички интернет страници са групирани по специален начин. Ако в мрежата се появи нов сайт, който не е цитиран от други ресурси, тогава за търсачката ще бъде трудно да го намери, за да го индексира и добави към своята база данни.

След като търсачката генерира списък от страници, започва процесът на индексиране (работата по изтегляне на всички данни от тях). С помощта на програми, специално създадени за тази цел, търсачката записва нова информация или презаписва старата, като изтрива неподходящата информация. Работата по индексиране на сайтове в Интернет продължава.

Програмите събират данни във временно хранилище. Там те се натрупват до определено количество, след което се стартира процесът на актуализиране, чийто основен принцип е актуализирането на информация в основната база данни на търсачката.

Индексът на търсачката съдържа огромен брой страници. Когато потребителят въведе заявка в лентата за търсене, търсачката избира подходящи връзки от своята база данни. С други думи, той съставя списък от сайтове, чиито страници споменават ключовите думи, зададени от потребителя.

Тъй като вътрешната база на търсачката е огромна, резултатите от търсенето могат да съдържат десетки страници. Как ги класира търсачката? По какъв принцип определя кои страници да покаже на потребителя на първо място? Всички страници са сортирани по съдържание, съответстващо на заявката за търсене. Колкото по-пълна е информацията, съдържаща се на страницата, толкова по-близо до върха на списъка ще бъде страницата.

В момента търсачките използват машинно обучение, за да класират страниците в SERP. Принципът на действие на този процес може да се разгледа на абстрактен пример.

Да кажем, че трябва да обучим робот да различава узрели от неузрели ябълки. Програмата за определяне на свойствата на плода се фокусира върху неговите характеристики:

цвят;
размерът;
твърдост;
съдържание на захар;
киселинно съдържание.

За анализ на робота се дават две ябълки: неузрели и готови. Той ги сравнява. След това обучаваме машината – показваме кои характеристики на ябълката са положителни, кои са отрицателни. Ние обясняваме по кой набор от параметри един плод може да бъде класифициран като узрял или не.

По този начин имаме алгоритъм за анализ на ябълки, с който роботът може самостоятелно да ги сортира. Сега можете да дадете не два плода, а много повече, машината ще ги раздели на зрели и неузрели.

Подобен принцип на работа е присъщ на работата на търсачката. Има специалисти, които обучават машини на алгоритми за сортиране на съдържание. Първо, те независимо анализират страниците, включени в резултатите от търсенето за заявката за търсене, като ги разделят на релевантни и нерелевантни. След това роботът се обучава да сортира страниците.

Релевантността на страниците е индикатор под формата на дробно число. На всяка страница се присвоява различна стойност на релевантност. След това всички ресурси се сортират в низходящ ред на този индикатор. Най-подходящите сайтове попадат в ТОП на резултатите от търсенето.

В допълнение към основния алгоритъм за сортиране, търсачките използват различни допълнителни, които също могат да повлияят на резултатите от търсенето. Например, те могат да се използват за филтриране на безскрупулни сайтове, които използват различни "сиви" схеми за промоция.

Основни принципи на търсачките: формули

Всяка търсачка използва свои собствени уникални алгоритми за търсене и класиране на страници и сайтове, но принципите на работа за всички търсачки са еднакви.

Процесът на търсене на информация, която отговаря на заявката на потребителя, се състои от няколко етапа: събиране на данни в Интернет, индексиране на сайтове, търсене по ключови думи и класиране на резултатите. Нека разгледаме по-отблизо всеки етап.

Събиране на данни.

След като сайтът е готов, трябва да се уверите, че роботите на търсачката знаят за външния му вид. Можете да поставите външни връзки към вашия интернет ресурс или да използвате други методи. Веднага след като роботът влезе в сайта, той ще събира данни за всяка страница. Този процес се нарича обхождане. Събирането на информация от сайта става не само след неговото създаване. Роботът периодично ще разглежда интернет ресурса, за да проверява уместността на информацията и да актуализира наличните данни.

Както за вас, така и за бота (робота), такова взаимодействие трябва да бъде взаимно изгодно и удобно. Вие, като собственик на сайта, се интересувате ботът да върши работата си бързо, без да претоварва сървъра, като същевременно събира данни от всички страници възможно най-пълно. Също така е важно ботът да направи всичко възможно най-бързо, за да премине към събиране на данни от следващия сайт в списъка си. От ваша страна можете да проверите дали сайта работи, няма проблеми с навигацията, няма 404 страници и т.н.

Индексиране.

Дори ако роботът е посетил вашия сайт повече от веднъж, това не означава, че интернет ресурсът веднага ще стане видим за търсачката и ще се появи в резултатите от търсенето. След събиране на данните, следващият етап от процеса на обработка на сайта е неговото индексиране (създаване на инвертиран индекс файл за всяка страница). Индексът е необходим за бързо търсене. По правило се състои от списък с думи от текста и информация за тях (позиции в текста, тежест и др.).

След като индексирането приключи, сайтът и отделните страници се появяват в резултатите от търсачката за потребителски заявки за търсене. Обикновено процесът на индексиране не отнема много време.

Търсене на информация.

На този етап информацията се търси директно чрез заявки за търсене на потребители. Първо, търсачката анализира заявката, определя тежестта на всяка от ключовите думи. След това търси съвпадения чрез обърнати индекси, избира всички документи в базата данни на търсачката, които съответстват на заявката за търсене.

Съответствието на документ с искане се определя по специална формула:

подобие(Q,D) = SUM(w qk * w dk),

където симулация (Q, D)- сходство на заявката Qдокумент д; w qk- тегло на k-тата дума в заявката; w dk- теглото на k-тата дума в документа.

Документите, които са най-сходни със заявката на потребителя, се отразяват в резултатите от търсенето.

Ранжиране.

На последния етап търсачката групира резултатите, така че потребителят първо да види връзки към най-подходящите страници. Всяка търсачка има своя уникална формула за класиране, която отчита влиянието на следните параметри:

тегло на страницата (индекс на цитиране, PageRank);
авторитет на домейна;
съответствието на текста със заявката;
релевантност на текстовете на външни връзки към заявката;
както и много други фактори за класиране.

Например, помислете за опростена формула за класиране:

Ра(x) = (m * Tа(x) + p*Lа(x)) * F(PRa),

Където Ra(x)- окончателно съответствие на документа аискане х, Ta(x)- релевантност на текста (кода) на документа аискане х, La(x)- релевантност на текста на връзките от други документи към документа аискане х, PR- индикатор за авторитет на страницата а, постоянна спрямо х,
F(PRa)е монотонно ненамаляваща функция и F(0) = 1, може да се предположи, че F(PRa) = (1 + q * PRa), м, стр, рса някои коефициенти.

По този начин мястото на дадена страница в резултатите от търсенето се влияе от различни фактори, които са едновременно свързани със заявката за търсене и не са свързани с нея.

Принципът на действие на системите за търсене на информация: критерии за класиране

Ако искате вашият Интернет ресурс да бъде в челната тройка или поне в десетката на резултатите от търсенето, трябва да познавате принципите на търсачките и критериите за класиране, за да оптимизирате постоянно сайта за техните изисквания. Има две основни групи такива критерии:

Критерии на текстовата търсачка.

Търсачката в този случай класира страниците въз основа на качеството на текстовото им съдържание. Оптимизирането на този компонент на сайта включва работа със семантичното ядро на етапа на създаване и попълване на интернет ресурса.

Търсачката, която обработва заявката на потребителя, ще покаже най-подходящите резултати на първата страница на изданието. В процеса на търсене на документи търсачката анализира правилността на попълване на заглавната фраза (заглавие), описание на страницата (описание) и наличието на ключова заявка в заглавията (H1, H2 и др.).

Критерии за нетекстова търсачка.

Търсачката извършва работа по анализа на тези критерии, след като сайтът е публикуван и индексиран. Основният принцип на класиране според критериите на тази група е да се оценява не качеството на тяхното съдържание, а профилът на външните връзки.

Търсачката анализира броя на връзките към сайта от други интернет ресурси, оценява тяхната достоверност, разглежда регистрациите в директории. Ако направим аналогия, тогава търсачката, като банка, която решава да отпусне заем на компания, събира отзиви за нея от изпълнители, доставчици и други кредитори.

Познаването на това как работят търсачките ще ви помогне да създавате и оптимизирате уебсайтове, които лесно ще заемат първи позиции в резултатите от търсенето и ще останат там за дълго време, тъй като отговарят на потребителските заявки за търсене.

Принципът на работа на търсачката Yandex

Работата на такива големи и известни търсачки като Google и Yandex се основава на система от клъстери. Те групират цялата информация в определени области, обвързани с определен клъстер. За индексиране на сайтове и отделни страници и събиране на данни от тях се използват специални роботи за обхождане. Те са два вида: основен робот (предназначен да събира данни от редовно актуализирани интернет ресурси) и робот (необходим за актуализиране на списъка с индексирани сайтове и техните индекси в най-кратки срокове). За да може търсачката Yandex да събира информация в Интернет възможно най-пълно, базата за търсене и програмният код се актуализират редовно:

Базата данни с информация за търсене се актуализира няколко пъти месечно, докато потребителите получават актуализирани данни от интернет ресурси, когато въвеждат заявки в реда за търсене. Тези данни се добавят от главния робот скенер.
Обновяването на програмния код или, както го наричат програмистите, „двигателят“ е предназначен да открива и отстранява недостатъците на алгоритмите, които класират страниците в резултатите от търсенето. Yandex обикновено предупреждава потребителите за предстоящи промени.

Основното предимство на търсачката Yandex, което обяснява нейната популярност в Runet, е способността да се намират различни словоформи, като се вземат предвид морфологичните особености на руския език. Географското насочване и формулата за търсене ви позволяват да получите най-точната формулировка на изхода. Yandex също има своя собствена уникална страница и алгоритъм за класиране на сайтове. Безспорното предимство на системата е скоростта на обработка на потребителските заявки за търсене и стабилната работа на сървърите.

Както вече споменахме, когато индексира ресурси, търсачката разглежда динамични връзки, чието присъствие може да накара бота да откаже да определи индекса на сайта.

Yandex се основава на анализ на текстово съдържание в документи с различни разширения (.pdf, .rtf, .doc, .xls, .ppt и др.).

В процеса на индексиране на интернет ресурс търсачката взема данни от файла robots.txt, докато атрибутът Allow и някои от мета таговете се поддържат, а мета таговете Revisit-After и Keywords не се вземат предвид.

Фрагментите (кратки описания на текстови документи) се състоят от фрази на страницата, която търсите, така че писането на тагове в описанието изобщо не е необходимо, но те могат да бъдат зададени, ако е необходимо.

Според много разработчици кодът на индексираните документи се определя автоматично, така че мета етикетът за кодиране не играе голяма роля.

Yandex обръща голямо внимание на индикатора за последната промяна на информацията (Last-Modified). Ако сървърът спре да предава тези данни на търсачката, тогава индексирането на сайта ще се извършва много по-рядко.

Ако даден интернет ресурс има свои собствени „огледала“ (например http://www.site.ru , http://site.ru , https://www.site.ru), трябва да се уверите, че търсачката не е индексирана. Ако това не е възможно, тогава е възможно да слепите такива сайтове заедно, като направите съответните промени в документа robots.txt.

След като интернет ресурсът влезе в Yandex.Catalog, търсачката ще го класифицира като сайт, който изисква специално внимание, което ще се отрази на неговото популяризиране. Това също ще опрости процедурата за определяне на темата на сайта, което несъмнено е плюс, тъй като ще има значителна външна връзка.

Разработчиците на Yandex не разкриват IP адресите на своите роботи. Въпреки това в регистрационните файлове на различни сайтове можете да намерите текстови знаци, принадлежащи на роботите на тази търсачка.

Най-важният от всички роботи за търсене е главният. Значението на сайта за Yandex зависи от резултатите от работата му по индексиране на страници.

Всеки робот има свой собствен график за индексиране на интернет ресурси. Времето на работа на различни роботи с всеки от сайтовете в базата данни на търсачката може да не съвпада.

В допълнение към основните роботи, търсачката има допълнителни, които редовно посещават страниците на интернет ресурси, за да проверят тяхната наличност. Например, това са роботите на Yandex.Catalog и рекламната мрежа Yandex.

Търсачката Yandex се фокусира върху следните ключови показатели за външна оптимизация:

TCI (Public Subject Citation Index) – показва средния брой връзки, които имат достъп до сайта. Не влияе пряко на резултатите от класирането, използва се за определяне на позиции в тематичната група Yandex.Catalog. Използва се при популяризиране на интернет ресурси.
WCI (претеглен индекс на цитиране) е специален алгоритъм, предназначен да брои броя на външните връзки към даден сайт. Той е от първостепенно значение при класиране на страници от търсачка.
Присъствие на сайта в Yandex.Catalogue.
Общият брой индексирани страници на сайта.
Честотата на индексиране на съдържанието на интернет ресурса.
Наличието и липсата на връзки от сайта, присъствието на сайта във филтрите за търсене.

Индексът на цитиране е в основата на тематичния и претеглен индекс на цитиране.

Индекс на цитиране(CI) - индикатор за броя на цитатите (или препратките към източника), помага да се определи кои от новосъздадените документи се отнасят за по-ранни публикации. IC се използва както за анализ на статии, така и на автори (например в научна среда).

В Yandex, както и в други търсачки, индексът на цитиране се счита за броя на обратните връзки, без да се вземат предвид връзките от сайтове от следните типове: немодерирани директории, табла за обяви, мрежови конференции, страници със статистика на сървъра, XSS връзки и др., чийто брой може постоянно да се увеличава без участието на собственика на ресурса.

Трябва да се уточни, че в каталога на Aport IC се разглежда като претеглен индекс на цитиране.

За да се изчисли този индекс, се използва графика на връзките: ако сайтовете са върхове на графика, а връзките към други сайтове са връзки на върхове или ръбове на графика, тогава графиката на връзките се появява като диаграма, показана на фигурата:

Където A, B, ..., F са определени сайтове в индекса на търсачката Yandex, а стрелките показват посоките на връзките между тях (еднопосочни или двупосочни).

Индексът на цитиране играе голяма роля при класирането на документите от търсачката, но крайните резултати зависят не само от този показател.

Смята се, че индексът на цитиране характеризира значимостта на публикацията, но в същото време не отразява структурата на връзките на сайта, в резултат на което ресурси с различен брой външни връзки могат да бъдат индексирани по същия начин.

За да се отстрани този недостатък, се използва претеглен индекс на цитиране, който характеризира не само количеството, но и качеството на препращащите ресурси. Използването на търсене на връзки и популярност на статични връзки улеснява работата на търсачките, като ги предпазва от различни текстови спамове. Търсачката Google използва PageRank, който е подобен на претегления индекс на цитиране.

За изчисляване на VCI, както и на други фактори, влияещи върху класирането, се използва референтна графика. Собственикът на сайта може самостоятелно да оцени VCI на своя интернет ресурс, като провери стойността на PageRank с помощта на някоя от наличните онлайн услуги. Но трябва да се има предвид, че индексът на Yandex съдържа само документи на руски език и само няколко популярни документа от чужди, така че стойността на Yandex VIC ще се различава от Google PageRank.

По дефиниция интернет търсачката е система за извличане на информация, която ни помага да намираме информация в световната мрежа. Това улеснява глобалния обмен на информация. Но интернет е неструктурирана база данни. Той се разраства експоненциално и се превърна в огромно хранилище на информация. Намирането на информация в интернет е трудна задача. Има нужда от инструмент за управление, филтриране и извличане на тази океанска информация. Търсачката служи за тази цел.

Как работи търсачката?

Интернет търсачките са машини, които търсят и извличат информация в Интернет. Повечето от тях използват архитектура на индексатор за обхождане. Те зависят от техните коловозни модули. Обхождащите, наричани още паяци, са малки програми, които обхождат уеб страници.

Роботите посещават първоначалния набор от URL адреси. Те копаят URL адресите, които се появяват на обходените страници, и изпращат тази информация до модула за обхождане. Роботът решава кои страници да посети следващите и дава тези URL адреси на роботите.

Темите, обхванати от различните търсачки, варират в зависимост от алгоритмите, които използват. Някои търсачки са програмирани да търсят сайтове по конкретна тема, докато роботите на други могат да посетят възможно най-много места.

Модулът за индексиране извлича информация от всяка страница, която посещава, и добавя URL адреса към базата данни. Това води до огромна справочна таблица от списък с URL адреси, сочещи към страници с информация. Таблицата показва страниците, които са били обхванати по време на обхождането.

Модулът за анализ е друга важна част от архитектурата на търсачката. Той създава индекс на полезност. Помощната програма за индексиране може да предостави достъп до страници с определена дължина или страници, съдържащи определен брой снимки върху тях.

По време на процеса на обхождане и индексиране, търсачката запазва страниците, които извлича. Те се съхраняват временно в хранилището на страницата. Търсачките поддържат кеш на страниците, които посещават, за да ускорят извличането на вече посетените страници.

Модулът за заявки на търсачката получава заявки за търсене от потребители под формата на ключови думи. Модулът за класиране сортира резултатите.

Архитектурата на индексатора за обхождане има много вариации. Те се променят в разпределената архитектура на търсачката. Тези архитектури се състоят от колекционери и брокери. Колекторите събират информация за индексиране от уеб сървъри, докато брокерите предоставят механизъм за индексиране и интерфейс за заявки. Брокерите индексират актуализацията въз основа на информация, получена от колекционери и други брокери. Те могат да филтрират информация. Много търсачки днес използват този тип архитектура.

Търсачки и класиране на страници

Когато създаваме заявка в търсачката, резултатите се показват в определен ред. Повечето от нас са склонни да посещават най-добрите страници за поръчки и да игнорират последните. Това е така, защото смятаме, че първите няколко страници са по-подходящи за нашата заявка. Така че всеки се интересува от класирането на своите страници в първите десет резултата от търсачките.

Думите, изброени в интерфейса за заявка на търсачката, са ключовите думи, които са били поискани от търсачките. Те представляват списък от страници, свързани с търсените ключови думи. По време на този процес търсачките извличат онези страници, които често срещат тези ключови думи. Те търсят връзки между ключови думи. Местоположението на ключовите думи също се взема предвид, както и ранга на страницата, която ги съдържа. Ключовите думи, които се появяват в заглавията на страниците или URL адресите, получават по-голяма тежест. Страници, които имат връзки, сочещи към тях, ги правят още по-популярни. Ако много други сайтове се свързват към страница, тя се възприема като ценна и по-подходяща.

Има алгоритъм за класиране, който използва всяка търсачка. Алгоритъмът е компютъризирана формула, предназначена да предоставя подходящи страници при поискване от потребителя. Всяка търсачка може да има различен алгоритъм за класиране, който анализира страниците в базата данни на машината, за да определи подходящите отговори на заявките за търсене. Търсачките индексират различна информация по различни начини. Това води до това, че конкретна заявка, доставена на две различни търсачки, може да извлече страници в различен ред или да извлече различни страници. Популярността на един уебсайт е определящ фактор за уместността. Популярността при кликване на даден сайт е друг фактор, който определя неговия ранг. Това е мярка за това колко често се посещава даден сайт.

Уеб администраторите се опитват да измамят алгоритмите на търсачките, за да подобрят позицията на сайта си в SERPs. Попълване на страници на уебсайтове с ключови думи или използване на мета тагове за заблуда на стратегиите за класиране в търсачките. Но търсачките са достатъчно умни! Те подобряват своите алгоритми, така че машинациите на уеб администраторите да не влияят на резултатите от търсенето.

Трябва да разберете, че дори страниците след първите няколко в списъка може да съдържат точно информацията, която търсите. Но бъдете сигурни, че добрите търсачки винаги ще ви предоставят изключително подходящи страници в най-горния ред!

Най-популярната уеб услуга днес е търсачката. Тук всичко е разбираемо, защото онези времена, когато представителите на първите интернет потребители можеха да наблюдават нови елементи в мрежата, отдавна са отминали.

Появява се и се натрупва толкова много информация, че на човек му става много трудно да намери точно тази, която му трябва. Представете си как би било търсенето в интернет, ако обикновен потребител трябваше да търси информация, която не разбирам къде. Не разбирам точно къде, защото няма да намерите много информация с ръчно търсене.

Търсачка, какво е това?

Добре е, ако потребителят вече знае сайтовете, които могат да имат необходимата информация, но какво друго да направи? За да се улесни живота на човек при намирането на необходимата информация в Интернет, бяха измислени търсачки или просто търсачки. Търсачката изпълнява една много важна функция, без която интернет не би бил същият, какъвто сме свикнали да го виждаме - това е търсенето на информация в мрежата.

Система за търсене- това е специален уеб сайт или по друг начин сайт, който предоставя на потребителите хипервръзки към страници, сайтове, които отговарят на дадена заявка за търсене, по тяхно желание.

За да бъдем малко по-точни, това е търсенето на информация в Интернет, което се осъществява благодарение на софтуерен и хардуерен функционален набор и уеб интерфейс за взаимодействие с потребителите.

За човешкото взаимодействие с търсачката е създаден уеб интерфейс, тоест видима и разбираема обвивка. Този подход на разработчиците на търсачки прави търсенето по-лесно за много хора. По правило интернет се търси с помощта на търсачки, но има и търсачки за FTP сървъри, определени видове стоки в световната мрежа или информация за новини или други посоки за търсене.

Търсенето може да се извърши не само върху текстовото съдържание на сайтове, но и върху други видове информация, която човек може да търси: изображения, видеоклипове, звукови файлове и др.

Как се извършва търсенето от търсачка?

Самото търсене в интернет, както и разглеждането на уебсайтове, е възможно с помощта на интернет браузър - browser. Едва след като потребителят е задал своята заявка в лентата за търсене, самото търсене се извършва директно.

Всяка търсачка съдържа софтуерна част, на която се основава цялата търсачка, тя се нарича търсачка - това е софтуерен пакет, който предоставя възможност за търсене на информация. След като се свърже с търсачка, формира заявка за търсене от човек и я въведе в лентата за търсене, търсачката генерира страница със списък с резултати от търсенето, като най-подходящите според търсачката са разположени по-горе тук.

Уместност на търсенето - търсене на най-подходящите материали за заявката на потребителя и поставяне на хипервръзки към тях на страницата с резултати от търсенето с по-точни резултати над другите. Самото разпределение на резултатите се нарича класиране на сайта.

И така, как търсачката подготвя своите материали за издаване и как търсачката търси информация? Събирането на информация в мрежата се улеснява от уникален за всяка търсачка робот или по друг начин бот, който има и редица други синоними като кроул или паяк, а самата система за търсене може да бъде разделена на три етапа :

Първият етап от работата на търсачката включва сканиране на сайтове в глобалната мрежа и събиране на копия на уеб страници на собствените сървъри. Това формира огромно количество информация, която все още не е обработена и не е подходяща за резултати от търсене.

Вторият етап от работата на търсачката се свежда до подреждане на информацията, получена по-рано, на първия етап, от сайтовете. Извършва се такова сортиране, което в най-кратки срокове ще благоприятства много висококачественото търсене, което потребителите всъщност очакват от търсачката. Етапът се нарича индексиране, което означава, че страниците вече са подготвени за издаване и текущата база данни ще се счита за индекс.

Това е третият етап, който определя резултатите от търсенето, след получаване на заявка от вашия клиент, въз основа на ключовите думи или близо до ключовите думи, посочени в заявката. Това допринася за подбора на най-подходящата информация за заявката и последващото й издаване. Тъй като има много информация, търсачката извършва класиране в съответствие със своите алгоритми.
Най-добрата търсачка е тази, която може да предостави материал, който най-правилно отговаря на заявката на потребителя. Но дори и тук може да има резултати, които са повлияни от хора, които се интересуват от популяризиране на техния сайт, такива сайтове, макар и не винаги, често се появяват в резултатите от търсенето, но не за дълго.

Въпреки че световните лидери вече са идентифицирани в много региони, търсачките продължават да развиват своето качествено търсене. Колкото по-добро търсене могат да предоставят, толкова повече хора ще го използват.

Как да използвам търсачката?

Какво е търсачка и как работи вече е ясно, но как да я използвате правилно? Повечето сайтове винаги имат лента за търсене, а до нея има бутон Търсене или Търсене. В лентата за търсене се въвежда заявка, след което трябва да натиснете бутона за търсене или, както е по-често, да натиснете клавиша Enter на клавиатурата и след няколко секунди ще получите резултата от заявката в под формата на списък.

Но получаването на правилния отговор на заявка за търсене не винаги е възможно от първия път. За да не стане търсенето на това, което искате, болезнено, трябва правилно да съставите заявка за търсене и да следвате препоръките, описани по-долу.

Съставете правилно заявката за търсене

Следват някои съвети за използване на търсачката. Спазването на някои трикове и правила при търсене на информация в търсачката ще ви позволи да получите желания резултат много по-бързо. Следвайте тези указания:

Правилното изписване на думите гарантира максимален брой съвпадения с желания информационен обект (Въпреки че съвременните търсачки вече са се научили как да коригират правописни грешки, този съвет не трябва да се пренебрегва).
Чрез използване на синоними в заявка може да се покрие по-широк диапазон на търсене.
Понякога промяната на дума в текста на заявка може да доведе до по-добър резултат, така че преформулирайте заявката.
Внесете специфичност в заявката, използвайте точни срещания на фрази, които трябва да определят основната същност на търсенето.
Експериментирайте с ключови думи. Използването на ключови думи и фрази може да помогне за идентифициране на основната точка и търсачката ще върне по-подходящ резултат.

И така, какво е търсачка - това не е нищо повече от възможност да намерите интересна информация и обикновено да я използвате напълно безплатно, да научите нещо, да разберете нещо или да направите правилното заключение за себе си. Много хора вече не си представят живота си без гласово търсене, в което не е нужно да въвеждате текста, просто трябва да кажете заявката си, а микрофонът е входното устройство тук. Всичко това свидетелства за постоянното развитие на технологиите за търсене в Интернет и необходимостта от тях.

Търсачката е база данни със специфична информация в Интернет. Много потребители смятат, че веднага щом въведат заявка в търсачката, веднага започват да сканират целия интернет, но това изобщо не е така. Интернет сканирането се извършва постоянно, много програми, данни за сайтове се въвеждат в база данни, където според определени критерии всички сайтове и всичките им страници се разпределят в различни списъци и бази данни. Тоест, това е вид файл с данни и търсенето се извършва не в Интернет, а в този файл.

Google е най-популярната търсачка в света.

В допълнение към търсачката, Google предлага много допълнителни услуги, софтуер и хардуер, включително услугата за електронна поща, браузърът Google Chrome, най-голямата видео библиотека в YouTube и много други проекти. Google уверено изкупува много проекти, които носят големи печалби. Повечето от услугите не са насочени към директен потребител, а към правене на пари в Интернет и са интегрирани с фокус върху интересите на европейските и американските потребители.

Mail е търсачка, популярна главно поради пощенската услуга.

Има много допълнителни услуги, ключът от които е пощата Mail, в момента Mail притежава социалната мрежа Odnoklassniki, собствената си мрежа My World, услугата Money-mail, много онлайн игри, три почти идентични браузъра с различни имена. Всички приложения и услуги имат много рекламно съдържание. Социалната мрежа "VKonatkte" блокира директните преходи към пощенските услуги, като се аргументира с голям брой вируси.

Уикипедия.

Wikipedia е справочна система с възможност за търсене.

Търсачка с нестопанска цел, която съществува от частни дарения, следователно не запълва страниците с реклами. Многоезичен проект, чиято цел е да създаде пълна справочна енциклопедия на всички езици на света. Няма конкретни автори, попълва се и се управлява от доброволци от цял свят. Всеки потребител може както да пише, така и да редактира статия.

Официалната страница е www.wikipedia.org.

Youtube е най-голямата видео библиотека.

Видео хостинг с елементи на социална мрежа, където всеки потребител може да добави видео. От момента, в който са придобити от Google Ink, не е необходима отделна регистрация за YouTube, достатъчно е да се регистрирате в пощенската услуга на Google.

Официалната страница е youtube.com.

Yahoo! е втората най-важна търсачка в света.

Има допълнителни услуги, най-известната от които е Yahoo mail. Като част от подобряването на качеството на търсачката, Yahoo предава данни за потребителите и техните заявки на Microsoft. От тези данни се формира представа за интересите на потребителите, както и пазар за рекламно съдържание. Търсачката Yahoo също така се занимава с поглъщането на други компании, например Yahoo притежава услугата за търсене Altavista и сайта за електронна търговия Alibaba.

Официалната страница е www.yahoo.com.

WDL е цифрова библиотека.

Библиотеката събира книги с културна стойност в цифров вид. Основната цел е да се повиши нивото на културното съдържание на Интернет. Достъпът до библиотеката е свободен.

Официалната страница е www.wdl.org/ru/.

Bing е търсачка от Microsoft.

Официалният уебсайт е www.baidu.com.

Търсачките в Русия

Rambler е "проамериканска" търсачка.

Първоначално е създаден като медиен интернет портал. Подобно на много други търсачки, тя има услуги за търсене на изображения, видео файлове, карти, прогноза за времето, секция за новини и много други. Издателите предлагат и безплатен браузър Rambler-Nichrome.

Официалната страница е www.rambler.ru.

Nigma е интелигентна търсачка.

По-удобна търсачка поради наличието на много филтри и настройки. Интерфейсът ви позволява да включвате или изключвате предложени подобни стойности в търсенето, за да получите по-добри резултати. Също така, когато получавате резултат от търсене, той ви позволява да използвате информация от други големи търсачки.

Официалната страница е www.nigma.ru.

Aport - онлайн каталог на стоки.

В миналото търсачката, но след като разработките и иновациите бяха прекратени, бързо загуби позиции и . В момента Aport е търговска платформа, където се представят стоки от повече от 1500 компании.

Официалната страница е www.aport.ru.

Sputnik е национална търсачка и интернет портал.

Създаден от Ростелеком. В момента е във фаза на тестване.

Официалният сайт е www.sputnik.ru.

Metabot е развиваща се търсачка.

Задачите на Metabot са да създаде търсачка за всички останали търсачки, като създаде позиции за издаване на резултати, като вземе предвид данните от целия списък от търсачки. Тоест това е търсачка за търсачките.

Официалната страница е www.metabot.ru.

Търсачката е спряна.

Официалната страница е www.turtle.ru.

KM - мултипортален.

Първоначално сайтът беше мултипортал с последващо въвеждане на търсачка. Търсенето може да се извърши както в сайта, така и във всички проследявани сайтове на Runet.

Официалната страница е www.km.ru.

Gogo - не работи, пренасочва към търсачка.

Официалната страница е www.gogo.ru.

Руският мултипортал, който не е много популярен, трябва да бъде подобрен. Търсачката включва новини, телевизия, игри, карта.

Официалната страница е www.zoneru.org.

Търсачката не работи, разработчиците предлагат да използвате търсачката.