Paano maghanap sa buong Internet. Ang pinakasikat na mga search engine sa internet sa Russian

Ang mga search engine (PS) ay may disenteng oras ay isang ipinag-uutos na bahagi ng internet. Ngayon sila ay malaki at pinaka-komplikadong mga mekanismo na hindi lamang isang tool para sa paghahanap ng anumang kinakailangang impormasyon, kundi pati na rin ang mga kapana-panabik na lugar para sa negosyo.


Maraming mga gumagamit ng paghahanap ang hindi kailanman naisip tungkol sa mga prinsipyo ng kanilang trabaho, tungkol sa kung paano pangasiwaan ang mga kahilingan ng gumagamit, kung paano ang data ng system ay binuo at gumagana. Ang materyal na ito ay makakatulong sa mga tao na nakikibahagi sa pag-optimize at, maunawaan ang aparato at ang mga pangunahing pag-andar ng mga search engine.

Mga Pag-andar at Konsepto Ps.

Suriin ang sistema - Ito ay isang hardware at software package na inilaan upang ipatupad ang function ng paghahanap sa internet, at pagtugon sa isang query sa gumagamit na karaniwang tinukoy bilang isang tekstong parirala (o mas tumpak na query sa paghahanap), nagbigay ng isang reference na listahan sa mga mapagkukunan ng impormasyon na isinagawa ng Kaugnayan. Ang pinaka-karaniwang at malalaking sistema ng paghahanap: Google, Bing, Yahoo, Baidu. Sa Runet - Yandex, Mail.ru, Rambler.

Isaalang-alang nang mas detalyado ang halaga ng query sa paghahanap mismo, ang pagkuha ng Yandex system halimbawa.

Ang kahilingan ay dapat na formulated ng gumagamit sa ganap na pagsunod sa paksa ng kanyang paghahanap, kasing simple hangga't maaari at madaling sabi. Halimbawa, nais naming makahanap ng impormasyon sa search engine na ito: "Paano pumili ng kotse para sa iyong sarili." Upang gawin ito, buksan pangunahing pahina At magpasok ng isang kahilingan upang maghanap "kung paano pumili ng kotse." Pagkatapos ay ang aming mga function ay nabawasan upang ipasok ang mga link sa mga mapagkukunan ng impormasyon na ibinigay sa network.




Ngunit kahit na kumikilos sa ganitong paraan, maaari mo at hindi makuha ang impormasyong kailangan mo. Kung magkakaroon kami ng katulad negatibong resulta, kailangan mo lamang repormahin ang iyong kahilingan, o sa database ng paghahanap ay talagang hindi kapaki-pakinabang na impormasyon sa pamamagitan ng. ang uri na ito Ang query (tulad ay posible sa tinukoy na "makitid" na mga parameter ng query, tulad ng, halimbawa, "Paano pumili ng kotse sa Anadyri").

Ang pinaka-pangunahing gawain ng bawat search engine ay upang maihatid sa mga tao nang eksakto ang uri ng impormasyon na kailangan nila. At upang gumawa ng mga gumagamit upang lumikha ng "tamang" uri ng mga kahilingan para sa mga search engine, iyon ay, mga parirala na tumutugma sa kanilang mga prinsipyo ng trabaho, halos imposible.

Iyon ang dahilan kung bakit ang mga espesyalista sa pag-unlad ng search engine ay gumagawa ng mga prinsipyo at algorithm ng kanilang trabaho na magbibigay sa mga gumagamit upang mahanap ang kanilang impormasyon. Nangangahulugan ito na ang sistema ay dapat "mag-isip" tulad ng iniisip ng isang tao kapag ang paghahanap ng kinakailangang impormasyon sa Internet.

Nang pumasok siya sa kanyang kahilingan sa search engine, nais niyang makita kung ano ang kailangan niya, kasing dali hangga't maaari at mas mabilis. Pagkatanggap ng resulta, ang mga gumagamit ng gumagamit para sa pagtatasa nito ng system, ay ginagabayan ng maraming pamantayan. Nakuha ba niya ang kinakailangang impormasyon? Kung hindi, ilang beses na kailangang baguhin ang teksto ng query upang mahanap ito? Paano nakuha ang may-katuturang impormasyon? Gaano kabilis suriin ang sistema Naproseso ang kahilingan nito? Paano kumportable ang mga resulta ng paghahanap? Ang unang resulta muna, o ay matatagpuan sa isang ika-30 na lugar? Kung gaano karaming mga "basura" (hindi kinakailangang impormasyon) ang natagpuan kasama kapaki-pakinabang na impormasyon? Magkakaroon ba ng may-katuturang impormasyon para dito, kapag gumagamit ng PS, sa isang linggo, o sa isang buwan?




Upang makuha ang tamang mga sagot sa mga naturang katanungan, ang mga developer ng paghahanap ay patuloy na nagpapabuti sa mga prinsipyo ng pagraranggo at mga algorithm nito, idagdag ang mga bagong pagkakataon at pag-andar at anumang paraan ay nagsisikap na gawing mas mabilis ang sistema.

Ang mga pangunahing katangian ng mga search engine.

Tumutukoy sa mga pangunahing katangian ng paghahanap:

Kapunuan.

Ang kapunuan ay isa sa mga pinakamahalagang katangian ng paghahanap, ito ay ang ratio ng mga numero na natagpuan sa kahilingan ng mga dokumento ng impormasyon sa kanilang kabuuang bilang sa internet na may kaugnayan sa kahilingang ito. Halimbawa, mayroong 100 mga pahina na may pariralang "Paano Pumili ng Kotse", at sa parehong query mayroon lamang 60 sa kabuuan, pagkatapos ay sa kasong ito ang paghahanap na puno ng 0.6 ay 0.6. Ito ay malinaw na ang mas malaki ang paghahanap mismo, mas malaki ang posibilidad na ang gumagamit ay makakahanap ng eksaktong dokumento na kailangan niya, siyempre, kung siya ay umiiral sa lahat.

Katumpakan.

Ang isa pang pangunahing pag-andar ng search engine ay katumpakan. Tinutukoy nito ang antas ng pagsunod sa kahilingan ng gumagamit para sa mga natagpuang pahina sa network. Halimbawa, kung ang pangunahing pariralang "kung paano pumili ng kotse" ay may isang daang dokumento, sa kalahati ng mga ito ay naglalaman ng pariralang ito, at sa iba pa ay mayroon ka lamang mga salita (kung paano pumili ng radyo ng kotse, at i-install ito sa kotse "), pagkatapos ay maghanap ng katumpakan na katumbas ng 50/100 \u003d 0.5.

Kaysa sa paghahanap ay mas tumpak, ang mas maaga ang gumagamit ay mahanap ang impormasyon na kailangan mo, ang mas magkakaibang "basura" ay magkikita sa mga resulta, ang mas kaunting mga dokumento na natagpuan hindi tumutugma sa kahulugan ng kahilingan.

Kaugnayan.

Ito ay isang mahalagang bahagi ng paghahanap, na nagpapakilala sa oras na dumaraan mula sa sandali ng impormasyon sa pag-publish sa Internet hanggang sa mai-publish ito sa search engine index base.

Halimbawa, sa susunod na araw pagkatapos ng impormasyon tungkol sa paglabas ng bagong iPad, maraming mga gumagamit ang nakabukas sa paghahanap gamit ang kaukulang mga uri ng mga kahilingan. Sa karamihan ng mga kaso, ang impormasyon tungkol sa balita na ito ay magagamit na sa paghahanap, bagaman napakaliit ay lumipas mula noong hitsura nito. Ito ay dahil sa pagkakaroon ng "mabilis na base" mula sa mga malalaking search engine, na kung saan ay na-update nang maraming beses bawat araw.

Bilis ng paghahanap.

Ang function na ito bilang bilis ng paghahanap ay malapit na nauugnay sa tinatawag na "katatagan ng mga naglo-load". Bawat segundo sa paghahanap malaking halaga Ang mga tao, ang ganitong workload ay nangangailangan ng isang makabuluhang pagbawas sa oras upang maproseso ang isang kahilingan. Dito, ang mga interes ng parehong search engine at ang user ay nag-tutugma: ang bisita ay nais na makakuha ng mga resulta nang mabilis hangga't maaari, at ang search engine ay dapat na magtrabaho ito nang mabilis hangga't maaari, upang hindi pabagalin ang pagproseso ng kasunod na mga kahilingan.

Visuity.

Ang isang visual na representasyon ng mga resulta ay isang mahalagang elemento ng kaginhawahan sa paghahanap. Ayon sa maraming mga kahilingan, hinahanap ng search engine ang libu-libong, at sa ilang mga kaso milyun-milyong iba't ibang mga dokumento. Dahil sa fuzziness ng compilation ng mga pangunahing parirala para sa paghahanap o hindi katumpakan, kahit na ang pinakaunang resulta ng query ay hindi laging may lamang kailangan ng impormasyon.

Nangangahulugan ito na ang isang tao ay madalas na may sariling paghahanap sa mga resulta na ibinigay. Ang iba't ibang bahagi ng mga pahina ng pagpapalabas ng PS ay makakatulong upang mag-navigate sa mga resulta ng paghahanap.

Ang kasaysayan ng pag-unlad ng mga search engine.

Nang magsimula ang Internet, ang bilang ng mga regular na gumagamit nito ay maliit, at ang halaga ng impormasyon para sa pag-access ay medyo maliit. Karamihan sa pag-access sa network na ito ay may mga espesyalista lamang ng mga lugar ng pananaliksik. Sa oras na iyon, ang gawain ng paghahanap ng impormasyon ay hindi nauugnay sa ngayon.

Ang isa sa mga unang paraan ng pag-oorganisa ng malawak na access sa mga mapagkukunan ng impormasyon ay ang paglikha ng mga katalogo ng site, at ang mga sanggunian sa kanila ay nagsimulang magpangkat sa mga paksa. Kaya ang unang proyekto ay ang mapagkukunan Yahoo.com, na binuksan sa tagsibol ng 1994. Sa dakong huli, kapag ang bilang ng mga site sa direktoryo ng Yahoo ay nadagdagan nang malaki, ang pagpipilian ng paghahanap ng kinakailangang impormasyon tungkol sa catalog ay idinagdag. Hindi pa ito ganap na isang search engine, dahil ang lugar ng naturang paghahanap ay limitado lamang sa pamamagitan ng mga site na kasama sa direktoryong ito, at hindi ganap na lahat ng mga mapagkukunan sa Internet. Ang mga katalogo ng link ay lubos na malawak na ginagamit nang mas maaga, ngunit sa kasalukuyan, halos ganap na nawala ang kanilang katanyagan.

Pagkatapos ng lahat, kahit na ngayon, ang malaking katalogo ay may impormasyon tungkol sa bahagyang bahagi ng mga website sa Internet. Ang pinaka sikat at malalaking katalogo sa mundo ay may impormasyon tungkol sa limang milyong mga site kapag ang Google Base ay naglalaman ng impormasyon tungkol sa higit sa 25 bilyong mga pahina.




Ang unang tunay na search engine ay webcrawler, na lumitaw noong 1994 taon.

Sa susunod na taon, lumitaw ang Altavista at Lycos. Bukod dito, ang una ay ang pinuno sa paghahanap para sa impormasyon sa isang mahabang panahon.




Noong 1997, si Sergey Brin, kasama ang Larry Page ay lumikha ng paghahanap sa Google Car bilang proyekto ng pananaliksik Sa Standford University. Ngayon, ang Google, ang pinaka-popular at popular na search engine sa mundo.




Noong Setyembre 1997, ang Yandex PS ay inihayag (opisyal), na kasalukuyan Siya ang pinaka-popular na sistema ng paghahanap sa runet.




Ayon sa N. Setyembre 2015.Ang bahagi ng mga search engine sa mundo ay ipinamamahagi bilang mga sumusunod:
  • Google - 69.24%;
  • Bing - 12.26%;
  • Yahoo! - 9.19%;
  • Baidu - 6.48%;
  • AOL - 1.11%;
  • Magtanong - 0.23%;
  • Excite - 0.00%


Ayon sa N. disyembre 2016., Palatandaan ng mga search engine sa runet:

  • Yandex - 48.40%
  • Google - 45.10%
  • Search.mail.ru - 5.70%
  • Rambler - 0.40%
  • Bing - 0.30%
  • Yahoo - 0.10%

Mga Prinsipyo ng Search Engine.

Sa Russia ang pangunahing sistema Ang paghahanap ay Yandex, pagkatapos ay ang Google, at pagkatapos ay [email protected]. Ang lahat ng mga malaking sistema ng paghahanap ay may sariling istraktura, na ibang-iba mula sa iba. Ngunit maaari mo pa ring piliin ang mga pangunahing elemento na karaniwan sa lahat ng mga search engine.

Indexing module.

Ang bahagi na ito ay binubuo ng tatlong programa ng robot:

Spider (sa Ingles. Spider) - isang programa na inilaan upang mag-download ng mga web page. Ang "Spider" ay nagda-download ng isang pahina, sa parehong oras na inaalis ang lahat ng mga link mula dito. Na-download ang HTML code sa halos bawat pahina. Para sa mga ito, ginagamit ng mga robot ang HTTP protocol.




Ang mga function na "Spider" ay mga sumusunod. Ang robot ay nagpapadala ng isang kahilingan sa server ng "Get / Path / Document" at iba pang mga utos ng HTTP query. Bilang tugon, ang programa ng robot ay tumatanggap ng isang daloy ng teksto na naglalaman ng impormasyon ng uri ng serbisyo at, siyempre, ang dokumento mismo.
  • URL ng na-download na pahina;
  • petsa kapag na-download ang pahina;
  • http response server header;
  • html code, "body" na mga pahina.
Crawler. ("Naglalakbay" spider). Ang program na ito ay awtomatikong pumapasok sa lahat ng mga link na matatagpuan sa pahina, at nagha-highlight din ito. Ang kanyang gawain ay upang magpasya kung saan sa hinaharap ang spider ay dapat na matagpuan, batay sa mga link na ito o batay sa tinukoy na listahan ng mga address.

Indexer. (Robot Indexer) ay isang programa na pinag-aaralan ang mga pahina na na-download ng mga spider.



Ang indexer ay ganap na disassembles sa pahina sa mga sangkap ng composite at pinag-aaralan ang kanilang pag-aaral, paglalapat ng morphological at lexical na uri ng mga algorithm nito.

Ang pagtatasa ay isinasagawa sa iba't ibang bahagi ng pahina, tulad ng mga headline, teksto, mga link, estilista at mga tampok sa istruktura, mga tag ng HTML, atbp.

Kaya, ang module ng pag-index ay posible na sumailalim sa mga sanggunian ng tinukoy na bilang ng mga mapagkukunan, mga pahina ng pag-download, kunin ang reference mass sa mga bagong pahina mula sa natanggap na mga dokumento at gawin ang kanilang detalyadong pag-aaral.

Database

Database (o ang search engine index) ay isang hanay ng imbakan ng data, isang hanay ng impormasyon kung saan ang mga naayos na parameter ng bawat naproseso na pag-index at na-download na dokumento ay naka-imbak.

Paghahanap ng server.

Ito ay napaka mahalagang elemento Ang buong sistema, dahil mula sa mga algorithm na pinagbabatayan ang pag-andar nito, ang bilis ay direktang umaasa at, siyempre, ang kalidad ng paghahanap.

Gumagana ang server ng paghahanap tulad ng sumusunod:

  • Ang kahilingan na nagmumula sa gumagamit ay napapailalim sa pag-aaral ng morphological. Ang kapaligiran ng impormasyon ng anumang dokumento na magagamit sa database ay nabuo (ito ay patuloy na ipapakita bilang isang snippet, i.e. Ang patlang ng impormasyon ng teksto ng kaukulang kahilingan).
  • Ang data na nakuha ay nagpapadala bilang mga parameter ng input na may espesyal na ranggo na module. Ang mga ito ay naproseso sa lahat ng mga dokumento, at sa wakas, para sa bawat naturang dokumento, ang rating nito ay kinakalkula, na kinikilala ang kaugnayan ng naturang dokumento bilang kahilingan ng gumagamit, at iba pang mga bahagi.
  • Depende sa mga kondisyon ng gumagamit na tinukoy ng gumagamit, ang rating na ito ay maaaring maayos na maayos sa pamamagitan ng karagdagang.
  • Ito ay pagkatapos ay binuo ng snippet kanyang sarili, i.e. Para sa anumang dokumento na natagpuan mula sa nararapat na talahanayan, ang pamagat, anotasyon na pinaka nakakatugon sa query ay nakuha, at ang link sa dokumentong ito, habang ang natagpuang wordforms at mga salita ay naka-highlight.
  • Ang mga resulta ng natanggap na paghahanap ay ipinapadala sa tao sa anyo ng isang pahina na ibinibigay ng mga resulta ng paghahanap (SERP).
Ang lahat ng mga elementong ito ay malapit na nauugnay sa bawat isa at pag-andar, nakikipag-ugnayan, na bumubuo ng isang natatanging, ngunit mahirap na mekanismo para sa paggana ng PS, na nangangailangan ng napakalaking gastos ng mga mapagkukunan.

Ang mga search engine ay itinuturing na pinakasikat na mga site sa Internet. Hindi nakakagulat, dahil upang makahanap ng isang bagay sa network, kailangan mo munang gamitin ang mga serbisyo sa paghahanap.


Mayroong maraming mga ito at hindi kahit nakaranas ng mga gumagamit ng Internet, alam nila ang hindi bababa sa 2-3 mga search engine.

Ano ang mga search engine? Alam ng isang tao ang tungkol sa isang search engine, alam ng ilan ang tungkol sa 10 mga serbisyo sa paghahanap, ngunit sa katunayan sila ay higit pa.

Siyempre, ang kanilang katanyagan ay iba, pati na rin ang interface, at ang kalidad ng mga resulta. Ipapakita namin sa iyo ang isang listahan ng iba't ibang mga search engine upang maihambing mo ang mga ito.

Mga sikat na search engine.

Binuo ang mga serbisyo sa paghahanap para sa iba't ibang mga kategorya ng mga tao. Ang pinakasikat na mga bansa o kahit na ang buong mundo, at hindi gaanong kilala ay dinisenyo para sa mga rehiyon o mga interes ng gumagamit.

Nasa ibaba ang 10 mga search engine na dapat mong malaman:

  1. - Lahat ay kilala tungkol sa search engine na ito, ito ay ang pinaka-popular sa Russia at nagbibigay ng isang malawak na pag-andar sa mga gumagamit nito (nagsisimula sa electronic payments, nagtatapos sa isang webmaster panel).
  2. - Lider sa lahat ng mga site sa mundo. Nasisiyahan sila sa mga tao mula sa lahat ng mga bansa at isaalang-alang ang pinakamataas na kalidad ng search engine. Tulad ng Yandex, nag-aalok ang mga kliyente ng maraming karagdagang mga tool.
  3. - Paghahanap at sistema ng impormasyon, isinasaalang-alang ang morpolohiya na nagsasalita ng Russia. Ang site ay may ilang mga hiwalay na bersyon, halimbawa, Xrambler, kung saan maaari kang maghanap kaagad sa ilang mga serbisyo.
  4. - Sa ibang bansa, ang sistemang ito ay napakalaking katanyagan. Siya ay matagal nang isinalin sa Ruso, ngunit hindi siya nakatanggap ng mahusay na katanyagan sa runet. Ang mga gumagamit ay magagamit sa iba't ibang paghahanap (mga larawan, video, atbp.).
  5. - Ang isang kumpanya na kilala sa runet, ay bumubuo sa ilang mga direksyon nang sabay-sabay. Bilang karagdagan sa sarili nitong search engine at ang pinaka-popular na serbisyo sa mail, sila ay mga may-ari ng naturang mga proyekto bilang mga kaklase at vkontakte.
  6. - Nilikha bilang isang mapagkukunan ng estado sa Russia, ngunit hindi nakatanggap ng pamamahagi ng masa. Maaari mong isagawa ang iba't ibang mga format ng paghahanap sa pamamagitan nito, pati na rin makakuha ng kapaki-pakinabang na impormasyon.
  7. - Dinisenyo upang maghanap ng impormasyon sa segment ng Intsik Internet. Sino ang nakakaalam, marahil at ito ay magiging kapaki-pakinabang para sa iyo. Maaari kang makatanggap ng balita, maghanap ng mga larawan, musika, kumuha ng mga card at marami pang iba.
  8. - Proyekto lahat sikat na kumpanya Microsoft. Sa pamamagitan ng dami ng trapiko, ang site na ito ay nagraranggo ng pangalawang sa ranggo ng mga search engine sa mundo. Siya ay nagtatrabaho mula noong 1998 at sa panahong ito ay maraming beses na na-upgrade.
  9. - Tanging mga dayuhan ang tinatamasa ang serbisyong ito. Project American at bilang karagdagan sa search engine, ang kumpanya ay may masa ng iba pang mga site at serbisyo. Ito ay nagkakahalaga ng noting na mayroon silang pinakamalaking direktoryo ng mga sanggunian sa mga website ng World Cobweb.

Kung ang isa sa mga search engine ay hindi makahanap ng impormasyon, pagkatapos ay hindi hinahanap ito sa pamamagitan ng isa pang site? Ngayon mayroon kang ilang mga mapagkukunan ng kalidad, at tiyak na makikita mo kung ano ang kailangan mo.

kabuuan

Panimula

Ang ilang mga tao ay maaari na ngayong ipakita ang Internet nang hindi naghahanap, naghahanap ng issuing at pag-aayos ng lahat ng mga search engine ng impormasyon na ito (IPS). Ngunit kahit na kamakailan lamang, ang lahat ng impormasyon ng Internet ay masaya sa ilang mga direktoryo, ang pangalan ay nasa pagdinig pa (DMOZ, Yahoo).

Ngayon, ang halaga ng impormasyon sa Internet ay napakalaki na hindi posible na magkasya ito sa anumang mga direktoryo. Para sa pagproseso, pag-iimbak ng impormasyon, mga organisasyong paghahanap ay nilikha at patuloy na nilikha, mahusay na mga produkto ng software na tinatawag naming mga search engine (PS). Ang bawat search engine (search engine) ay may sariling mga database, ang kanilang sariling pagproseso, paghahanap, pagraranggo, at impormasyon na nagbibigay ng mga algorithm.

Ang mga sistema ng paghahanap sa internet ay.

Maaari mong ibigay ang sumusunod na kahulugan sa akademiko sa mga search engine. Ang search engine ay isang hanay ng mga programa at teknikal na paraan para sa pag-oorganisa sa internet ng isang paghahanap ng gumagamit, kung saan sa kahilingan ng teksto, ang gumagamit ay tumatanggap ng isang listahan ng mga may-katuturang (may-katuturang query) na mga resulta.

Ang pagpapalabas ay ginawa sa anyo ng isang listahan ng mga sanggunian sa pinagmumulan ng impormasyon na may maikling paglalarawan (preview) kung minsan sa larawan.

Para sa unang halimbawa, tandaan natin ang pinuno ng mundo ng paghahanap na "Google" at ang pinuno ng runet search engine na "Yandex". Bilang karagdagan sa mga search engine na ito, maaari kang tumawag ng isa pang dosenang umiiral na mga search engine, tungkol sa kung saan kami ay makipag-usap sa isang maliit na mas mababa.

Opinyon: Mga sistema ng paghahanap sa Google, Yandex at iba pa ay hindi generators (mga tagagawa) ng nilalaman, ngunit mga aggregator (baterya) ng nilalaman at sa pangunahing masa, nilalaman ng ibang tao. Ito ay nagkakahalaga ng pag-alala na ang paggamit ng nilalaman ng ibang tao upang lumikha ng kanilang sariling trapiko at ang monetization nito ay maaaring characterized bilang "pandarambong", na, sa pagsasanay, siyempre, ay hindi mangyayari.

Marka

  • At ibinabahagi ng Google ang unang dalawang lugar ng mga lider: mga 49% at 45%.
  • Ikatlong Lugar: Paghahanap Mail.ru ay tungkol sa 3%;
  • Ang natitirang mga search engine ay lumulutang sa ibaba 1%.

Pinapanood ko ang mga istatistika sa Google Analytics:

  • yandex / Organic 40.26%
  • google / Organic 38.93%
  • mail.ru / Organic 0.60%
  • rambler / Organic 0.52%
  • bing / organic 0.12%

Statistics Inxorab: Sa paghahanap para sa Yandex at tinutugunan din, at kung isaalang-alang mo na 3% ay isang mahusay na resulta kumpara sa 45%, pagkatapos ay maaari mong tawagan ang ikatlong sa katanyagan.

Sa pagsasaalang-alang na ito, ang pangangatuwiran tungkol sa katanyagan ng mga search engine bukod sa Yandex at Google, ay maaaring maiugnay sa pagpapatayo, at espesyal na pag-promote ng mga site sa iba pang mga search engine (hindi yandex at google), na hindi karapat-dapat pansin.

Paano gumagana ang mga search engine

Ang tanong ay kung paano gumagana ang mga search engine, ang parehong karaniwang bilang ang tanong ng kalangitan. Kung ang langit ay asul, pagkatapos ay mangolekta ng mga search engine ang impormasyon sa internet, naproseso ito, ranggo at pumunta sa query sa paghahanap.

Ang teorya ng paghahanap sa internet ay mas mahalaga at sa artikulo ay hindi dapat naroroon. Gayunpaman, ang mga highlight ay magiging kapaki-pakinabang sa amin:

Ang mga search engine sa Internet ay hindi nag-iimbak ng mga dokumento, ibig sabihin, hindi sila ganap na nag-download at nag-alis ng mga dokumento sa kanilang repository;

Ginagamit ng mga IP ang Internet bilang isang desentralisadong repository ng dokumento. Ang mga search engine ay paminsan-minsan na laktawan ang internet, piliin ang kinakailangan, ayon sa kanilang mga algorithm, impormasyon at bahagyang paglalagay nito (impormasyon) sa database nito (database). Mula dito ng ilang mga problema:

  • Ang mga IP ay ginagamit upang mag-isyu hindi lahat ng impormasyon sa internet, ngunit bahagi lamang;
  • Ang impormasyon sa internet ay madalas na nagbabago. Ang tungkol sa 1500 libong mga pahina bawat araw ay idinagdag, mula dito isang posibleng "walang laman na pagpapalabas";
  • Mayroong maraming bilang ng mga doubles (dobleng nilalaman). Sa kasamaang palad, wala akong tumpak na duplicate na data, at ang isang 5% na dobleng digit ay tila overestimated;
  • Ang isang pulutong ng advertising, na din bypass search engine;
  • Ang "wandering" ng mga robot ng paghahanap sa network ay paulit-ulit na pinatataas ang hindi mapagkukunan ng pag-load (hindi tumutukoy sa mga search engine);
  • Karamihan sa mga komersyal na site (mga 83%), at may isang maliit na kaalaman na halaga.

Para sa mga ito at ilang iba pang mga kadahilanan, ang napakalaki karamihan ng mga IPS Internet ay gumagamit ng scheme ng paghahanap sa keyword (mga search engine), at hindi isang klasikong paghahanap para sa scheme ng pag-uuri ng impormasyon.

Mga tampok sa paghahanap sa pamamagitan ng mga keyword

Sa kabila ng pagbabago ng mga algorithm ng mga search engine, ang advertisement na sinusubukan mong kumbinsihin sa amin na ang mga kotse ay maging mas matalinong at marumi, ang paghahanap para sa mga search engine ay isang paghahanap sa pamamagitan ng mga keyword.

Gusto ko ang scheme ng paghahanap na ito sa pamamagitan ng mga keyword.

Tulad ng makikita mo, ang operasyon ng internet search engine ay batay sa paghahanap para sa mga bagong dokumento (Spider + Crawler Search Robot), ang pag-index ng mga document na dokumento (indexer) at pagsasagawa ng isang user query (search engine engine engine). Ang mga pangalan ng mga robot ng paghahanap na ginagamit para sa mga layuning ito ay nakalista sa mga braket.

Tulad ng sinabi ko, ang karamihan sa mga search engine ay hindi kinopya ang buong mga teksto ng mga dokumento sa kanilang database. Upang maghanap ng isang index ng dokumento, nilikha ang imahe ng paghahanap nito. Upang maisaayos ang paghahanap ng software, ang robot ng pag-index ay lumilikha ng isang imahe ng dokumento ng software, ang tinatawag na derived method (nagmula). Iyon ay, ang pamagat at set. mga Keyword.

Gayunpaman, ito ay medyo posible na ang lahat ng IPS ay nagbibigay pansin sa mga sumusunod:

  • Ang pagkakaroon ng isang pangunahing salita sa. dokumento;</li><li>Ang pagkakaroon ng isang susi sa URL o domain;</li><li>Pangunahing presensya sa subtitle;</li><li>Ang kabuuang bilang ng mga susi sa pahina (% density);</li><li>Ang pagkakaroon ng mga susi sa paglalarawan (paglalarawan);</li><li>Anong mga link sa web ang humantong sa pahinang ito;</li><li>Anong mga panloob na link ang nasa pahinang ito.</li> </ul><h2><span>Mga pahina ng pagraranggo</span></h2><p>Sa dulo ng teorya, ito ay nagkakahalaga ng pagbanggit tungkol sa. Mas madalas, ang ranggo ng mga pahina ng pag-isyu ay binabanggit sa konteksto ng kaugnayan. Iyon ay, ang mga search engine ay dapat, bumuo ng mga resulta ng paghahanap para sa pinaka-tumpak na pagsunod sa query sa paghahanap. Tulad ng writes Yandex, walang dapat mawawala (kapunuan ng pagpapalabas) at walang dapat makita dagdag (pagkalipol katumpakan). Paano ito lumiliko sa pagsasanay, nakikita mo araw-araw.</p><h2>Output.</h2><ul><li>Ang mga search engine sa Internet ay kumplikadong mga produkto ng software na nagbibigay ng libu-libong espesyalista at malalaking mapagkukunan ng materyal.</li><li>Ang mga algorithm ng search engine ay itinatago sa mga lihim, bagaman ang mga pangunahing accent ng mga update sa algorithm ay magagamit sa publiko at nagdadala ng kanilang sariling mga pangalan.</li><li>Sa kabila ng iba't ibang diskarte sa pagbuo ng pagpapalabas, ang lahat ng mga search engine ay batay sa <a href="https://02stroy.ru/tl/canopies-and-awnings/podklyuchenie-dopolnitelnogo-radiatora-otopleniya-k.html">pangkalahatang mga prinsipyo</a> Pag-index ng mga pahina na nananatiling batayang sa pag-promote.</li> </ul><h2><span>Yandex search engine.</span></h2><p>Ang sikat na runet search engine, na kadalasang nagiging popular. Ayon sa mga istatistika noong 2009, patuloy na laktawan ng Yandex ang 15 milyong mga pahina ng runet, na nagpoproseso ng 140 libong GB ng data ng teksto, 1.6 bilyong natatanging mga larawan mula sa 2.1 bilyong larawan ng lahat.</p><p>Nilikha yandex search engine noong 1993. Ang salitang yandex ay hindi nangangahulugan ng anumang bagay, bagaman ito ay pinaniniwalaan na ito ang pagbabagong-anyo ng salitang "index", o ang pariralang "isa pang indexer". Ngayon Yandex.Poisk treats isang isang-kapat ng isang bilyong mga kahilingan sa bawat araw at kung ito ay kaya mapanghimasok, pagkatapos ay magiging aking paboritong search engine.</p><h2>Hanapin yandex.</h2><p>https://yandex.ru/: Ang paghahanap ng user Yandex ay nakaayos sa internet na isinasaalang-alang ang rehiyon ng gumagamit. Ang kakayahang maghanap ng mga larawan, video, card, balita, blog, kalakal at mga diksyunaryo.</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-4.png' align="center" width="100%" loading=lazy loading=lazy></p><p>Para sa isang manipis na paghahanap, mayroong iyong wika sa paghahanap dito (https://yandex.ru/support/search/query-larguage/).</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-6.png' width="100%" loading=lazy loading=lazy></p><p>search Systems Internet Yandex.</p><h2>Google search engine</h2><p>Sa paghahanap sa paghahanap sa Google, ang paghahanap ay nakaayos nang walang paksa (pangunahing paghahanap) at paghahanap sa pamamagitan ng mga partisyon: mga larawan, balita, card, video, pamimili, mga libro, flight, pananalapi.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-8.png' align="center" width="100%" loading=lazy loading=lazy></p><p>May mga setting:</p><p><b>Ligtas na paghahanap.</b> Pinapayagan kang i-block ang hindi katanggap-tanggap na nilalaman at sekswal na mga imahe sa mga resulta ng paghahanap sa Google. Ang tampok na ito ay hindi ginagarantiyahan ng isang daang porsyento na proteksyon, ngunit itinatago ang karamihan ng nilalaman na ito.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-13.png' align="center" width="100%" loading=lazy loading=lazy></p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-9.png' align="center" width="100%" loading=lazy loading=lazy></p><p><b>Pagtatakda ng bilang ng mga resulta</b> Sa pahina (default 10).</p><p><b>Personal na mga resulta</b>. Paghahanap sa mga link sa Google, mga larawan at video sa iyong ibinahagi ang iyong mga kaibigan sa mga social network.</p><p><b>Pagpili ng isang rehiyon</b>. Bilang default, ang kasalukuyang rehiyon.</p><p><b>Mga wika.</b> Maaari mong tukuyin ang wika ng paghahanap.</p><p><b>Advanced na paghahanap.</b> Pinapayagan kang maghanap ng mga pinalawak na parameter.</p><p><b>Mga instrumento.</b> Dito maaari mong piliin ang wika ng paghahanap, tukuyin ang oras ng impormasyon, at pumili ng eksaktong pagkakataon o lahat ng pagpapalabas.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-10.png' width="100%" loading=lazy loading=lazy></p><p>search Systems Internet Google.</p><h2>Mail search engine</h2><p>https://go.mail.ru/. Narito ang paghahanap ay nakaayos sa Internet (pangkalahatang paghahanap), video at mga larawan. May isang hiwalay na paghahanap para sa mga application para sa. <a href="https://02stroy.ru/tl/accessories-for-ladders/kak-podklyuchit-noutbuk-k-internetu-cherez-smartfon-varianty.html">mga aparatong mobile.</a>.</p><p> (<span>https://www.bing.com/?scope\u003dweb&form\u003dz9lh.</span>). Pangkalahatang paghahanap, maghanap ng mga larawan, video, balita, card.</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-11.png' align="center" width="100%" loading=lazy loading=lazy></p><p><b>Yahoo Paghahanap sa Russian</b>. https://ru.search.yahoo.com/. Purong paghahanap nang walang advertising. Paghahanap sa Internet, mga larawan at balita. Piliin ang oras upang magdagdag ng impormasyon.</p><h2>Iba pang mga search engine</h2><ul><li>Duckduckgo (https://duckduckgo.com/) intelligent na paghahanap.</li><li>Pipl (https://pipl.com/) Maghanap para sa mga tao sa USA.</li><li>Findsounds ( <span>http://www.findsounds.com/ 11 mga tool para sa pag-aaral ng kaugnayan ng mga pahina ng paghahanap sa site</span></li> </ul> <p>Ang pinaka-popular na serbisyo sa web ng kamakabaguhan ay ang search engine. Ang lahat ay ipinaliwanag dito, dahil ang mga oras na iyon kapag ang mga kinatawan ng unang mga gumagamit ng Internet ay maaaring obserbahan ang mga bagong item sa network matagal na ang nakalipas.</p> <p>Lumilitaw ang impormasyon at nagtitipon nang labis na ang tao ay naging napakahirap upang mahanap ang eksaktong isa na kailangan niya. Isipin, na parang isang paghahanap sa internet, kung ang isang ordinaryong gumagamit ay kailangang maghanap ng impormasyon na hindi maunawaan kung saan. Hindi na hindi namin maintindihan kung saan, dahil hindi ka makakahanap ng maraming impormasyon para sa isang manu-manong paghahanap.</p> <h2>Search engine, ano ito?</h2> <p>Well, kung ang gumagamit ay kilala na malaman ang mga site kung saan posible na magkaroon ng kinakailangang impormasyon, ngunit kung ano ang gagawin kung hindi man? Upang mapadali ang buhay ng isang tao sa paghahanap ng kinakailangang impormasyon sa internet at imbento ng mga search engine o simpleng mga search engine. Ang search engine ay gumaganap ng isang napakahalagang pag-andar, kung wala ang internet ay hindi gusto ito bilang ginamit namin upang makita - ito ay isang paghahanap para sa impormasyon sa network.</p> <p><b>Suriin ang sistema</b> - Ito ay isang espesyal na node sa web o ibang site na nagbibigay ng mga gumagamit na may hyperlink sa mga pahina, mga site na nakakatugon sa tinukoy na query sa paghahanap.</p> <p>Upang maging bahagyang mas tumpak, pagkatapos ay maghanap ng impormasyon sa Internet, na isinasagawa ng software at hardware functional setting at web interface para sa pakikipag-ugnay sa mga gumagamit.</p> <p>Upang makipag-ugnay sa isang tao na may isang search engine at isang web interface ay nilikha, iyon ay, nakikita at maliwanag na shell. Ang diskarte ng mga developer ng pag-unlad ay nagpapabilis sa paghahanap para sa maraming tao. Bilang isang patakaran, ito ay nasa internet na ang paghahanap ay isinasagawa gamit ang mga search engine, ngunit umiiral din ang mga sistema ng paghahanap para sa mga server ng FTP, <a href="https://02stroy.ru/tl/exterior-stairs/vystup-iz-gipsokartona-konstruktivnye-osobennosti-vystupa-dlya.html">paghiwalayin ang mga species</a> Mga kalakal sa World Wide Web, o impormasyon ng balita o iba pang mga direksyon sa paghahanap.</p> <p>Ang paghahanap ay maaaring isagawa hindi lamang sa pamamagitan ng tekstong nilalaman ng mga site, kundi pati na rin sa iba pang mga uri ng impormasyon na maaaring maghanap ng isang tao: mga larawan, video, mga sound file, atbp.</p> <h2>Paano ang paghahanap para sa search engine?</h2> <p>Ang paghahanap mismo ay nasa Internet, eksakto ang parehong bilang panonood ng mga web site ay posible sa Internet Browser Internet browser. Pagkatapos lamang itanong ng user ang kanyang query sa search bar, ang paghahanap mismo ay direkta.</p> <p>Ang anumang search engine ay naglalaman ng isang bahagi ng software kung saan ang buong search engine ay batay, ito ay tinatawag na search engine - ito ay isang pakete ng software at nagbibigay ng kakayahang maghanap ng impormasyon. Pagkatapos i-on ang search engine, ang pagbuo ng query sa paghahanap ng isang tao at ipasok ito sa string ng paghahanap, ang search engine ay bumubuo ng isang pahina na may isang listahan ng mga resulta ng paghahanap, ang pinaka-may-katuturan, ayon sa search engine dito ay matatagpuan sa itaas.</p> <p>Paghahanap ng kaugnayan - Maghanap para sa pinaka-responding service sa mga materyales ng gumagamit at ang lokasyon ng hyperlink sa mga ito sa pahina ng pagpapalabas na may mas tumpak na mga resulta sa itaas ng iba. Ang pamamahagi mismo ay tinatawag na ranggo ng mga site.</p> <p>Kaya paano naghahanda ang search engine para sa pag-isyu ng iyong mga materyales at kung paano natagpuan ang pangalan ng search engine? Ang koleksyon ng impormasyon sa network ay nag-aambag na natatangi para sa bawat sistema ng paghahanap ng isang robot o ibang bot, na mayroon ding ilang iba pang mga kasingkahulugan bilang isang crawler o spider, at ang sistema ng paghahanap mismo ay maaaring nahahati sa tatlong yugto:</p> <p>Sa unang hakbang ng trabaho sa search engine, maaari mong i-attribute ang mga site ng pag-scan sa pandaigdigang network at pagkolekta ng iyong sariling mga kopya ng mga web page. Ito ay bumubuo ng isang malaking bilang ng hindi pa naproseso at hindi angkop na impormasyon para sa mga resulta ng paghahanap.</p> <p>Ang ikalawang yugto ng search engine ay nabawasan upang dalhin sa pagkakasunud-sunod ng dating nakuha, sa unang yugto ng impormasyon mula sa mga site. Ang pag-uuri na ito ay ginawa, na para sa pinakamaliit na oras ay pabor sa pinakamataas na kalidad ng paghahanap, kung saan ang mga gumagamit ay talagang naghihintay para sa search engine. Ang entablado ay tinatawag na indexing, nangangahulugan ito na ang mga pahina ay handa na para sa extradition, at ang kasalukuyang base ay ituturing na isang index.</p> <p>Lamang ang ikatlong yugto at nagiging sanhi ng mga resulta ng paghahanap pagkatapos matanggap ang isang kahilingan mula sa client nito, batay sa key o tungkol sa mga keyword na tinukoy sa kahilingan. Nag-aambag ito sa pagpili ng pinaka-may-katuturang kahilingan para sa impormasyon at kasunod na pagpapalabas. Dahil ang impormasyon, napaka, napakarami, ang search engine ay gumaganap ng ranggo sa linya kasama ang mga algorithm nito. <br>Ang pinakamahusay na search engine ay ang isa na maaaring magbigay ng pinaka-tamang pagtugon sa materyal sa kahilingan ng gumagamit. Ngunit dito maaari nilang matugunan ang mga resulta na naiimpluwensyahan ng mga taong interesado sa pagtataguyod ng kanilang site, ang mga naturang site ay hindi palaging, ngunit madalas na lumilitaw sa mga resulta ng paghahanap, ngunit hindi para sa isang mahabang panahon.</p> <p>Bagaman tinukoy ang mga lider ng mundo sa maraming rehiyon, patuloy na binuo ng mga search engine ang kanilang mataas na kalidad, paghahanap. Ang mas mahusay na paghahanap ay maaari nilang ibigay, mas maraming mga tao ang gagamitin ito.</p> <h2>Paano gamitin ang search engine?</h2> <p>Ano ang isang search engine at kung paano ito gumagana nang maliwanag, ngunit kung paano gamitin ito ng tama? Karamihan sa mga site ay laging nagpapakita ng isang string ng paghahanap, at sa tabi nito ay ang pindutan ng paghahanap o paghahanap. Ang isang kahilingan ay ipinasok sa string ng paghahanap, pagkatapos ay kailangan mong pindutin ang pindutan ng paghahanap o kung paano ito nangyayari nang mas madalas, pindutin ang Enter key sa keyboard at sa loob ng ilang segundo makuha mo ang resulta ng query bilang isang listahan.</p> <p>Ngunit upang makuha ang tamang sagot sa kahilingan sa paghahanap, hindi laging posible na makuha ang unang pagkakataon. Upang maghanap para sa ninanais ay hindi naging masakit, kinakailangan upang maayos na bumuo ng isang query sa paghahanap at sundin ang mga rekomendasyon sa ibaba.</p> <h3>Gumawa ng tama ang query sa paghahanap</h3> <p>Susunod ay ipahiwatig ang mga tip sa kung paano gamitin ang search engine. Kasunod ng ilang mga trick at panuntunan kapag naghahanap ng impormasyon sa search engine ay magbibigay ng pagkakataon upang makuha ang nais na resulta nang mas mabilis. Sundin ang mga rekomendasyong ito:</p> <ol><li>Tinitiyak ng karampatang pagsulat ng mga salita ang maximum na bilang ng mga tugma sa nais na bagay ng impormasyon (hindi bababa sa mga modernong search engine na natutunan na iwasto ang mga error sa spelling, ngunit hindi kinakailangan na pabayaan ang payo na ito).</li> <li>Sa pamamagitan ng paggamit ng mga kasingkahulugan sa query, maaari mong maabot ang isang mas malawak na hanay ng paghahanap.</li> <li>Kung minsan ang pagbabago ng salita sa teksto ng query ay maaaring magdala ng mas malaking resulta. Humiling ng isang kahilingan.</li> <li>Bago ang kahilingan ay tumutukoy, gumamit ng tumpak na pagpasok ng mga parirala upang matukoy <a href="https://02stroy.ru/tl/canopies-and-awnings/pochemu-gitler-schital-levitana-glavnym-vragom-kto-byl-glavnym-vragom.html">ang pangunahing kakanyahan</a> Paghahanap.</li> <li>Eksperimento sa mga keyword. Ang paggamit ng mga keyword at parirala ay maaaring makatulong na makilala ang pangunahing kakanyahan, at ang search engine ay magbibigay ng mas may-katuturang resulta.</li> </ol><p>Kaya ang isang search engine ay walang anuman kundi ang pagkakataon upang mahanap ang impormasyon ng interes at karaniwang ganap na libre upang gamitin ito, upang matuto ng isang bagay, upang maunawaan ang isang bagay o gumawa ng tamang konklusyon para sa iyong sarili. Maraming hindi na kumakatawan sa kanilang buhay nang walang paghahanap ng boses, kung saan ang teksto ay hindi kailangang makakuha, kailangan mo lamang ipahayag ang iyong kahilingan, at ang aparatong input ng mikropono ay narito. Ang lahat ng ito ay nagpapahiwatig ng isang patuloy na pag-unlad ng mga teknolohiya sa paghahanap sa internet at ang pangangailangan para sa kanila.</p> <p>Kasama sa arkitektura ng search engine ang:</p> <i> </i><p><input class="toctogglecheckbox" id="toctogglecheckbox" role="button" style="display:none" type="checkbox"></p><h3><span>Encyclopedic Youtube.</span> </h3> <ul> <p>1 / 5</p><p>✪ Aralin 3: Paano gumagana ang search engine. Panimula sa SEO.</p> <p>✪ Search Engine mula sa loob</p> <p>✪ Shodan - itim na google</p> <p>✪ Ang search engine ng Cheburashka ay papalitan ang Google at Yandex sa Russia</p> <p>✪ Aralin 1 - Paano nakaayos ang search engine</p> <h4>Subtitle</h4> <i> </i> </ul><h2>Kasaysayan</h2> <table class="bordered infobox" style="padding: 5px; font-size: 0.867em;"><tbody><tr><th class="first_header" colspan="«3»">Kronolohiya</th> </tr><tr><th>Taon</th> <th>Sistema</th> <th>Kaganapan</th> </tr><tr><td rowspan="3">1993 </td> <td><span>W3catalog?!</span> </td> <td>Tumatakbo</td> </tr><tr><td>Aliweb.</td> <td>Tumatakbo</td> </tr><tr><td><span>Jumpstation.</span> </td> <td>Tumatakbo</td> </tr><tr><td rowspan="3">1994 </td> <td><span>Webcrawler.</span> </td> <td>Tumatakbo</td> </tr><tr><td><span>Infoseek.</span> </td> <td>Tumatakbo</td> </tr><tr><td>Lycos.</td> <td>Tumatakbo</td> </tr><tr><td rowspan="7">1995 </td> <td>Altavista.</td> <td>Tumatakbo</td> </tr><tr><td>Daum</td> <td>Base</td> </tr><tr><td><span>Buksan ang teksto.</span> Web index</td> <td>Tumatakbo</td> </tr><tr><td>Magellan.</td> <td>Tumatakbo</td> </tr><tr><td>Excite.</td> <td>Tumatakbo</td> </tr><tr><td>SAPO.</td> <td>Tumatakbo</td> </tr><tr><td>Yahoo!</td> <td>Tumatakbo</td> </tr><tr><td rowspan="5">1996 </td> <td><span>Dogpile.</span> </td> <td>Tumatakbo</td> </tr><tr><td><span>Inktomi.</span> </td> <td>Base</td> </tr><tr><td>Rambler.</td> <td>Base</td> </tr><tr><td><span>Hotbot.</span> </td> <td>Base</td> </tr><tr><td>Magtanong kay Jeeves.</td> <td>Base</td> </tr><tr><td rowspan="2">1997 </td> <td><span>Hilagang liwanag</span> </td> <td>Tumatakbo</td> </tr><tr><td>Yandex.</td> <td>Tumatakbo</td> </tr><tr><td>1998 </td> <td>Google</td> <td>Tumatakbo</td> </tr><tr><td rowspan="5">1999 </td> <td><span>Allthereweb.</span> </td> <td>Tumatakbo</td> </tr><tr><td><span>Genieknows.</span> </td> <td>Base</td> </tr><tr><td>NAVER.</td> <td>Tumatakbo</td> </tr><tr><td>Teoma.</td> <td>Base</td> </tr><tr><td><span>Vivisimo.</span> </td> <td>Base</td> </tr><tr><td rowspan="2">2000 </td> <td>Baidu.</td> <td>Base</td> </tr><tr><td><span>Exalead.</span> </td> <td>Base</td> </tr><tr><td>2003 </td> <td><span>Info.com.</span> </td> <td>Tumatakbo</td> </tr><tr><td rowspan="3">2004 </td> <td>Yahoo! Paghahanap.</td> <td>Huling paglulunsad</td> </tr><tr><td><span>A9.com.</span> </td> <td>Tumatakbo</td> </tr><tr><td><span>Sogou.</span> </td> <td>Tumatakbo</td> </tr><tr><td rowspan="4">2005 </td> <td>MSN Search.</td> <td>Huling paglulunsad</td> </tr><tr><td>Ask.com.</td> <td>Tumatakbo</td> </tr><tr><td>Nigma</td> <td>Tumatakbo</td> </tr><tr><td><span>Goodsearch.</span> </td> <td>Tumatakbo</td> </tr><tr><td><span>Hanapin mo ako</span> </td> <td>Base</td> </tr><tr><td rowspan="5">2006 </td> <td><span>wikiseek.</span> </td> <td>Base</td> </tr><tr><td>Quaero.</td> <td>Base</td> </tr><tr><td>Live na paghahanap.</td> <td>Tumatakbo</td> </tr><tr><td><span>Chacha.</span> </td> <td>Patakbuhin (beta)</td> </tr><tr><td><span>Guruji.com.</span> </td> <td>Patakbuhin (beta)</td> </tr><tr><td rowspan="4">2007 </td> <td>wikiseek.</td> <td>Tumatakbo</td> </tr><tr><td><span>Sproose.</span> </td> <td>Tumatakbo</td> </tr><tr><td>Wikia Paghahanap.</td> <td>Tumatakbo</td> </tr><tr><td><span>Blackle.com.</span> </td> <td>Tumatakbo</td> </tr><tr><td rowspan="10">2008 </td> <td>Duckduckgo.</td> <td>Tumatakbo</td> </tr><tr><td>Toby.</td> <td>Tumatakbo</td> </tr><tr><td><span>Picollator.</span> </td> <td>Tumatakbo</td> </tr><tr><td><span>Viewzi.</span> </td> <td>Tumatakbo</td> </tr><tr><td>Cuil.</td> <td>Tumatakbo</td> </tr><tr><td><span>Boogami.</span> </td> <td>Tumatakbo</td> </tr><tr><td><span>Leapfish.</span> </td> <td>Patakbuhin (beta)</td> </tr><tr><td><span>Forestle.</span> </td> <td>Tumatakbo</td> </tr><tr><td>Vadlo.</td> <td>Tumatakbo</td> </tr><tr><td>Powerset.</td> <td>Tumatakbo</td> </tr><tr><td rowspan="5">2009 </td> <td>Bing.</td> <td>Tumatakbo</td> </tr><tr><td>Kaz.kz.</td> <td>Tumatakbo</td> </tr><tr><td><span>Yebol</span> </td> <td>Patakbuhin (beta)</td> </tr><tr><td><span>Mugurdy.</span> </td> <td>Pagsasara</td> </tr><tr><td><span>Scout.</span> </td> <td>Tumatakbo</td> </tr><tr><td rowspan="3">2010 </td> <td>Cuil.</td> <td>Pagsasara</td> </tr><tr><td>BLEKKO.</td> <td>Patakbuhin (beta)</td> </tr><tr><td>Viewzi.</td> <td>Pagsasara</td> </tr><tr><td rowspan="1">2012 </td> <td>WAZZUB.</td> <td>Tumatakbo</td> </tr><tr><td rowspan="1">2014 </td> <td>Satellite.</td> <td>Patakbuhin (beta)</td> </tr></tbody></table><p>Sa isang maagang yugto ng pag-unlad ng Internet Tim Berners-Lee suportado ng isang listahan ng mga web server na nai-post sa website ng CERN. Ang mga site ay naging higit pa at higit pa, at manu-manong pinananatili ang naturang listahan ay nagiging mas kumplikado. Ang website ng NCSA ay isang espesyal na seksyon na "Ano ang Bago!" (Ingles kung ano ang bago!), Kung saan nai-publish nila ang mga link sa mga bagong site.</p><p>Ang unang programa ng computer upang maghanap sa internet ay ang programa <span>Archie.</span> (Eng archie - archive nang walang titik na "b"). Nilikha ito noong 1990 ni Alan Emtage, Bill Heel (Bill Heelan) at J. Peter Doych (J. Peter Deutsch), mga mag-aaral na nag-aaral ng computer science sa McGill University sa Montreal. Ang programang na-download na listahan ng lahat ng mga file mula sa lahat ng magagamit na mga anonymous na mga server ng FTP at binuo ang isang database kung saan maaari kang maghanap sa pamamagitan ng mga pangalan ng file. Gayunpaman, ang programa ng Archie ay hindi nag-index ng nilalaman ng mga file na ito, dahil ang dami ng data ay napakaliit na ang lahat ay madaling makita nang manu-mano.</p><p>Ang pag-unlad at pagpapalaganap ng Gopher Network Protocol na imbento noong 1991 ni Mark McCahill (McCahill) sa University of Minnesota, na humantong sa paglikha ng dalawang bagong programa sa paghahanap, <span>Veronica.</span> At jughead. Tulad ni Archi, hinahanap nila ang mga pangalan ng file at mga headline na nakaimbak sa mga sistema ng index ng Gopher. Veronica (Eng. <span>Napakadaling index ng net-wide ng rodent sa nakakompyuter na mga archive</span>) Pinapayagan upang maghanap sa pamamagitan ng mga keyword karamihan ng mga header ng gopher menu sa lahat ng mga listahan ng gopher. JUGHEAD Program (Eng. <span>Jonzy "S Universal Gopher Hierarchy Excavation and Display.</span>) Kinuha ko ang impormasyon ng menu mula sa ilang mga server ng gopher. Kahit na ang pangalan ng archie search engine ay walang kaugnayan sa comic cycle <span>"Archie"</span>Gayunpaman, ang Veronica at Jughead ay mga character ng mga komiks na ito.</p><p>Noong tag-araw ng 1993, walang isang sistema upang maghanap ng Web, bagaman ang maraming dalubhasang direktoryo ay sinusuportahan nang manu-mano. Si Oscar Niershtrasz (Oscar Nierstrasz) sa Geneva University ay nagsulat ng maraming sitwasyon sa Perl, na pana-panahong kinopya ang mga pahinang ito at muling isinulat ang mga ito sa isang karaniwang format. Ito ay naging batayan para sa. <span>W3catalog?!</span>, ang unang primitive na sistema ng paghahanap ng network, na inilunsad noong Setyembre 2, 1993.</p><p>Marahil, ang unang robot ng paghahanap na nakasulat sa wikang Perl ay "World Wide Web Wanderer" - Mateo Grey (Mateo Grey) mula noong Hunyo 1993. Nilikha ng robot na ito ang index ng paghahanap na "Wandex". Ang layunin ng wanderer robot ay upang sukatin ang laki ng World Wide Web at hanapin ang lahat ng mga web page na naglalaman ng mga salita mula sa kahilingan. Noong 1993, lumitaw ang ikalawang search engine na "Aliweb". Hindi ginamit ng AliWeb ang robot ng paghahanap, ngunit sa halip ay inaasahan ko ang mga notification mula sa mga administrator ng website tungkol sa pagkakaroon ng isang index file sa kanilang mga site sa isang partikular na format.</p><p>Jumpstation.</span>Nilikha noong Disyembre 1993 ni Jonathan Fletcher, naghahanap ng isang web page at binuo ang kanilang mga indeks gamit ang isang robot ng paghahanap, at gumamit ng isang web form bilang isang interface para sa mga formulating query sa paghahanap. Ito ang unang tool sa paghahanap sa online na pinagsama ang tatlong pinakamahalagang function ng search engine (check, indexing at aktwal na paghahanap). Dahil sa limitadong mga mapagkukunan ng mga computer noong panahong iyon, ang pag-index at, samakatuwid, ang paghahanap ay limitado lamang sa mga pangalan at header ng mga web page na natagpuan ng robot ng paghahanap.</p><p>Ang mga search engine ay lumahok sa "bubble ng dotcomms" ng huling bahagi ng dekada 1990. Ang ilang mga kumpanya ay epektibong pumasok sa merkado, pagtanggap ng mga kita ng rekord sa panahon ng kanilang pangunahing pampublikong alok. Ang ilan ay inabandona sa merkado ng mga pampublikong magagamit na mga search engine at nagsimulang magtrabaho lamang sa sektor ng korporasyon, halimbawa, <span>Hilagang liwanag</span>.</p><p>Tinulungan ng Google ang ideya ng pagbebenta ng mga keyword noong 1998, pagkatapos ito ay isang maliit na kumpanya na nagsisiguro sa trabaho ng search engine sa goto.com. Ang hakbang na ito ay minarkahan para sa paglipat ng mga search engine mula sa kumpetisyon sa bawat isa sa isa sa mga pinaka-kapaki-pakinabang na komersyal na negosyo sa internet. Ang mga search engine ay nagsimulang magbenta ng mga unang lugar sa mga resulta ng paghahanap sa mga indibidwal na kumpanya.</p><p>Ang Google Search Engine ay tumatagal ng isang kilalang posisyon mula noong simula ng 2000s. Nakamit ng kumpanya ang mataas na posisyon dahil sa mahusay na mga resulta ng paghahanap gamit ang algorithm ng PageRank. Ang algorithm ay isinumite sa publiko sa artikulong "The Anatomy of Search Engine", na isinulat ni Sergey Brin at Larry Page, Founder ng Google. Ang umuulit na algorithm ay nagraranggo ng mga web page batay sa pagtatasa ng bilang ng mga hyperlink sa web page sa ilalim ng palagay na ang "mabuti" at "mahalagang" mga pahina ay tumutukoy sa higit sa iba. Ang interface ng Google ay dinisenyo sa estilo ng Spartan kung saan walang sobra-sobra, hindi katulad ng maraming mga kakumpitensya nito na naka-embed sa search engine sa isang web portal. Ang search engine ng Google ay naging popular na lumitaw ang mga imitatives ng system, halimbawa, <span>Misteryo Seeker.</span>(Lihim na search engine).</p> <h3><span>Maghanap ng impormasyon sa Russian</span></h3> <p>Noong 1996, ipinatupad ang isang paghahanap na isinasaalang-alang ang morpolohiya ng Russia sa AltaVista Search Engine at ang orihinal na Russian Search Engines Rambler at Aport ay inilunsad. Noong Setyembre 23, 1997, binuksan ang search engine ng Yandex. Noong Mayo 22, 2014, binuksan ang Rostelecom ng National Satellite Search Engine, na sa oras ng 2015 ay nasa beta testing. Noong Abril 22, 2015, binuksan ang isang bagong serbisyo ng satelayt. Partikular na mga bata para sa mga batang may pinahusay na seguridad.</p><p>Ang mga pamamaraan ng pagtatasa ng kumpol at paghahanap para sa metadata ay nakatanggap ng mahusay na katanyagan. Ng internasyonal na mga kotse ng naturang plano, ang pinakadakilang katanyagan <span>"Clusty"</span> Mga kumpanya <span>Vivisimo.</span>. Noong 2005, ang nigma search engine na sumusuporta sa awtomatikong clustering ay inilunsad sa Russia sa suporta ng Moscow State University. Noong 2006, binuksan ng Russian metamoshin quintura, nag-aalok ng visual clustering sa anyo ng mga tag na ulap. Nag-eksperimento din si Nigma sa visual clustering.</p> <h2><span>Paano gumagana ang search engine</span></h2> <p>Ang mga pangunahing bahagi ng search engine: paghahanap robot, index, search engine.</p><p>Bilang isang panuntunan, ang mga sistema ay nagtatrabaho sa mga yugto. Una, ang paghahanap ng robot ay tumatanggap ng nilalaman, pagkatapos ay ang indexer ay bumubuo ng isang index na magagamit para sa paghahanap ng index, at sa wakas, ang search engine ay nagbibigay ng pag-andar upang maghanap para sa na-index na data. Upang i-update ang search engine, ang cycle ng pag-index ay muling ginagamit.</p><p>Ang mga search engine ay gumagana, pag-iimbak ng impormasyon tungkol sa maraming mga web page na nakuha nila mula sa mga pahina ng HTML. Maghanap ng robot o "crawler" (Eng crawler) - isang programa na awtomatikong pumasa sa lahat ng mga link na natagpuan sa pahina, at nagha-highlight sa kanila. Crowler, batay sa mga sanggunian o batay sa isang paunang natukoy na listahan ng address, maghanap ng mga bagong dokumento na hindi pa kilala sa search engine. Maaaring ibukod ng may-ari ng site ang ilang mga pahina gamit ang robots.txt gamit ang maaari mong ipagbawal ang pag-index ng mga file, mga pahina o mga direktoryo ng site.</p><p>Sinusuri ng search engine ang nilalaman ng bawat pahina para sa karagdagang pag-index. Ang mga salita ay maaaring makuha mula sa mga headline, teksto ng teksto o mga espesyal na larangan - Metategs. Ang indexer ay isang module na pinag-aaralan ang pahina, na dati nang nasira sa mga bahagi sa pamamagitan ng paglalapat ng sarili nitong leksiko at morphological algorithm. Ang lahat ng mga elemento ng web page ay pinalawig at pinag-aralan nang hiwalay. Ang data ng web page ay naka-imbak sa database ng index para magamit sa kasunod na mga kahilingan. Pinapayagan ka ng index na mabilis kang makahanap ng impormasyon sa kahilingan ng user. Ang isang bilang ng mga search engine na katulad ng Google Store ang orihinal na pahina ng kabuuan o bahagi nito, ang tinatawag na cache, pati na rin ang iba't ibang impormasyon tungkol sa web page. Ang iba pang mga sistema na katulad ng AltaVista ay nakaimbak sa bawat salita ng bawat nahanap na pahina. Tinutulungan ng paggamit ng cache ang pagkuha ng pagkuha ng impormasyon mula sa mga binisita na pahina. Ang mga naka-cache na pahina ay laging naglalaman ng teksto na tinanong ng user sa query sa paghahanap. Ito ay maaaring maging kapaki-pakinabang kapag na-update ang web page, iyon ay, hindi na naglalaman ng teksto ng kahilingan ng gumagamit, at ang pahina sa cache ay matanda. Ang sitwasyong ito ay nauugnay sa pagkawala ng mga link (Eng. <span>linkrot.</span>) At magiliw sa gumagamit (usability) Google diskarte. Ipinapahiwatig nito ang pagpapalabas ng maikling mga fragment ng teksto mula sa cache na naglalaman ng teksto ng query. Ang prinsipyo ng pinakamaliit na sorpresa ay may bisa, karaniwang inaasahan ng gumagamit na makita ang nais na mga salita sa mga teksto ng nakuha na mga pahina ( <span>Mga pag-expire ng user.</span>). Bilang karagdagan, ang paggamit ng mga naka-cache na pahina ay nagpapabilis sa paghahanap, ang mga pahina ng cache ay maaaring maglaman ng naturang impormasyon na hindi na magagamit kahit saan.</p><p>Ang search engine ay gumagana sa mga file na output na nakuha mula sa indexer. Ang search engine ay tumatagal ng mga kahilingan ng user, pinoproseso ang mga ito gamit ang isang index at ibabalik ang mga resulta ng paghahanap.</p><p>Kapag ang isang gumagamit ay pumasok sa isang query sa search engine (karaniwang gumagamit ng mga keyword), sinusuri ng system ang index nito at nagbibigay ng isang listahan ng mga pinaka-angkop na mga web page (pinagsunod-sunod ng anumang criterion), karaniwang may isang maikling anotasyon na naglalaman ng isang header ng dokumento at kung minsan ay bahagi ng teksto. Ang index ng paghahanap ay batay sa isang espesyal na pamamaraan batay sa impormasyon na nakuha mula sa mga web page. Mula noong 2007, ang Google Search Engine ay nagbibigay-daan sa iyo upang maghanap ng oras, na lumilikha ng nais na mga dokumento (pagtawag sa menu ng Mga Tool sa Paghahanap at ang direksyon ng hanay ng oras). Sinusuportahan ng karamihan sa mga search engine ang paggamit ng mga operator ng Boolean sa mga query at, o, hindi, na nagbibigay-daan sa iyo upang linawin o palawakin ang listahan ng mga nais na keyword. Sa kasong ito, ang sistema ay maghanap ng mga salita o parirala nang eksakto kung paano ito ipinakilala. Ang ilang mga search engine ay may pagkakataon. <span>tinatayang paghahanap</span>Sa kasong ito, pinalawak ng mga user ang lugar ng paghahanap, na tumutukoy sa distansya sa mga keyword. Mayroon ding. <span>conceptual Search.</span>na gumagamit ng statistical analysis ng paggamit ng nais na mga salita at parirala sa mga teksto ng mga web page. Ang mga sistemang ito ay posible upang itala ang mga query sa natural na wika. Ang isang halimbawa ng naturang search engine ay magtanong sa website ng COM.</p><p>Ang pagiging kapaki-pakinabang ng search engine ay depende sa kaugnayan ng mga pahina na natagpuan sa pamamagitan ng ito. Hindi bababa sa milyun-milyong mga web page at maaaring magsama ng isang salita o parirala, ngunit ang ilan sa mga ito ay maaaring maging mas may kaugnayan, popular o makapangyarihan kaysa sa iba. Karamihan sa mga search engine ay gumagamit ng mga pamamaraan sa pagraranggo upang magretiro sa listahan ng "pinakamahusay". Ang mga search engine ay nagpapasiya kung aling mga pahina ang mas may kaugnayan, at sa anong pagkakasunud-sunod ang mga resulta ay dapat ipakita, sa iba't ibang paraan. Mga pamamaraan sa paghahanap, pati na rin ang internet mismo ay nagbabago sa paglipas ng panahon. Kaya dalawang pangunahing uri ng mga search engine ang lumitaw: sistema ng mga paunang natukoy at hierarchically order keywords at mga sistema kung saan ang isang inverted index ay nabuo batay sa pagtatasa ng teksto.</p><p>Karamihan sa mga search engine ay mga komersyal na negosyo na kumikita sa kapinsalaan ng advertising, sa ilang mga search engine maaari kang bumili ng mga unang lugar sa dagdag na singil para sa tinukoy na mga keyword. Ang mga search engine na hindi kumukuha ng pera para sa pamamaraan para sa mga resulta ng pag-isyu, kumita sa advertising sa konteksto, habang ang mga mensahe sa advertising ay sumunod sa kahilingan ng gumagamit. Ang ganitong advertisement ay ipinapakita sa pahina na may isang listahan ng mga resulta ng paghahanap, at ang mga search engine ay kumita sa bawat gumagamit na mag-click sa mga mensahe sa advertising.</p> <h2><span>Mga Uri ng Mga Search Engine.</span></h2> <p>Mayroong apat na uri ng mga search engine: may mga robot ng paghahanap, pinamamahalaan ng tao, hybrid at meta-system.</p> <ul><li><i>mga sistema gamit ang mga robot ng paghahanap</i></li> </ul> Binubuo ng tatlong bahagi: Krauller ("bot", "robot" o "spider"), index at software search engine. Kinakailangan ang Crowler upang lampasan ang network at lumikha ng mga web page. Index - isang malaking archive ng mga kopya ng mga web page. layunin <a href="https://02stroy.ru/tl/internal-stairs/kvartirnyi-teploschetchik-danfoss-teploschetchiki-i-komplektuyushchie.html">software.</a> - Suriin ang mga resulta ng paghahanap. Dahil sa ang katunayan na ang robot ng paghahanap sa mekanismong ito ay patuloy na sinusuri ang network, impormasyon sa <a href="https://02stroy.ru/tl/accessories-for-ladders/chto-dolzhno-byt-vazhnee-razum-ili-chuvstva-chto-v-bolshei.html">higit sa</a> may kaugnayan. Karamihan sa mga modernong search engine ay mga sistema ng ganitong uri. <ul><li><i>man-driven (mapagkukunan katalogo)</i></li> </ul> Ang mga search engine na ito ay tumatanggap ng mga listahan ng mga web page. Ang direktoryo ay naglalaman ng address, pamagat at <a href="https://02stroy.ru/tl/ramps/administrativnoe-delenie-italii-osobennosti-kratkoe-opisanie-osnovnyh.html">maikling Paglalarawan</a> Lugar. Ang direktoryo ng mapagkukunan ay naghahanap lamang ng mga resulta mula sa mga paglalarawan ng pahina na isinumite dito sa pamamagitan ng mga webmaster. Ang bentahe ng mga direktoryo ay ang lahat ng mga mapagkukunan ay sinuri nang manu-mano, samakatuwid, ang kalidad ng nilalaman ay mas mahusay kumpara sa mga resulta na nakuha ng unang uri ng sistema. Ngunit mayroon ding disadvantage - ang pag-update ng mga direktoryong ito ay manu-mano at maaaring makabuluhang mahuli sa likod ng tunay na kalagayan. Ang ranggo ng pahina ay hindi maaaring baguhin agad. Bilang mga halimbawa ng naturang mga sistema, maaari mong dalhin <span>catalog Yahoo.</span>, DMOZ at Galaxy. <ul><li><i>hybrid Systems.</i></li> </ul> Ang ganitong mga search engine tulad ng Yahoo, Google, MSN ay nagsasama ng mga function ng mga sistema gamit ang mga robot ng paghahanap, at mga sistema na pinamamahalaan ng tao. <ul><li><i>meta system.</i></li> </ul> Ang mga sistema ng metapoisk ay pagsamahin at ranggo ang mga resulta ng ilang mga search engine nang sabay-sabay. Ang mga search engine na ito ay kapaki-pakinabang kapag ang bawat search engine ay may natatanging index, at ang mga search engine ay mas mababa "smart." Dahil ngayon ang paghahanap ay napabuti magkano, ang pangangailangan para sa kanila ay nabawasan. Mga halimbawa: <span>Metacrawler.</span> at paghahanap ng msn. <h2><span>Search engine market.</span></h2> <p>Ang Google ang pinaka-popular na search engine sa mundo na may bahagi ng merkado na 68.69%. Ang Bing ay tumatagal ng pangalawang posisyon, ang bahagi nito ay 12.26%.</p><p>Ang pinaka-popular na mga search engine sa mundo:</p> <table class="wikitable sortable"><tbody><tr class="odd"><th>Suriin ang sistema</th> <th class="c">Ibahagi ang Market noong Hulyo 2014.</th> <th>Ibahagi ang Market noong Oktubre 2014.</th> <th class="c">Ibahagi ang Market noong Setyembre 2015.</th> </tr><tr><td>Google</td> <td class="e" style="text-align:right;">68,69 % </td> <td style="text-align:right;">58.01 % </td> <td class="e" style="text-align:right;">69.24% </td> </tr><tr class="odd"><td>Baidu.</td> <td class="c" style="text-align:right;">17,17 % </td> <td style="text-align:right;">29.06 % </td> <td class="c" style="text-align:right;">6,48% </td> </tr><tr><td>Bing.</td> <td class="e" style="text-align:right;">6.22 % </td> <td style="text-align:right;">8.01 % </td> <td class="e" style="text-align:right;">12,26% </td> </tr><tr class="odd"><td>Yahoo!</td> <td class="c" style="text-align:right;">6.74 % </td> <td style="text-align:right;">4.01 % </td> <td class="c" style="text-align:right;">9,19% </td> </tr><tr><td>AOL.</td> <td class="e" style="text-align:right;">0,13 % </td> <td style="text-align:right;">0.21 % </td> <td class="e" style="text-align:right;">1,11% </td> </tr><tr class="odd"><td>Excite.</td> <td class="c" style="text-align:right;">0.22 % </td> <td style="text-align:right;">0,00 % </td> <td class="c" style="text-align:right;">0.00% </td> </tr><tr><td>Magtanong.</td> <td class="e" style="text-align:right;">0,13 % </td> <td style="text-align:right;">0,10 % </td> <td class="e" style="text-align:right;">0,24% </td> </tr></tbody></table><h3>Asya</h3> <p>Sa mga bansa sa Silangang Asya at sa Russia, ang Google ay hindi ang pinaka-popular na search engine. Sa Tsina, halimbawa, mas popular <span>soso search engine</span>.</p><p>SA <a href="https://02stroy.ru/tl/ramps/obzor-dizelnyh-kotlov-kiturami-gazovye-kotly-otopleniya-kiturami-iskusstvo.html">South Korea.</a> Tungkol sa 70% ng mga residente ng Yahoo ay ginagamit ng portal ng paghahanap ng sariling pag-unlad na naver Japan at Yahoo! Ang Taiwan ay ang pinaka-popular na mga sistema para sa paghahanap sa Japan at Taiwan, ayon sa pagkakabanggit.</p> <h3><span>Russia at Russian na nagsasalita ng mga search engine.</span></h3> <p>Ayon sa LiveInternet noong Hunyo 2015 sa pagsakop ng mga query sa paghahanap na nagsasalita ng Russia:</p> <ul><li>Lahat ng nagsasalita: <ul><li>Yahoo! (0.1%) at pag-aari ng mga search engine ng kumpanya: <span>Inktomi.</span>, Altavista, <span>Allthereweb.</span></li> </ul></li> <li>Ingles na nagsasalita at internasyonal: <ul><li><span>Askjeeves.</span> (Teoma mekanismo)</li> </ul></li> <li>Russian-speaking - Karamihan sa "Russian-speaking" search engine index at naghahanap ng mga teksto sa maraming wika - Ukrainian, Belarusian, Ingles, Tatar at iba pa. Ang mga ito ay naiiba mula sa "lahat ng nagsasalita" na mga sistema ng pag-index ng lahat ng mga dokumento sa isang hilera, ang katunayan na, higit sa lahat, ang mga mapagkukunan na matatagpuan sa mga zone ng domain ay na-index, kung saan ang wikang Ruso ay dominado, o iba pang mga pamamaraan na limitahan ang kanilang mga robot sa mga site na nagsasalita ng Russia.</li> </ul><p>Ang ilan sa mga search engine ay gumagamit ng panlabas na mga algorithm sa paghahanap.</p> <h3><span>Quantitative data ng search engine ng Google.</span></h3> <p>Ang bilang ng mga gumagamit ng Internet at mga search engine at mga kinakailangan ng gumagamit para sa mga system na ito ay patuloy na lumalaki. Upang madagdagan ang bilis ng paghahanap ng ninanais na impormasyon, ang mga malalaking search engine ay naglalaman ng malaking bilang ng mga server. Ang mga server ay karaniwang naka-grupo sa mga sentro ng server (mga sentro ng petsa). Mga sikat na search engine, ang mga sentro ng server ay nakakalat sa buong mundo.</p><p>Noong Oktubre 2012, inilunsad ng Google ang proyekto "kung saan nakatira ang Internet", kung saan ang mga gumagamit ay binibigyan ng pagkakataon upang makilala ang mga sentro ng pagproseso ng kumpanyang ito.</p><p>Ang sumusunod na trabaho ay kilala tungkol sa gawain ng mga sentro ng data ng Google Search Engine:</p> <ul><li>Ang kabuuang kapangyarihan ng lahat ng mga sentro ng data ng Google noong 2011 ay tinatayang 220 MW.</li> <li>Noong 2008, nagplano ang Google upang magbukas ng bagong kumplikado sa Oregon, na binubuo ng <a href="https://02stroy.ru/tl/accessories-for-ladders/vozdushnyi-rezhim-zdaniya-vetrovoe-davlenie-vozdushnyi-rezhim-zdaniya-tri-zadachi.html">tatlong gusali</a> Ang kabuuang lugar na 6.5 milyong m², sa magasin ng magazine na Harper ay kinakalkula na ang isang malaking kumplikadong consumes higit sa 100 MW ng kuryente, na maihahambing sa pagkonsumo ng enerhiya ng lungsod na may populasyon na 300,000 katao.</li> <li>Ang tinatayang bilang ng mga server ng Google sa 2012 ay 1,000,000.</li> <li>Ang mga gastos sa Google sa mga sentro ng data ay umabot sa $ 1.9 bilyon noong 2006, at noong 2007 - $ 2.4 bilyon.</li> </ul><p>Ang laki ng World Wide Week, isang na-index na Google para sa Disyembre 2014, ay humigit-kumulang na 4.36 bilyong mga pahina.</p> <h2><span>Mga search engine na isinasaalang-alang ang relihiyosong pagbabawal</span></h2> <p>Ang pandaigdigang pamamahagi ng Internet at isang pagtaas sa katanyagan ng mga elektronikong aparato sa mundo ng Arabic at Muslim, sa partikular, sa mga bansa ng Gitnang Silangan at ang Indian subcontinent, ay nag-ambag sa pagpapaunlad ng mga lokal na search engine na isinasaalang-alang ang mga tradisyon ng Islam . Ang ganitong mga search engine ay naglalaman ng mga espesyal na filter na tumutulong sa mga gumagamit na huwag ipasok ang mga ipinagbabawal na site, tulad ng mga site na may pornograpiya, at pahintulutan silang gamitin lamang ang mga site na ang mga nilalaman ay hindi salungat sa pananampalataya ng Islam. Di-nagtagal bago ang buwan ng Muslim ng Ramadan, noong Hulyo 2013, ang mundo ay iniharap <span>Haralgoogling.</span> - Ang isang sistema na nagbibigay-daan sa mga gumagamit lamang freebies "karapatan" na mga link, pag-filter ng mga resulta ng paghahanap na nakuha mula sa iba pang mga search engine, tulad ng Google at Bing. Dalawang taon na ang nakararaan, noong Setyembre 2011, inilunsad ang search engine na si Istalal, na dinisenyo upang maghatid ng mga gumagamit ng Gitnang Silangan. Gayunpaman, ang serbisyo sa paghahanap na ito ay kailangang magsara sa lalong madaling panahon, ayon sa may-ari, dahil sa kakulangan ng pagpopondo.</p><p>Ang kakulangan ng mga pamumuhunan at ang mabagal na tulin ng pagkalat ng mga teknolohiya sa mundo ng Muslim ay pumigil sa pag-unlad at pinigilan ang tagumpay ng isang malubhang search engine ng Islam. Malinaw na kabiguan ng mga malalaking pamumuhunan sa mga proyekto sa web ng musika sa Muslim, ang isa ay <span>Muxlim.</span>. Nakatanggap siya ng milyun-milyong dolyar mula sa mga mamumuhunan, tulad ng mga seremonya ng seremonya ng seremonya, at ngayon - alinsunod sa pinakabagong mensahe mula sa IMHalal bago ito sarado - ay nakatayo sa isang kaduda-dudang ideya na "ang susunod na Facebook o Google ay maaaring lumitaw lamang sa mga bansa sa Gitnang Silangan, kung sinusuportahan mo ang aming mga makikinang na kabataan. " Gayunpaman, ang mga eksperto sa Internet ng Islam ay nakikibahagi sa kahulugan ng kung ano ang tumutugma o hindi tumutugma sa Sharia, at uri-uriin ang mga website bilang "halal" o "haram". Ang lahat ng mga dating at tunay na mga search engine ng Islam ay espesyal lamang ng isang naka-index na hanay ng data o ang pangunahing mga search engine, tulad ng Google, Yahoo at Bing, na may isang partikular na sistema ng pag-filter na gumagamit ng mga gumagamit upang ma-access ang Haram site, tulad ng mga site tungkol sa hubad, LGBT , <a href="https://02stroy.ru/tl/accessories-for-ladders/azartnye-igry-v-tailande-azartnye-igry-v-tailande-petushinye-boi-v-tailande.html">pagsusugal</a> At anumang iba pang, ang paksa na kung saan ay itinuturing na anti-Islamic.</p><p>Kabilang sa iba pang mga search engine na nakatuon sa relihiyon ay isang pangkaraniwang Judio - ang Jewish na bersyon ng Google at Seekfind.org - isang Kristiyanong site na kinabibilangan ng mga filter na nagpoprotekta sa mga gumagamit mula sa nilalaman na maaaring mapahamak o pahinain ang kanilang pananampalataya.</p> <h2><span>Mga personal na resulta at mga bula ng filter</span></h2> <p>Maraming mga search engine tulad ng Google at Bing gamitin ang mga algorithm ng pumipili sa paghula ng kung anong impormasyon ang nais ng user na makita, batay sa mga nakaraang pagkilos nito sa system. Bilang resulta, ipinapakita lamang ng mga website ang impormasyon na naaayon sa mga nakaraang interes ng gumagamit. Ang epekto na ito ay tinatawag na "bubble of filters".</p><p>Ang lahat ng ito ay humahantong sa ang katunayan na ang mga gumagamit ay mas mababa salungat sa kanilang pananaw ng impormasyon at maging intellectually nakahiwalay sa kanilang sariling "impormasyon ng bubble". Kaya, ang "epekto ng bubble" ay maaaring mayroon <a href="https://02stroy.ru/tl/canopies-and-awnings/uteplenie-karkasnogo-doma-penoplastom-kak-minimizirovat.html">mga negatibong kahihinatnan</a> Para sa pagbuo ng sibil na opinyon.</p> <h2><span>Bias search engine.</span></h2> <p>Sa kabila ng katotohanan na ang mga search engine ay na-program upang suriin ang mga website batay sa ilang kumbinasyon ng kanilang katanyagan at kaugnayan, sa katotohanan, ang mga pang-eksperimentong pag-aaral ay nagpapahiwatig na ang iba't ibang mga pampulitika, pang-ekonomiya at panlipunan na mga kadahilanan ay nakakaapekto sa pagpapalabas ng paghahanap.</p><p>Ang ganitong mga bias ay maaaring direktang resulta ng mga proseso ng ekonomiya at komersyal: Ang mga kumpanya na na-advertise sa search engine ay maaaring maging mas popular sa mga resulta ng karaniwang paghahanap dito. Ang pagtanggal ng mga resulta ng paghahanap na hindi nakakatugon sa mga lokal na batas ay isang halimbawa ng impluwensya ng mga prosesong pampulitika. Halimbawa, hindi ipapakita ng Google ang ilang mga website ng Neo-Nazi sa France at Germany, kung saan ang pagtanggi ng Holocaust ay labag sa batas.</p><p>Ang bias ay maaari ding maging resulta <a href="https://02stroy.ru/tl/accessories-for-ladders/kto-schastliv-v-rossii-zagadki-sociologii-kto-schastliv-v-rossii.html">mga proseso ng panlipunan</a>Dahil ang mga algorithm ng search engine ay madalas na binuo upang maalis ang mga di-format na mga punto ng pagtingin sa pabor ng higit pang mga "popular" na mga resulta. Ang mga algorithm sa pag-index ng mga pangunahing search engine ay nagbibigay ng prayoridad sa mga Amerikanong site.</p><p>Maghanap ng bomba - isang halimbawa ng isang pagtatangka upang pamahalaan ang mga resulta ng paghahanap para sa mga pampulitika, panlipunan o komersyal na mga dahilan.</p> <h2>Tingnan din</h2> <ul><li>Qwika.</li> <li>Electronic Library # list list at search engine.</li> <li>Web Developer Toolbar.</li> </ul><h2>Mga Tala</h2> <h2>Literatura</h2> <ul><li><span><i>Ashmanov I. S., Ivanov A. A.</i> Pag-promote ng site sa mga search engine. - M.: Williams, 2007. - 304 p. - ISBN 978-5-8459-1155-1.</span></li> <li><span><i>Baikov v.D.</i> Ang internet. Maghanap ng impormasyon. Pag-promote ng website. - St. Petersburg. : Bhv-Petersburg, 2000. - 288 p. - ISBN 5-8206-0095-9.</span></li> <li><span><i>Kolisnichenko D. N.</i> Mga search engine at pag-promote ng mga website sa Internet. - M.: Dialectics, 2007. - 272 p. - ISBN 978-5-8459-1269-5.</span></li> </ul><ul><li><span><i>Lande d.v.</i> Maghanap ng kaalaman sa internet. - M.: Dialectics, 2005. - 272 p. - ISBN 5-8459-0764-0.</span></li> </ul><ul><li><span><i>Lande D.V., Skarsky A. A., Bezsessudnov I. V.</i> Internet: nabigasyon sa kumplikadong mga network: mga modelo at mga algorithm. - m.: Librok (editoryal urss), 2009. - 264 p. - ISBN 978-5-397-00497-8.</span></li> </ul><ul><li><span><i>Chu H., Rosenthal M.</i> Mga search engine para sa World Wide Web: Isang comparative study and evaluation methodology (English) // Proceedings of the Annual Meeting-American Society for Information Science: Journal. - 1996. - Vol. 33. - P. 127-135.</span></li> </ul><ul><li><span><i>Gandal, Neil.</i> Ang dynamics ng kumpetisyon sa internet search engine market. - 2001. - Vol. 19. - P. 1103-1117. -</span></li></ul> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy loading=lazy>");</script> </div> </div> <div class="td-pb-span4 td-main-sidebar"> <div class="td-ss-main-sidebar"> <aside class="widget widget_text" id="text-4"> <div class="textwidget"> </div> </aside> <aside class="widget widget_text" id="text-3"> <div class="textwidget"> <div id="vk_groups"></div> </div> </aside> <aside class="widget popular-posts" id="wpp-4"> <div class="block-title"><span>Mga sikat na artikulo</span></div> <ul class="wpp-list wpp-list-with-thumbnails"> <li> <a href='https://02stroy.ru/tl/components/chto-takoe-parabulbarnoe-vvedenie-preparata-parabulbarnoe-vvedenie-chto-eto.html' title='Parabulbar Administration Ano ito' target='_self'><img src="/uploads/4bafaf522342428eb379cdd310f0979b.jpg" width="120" height="80" alt="Parabulbar Administration Ano ito" class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/components/chto-takoe-parabulbarnoe-vvedenie-preparata-parabulbarnoe-vvedenie-chto-eto.html' title='Parabulbar Administration Ano ito' class='wpp-post-title' target='_self'>Parabulbar Administration Ano ito</a></li> <li> <a href='https://02stroy.ru/tl/visors-and-awnings/kak-lechit-miopiyu-mozhno-li-vylechit-blizorukost-miopiya.html' title='Kung paano tratuhin ang myopia kung maaari mong gamutin' target='_self'><img src="/uploads/216d5d79674d01d1f0144025e2395c10.jpg" width="120" height="80" alt="Kung paano tratuhin ang myopia kung maaari mong gamutin" class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/visors-and-awnings/kak-lechit-miopiyu-mozhno-li-vylechit-blizorukost-miopiya.html' title='Kung paano tratuhin ang myopia kung maaari mong gamutin' class='wpp-post-title' target='_self'>Kung paano tratuhin ang myopia kung maaari mong gamutin</a></li> <li> <a href='https://02stroy.ru/tl/ramps/zachem-podayut-vodu-s-kofe-zachem-k-kofe-podayut-vodu-sravnenie-sposobov.html' title='Bakit ang tubig ay hinahain sa kape' target='_self'><img src="/uploads/182570cd337a9272b4d8508ba1e0745c.jpg" width="120" height="80" alt="Bakit ang tubig ay hinahain sa kape" class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/ramps/zachem-podayut-vodu-s-kofe-zachem-k-kofe-podayut-vodu-sravnenie-sposobov.html' title='Bakit ang tubig ay hinahain sa kape' class='wpp-post-title' target='_self'>Bakit ang tubig ay hinahain sa kape</a></li> <li> <a href='https://02stroy.ru/tl/components/ogranicheniya-posle-korrekcii-zreniya-posle-lazernoi-korrekcii.html' title='Pagkatapos ng pagwawasto ng laser ng paningin - kung ano ang hindi maaaring gawin' target='_self'><img src="/uploads/fa3137dcfd5f966a9f4e6678543d49d5.jpg" width="120" height="80" alt="Pagkatapos ng pagwawasto ng laser ng paningin - kung ano ang hindi maaaring gawin" class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/components/ogranicheniya-posle-korrekcii-zreniya-posle-lazernoi-korrekcii.html' title='Pagkatapos ng pagwawasto ng laser ng paningin - kung ano ang hindi maaaring gawin' class='wpp-post-title' target='_self'>Pagkatapos ng pagwawasto ng laser ng paningin - kung ano ang hindi maaaring gawin</a></li> <li> <a href='https://02stroy.ru/tl/internal-stairs/chto-nuzhno-znat-o-lazernoi-korrekcii-dalnozorkosti-lazernaya-korrekciya.html' title='Laser correction ng legarticity ng pagwawasto ng pangitain ng Hallery' target='_self'><img src="/uploads/2d418f432de2008f3fda075b9cda1ee8.jpg" width="120" height="80" alt="Laser correction ng legarticity ng pagwawasto ng pangitain ng Hallery" class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/internal-stairs/chto-nuzhno-znat-o-lazernoi-korrekcii-dalnozorkosti-lazernaya-korrekciya.html' title='Laser correction ng legarticity ng pagwawasto ng pangitain ng Hallery' class='wpp-post-title' target='_self'>Laser correction ng legarticity ng pagwawasto ng pangitain ng Hallery</a></li> <li> <a href='https://02stroy.ru/tl/ramps/dvizheniya-zemli-i-ih-geograficheskie-sledstviya-lekciya.html' title='Lecture: Movement of the Earth sa paligid ng axis at ang mga kahihinatnan nito heograpikal na kahihinatnan ng kilusan ng lupa sa paligid ng axis nito' target='_self'><img src="/uploads/81259b93249811ab281228f5aefb0381.jpg" width="120" height="80" alt="Lecture: Movement of the Earth sa paligid ng axis at ang mga kahihinatnan nito heograpikal na kahihinatnan ng kilusan ng lupa sa paligid ng axis nito" class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/ramps/dvizheniya-zemli-i-ih-geograficheskie-sledstviya-lekciya.html' title='Lecture: Movement of the Earth sa paligid ng axis at ang mga kahihinatnan nito heograpikal na kahihinatnan ng kilusan ng lupa sa paligid ng axis nito' class='wpp-post-title' target='_self'>Lecture: Movement of the Earth sa paligid ng axis at ang mga kahihinatnan nito heograpikal na kahihinatnan ng kilusan ng lupa sa paligid ng axis nito</a></li> <li> <a href='https://02stroy.ru/tl/accessories-for-ladders/test-na-tip-daltonizma-proverka-cvetooshchushcheniya-dlya.html' title='Pagpapatunay ng mga upuan ng kulay para sa mga driver' target='_self'><img src="/uploads/7f64989a0ff4693f0d90b701417e3e4b.jpg" width="120" height="80" alt="Pagpapatunay ng mga upuan ng kulay para sa mga driver" class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/accessories-for-ladders/test-na-tip-daltonizma-proverka-cvetooshchushcheniya-dlya.html' title='Pagpapatunay ng mga upuan ng kulay para sa mga driver' class='wpp-post-title' target='_self'>Pagpapatunay ng mga upuan ng kulay para sa mga driver</a></li> <li> <a href='https://02stroy.ru/tl/exterior-stairs/krasnye-pyatna-na-kozhe-pod-glazami-pochemu-pod-glazami-i-vokrug.html' title='Bakit sa ilalim ng mga mata at sa paligid ng mga pulang spot ay lumilitaw: diagnosis at epektibong paggamot' target='_self'><img src="/uploads/2300664067a5ac0a24591059b33f4ed8.jpg" width="120" height="80" alt="Bakit sa ilalim ng mga mata at sa paligid ng mga pulang spot ay lumilitaw: diagnosis at epektibong paggamot" class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/exterior-stairs/krasnye-pyatna-na-kozhe-pod-glazami-pochemu-pod-glazami-i-vokrug.html' title='Bakit sa ilalim ng mga mata at sa paligid ng mga pulang spot ay lumilitaw: diagnosis at epektibong paggamot' class='wpp-post-title' target='_self'>Bakit sa ilalim ng mga mata at sa paligid ng mga pulang spot ay lumilitaw: diagnosis at epektibong paggamot</a></li> <li> <a href='https://02stroy.ru/tl/ramps/atropin-sposob-primeneniya-primenenie-atropina-sposob-primeneniya-i.html' title='Atropine paraan ng application.' target='_self'><img src="/uploads/052f2350af04eb9a701a84831d029ecb.jpg" width="120" height="80" alt="Atropine paraan ng application." class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/ramps/atropin-sposob-primeneniya-primenenie-atropina-sposob-primeneniya-i.html' title='Atropine paraan ng application.' class='wpp-post-title' target='_self'>Atropine paraan ng application.</a></li> <li> <a href='https://02stroy.ru/tl/exterior-stairs/izmerenie-vnutriglaznogo-davleniya-pri-glaukome-provoditsya-issledovanie-vnutriglaznogo-davleniya-kak.html' title='Pananaliksik mula sa intraocular presyon' target='_self'><img src="/uploads/682ebdb57d098aa561fdc83900fc5d8f.jpg" width="120" height="80" alt="Pananaliksik mula sa intraocular presyon" class="wpp-thumbnail wpp_cached_thumb wpp_featured" / loading=lazy loading=lazy></a> <a href='https://02stroy.ru/tl/exterior-stairs/izmerenie-vnutriglaznogo-davleniya-pri-glaukome-provoditsya-issledovanie-vnutriglaznogo-davleniya-kak.html' title='Pananaliksik mula sa intraocular presyon' class='wpp-post-title' target='_self'>Pananaliksik mula sa intraocular presyon</a></li> </ul> </aside> <aside class="widget widget_text" id="text-5"> <div class="textwidget"> </div> </aside> </div> </div> </div> </div> </div> <div class="td-sub-footer-container"> <div class="td-container"> <div class="td-pb-row"> <div class="td-pb-span7 td-sub-footer-menu"> <div class="menu-td-demo-footer-menu-container"> <ul id="menu-td-demo-footer-menu" class="td-subfooter-menu"> <li class="menu-item type-post_type object-page first td-menu-item td-normal-menu "><a href='https://02stroy.ru/tl/sitemap.xml'>Site `s mapa.</a></li> <li class="menu-item type-post_type object-page td-menu-item td-normal-menu "><a href=''>Tungkol sa site</a></li> <li class="menu-item type-post_type object-page td-menu-item td-normal-menu "><a href=''>Contacts.</a></li> </ul> </div> </div> <div class="td-pb-span5 td-sub-footer-copy"> © <strong>02stroy.ru.</strong> </div> </div> </div> </div> </div> <script type="text/javascript"> jQuery(function($) { $(document).on("click", ".pseudo-link", function() { window.open($(this).data("uri")); }); }); </script> <script> (function() { var html_jquery_obj = jQuery('html'); if (html_jquery_obj.length && (html_jquery_obj.is('.ie8') || html_jquery_obj.is('.ie9'))) { var path = '/wp-content/themes/Newspaper%20v7.4/Newspaper/style.css'; jQuery.get(path, function(data) { var str_split_separator = '#td_css_split_separator'; var arr_splits = data.split(str_split_separator); var arr_length = arr_splits.length; if (arr_length > 1) { var dir_path = '/wp-content/themes/Newspaper%20v7.4/Newspaper'; var splited_css = ''; for (var i = 0; i < arr_length; i++) { if (i > 0) { arr_splits[i] = str_split_separator + ' ' + arr_splits[i]; } var formated_str = arr_splits[i].replace(/\surl\(\'(?!data\:)/gi, function regex_function(str) { return ' url(\'' + dir_path + '/' + str.replace(/url\(\'/gi, '').replace(/^\s+|\s+$/gm, ''); }); splited_css += "<style>" + formated_str + "</style>"; } var td_theme_css = jQuery('link#td-theme-css'); if (td_theme_css.length) { td_theme_css.after(splited_css); } } }); } })(); </script> <script src="https://02stroy.ru/wp-content/cache/min/1/25468ab301f1c6323a694da04214026c.js" data-minify="1"></script> <script src="https://02stroy.ru/wp-content/cache/min/1/16b16c55e06aaf5f414dc3cbf083d9dc.js" data-minify="1"></script> </body> </html> <script data-cfasync="false" src="/cdn-cgi/scripts/5c5dd728/cloudflare-static/email-decode.min.js"></script>