Главни Интернет Пословање Шта је софтверски паук?

Шта је софтверски паук?

Ваш Хороскоп За Сутра

„Софтверски паук“ је беспилотни програм којим управља претраживач који претражује мрежу баш као што бисте то учинили. Док посећује сваку веб локацију, бележи (чува на чврстом диску) све речи на свакој веб локацији и бележи сваку везу до других веб локација. Затим „кликне“ на везу и искључи се за читање, индексирање и чување друге веб локације.

беверли д ангело и ал пацино

Софтверски паук често чита, а затим индексира целокупан текст сваке веб локације коју посети у главну базу података претраживача за који ради. Недавно су многи мотори као што је АлтаВиста почели да индексирају само до одређеног броја страница веб локације, често око 500, а затим се заустављају. Очигледно је то зато што је Веб постао толико велик да је немогуће све индексирати. Колико страница ће паук индексирати, није сасвим предвидљиво. Због тога је добра идеја да на вашу веб локацију посебно пошаљете сваку важну страницу коју желите да индексирате, попут оних које садрже важне кључне речи.

Програмски паук је попут електронског библиотекара који изреже садржај сваке књиге у свакој библиотеци на свету, сортира их у гигантски главни индекс, а затим изгради електронску библиографију која чува информације о томе који текстови упућују на друге текстове. Неки софтверски пауци могу индексирати више од милион докумената дневно! Важно је схватити да паукови претраживача раде само две ствари:

  • Они индексирају текст.
  • Прате везе.

На недавној конференцији о стратегијама претраживача коју је одржао СеарцхЕнгинеВатцх.цом, један од гостујућих говорника, Схари Тхуров из компаније Грантастиц Десигнс, изнео је ову чињеницу и поновио је неколико пута да би илустровао њен значај: „Претраживачи индексирају текст и следе линкове. Они индексирају текст и прате везе. То је све што раде. '

Њена поента је важна и кључна за разумевање природе паука претраживача. Ако је текст ваше веб локације садржан у графици, претраживачи га не могу индексирати. Ако су све ваше важне кључне речи за које се надате да ћете постићи рангирање укључене у графику, а не у ХТМЛ текст, ваша веб локација неће постићи ранг листу. Запамтите, претраживачи не индексирају слике и не читају слике, они индексирају текст и прате везе. То је све. Ако на видљивој страници нема текста, ниједна количина кључних речи у метаознаци кључне речи неће вам помоћи да постигнете рангирање.

Оно што паук види на вашој веб локацији одредиће како је ваша веб локација наведена у њеном индексу. Претраживачи одређују релевантност странице на основу сложеног система бодовања који претраживачи покушавају да сачувају у тајности. Овај систем додаје или одузима поене на основу ствари као што су колико пута се кључна реч појавила на страници, где се на страници појавила и колико је укупно речи пронађено. Странице које постигну највише поена враћају се на врх резултата претраге; остали су сахрањени на дну, и никада их неће бити пронађени.

Док софтверски паук посећује вашу веб локацију, он бележи све везе на вашој страници до других веб локација. У огромној бази података било ког претраживача забележене су све везе између веб локација. Претраживач зна на које сте веб локације водили и, што је још важније, на оне које су водиле до вас. Многи мотори ће чак користити број веза до ваше странице као показатељ популарности, а затим ће побољшати рангирање на основу овог фактора.

шта ради Карсон Мекалистер

Цопиригхт © 2000 иПроспецт.цом