Web Crawler

Webový prehľadávač, známy tiež ako pavúk, je automatizovaný program alebo robot, ktorý systematicky prehľadáva internet a hľadá nový alebo aktualizovaný obsah. Účelom webového prehľadávača je zhromažďovať informácie, napríklad text, obrázky a odkazy, a potom tieto informácie indexovať v databáze pre neskoršie použitie vyhľadávacím nástrojom alebo inými aplikáciami.

Web Crawlers pracujú začatím na konkrétnej webovej stránke a potom sledujú odkazy na iné stránky na rovnakom webe a potom na iné stránky. Používajú algoritmy na určenie, ktoré stránky na prehľadávanie a ako často, a môžu byť nakonfigurované na rešpektovanie súborov robots.txt, ktoré používajú webové stránky na kontrolu, ktoré stránky sú prehľadávané a indexované.

Webové prehľadávače používajú vyhľadávacie nástroje ako Google a Bing na indexovanie obsahu webových stránok a na ich vyhľadávanie. Spoločnosti ich tiež používajú na zhromažďovanie informácií o svojich konkurentoch, na sledovaní správania zákazníkov a monitorovaní online zmienok o svojej značke.

Webové prehľadávače môžu byť výkonnými nástrojmi, ale môžu spôsobiť problémy, ak sa nepoužívajú zodpovedne. Môžu zaťažiť webové servery a môžu sa dokonca použiť na škodlivé účely, ako je škrabanie osobných údajov alebo pokus o preniknutie do systémov.

Celkovo sú webové prehľadávače dôležitou súčasťou moderného internetového ekosystému, ktoré pomáhajú udržiavať vyhľadávacie nástroje aktuálne a poskytovať cenné údaje pre podnikom aj výskumným pracovníkom. Je však dôležité ich používať zodpovedne a s ohľadom na práva vlastníkov webových stránok a obavy súkromia.

 

Späť do slovníka pojmov

 

Poznáte tiež...?

 

Cache je označenie pre vyrovnávaciu pamäť, vyrovnávacia pamäť - najčastejšie počítača alebo internetového prehliadača. Pojem sa prvýkrát objavil už v polovici 60. rokov 20. storočia. V oboch prípadoch je cieľom cache zrýchliť...

Čítať ďalej

Pod pojmom TCP / IP sa ukrýva označenie pre primárnu prenosové protokoly, pre sadu protokolov, ktoré riadia komunikáciu v počítačovej sieti. Ide o hlavné protokoly siete Internet, sadu pravidiel, ktoré zabezpečujú komunikáciu...

Čítať ďalej

Hlboký web je súčasťou internetu, ktorý nie je indexovaný vyhľadávacími nástrojmi a nie je ľahko prístupný širokej verejnosti. Je to ako skrytá vrstva internetu, ktorá nie je viditeľná alebo prehľadávateľná tradičnými prostriedkami. Hlboký web obsahuje veľa cenných...

Čítať ďalej