Web Crawler

Webový prehľadávač, známy tiež ako pavúk, je automatizovaný program alebo robot, ktorý systematicky prehľadáva internet a hľadá nový alebo aktualizovaný obsah. Účelom webového prehľadávača je zhromažďovať informácie, napríklad text, obrázky a odkazy, a potom tieto informácie indexovať v databáze pre neskoršie použitie vyhľadávacím nástrojom alebo inými aplikáciami.

Web Crawlers pracujú začatím na konkrétnej webovej stránke a potom sledujú odkazy na iné stránky na rovnakom webe a potom na iné stránky. Používajú algoritmy na určenie, ktoré stránky na prehľadávanie a ako často, a môžu byť nakonfigurované na rešpektovanie súborov robots.txt, ktoré používajú webové stránky na kontrolu, ktoré stránky sú prehľadávané a indexované.

Webové prehľadávače používajú vyhľadávacie nástroje ako Google a Bing na indexovanie obsahu webových stránok a na ich vyhľadávanie. Spoločnosti ich tiež používajú na zhromažďovanie informácií o svojich konkurentoch, na sledovaní správania zákazníkov a monitorovaní online zmienok o svojej značke.

Webové prehľadávače môžu byť výkonnými nástrojmi, ale môžu spôsobiť problémy, ak sa nepoužívajú zodpovedne. Môžu zaťažiť webové servery a môžu sa dokonca použiť na škodlivé účely, ako je škrabanie osobných údajov alebo pokus o preniknutie do systémov.

Celkovo sú webové prehľadávače dôležitou súčasťou moderného internetového ekosystému, ktoré pomáhajú udržiavať vyhľadávacie nástroje aktuálne a poskytovať cenné údaje pre podnikom aj výskumným pracovníkom. Je však dôležité ich používať zodpovedne a s ohľadom na práva vlastníkov webových stránok a obavy súkromia.

 

Späť do slovníka pojmov

 

Poznáte tiež...?

 

RAID poľa je spôsob, ako predísť strate dát pri zlyhaní pevného disku. RAID pole tvorí obyčajné a sériovo vyrábané pevné disky. Dáta sa potom ukladajú na viac nezávislých diskov - a vďaka tomu,...

Čítať ďalej

Responzívny webový dizajn je ako mať webovú stránku, ktorá môže posunúť tvar, aby vyzerala dobre na akejkoľvek obrazovke. Dnes používame rôzne zariadenia s rôznymi veľkosťami a rozlíšeniami obrazovky, ako sú smartfóny, tablety, notebooky a stolné počítače. Je dôležité,...

Čítať ďalej

Hypertext je systém, na ktorom je postavený World Wide Web. Obsah v takomto systéme nie je štruktúrovaný lineárne, ale kontextovo previazaný za pomoci takzvaných hypertextových odkazov. Tie odkazujú na informácie,...

Čítať ďalej