Naučiť sa vyhľadávať informácie na webe je dôležité. Je to priam fatálne
dôležité. Vlastne je to to úplne najdôležitejšie. A to ešte stále zľahčujeme.
Spomeňte si na prirovnanie z úvodu tejto časti knihy - web je obrovská knižnica,
ktorá nemá jednotný katalóg, ale množstvo väčších či menších zoznamov a
databáz. Tie sa delia do dvoch základných skupín: katalógy a fulltextové
prehľadávače.
Katalógy sú ručne (alebo myšne?:) zostavené zoznamy webstránok, kde sa ku každej
zaradenej stránke môžete preklikať s použitím elementárnej logiky. Napríklad ak
vás zaujímajú slovenské cestovné kancelárie, naťukáte do prehliadača adresu www.superzoznam.sk a na titulnej stránke
nájdete kategóriu ”Cestovanie a doprava". Po kliknutí na jej nadpis sa objavia
ďalšie podkategórie, napríklad Hotely, Ubytovanie, Doprava a preprava, Cestovné
poriadky, Mapy a - Cestovné kancelárie.
Aj katalógy sa, samozrejme, dajú prehľadávať, takže ak by ste hneď na úvodnej
stránke napísali do vyhľadávacieho okna ”Cestovné kancelárie", výsledkom by
bol priamy odkaz na podkapitolu ”Cestovné kancelárie" a zároveň zoznam
všetkých webstránok, ktoré majú tento text priamo v popise. Malina.
V čom je teda problém, spýta sa idealistický surfer? Katalógy sú predsa presne to,
čo potrebujem! Problém vzniká vtedy, keď vás nezaujíma niečo tak všeobecné ako
cestovné kancelárie, ale niečo tak konkrétne ako priemerné množstvo zrážok v
povodí Nigeru v októbri. (Potrebujete predsa vedieť, či si máte so sebou zobrať
dáždnik.)
Skúste si teraz predstaviť adresár VEDA/METEOROLÓGIA/POZOROVANIA/ŠTATISTIKY/
AFRIKA/NIGÉRIA/ZRÁŽKY/OKTÓBER. Navyše by ste nemali nijakú istotu, či hľadaná
informácia namiesto toho nebude pod NÁBOŽENSTVÁ/AFRICKÉ/ŠAMANIZMUS/
TECHNIKY/VYVOLÁVANIE DAŽĎA/OKTÓBER.
Okrem nevhodnosti katalógov pre vyhľadávanie špecifických informácií je tu ešte
druhý, rovnako významný problém. Katalógy sú odkázané na ručné zaraďovanie
odkazov a niektoré cestovné kancelárie (o afrických šamanoch nehovoriac) sa
jednoducho neobťažujú zaradiť do nich svoju stránku. Jeden z nemnohých
profesionálnych surferov, ktorí katalógy zostavujú, na ňu pritom môže naraziť o
mesiac, o rok, či - najpravdepodobnejšie - nikdy.
Preto vznikli Fulltextové vyhľadávače, ktoré automaticky prehľadávajú celý
text dokumentov, na ktoré na webe narazia. Znamená to, že ak budete hľadať reťazec
”sopky v Taliansku", výsledkom bude odkaz na všetky stránky, na ktorých sa
nachádza tento text. Správna formulácia otázok pre fulltextové vyhľadávače je z
veľkej časti závislá na mystickom spojení dlhodobej skúsenosti, intuície,
inteligencie a šťastia užívateľa. Každý vyhľadávač má pritom svoje vlastné
pravidlá zadávania otázok, ktoré sa oplatí naštudovať (na titulnej stránke
hľadajte Help). Zložitejšia otázka totiž môže vyzerať aj takto:
sopka vulkán kráter +Taliansko -Etna činné host:uk - ak nás zaujímajú britské
stránky o sopkách v Taliansku okrem Etny, viac však o tých činných.
Ďalšie príklady formulácie otázok pre fulltextové vyhľadávače:
Madagaskar rieky - príklad nesprávnej otázky. Nájde všetky dokumenty, kde sa
vyskytuje slovo Madagaskar ALEBO slovo rieky (naproti tomu pri takejto otázke v katalógu
by sme zväčša dostali ako prvé stránky, ktoré majú v titulku alebo popise obidve
slová)
+Madagaskar +rieky - nájde dokumenty, v ktorých sa vyskytujú súčasne obidve slová
"rieky na Madagaskare" - nájde dokumenty, kde sa vyskytuje fráza "rieky
na Madagaskare"
Niektoré vyhľadávače, napríklad Altavista, dokážu zároveň obmedziť
vyhľadávanie na dokumenty v určitom jazyku. Ešte dôležitejšie ako vyhľadanie
stránok o madagaskarských riekach je však ich zoradenie. Fulltextovým vyhľadávačom
viac imponujú webstránky, ktoré majú hľadané slová v titulku, prípadne na
začiatku dokumentu, ďalej tie, kde sa reťazec vyskytuje najčastejšie a je zaradený
aj v skrytom popise dokumentu (takzvané META-tags). Každý hľadač má na zoraďovanie
vlastný recept a ten v najväčšej miere ovplyvňuje úspech či neúspech vášho
pátrania.
Medzi najznámejšie fulltextové vyhľadávače patria www.altavista.com (skrátene www.av.com), www.hotbot.com
či www.excite.com. Najviac stránok pokrýva www.alltheweb.com - to by však nemalo byť v
žiadnom prípade relevantným kritériom pre výber vyhľadávača. Treba si uvedomiť,
že vy nehľadáte ČO NAJVIAC stránok o Madagaskare, ale JEDNU, kde bude, podľa
možností, napísané všetko.
Ako mimoriadne užitočný sa teda javí relatívne nový vyhľadávač www.google.com, ktorý je založený na úplne odlišnej
technológii - stránky hodnotí podľa toho, ako INÉ stránky na ne odkazujú.
Odkazovanie, teda vytváranie hypertextových prepojení na cudzie stránky, je
rozšíreným hobby všetkých internetistov. Pritom platí logický záver: čím je
stránka zaujímavejšia, originálnejšia a obsiahlejšia, tým viac ľudí na ňu
odkazuje.