WWW – World Wide Web

08.09.2016 23:02

Najznámejšia a najpoužívanejšia služba Internetu. Poskytuje informácie vo forme hypertextu.

Hypertext je (pôvodne lineárny) text, prispôsobený pre preskakovanie „z myšlienky na myšlienku“. Preskakovanie v hypertexte je označované ako browsing.
Informácie vo forme hypertextu sú členené na (relatívne malé) jednotky, ktoré sa nazývajú stránky.
Informácie v rámci  stránok sú usporiadané lineárne. Medzi stránkami môžu existovať ľubovoľné prepojenia – stránky môžu byť medzi sebou previazané ako autor chce. Väzby sú tvorené aktívnymi odkazmi ktorých zvolením (kliknutím myši) môžeme vyvolať prechod na iné miesto.

Aktívne odkazy môžu byť reprezentované:
Časťami textu
Obrázkami
Časťami obrázkov

Stránky tvoriace WWW sú zapísané v jazyku HTML, ktorý okrem textu a odkazov na ďalšie stránky umožňuje poskytovať informácie v podobe grafických objektov, animácií, videosekvencií, zvukov a pod.
WWW stránky sú umiestnené na webových serveroch neustále pripojených k Internetu, ktoré na základe požiadavky používateľa (klienta) odosielajú požadované údaje k nemu.
Požiadavky na zobrazovanie údajov vytvára používateľ prostredníctvom prehliadača (www klienta) buď priamo zadaním adresy (IP, domény, URL), alebo kliknutím na aktívny hypertextový odkaz.

Najznámejšie priehliadače sú:

  • Internet Explorer
  • Mozilla Firefox
  • Opera

Komunikácia medzi klientom - webovým prehliadačom - a webovým serverom sa realizuje prostredníctvom HTTP (Hypertext Transfer Protocol), ktorý po zadaní požiadavky na získanie informácií nadviaže spojenie TCP a pripojí sa na port cieľového počítača (štandardne 80). Na tomto porte pracuje webový server (http server), ktorý požiadavky analyzuje a nazad odošle údaje obsahujúce požadovaný súbor, informáciu o jeho neexistencii, alebo iné doplnkové informácie.

Niekedy medzi požiadavkou klienta a odoslaním údajov zo strany servera môžu prebehnúť  ďalšie procesy pozostávajúce napr. z overenia práva na prístup k informáciám, získania údajov z databázy, realizácii výpočtu na strane servera atd. Klientskemu počítaču sa odovzdávajú len výsledky týchto procesov.

Každá stránka zvyčajne okrem textu pozostáva z menu, pomocou ktorého sa môžeme prepínať v obsahu a z hypertextových odkazov priamo v texte. Tieto sú od ostatného textu odlíšené, po ukázaní myšou naň sa zmení tvar kurzoru myši a po kliknutí prepnú zobrazenie na iné miesto v rámci stránky alebo na inú stránku.
Takmer neobmedzené množstvo informácií na Internete má za následok, že vyhľadanie informácií v nich je bez podporných nástrojov nemožné. Nástroj používaný na vyhľadávanie informácií sa nazýva vyhľadávač.

Vyhľadávanie informácií

Na to, aby ste mohli služby vyhľadávača používať, musíte poznať jeho adresu. Každá krajina má svoje národné vyhľadávače, ktoré sa orientujú iba na miestne internetové stránky. No na internete existujú aj globálne vyhľadávače, ktoré vyhľadajú požadovanú informáciu celosvetovo bez ohľadu na krajinu, kde sa nachádzajú.

Vyhľadávače delíme na katalógové a full-textové.

Katalógový vyhľadávač si pamätá, akú adresu tá-ktorá stránka má a čo ponúka.

Full-textové vyhľadávače dokážu stránky na internete prehľadávať podľa  ich obsahu.

Katalógy

Internetový katalóg je hierarchicky usporiadaný zoznam odkazov na WWW stránky, zaradený do kategórií pre prehľadnejšie vyhľadávanie. Na rozdiel od vyhľadávačov sú stránky do systému zadávané manuálne, ich obsah je kontrolovaný a zároveň  sú kategorizované. Výhodou katalógov je presná kategorizácia informácií, avšak počet zaznamenaných stránok je, oproti automaticky pracujúcim vyhľadávačom, veľmi malý.

Katalóg obsahuje zoznam kategórii, ktoré môžete zvoliť a prehliadať, takisto môžete prehľadávať celú databázu. Aj niektoré vyhľadávače umožňujú vyhľadávať cez usporiadanú štruktúru manuálne katalogizovaných stránok, ktorá však tvorí iba malú časť ich kompletnej databázy.

Veľmi obľúbeným druhom katalógov, hlavne pre ľudí pracujúcich v oblasti IT, sú katalógy zamerané na poskytovanie rôzneho softvéru. Softvér je možné vyhľadávať podľa  názvu alebo funkcie, voliť  si typ platformy a licencie.

Najčastejšie používané katalógy so softvérom:

https://sourceforge.net/ - množstvo projektov pod GNU GPL licenciou, vrátane zdrojových kódov
https://www.freecode.com – ďalšia  "kopa" softvéru, určeného hlavne pre Linux
https://download.cnet.com/windows/- niečo pre prívržencov operačných systémov od Microsoftu
www.tucows.com

K najznámejším slovenským katalógovým vyhľadávačom patrí  Zoznam, SuperZoznam, Atlas, no existuje ich podstatne viac.
V podstate sú si navzájom podobné, od seba sa odlišujú iba veľkosťou databázy údajov vďaka ktorej vám dokážu vami požadovanú informáciu vyhľadať, alebo aj nie, ak databáza nie je dostatočne obsažná a doplnkovými službami, ktoré ponúkajú na svojich stránkach.

Vyhľadávače

Internetový vyhľadávač je nástroj umožňujúci vyhľadávanie informácií (dokumentov, multimédií, súborov...) na internete na základe používateľom definovaných kritérií. Na rozdiel od katalógov, v ktorých je usporiadanie informácií dopredu stanovené, vyhľadávače hľadajú údaje až po zadaní vyhľadávacích kritérií.

Princíp činnosti vyhľadávača

Vyhľadávače pracujú na princípe zaznamenávania informácií o veľkom množstve WWW stránok. Stránky na internete sú automaticky prehľadávané programom nazývaným web spider, ktorý ich indexuje z dôvodu rýchlejšieho vyhľadávania.

Na začiatku web spider začína so zoznamom odkazov na stránky, ktoré má prehľadať. Zoznam odkazov je buď zadaný manuálne, alebo získaný zo zoznamu už indexovaných stránok, poprípade zo zoznamu stránok, ktoré ich autori registrovali u vyhľadávača. Ak web spider nájde na prehliadaných stránkach ďalšie odkazy, pridá ich do svojho zoznamu, čím zabezpečí prehľadanie veľkého množstva stránok.

Obsah každej stránky je analyzovaný a zisťuje sa spôsob, akým je možné stránku indexovať. Či už podľa slov nachádzajúcich sa v názve stránky, jej popise alebo hlavičke, poprípade v položkách nazvaných metatagy, čo sú špeciálne HTML značky, upresňujúce indexovanie stránky vyhľadávačom. Proces prehľadávania je ukončený, ak bol indexovaný dostatočný počet WWW stránok.

Dáta o web-stránkach sú uložené v databáze pre neskoršie použitie pri vyhľadávaní. Niektoré vyhľadávače, ako Google, ukladajú, zároveň s informáciami o danej stránke, aj časť alebo celú zdrojovú web-stránku do tzv. cache, na urýchlenie prístupu k danej stránke pri jej vyhľadávaní. Občas sa teda môže stať, že niektoré stránky už "fyzicky" neexistujú alebo nie sú dostupné, avšak vyhľadávač je stále schopný využiť ich obsah pri vyhľadávaní, aj keď odkaz na stránku je už dávno neplatný.

Existuje však aj iný typ vyhľadávačov, nazývaný real-time vyhľadávače (napr. Orase), ktoré si nevytvárajú index. Informácie o stránkach sú zozbierané až po zadaní dotazu. Výhody oproti indexom sú v aktuálnosti nájdených stránok, eliminácii odkazov na už neexistujúce stránky a nižšie systémové nároky (Google potrebuje takmer 100 000 počítačov, Orase iba jeden!). Zjavná nevýhoda je v nízkej rýchlosti vyhľadávania.

Full-textový vyhľadávač má výhody, aj nevýhody. Medzi nevýhody patrí obrovské množstvo zobrazených informácií, v ktorom sa ťažko vyhľadá to, čo potrebujete. Medzi výhody zas patrí to, že práve cez full-textový vyhľadávač často nájdete presne tie informácie, ktoré potrebujete.

Najznámejším full-textovým vyhľadávačom je u nás Google, no treba podotknúť, že dnes je full-textový vyhľadávač súčasťou skoro každého katalógového vyhľadávača, stačí  si len prepnúť spôsob prehľadávania stránok.

Na internetovej stránke vyhľadávača je zväčša v hornej časti  okienko, do ktorého musíte vpísať slovo, ktoré na internete hľadáte.
Môže to byť názov firmy, výrobku, alebo čokoľvek iné, čo vás zaujíma. Ak zadáte trebárs slovo "noviny", vyhľadávač  vám zobrazí odkazy na všetky stránky, ktoré majú niečo spoločné s novinami. Zobrazený odkaz na stránku o novinách však ešte neznamená, že nájdete presne to, čo ste hľadali.
Katalógový vyhľadávač vám informáciu zobrazí podľa zadaného slova, hesla. Sú to teda stránky, ktoré majú zväčša hľadané slovo v názve, alebo v popise.
Nerozozná napríklad  skloňované slová, preto sa vždy snažte do vyhľadávača zadať čo najpresnejšiu gramatickú podobu hľadaného slova. Tieto vyhľadávače sú rýchle a často aj presné. No nie všetky stránky majú v názve alebo vo svojom popise to, čo hľadáte. V takom prípade použite full-textové vyhľadávače, ktoré prehľadávajú priamo obsah stránok. To znamená, že ak hľadáte stránky obsahujúce informácie o chemickom zložení vody, do vyhľadávača zadajte heslo "chemické zloženie vody" a on vám zobrazí všetky stránky, ktoré vo svojom obsahu skrývajú toto slovné spojenie.

Slovenské vyhľadávače, zoznamy a katalógy:

Atlas Altavista Box Business Centrum
Dunčo Hladat. host Inzine Katalog Miesto
Naj Najdes Panorama Pozri Webfast
Superzoznam Surf Vševedko Webpilot; Zoznam

Zahranicné vyhladávace, zoznamy a katalógy:

Quick.cz AskJeeves.com AltaVista.com Atlas.com Atlas.cz
Centrum.cz Einmedia.com Excite.com Google.com Lycos.com
Go.com Goto.com Hotbot.com Looksmart.com Mozek.cz
Opera.com Teoma.com Seznam.cz WebCrawler.com  

 Vyhľadávanie

Používateľ po navštívení stránky vyhľadávača zadá dotaz, väčšinou použitím slov alebo fráz, ktoré hľadá a tzv. kľúčových slov, čo sú príkazy pre vyhľadávač, upresňujúce spôsob vyhľadávania, niekedy nazývané aj operátory. Vyhľadávač na základe dotazu prehľadá svoju databázu a vypíše zoznam nájdených stránok zodpovedajúcich dotazu.

Pri vyhľadávaní je pre používateľa veľmi dôležitá relevantnosť nájdených informácií, tzn. významová zhoda informácií, ktoré požadoval a informácií vo vyhľadávačom nájdených stránkach. Pokiaľ budete hľadať informácie o bootovaní operačného systému a vyhľadávač vám poskytne zoznam stránok týkajúcich sa obchodov s topánkami (boot=topánka), bude relevantnosť nízka.

Môžu existovať milióny stránok obsahujúcich hľadaný výraz, niektoré viac populárne, relevantné alebo uprednostňované ako iné. Väčšina vyhľadávačov preto používa metódy na zoradenie výsledkov, aby tie "najlepšie" výsledky boli zobrazené na prvých miestach. Tieto metódy však závisia od vyhľadávača a menia sa a v závislosti od vývoja Internetu a objavov nových vyhľadávacích techník.

Väčšina vyhľadávačov má vlastnú doménu, stačí teda zadať napr. www.lycos.com alebo www.szm.sk  a objaví sa stránka s možnosťou zadania dotazu. Komplexnejšie vyhľadávače umožňujú, okrem základného vyhľadávania a použitia operátorov, aj použitie rozšíreného vyhľadávania, ktoré upresní výsledky vyhľadávania. Rozšírené vyhľadávanie je väčšinou len "user-friendly" alternatívou k použitiu operátorov, avšak u niektorých vyhľadávačov bez podpory operátorov je jeho použitie jediná možnosť vyhnúť sa množstvu irelevantných odkazov.

Pre zvýšenie relevantnosti je veľmi dôležité vyhľadávať pomocou čo najväčšieho počtu slov, v kombinácii s operátormi alebo rozšírenými možnosťami vyhľadávania.
Ak viem, že hľadám freeware na úpravu bitmapových obrázkov pre Windows, použijem napr. dotaz: "bitmap editor"+Windows+freeware+download.
Niekedy nie je nutné použiť +, avšak závisí od vyhľadávača, čí bude vyhľadávať len stránky obsahujúce všetky zadané slová alebo každú stránku obsahujúcu aspoň jedno zo zadaných slov. Znamienko + zabezpečí, že hľadaná stránka bude obsahovať všetky zadané slová a zmenší tým počet výsledkov. Použitie úvodzoviek zase značí, že hľadáme frázu "bitmap editor" a nie slová bitmap a editor. Daný príklad by mal fungovať v každom "dobrom" vyhľadávači.

Na upresnenie vyhľadávania a zvýšenie relevantnosti nájdených informácií je možné použiť kľúčové slová (operátory). Kľúčové slová tvoria špeciálnu množinu slov, príkazov pre vyhľadávač, ktoré nebudú vyhľadávané v texte ale špecifikujú určíte "vzťahy" medzi hľadanými slovami.
Najčastejšie používanými sú boolovské operácie (and, or, not...), pričom niektoré vyhľadávače umožňujú aj požitie tzv. wildcards (zástupných znakov), poprípade rozlišujú veľké a malé písmená, čí diakritiku v texte (na to si treba pri zadávaní dotazu dávať veľký pozor: "Vyhľadávač" môže byť niečo iné ako "vyhľadávač", či "vyhladavac"). Väčšinou sú slová z diakritikou konvertované na tvar bez diakritiky a potom vyhľadávané, hlavne pri zahraničných vyhľadávačoch. Preto je dôležité, ak takú možnosť máte, nastaviť aj jazyk pre vyhľadávanie.

Zástupné znaky (obvykle znak *) nahradzujú ľubovoľný text, napr. monitor*, nájde všetky slová obsahujúce základ monitor, čiže aj monitory, monitorovanie, atd.

Boolovské operacie

AND (+) - budú sa hľadať stránky, ktoré obsahujú všetky slová v dotaze, pred ktorými je AND(+)
html AND editor AND wysiwyg AND freeware
html+editor+wysiwyg+freeware

OR - vyhľadá stránky, ktoré obsahujú aspoň jedno zo slov zadaných v dotaze. Toto je u veľkého množstva vyhľadávačov štandardná operácia pri oddelení slov medzerníkom.
monitor OR display
monitor display

NOT (-) - vyhľadá stránky neobsahujúce slovo zadané v dotaze, pred ktorým je NOT(-)
monitor NOT display
monitor-display

NEAR - niektoré vyhľadávače (AltaVista) umožňujú použitie operátora NEAR, ktorý značí, že hľadané slová sa majú nachádzať blízko pri sebe.
Dotaz: ibm NEAR/5 computer zobrazí stránky obsahujúce slová ibm a computer vzdialené max. 5 slov od seba.

Operátory je možné kombinovať, pričom je možné používať zátvorky ( ).
(monitor OR display) AND iiyama NOT viewsonic

V prípade, že hľadáme slovo, ktoré je zároveň kľúčovým slovom, jednoducho ho uzavrieme do úvodzoviek: "AND".

Slová uzavreté to úvodzoviek sú vyhľadávané ako fráza: "Microsoft Office".

Nasledujúca tabuľka poskytuje prehľad funkcií niektorých vyhľadávačov:

Obmedzenia súčasných vyhľadávačov.

  • Žiadna súčasná technológia nie je schopná kompletne indexovať rýchlo sa zväčšujúci Web.
  • Množstvo stránok je často aktualizovaných, takže vyhľadávače sú nútené k ich pravidelnému prehľadávaniu.
  • Dotazy sú zatiaľ obmedzené len na vyhľadávanie slov alebo fráz, čo značné obmedzuje vyhľadávanie multimédií.
  • Indexácia dynamicky generovaných stránok je obtiažna a pomalá alebo môže viesť k nadmernému množstvu rovnakých výsledkov.
  • Množstvo dynamických stránok je nemožné indexovať, čo vedie k fenoménu známemu ako neviditeľný web.
  • Niektoré vyhľadávače nezoraďujú výsledky podľa relevancie, ale skôr v závislosti od toho, kto koľko zaplatí.

Veľa stránok používa triky na ovplyvnenie svojej pozície v zozname výsledkov a dostávajú sa tak na prvé miesta. Príkladom môžu byt rôzne stránky obsahujúce v keyword metatagoch často vyhľadávané výrazy (napr. windows, service-pack, security), pričom ich obsah je úplne iný (väčšinou pornografia a nelegálny software, tzv. warez).


Metavyhľadávače

Internetový metavyhľadávač je zvláštnym druhom vyhľadávača. Nemá vlastnú indexovú databázu ani neprehľadáva web-stránky. Pracuje ako "prostredník" medzi používateľom a ostatnými vyhľadávačmi.

Po zadaní dotazu ho metavyhľadávač odovzdá niekoľkým vyhľadávačom, pričom ich výsledky spracuje a poskytne späť používateľovi. To umožňuje zadať dotaz iba raz, avšak pristupovať k viacerým vyhľadávačom naraz. Pretože žiadny vyhľadávač nie je schopný indexovať celý Web, hlavnou myšlienkou metavyhľadávačov je poskytnúť oveľa väčšie množstvo výsledkov v kratšom čase, zadaním iba jedného dotazu.

Metavyhľadávač vám môže pomôcť, ak použitie "obyčajného" vyhľadávača poskytuje veľa irelevantných výsledkov. Okrem toho, každý vyhľadávač používa inú syntax operátorov na upresnenie vyhľadávania. Metavyhľadávač dotaz spracuje a upraví ho pre každý vyhľadávač zvlášť.

Metavyhľadávače sú rôzne. Niektoré využívajú iba známe a populárne vyhľadávače, iné spolupracujú aj s menej známymi vyhľadávačmi a inými databázami. Takisto sa odlišujú vo forme zobrazenia výsledkov vyhľadávania.
Existujú metavyhľadávače, ktoré zobrazujú výsledky podľa vyhľadávača, z ktorého výsledky pochádzajú. Používateľ si potom môže vybrať, ktorý vyhľadávač mu poskytuje najpresnejšie výsledky a hľadať na ňom ďalej.
Iné metavyhľadávače zoraďujú výsledky podľa relevantnosti, často bez informácie, z ktorého vyhľadávača výsledky pochádzajú. Výhodou tohto prístupu je eliminácia duplicitných odkazov a umiestnenie najrelevantnejších výsledkov na prvé priečky.
Výsledky sa môžu líšiť pri použití rôznych metavyhľadávačov, avšak aj použitie toho najjednoduchšieho metavyhľadávača umožní prehľadať väčšiu časť webu ako pri použití samostatného vyhľadávača.

Odkazy

www.metacrawler.com
www.metasearch.com
www.search.com
www.ixquick.com

Tipy na vyhladávanie

Pred vyhľadávaním sa zamyslite, čo relevantná stránka MUSÍ obsahovať (pred slovo použite operátor "+"), čo obsahovať NESMIE (operátor -), prípadne čo obsahovať môže (operátor OR) a nebojte sa zadávať aj zložitejšie otázky.

Napríklad Výraz "+Galileo -probe scientist OR astronomer" donúti Google vyhľadať všetko o vedcovi alebo astronómovi Galileovi Galileim bez toho, aby nám ukázal informácie o rovnomennej sonde.

  1. Jednoduchším spôsobom môžete takúto otázku zadat len vyplnením formuláru v rozšírenom vyhľadávaní  www.google.sk.
  2. Ak neviete, cez aké kľúčové slová hľadať, skúste sa k výsledku vyhľadávania preklikať cez katalóg - directory.google.sk, alebo u nás napríklad www.zoznam.sk.
  3. Vhodné použitie frázy je často účinnejšie, ako vypisovanie mnohých kľúčových slov. Zamyslite sa, ci existuje fráza, ktorá spája vami hľadané stránky.
  4. Nepoužívajte vo svojich vyhľadávaniach predložky ani spojky (iba ako súčasť fráz) - zbytočne do vašich odpovedí zanášajú veľký počet stránok s nulovou relevanciou (ktorá stránka nepoužíva predložky?). Niektoré najčastejšie sa vyskytujúce slová (napr. and, the, ...) dokonca Google sám zakazuje ako takzvané stopwords. Ak na ich použití trváte, použite pred nimi operátor "+".
  5. Vyhľadávajte podľa typu súboru. Napríklad ak hľadáte powerpointovskú prezentáciu, obmedzte vyhľadávanie na súbory *.pps. Ak potrebujete rozsiahly dokument, bude zrejme vo formáte PDF.
    Pre vyhľadanie konkrétneho typu dokumentu zadajte v google jeho príponu za parameter "filetype", napríklad: "internet Slovensko filetype:pdf".
  6. Ak hľadáte slovenské stránky, prepnite Google na "Jazyk: slovenský", alebo obmedzte hľadanie na našu doménu použitím "domain:.sk". Slovenské stránky čoraz lepšie prehľadávajú aj domáce vyhľadávače a často si s nimi poradia ešte lepšie ako Google. Vyskúšajte ich.
  7. Ak stránka nájdená v Google momentálne nefunguje, môžete si pomôcť kliknutím na odkaz "Cached" (Z pamäti). Stránka sa načíta v tej podobe, v akej ju server Google naposledy zaznamenal.

Hoci internet ponúka miliardy stránok nabitých informáciami, ich vyhľadávanie zostáva naďalej jedným z najväčších problémov. Chyba nie je na strane vyhľadávacích serverov, ktoré sa za desaťročie veľmi zlepšili, ale v ľuďoch. Nevedia, ako sa pýtať, vyhľadávače im potom nemôžu ponúknuť rozhodujúce stránky.

Späť

Vyhľadávanie

(c) 2008 Všetky práva vyhradené.