Současnost

Současnost
Předcházející	Kapitola 2. Od historie k současnosti webu	Další

Již od roku 2001 se Tim Berners-Lee snaží o další revoluci na webu a to o sémantický web. V květnu 2001 vydává spolu s dalšími autory článek na Scientific American, kde tuto ideu poprvé zmiňuje a upozorňuje na skutečnost, že v současnosti je World Wide Web jen haldou webových stránek, která neustále roste a ve které je stále složitější nalézt relevantní informace. Sémantickému webu se proto začala věnovat nově založená skupina W3C nazvaná Semantic Web.

Co vlastně znamená slovní spojení sémantický web? Sémantika je nauka o významu slov a jejich vztahu ke skutečnosti a pojem web představuje dokumenty v počítačové síti navzájem propojené odkazy. Sémantický web by tedy měl představovat dokumenty, které se skládají nejen z obsahu, ale poskytují také vysvětlující informace o svém obsahu (data o datech - metadata). Jedna z definic sémantického webu říká: sémantický web je rozšířením současného webu, v kterém jsou data popsaná tak, aby jejich významu rozuměly i počítače [SemanticWeb].

Přední propagátoři sémantického webu Tim Berners-Lee, James Hendler a Ora Lassila tvrdí, že je ještě daleko doba, kdy budou počítače schopny rozumět mluvenému nebo psanému projevu, a proto bude lepší jim jít v této cestě naproti a systémem pravidel zajistit výměnu informací mezi člověkem a počítačem (nebo dokonce počítačem a počítačem) [SemanticWeb].

Je tato revoluce na poli webových technologií nutná? Zdá se, že ano!

Vysvětleme si to na příkladě vyhledávačů, bez kterých si již jen těžko dokážeme naši práci na webu představit. Jaká úskalí můžou nastat, když vyhledávač (robot, počítač) pracuje s dokumenty, které nemají sémanticky definovaný obsah?

dostaneme na dotaz hodně odpovědí s malou relevancí
žádná odpověď nebo malé množství (příliš specifický dotaz)
přílišná citlivost na slovník (stejný význam se dá napsat i jinými slovy)
výsledkem je 1 stránka (co když jsou informace v dokumentu, který je rozdělen na více částí?)

I přes neustálý vývoj vyhledávačů tyto nedostatky zůstávají. Stejně tak v případě, kdy je vyhledávací proces úspěšný, zůstává ta časově nejnáročnější práce na člověka - výběr a prohledání získaných dokumentu za účelem získání informace. Počítač/vyhledávač neumí interpretovat význam vět, vybrat hodnotné informace pro uživatele [semanticWebPrimer].

Abychom si tento problém ještě více přiblížili, ukážeme si jej na normální prácí s počítačem. Již odedávna je na počítačích aplikována hierarchie stromu, která se využívá pro ukládání souborů, strukturu dokumentů, strukturu webových stránek, atd. S tím nám vyvstává několik problémů. Představme si situaci, kdy hledáme dokument, který jsme si někam uložili, ale nevíme kam. Indicie, které při hledání máme, jsou:

je to dokument, který mi včera poslal Václav, je o robotech, autor se myslím jmenoval Martin Lukenský.

Ve stromové struktuře to ale na základě těchto informací nikdy nenajdeme. Můžeme použít vyhledávání v operačním systému, ale to nám zde nejspíš moc nepomůže. Odpovědí na tento problém by měly být soubory ukládané společně se sémantickou informací. Při uložení takového souboru by počítač automaticky zaznamenal, že jde o soubor typu dokument, uložený z e-mailu a je od odesilatele jménem Václav. Informace o autorovi a popisu obsahu už by si nesl s sebou.

Předcházející	Nahoru	Další
Kapitola 2. Od historie k současnosti webu	Domů	Úskalí současného webu