Kapitola 5. Analýza využití znalostních technologií v součastnosti

Obsah

Používané technologie
RSS
Dublin Core
Creative Commons
CC/PP
FOAF
DOAC
Průzkum portálů využívajících technologie sémantického webu
Otevřené databáze
Sémantické vyhledávače
Sémantické technologie implementované na známých portálech
Shrnutí současné implementace a perspektivy
Reálné přínosy sémantických technologií

Používané technologie

V této kapitole si popíšeme technologie týkající se sémantického webu, se kterými se už denně setkáváme nebo se setkávat v budoucnu můžeme.

RSS

I když formát RSS souvisí se sémantickým webem spíše okrajově, uvedeme si ho zde. A to hlavně proto, že je (ale i není) postaven na RDF, používá se každodenně a je to vůbec nejrozšířenější metadatový formát na Internetu [semMuni2].

Obrázek 5.1. Logo RSS (Zdroj: http://www.rssboard.org)

Logo RSS (Zdroj: http://www.rssboard.org)

RSS je velmi jednoduchá ontologie, která poskytuje metadata o publikovaných článcích na webu. Nejčastěji se používá na blozích, e-magazínech a jiných internetových publikacích. Jako internetovým čtenářům nám tento formát ulehčuje čerpání aktuálních informací z několika námi vybraných zdrojů. Stačí si zkopírovat adresu RSS feedu daného serveru do své RSS čtečky a ta se již postará o příjem těchto metainformací. Nemusíme tak brouzdat po několika různých serverech a vše potřebné máme na jednom místě [SemWebTutorial] [semMuni2].

Vývoj RSS je však velmi nekonzistentní a dokonce ani zkratka RSS není pro rozdílné verze stejná (RSS 0.9x - Rich Site Summary, RSS 1.0 - RDF Site Summary, RSS 2.0 - Really Simple Syndication). Na vině jsou vývojářské tábory, které nejsou schopné se dohodnout na jednom standardu. Jako první přišla s formátem RSS firma Netscape pro svůj informační portál my.netscape.com. Tato verze byla označena jako RSS 0.9 a její jádro bylo založeno na RDF. Odstraněním RDF, zjednodušením standardu a přidáním nových vlastností vznikla verze RSS 0.91 od firmy UserLand. Netscape o tento formát následně ztrácí zájem a na pole vývoje přichází samostatná mezinárodní skupina vývojářů, která kritizuje odstranění RDF a nemožnost rozšiřitelnosti (modularizace). Vytváří proto v prosinci 2000 formát RSS 1.0, který je opět založen na RDF a je rozšiřitelný díky jmenným prostorům. Na to reaguje firma UserLand postupným vydáním standardů RSS 0.92, RSS 0.93 a RSS 0.94. Přidává však jen nové prvky. Na možnost rozšiřitelnosti reaguje až v roce 2002, kdy vydává formát RSS 2.0, který již také používá jmenné prostory [semMuni2].

Obrázek 5.2. Poměr zastoupení jednotlivých verzí RSS (Zdroj: [semMuni2])

Poměr zastoupení jednotlivých verzí RSS (Zdroj: )

Největší výhodou RSS formátu je jeho jednoduchost. Díky ní se tento formát tak rychle a masově prosadil.

Dublin Core

Dublin Core je metadatový formát, který vznikl ještě před W3C iniciativou kolem sémantického webu. Byl původně určen pro popis obsahu webových stránek, popis zdrojů v muzeích, knihovnách a různých vládních institucích. Je jednoduchý, rozšiřitelný a snadno modulovatelný. Díky tomu se také stal univerzálním formátem na elektronické popisování objektů reálného světa a je mezinárodně podporovaný [novaGenerace].

Creative Commons

Creative Commons slouží pro přidání informace o licenci k danému dokumentu (článku, fotce, videu, atd.). K podání této informace generuje HTML kód obohacený o RDFa. Můžeme tak pomocí vygenerovaného kódu jednoduše určit, že daný obrázek je volně šiřitelný a nevyhrazujete si na něj žádná práva nebo naopak.

CC/PP

CC/PP (Composite Capability/Preference Profiles) je formát, který je založený na RDF a slouží pro popisování softwarových a hardwarových vlastností webových klientů. Na základě přesných informací o klientovi můžeme přizpůsobit zasílaný obsah na koncové zařízení. Můžeme tak naplno využít možnosti mobilního zařízení nebo stolního počítače s velkým monitorem. Obsah a vzhled se bude pro tyto zařízení pochopitelně lišit [SemWebTutorial] [novaGenerace].

FOAF

Friend Of A Friend (FOAF) slouží jako formát pro popis lidí, jejich aktivit, vlastností a hlavně vztahů. Vizí je, aby se díky tomu začaly bořit zdi mezi jednotlivými sociálními servery, jako jsou Facebook, MySpace, Orkut, LinkedIn a jiné. Každý server by totiž mohl fungovat jako hosting FOAF profilů, tvořící jednu velkou, otevřenou, decentralizovanou sociální síť. O oblibě tohoto projektu svědčí 1,6 milionu FOAF záznamů na webu (červenec 2004). Adresa tohoto projektu je http://foaf-project.org [uvodSemWeb].

Obrázek 5.3. Grafické znázornění FOAF. (Zdroj: [HolyExpo])

Grafické znázornění FOAF. (Zdroj: )

DOAC

Do FOAF formátu byl časem integrován modul DOAC (Description of a Career), což je slovník sloužící k popisu osoby z hlediska profesního. Člověk si tak může vytvořit životopis, který bude kompatibilní s evropským Europass Curriculum a vložit si jej na své stránky. Agenti hledající člověka na určitou pozici budou mít ulehčenou práci při průzkumu trhu, protože pouze zadají své požadavky do vyhledávače [doac].

Obrázek 5.4. DOAC + FOAF. (Zdroj: http://ramonantonio.net/doac/)

DOAC + FOAF. (Zdroj: http://ramonantonio.net/doac/)