bron interactieontwerpen.sebastix.nl (studie blog) - dit artikel bevat mogelijk verouderde content

Semantic Web (essay)

dinsdag 3 juni 2008 - 1717 woorden, 9 min read

door Sebastian Hagens De mens en technologie “virtualiseert”. Het virtueel platform die gedreven is op technologi...

door Sebastian Hagens

De mens en technologie “virtualiseert”. Het virtueel platform die gedreven is op technologie wordt steeds belangrijker in het leven. Op dit platform wordt steeds meer geschreven, besproken en geleefd. Het is een grote brok aan informatie die bestaat uit tekst, afbeeldingen en video’s. Het word wide web brengt verschillende vormen van media bij elkaar welke toegankelijk is via hoofdzakelijk de computer maar ook via mobiele telefonie en andere producten die straks continue in verbinding staan met de virtuele wereld. Op deze manier komen de reële en virtuele wereld steeds dichter bij elkaar. Maar hoe zit het met de kwaliteit en betekenis van al die informatie?

Op het internet verschijnen steeds meer online applicaties waar je je foto’s kan beheren, je agenda kan bijhouden, werk kunt zoeken, sociale contacten kunt onderhouden enzovoorts. Deze applicaties zijn vaak in beheer van een groot bedrijf die het technisch platform toegankelijk maakt voor gebruikers. De gebruikers zijn verantwoordelijk voor de inhoud en kunnen deze zelf aanleveren en beheren. Dit idee is de laatste jaren omgedoopt in een hippe marketingterm ‘web2.0’ welke synoniem is voor user generated content en het sharen ervan met andere gebruikers. Grote digitale platformen zijn er groot mee geworden bijvoorbeeld Facebook, YouTube en Flickr. Elk platform richt zich echter vaak op één bepaald podium, zoals Flickr dat doet op fotografie. Daarmee bakenen ze voor jou al een groot gebied is; die van fotografie. Ben je op zoek naar hoge kwalitatieve foto’s? Dan moet je zoeken op Flickr. Als je eenmaal de foto hebt gevonden dan weet je wat er op de foto staat, maar je kent het verhaal achter de foto niet. Zoals meer informatie over de locatie, meer informatie over de maker van de foto, meer informatie over het tijdstip. Rondom die foto is ook een hele context aanwezig die de foto een meerwaarde kan geven. De foto bevat nog talloze referenties naar andere gebieden. Deze gebieden zijn ook aanwezig op het web.

Als we Nova Spivack (http://www.vimeo.com/684381) mogen geloven wordt alle data straks allemaal met elkaar verbonden binnen een semantische omgeving. Momenteel vind dit ook plaats binnen het sociale web, mensen worden verbonden met mensen en zo ontstaat er per persoon een bepaald profiel met connecties naar anderen. In de toekomst wordt alles aan alles gekoppeld. Als dit is gebeurd, dan zijn we in staat om veel sneller en efficiënter te zoeken binnen een bepaald onderwerp. Aan elk onderwerp kun je tientallen websites koppelen maar ook producten, locaties, evenementen, groepen, beeldmateriaal, bedrijven enzovoort.

Echter voordat het zover is, zal er nog een heleboel moeten gebeuren aan de huidige informatie op het web. Als je een website maakt over een bepaald onderwerp, is de kans groot dat er toch maar weinig bezoekers op komen. Wanneer komen er wel veel bezoekers? Zodra jouw website wordt verbonden aan een andere website. Wanneer komen er echt veel bezoekers? Zodra jouw websites aan heel veel websites wordt gekoppeld. Maar wie koppelt deze websites dan aan elkaar? Dat gebeurt nog grotendeels handmatig door de gebruikers. Echter zijn er al wel applicaties die dit eenvoudiger maken, maar niet in staat zijn om iets te beoordelen of iets relevant is in een bepaalde context. Een browser als Flock is hier een goed voorbeeld van of StumbleOpon, een plugin voor je browser. Waar deze applicaties goed gebruik van maken, is jouw gedrag. Jouw gedrag bepaald namelijk wat jij interessant vindt of niet. Dat is natuurlijk per persoon verschillend en daarom ben ik ook van mening dat een applicatie zich op jouw dient aan te passen in plaats van andersom.

Het internet moet grondig worden gestructureerd om alle informatie met de juiste relevantie aan elkaar te koppelen. De grote ‘web2.0’ platformen doen dit in principe al, echter is dit nog maar gericht op één bepaald medium. Google probeert tegenwoordig al meer te zijn dan een zoekmachine, maar slaat de plank nog steeds mis in mijn ogen als het gaat om echte relevante informatie. Dat komt omdat Google grotendeels werkt met statistieken die niet gebaseerd zijn op beoordelingen van gebruikers, maar op bepaalde technieken en aantal bezoekers per plek. Het aantal bezoekers zegt natuurlijk al heel veel over een website, maar het blijven vaak websites die iets vertellen over een onderwerp. Vaak is het niet datgene wat je specifiek zoekt. Voor informatie over een bepaald onderwerp waar je nog niets vanaf weet is Google een goede uitkomst, echter als je je wilt verdiepen in bepaalde aspecten binnen in een onderwerp dan moet je veel geduld hebben en weten hoe je moet zoeken buiten Google om tot een succesvol resultaat te komen.
Alle informatie moet opnieuw worden beoordeeld, ditmaal door de gebruikers van het web. Wat bedoel ik met alle informatie? Niet alleen tekst en afbeeldingen, maar ook producten, locaties, fora, bedrijven, personen enzovoort. Hoe moeten we dit dan beoordelen? Je kunt bijvoorbeeld zeggen dat een bepaalde website gekoppeld is aan een bepaald persoon. Die persoon werkt bijvoorbeeld weer bij een bedrijf die wellicht weer iets te maken heeft met de eerder genoemde bepaalde website of juist niet. Dit soort beoordelingen moeten worden gemaakt door de gebruikers. Wellicht kunnen computers dit soort beoordelingen ook maken, maar die acht ik momenteel nog niet in die staat. Het menselijk brein zal hoe dan ook altijd intelligenter blijven dan die van de technologie.
Bepaalde connecties kunnen ook weer worden gecategoriseerd. Een connectie tussen A en B is het belangrijkste, maar je kunt de connectie ook nog indelen in verschillende categorieën. Je kunt als persoon een bepaalde relatie hebben met een locatie. Je werkt er misschien, je woont er of er woont iemand die je kent. Deze persoon staat weer in connectie met jou als vriend, als collega of misschien je liefde. Deze connecties moeten ook weer door jou zelf worden beoordeeld.

Ik zeg eigenlijk al dat ieder individu op het web één virtueel profiel moet krijgen waar elke applicatie mee overweg moet kunnen. Elke applicatie moet kunnen zien wie ik ben en wat ik doe. Op deze manier kunnen mijn persoonlijke beoordelingen ook worden afgevangen en worden opgeslagen. Deze statistieken zijn belangrijk voor mijn resultaten die ik terug krijg op het web. Ik wil niet dezelfde resultaten als mijn buurman als we zoeken op hetzelfde onderwerp. Mijn buurman heeft wellicht andere interesses als hij zoekt naar ‘reizen + Japan’ dan ik. Ik hou zelf van Japanse automerken en de technologie, maar mijn buurman misschien wel van de cultuur en geschiedenis van het land. Het moet ook mogelijk zijn om soortgelijke resultaten terug te krijgen net als mijn buurman. Technisch zou je dan kunnen zoeken met andere profielen van andere individuen, zonder teveel informatie prijs te geven over de identiteit van de ander.

We zullen in de toekomst in de virtuele wereld een heel stuk van onze anonimiteit moeten inleveren om het web zich te laten aanpassen aan ons. Een stuk van ons karakter, gedrag en persoonlijkheid moeten we digitaliseren zodat de techniek kan reageren op onze interesses en behoeftes.

Als deze verschuiving gaat plaatsvinden naar een meer semantisch web dan gaat er eerst een heleboel informatie ‘verdwijnen’ die momenteel op het internet staat. De informatie zal nog wel blijven bestaan, maar uiteindelijk zijn de de personen die bepalen of bepaalde informatie wel of niet relevant is binnen een onderwerp. Goede relevante informatie daarentegen zal alleen maar belangrijker worden en zo dicht mogelijk op de juiste plek terecht gaan komen waar deze hoort te staan binnen een onderwerp.

Als reactie op deze komende verschuiving heb ik ook een interactieconcept bedacht die bepaalde data al dichter naast elkaar moet gaan zetten binnen één platform. Tegenwoordig stellen vele grote platformen (zoals Digg, Flickr, YouTube, Google enzovoort) hun databases beschikbaar, met API’s (Application Programming Interfaces), om deze op een extern platform te kunnen gebruiken. Ik heb een aantal van deze platformen gekoppeld aan een eigen gemaakt platform onder de naam 2find. Op 2find dient de gebruiker zich te registreren alvorens te gaan zoeken binnen een onderwerp. Waarom? Alleen op deze manier kan ik bepaalde beoordelingen (het gedrag, de klik en de tijdsduur van een bezoek aan een pagina) afvangen op mijn platform en een relevantie connectie leggen tussen bepaalde data in een bepaalde categorie. Als je zoekt naar een onderwerp krijg de resultaten terug in acht verschillende categorieën; websites, documenten, afbeeldingen, video’s, producten, locaties, personen en communities. In het begin zul je resultaten terug krijgen die grotendeels gebaseerd zijn op statistieken. Pas als je vaker gebruik maakt van 2find, vult het systeem je profiel steeds meer in als het gaat om je interesses binnen bepaalde onderwerpen. Uiteraard is het mogelijk om eerst zelf globaal je eigen interesses aan te vinken, maar gaandeweg door je zoekhandelingen wordt dit steeds gerichter op jou. Het gedrag op 2find wordt namelijk afgevangen en opgeslagen gekoppeld aan je profiel. Het systeem zoekt in de toekomst dan zelf naar relevante resultaten die gebaseerd zijn op eerdere zoekhandelingen van jou en andere met dezelfde overeenkomsten.
Op deze manier probeer ik de bestaande data opnieuw te structuren in categorieën en te laten beoordelen door gebruikers. Hieruit volgt een nieuw resultaat die een nieuwe betekenis heeft gekregen; een semantische laag naast de bestaande laag statistieken.

Het semantische web zal er hoe dan ook komen, maar dat zal niet vanzelf gaan. Er zal meer worden gevraagd van de gebruiker om uiteindelijk een veel betrouwbaarder resultaat terug te geven als het gaat om informatie waar de gebruiker zoekt. In mijn ogen moet er in de toekomst een grote standaard komen om je als individu op het web op elke website te kunnen identificeren. Elk individu heeft zijn / haar eigen interesses, karakter, gedrag en wensen. Het web moet zich hierop aanpassen in plaats van dat de gebruiker zich moet aanpassen aan het web.

Het World Wide Web Consortium, de uitvinders van het web, zijn al jarenlang bezig met het semantische web en hebben al diverse standaarden ontwikkeld om bepaalde informatie meer betekenis te kunnen geven. Echter ben ik van mening dat ze momenteel al zoveel standaarden hebben, dat je als maker van informatie niet weet welke je moet kiezen. In plaats van een nieuw technisch hulpmiddel te gebruiken lijkt mij het veel slimmer om een gebruiker te identificeren, zijn gedrag te analyseren en vervolgens conclusies trekken welke informatie relevant is aan deze persoon met een bepaalde wens in de virtuele wereld van het internet.