Welkom

Uit DBpedia in Dutch
Ga naar: navigatie, zoeken
Dbpedia logo nl.png
Welkom op de hoofdpagina van nl.dbpedia.org, de machineleesbare versie van de Nederlandstalige Wikipedia. DBpedia.org wordt automatisch opgebouwd door extractie software die de informatie uit de Wikipedia pagina's ophaalt en deze op een gestructureerde manier vastlegt en beschikbaar maakt als Linked Open Data.

Op dit moment (janauri 2015) wordt in internationaal DBpedia-verband gewerkt aan een grondige vernieuwing van deze website. Wij hopen begin 2015 de nieuwe webomgeving van DBpedia te presenteren. Op die website zal ook worden uiteengezet, welke stappen de laatste tijd zijn gezet op het gebied van kwaliteitsverbetering: meer en betere links, meer data over personen dan uit Wikipedia kan worden geëxtraheerd, een betere ontologie, alsook koppelingen naar nieuwe domeinen van kennis. De eerste besluiten daartoe zijn op de DBpedia Community Meeting in Dublin genomen.

Inhoud

Initiatief

Het inrichten van de Nederlandstalige versie van de DBpedia is een initiatief van Stichting Bibliotheek.nl samen met de Universiteit van Leipzig. Ook de Vlaamse bibliotheekorganisatie Bibnet is aangehaakt. Intussen is echter de groep achter nl.dbpedia.org breder geworden dan de bibliotheken alleen, want DBpedia fungeert als een soort centrale datastructuur voor Linked Open Data. Alle informatie die op nl.dbpedia.org wordt verzameld is vrij beschikbaar. De opgenomen pagina's kunnen direct opgevraagd worden, zie bijvoorbeeld http://nl.dbpedia.org/page/Utrecht_(stad) of kunnen via een SPARQL interface op http://nl.dbpedia.org/sparql geraadpleegd worden.

Help mee!

De werkzaamheden die Stichting Bibliotheek.nl coördineert hebben vooral betrekking op de technische werkzaamheden voor het inrichten van de software en de data opslag. Om op nl.dbpedia.org tot een goede afspiegeling te komen van de rijke informatie in de Wikipedia zijn echter meer activiteiten nodig. Zo is het belangrijk dat de Wikipedia pagina's zelf goed gestructureerd opgebouwd zijn zodat de extractie software hier goed mee over weg kan. En moeten er vertaaltabellen (mappings) ingericht worden om de informatie te koppelen aan de DBpedia ontologie. De initiatiefnemers nodigen iedereen uit om mee te helpen aan het beter maken van de koppeling tussen de Wikipedia en de DBpedia. Kijk op Help mee! voor meer informatie over hoe je kan bijdragen of bekijk de presentatie over DBpedia van Gerard Kuys voor meer achtergrond informatie over dit project.

Recente ontwikkelingen

Sinds de start in januari 2013 is grote vooruitgang geboekt met het mappen van sjablonen. Zoveel vooruitgang, dat nu weer aandacht zou moeten worden opgeëist door het toevoegen van sjablonen aan artikelen. Aandachtspunt is ook de DBpedia ontologie. In haar oorspronkelijke opzet kende zij een ondiepe structuur, en diende zij vooral om de geëxtraheerde kernbegrippen te accommoderen. Er ontstaat echter - onder volle erkenning van de noodzaak om hier voorzichtig mee om te gaan - behoefte aan een ontologiestructuur die beter aansluit bij professionele classificatiesystemen en thesauri. Mondjesmaat worden in de DBpedia ontologie klassen toegevoegd of anders gerangschikt om de afstand tot deze laatste kleiner te maken.

Bijna ongemerkt is daarmee de grens overschreden, die nl.DBpedia tot dusver eerbiedigde. Er komen nu resources in de ontologie die niet worden geëxtraheerd uit de pagina's van de Nederlandstalige Wikipedia. Zo is in de DBpedia dataset aan een relatief kleine groep van auteurs een verwijzing naar VIAF (viaf.org) toegevoegd, waardoor voor deze groep van schrijvers direct kan worden doorgelinkt naar VIAF (waarin inmiddels de Nederlandse Thesaurus van Auteursnamen is opgenomen). Via VIAF kan nl.DBpedia vervolgens data gaan opslaan over het geslacht van de betrokken personen, een gegeven dat (behalve voor een kleine categorie sporters) niet uit de pagina's van Nederlands Wikipedia kan worden geëxtraheerd. Een andere verbinding die nu mogelijk is geworden, is die m.b.t. de informatie over molens. De rijke dataset over molens van Wikipedia.nl (en dus ook nl.DBpedia) is 'opgelijnd' (aligned) met die van de Rijksdienst voor Cultureel Erfgoed (RCE). De vooral encyclopedische informatie van DBpedia kan nu eenvoudig worden gelinkt aan de professionele beschrijvingen die van de RCE afkomstig zijn.

De volgende stap waaraan wordt gewerkt, is het linken van data over personen aan data over plaatsen, anders dan geboorteplaats en plaats van overlijden. Hiervoor zal een verzameling van properties moeten worden gedefinieerd, die zoveel mogelijk aansluit bij andere vocabulaires die dit onderwerp raken.

Aandacht voor de datakwaliteit

Al in een artikel voor het Semantic Web Journal vroeg Bob du Charme zich af, wat de relatie zou zijn tussen DBpedia en WikiData. Het antwoord op die vraag komt er aan, ook voor data in het Nederlandse taalgebied. Met de uitwisseling en het vergelijken van de data van DBpedia en van het Wikidata-project hebben beide partijen te winnen. De Nederlandstalige DBpedia heeft daarom tijdens de Community Meeting van 30 januari 2014 met Wikidata afgesproken, aan zulk een uitwisseling systematisch aandacht te gaan geven. De eerste proefneming zal gaan over de monumentendata in de datasets van resp. DBpedia en Wikidata, met als doel om te kijken of daarna zogeheten narratives kunnen worden ontwikkeld. De kick-off is geweest op 20 maart 2014 in Utrecht, bij welke gelegenheid praktische afspraken zijn gemaakt.

Nederlandstalig DBpedia had aanvankelijk besloten om linksets te gaan maken die de verbinding leggen tussen DBpedia en de Getty-vocabulaires die onlangs als Linked Open Data zijn gepubliceerd. We wilden dit gaan doen voor de Nederlandstalige begrippen, en vervolgens kijken of dit ook voor de hele DBpedia gedaan kon worden. Inmiddels heeft de ontwikkeling bij de internationale DBpedia dit voornemen overbodig gemaakt: de Getty-thesauri staan op de nominatie om voor heel DBpedia gelinkt te worden. De lijst van alle externe datasets die op dit moment in DBpedia geladen zijn vindt men hier.

Versie 3.9

Op 23 september 2013 heeft Christian Bizer de nieuwe versie, 3.9, van DBpedia bekend gemaakt. Een van de toevoegingen is, dat er nu niet meer strikt een infobox in een Wikipedia-artikel hoeft te staan om concepten te extraheren. Daarnaast is nu een groot aantal DBpedia-concepten gelinkt aan Wikidata-concepten en aan concepten in Yago, Freebase en Geonames. Aardig om te vermelden is, dat de Nederlandstalige DBpedia in de anderhalf jaar van zijn bestaan een van de best-gemapte lokale versies geworden is. Er zijn volgens Bizer 335 mappings in het Nederlands - dit aantal ligt echter inmiddels al op 444. Bizers getal voor nl.dbpedia.org wordt alleen overtroffen door de Engelstalige en Poolse versies.

In het kader van de Google Summer of Code is de software achter DBpedia opgekrikt. Er is een nieuw gebruikersinterface op de Linked Data, terwijl ook de mogelijkheden voor het zoeken van resources en conceptherkenning zijn uitgebreid. De Nederlandstalige DBpedia is de eerste omgeving, waar het nieuwe gebruikersinterface (de Linked Data Viewer) is toegepast. Ook voor de komende Google Summer of Code is DBpedia weer een van de thema's.

Versie 4.0

Op 3 september 2014 heeft Volha Bryl van de Universiteit van Mannheim de 4.0 release van DBpedia bekend gemaakt. Er is een begin gemaakt met het stroomlijnen van de ontologie, en er wordt toegewerkt naar een versie die gemakkelijker onderhoudbaar is. Ook zijn de extractoren verbeterd. Deze release is DBpedia 2014 gedoopt, omdat het doornummeren naar 4.0 de indruk zou wekken dat grote structuurwijzigingen zijn doorgevoerd, en dat is niet het geval.

1st DBpedia International Community Meeting

Op 30 januari 2014 vond aan de VU in Amsterdam de eerste internationale Community Meeting van DBpedia plaats, die mede was georganiseerd door het Nederlandstalig Chapter van DBpedia.

Het programma voorzag voor één van de drie Parallel Sessies (PS) in een bijeenkomst van het lokale Chapter. Belangstellenden waren welkom! Tot de onderwerpen die in de Nederlandse Parallel Sessie in de middag besproken werden behoorden vragen rondom verrijkingen buiten het extractieproces om en procedures voor het verbeteren van de ontologie van DBpedia.

Op de DBpedia-stakeholders bijeenkomst van 31 januari is besloten om met het oog op de continuïteit aan het DBpedia-project een minder losse organisatiestructuur te geven. Op dit moment (maart 2014) wordt een ontwerp voor een Charter besproken, waarin wordt vastgelegd dat DBpedia wordt opgezet langs lijnen die veel lijken op die van de Wikimedia Foundation: een internationale Board met verschillende afdelingen (Chapters) per land of per taalgebied.

2nd DBpedia International Community Meeting

Op 3 september 2014 vond in Leipzig de tweede internationale community meeting van DBpedia plaats. DBpedia is van een vrijwilligersorganisatie nu een formele organisatie geworden, een rechtspersoon. De vorm die daarvoor gekozen is, is die van een dochterorganisatie van INFaI, de samenwerkingsorganisatie tussen wetenschap (in dit geval de universiteit van Leipzig) en maatschappij. Qua interne structuur volgt DBpedia op hoofdlijnen het model van de Wikipedia Foundation: een centrale organisatie waarvan een gekozen Board de belangrijke beslissingen neemt en een uitvoerend bestuur die beslissingen voorbereidt en uitvoert. In de Board zijn de landelijke afdelingen vertegenwoordigd, waaronder ook de Nederlandstalige DBpedia. De DBpedianen in Leipzig hebben ingestemd met het voorstel voor een nieuwe website, en voor profilering van DBpedia, vooralsnog alleen met stickers en een fact sheet. Er wordt nu gewerkt aan het overhevelen van de content van de oude (internationale) website naar de nieuwe omgeving, dit proces is naar verwachting eind november in een gevorderd stadium.

Internationale Semantic Web Conferentie 2014

Op de ISWC was DBpedia herkenbaar aanwezig. Alle deelnemers aan het congres hebben een vel papier meegekregen, waarin wordt uiteengezet hoeveel begrippen (de Engelstalige) DBpedia bevat en hoe deze begrippen over verschillende kennisgebieden zijn verdeeld. Het is de bedoeling, dat over ongeveer een maand een soortgelijke versie van deze Infographics speciaal voor de Nederlandstalige DBpedia verschijnt. Nieuw was ook de aankondiging, dat de Universiteit van Mannheim werkt aan een manier om historische data vast te houden. Op dit moment wordt in veel gevallen de waarde van een attribuut in bijvoorbeeld een veld in een Infobox overschreven zodra er een nieuwe toestand is ontstaan. Daarmee gaat de informatie over voorafgaande toestanden verloren. Overschreven waarden kunnen echter worden teruggehaald uit de verzameling van vorige versies van een Wikipedia-pagina. Volha Bryl van de Universiteit van Mannheim verwacht, dat op deze manier de informatie in DBpedia, bijvoorbeeld die over bedrijven, kan worden verdiept. Dit is nuttig voor het genereren van statistische reeksen over de tijd. Indien de data compleet genoeg zijn, kunnen deze ook voor trendvoorspelling worden geëxtrapoleerd.

6th DBpedia International Community Meeting 2016, 11 and 12 February, The Hague - NL

Op Donderdagavond 11 februari en vrijdag 12 februari 2016 was er de zesde internationale community meeting van DBpedia, dit keer bij de Koninklijke Bibliotheek (KB) in Den Haag.
Welkom en ontvangst was op donderdagavond bij TNO New Babylon in Den Haag. Voor meer details over het programma zie DBpedia.org.
Deelname was gratis, maar registratie voor deze bijeenkomst was verplicht en een ticket was hier verkrijgbaar.

De mensen van nl.DBpedia.org

Sinds september 2014 is Ruben Verborgh het Vlaamse smaldeel van DBpedia komen te versterken. Hij werkt een voorstel uit voor het extraheren van impliciete informatie uit Wikipedia, of een persoon man of vrouw is. Dergelijke gegevens worden tot nu toe niet in infoboxen op Wikipedia-pagina's toegestaan en moeten dus langs andere weg worden verkregen en in DBpedia worden opgenomen.

Persoonlijke instellingen
Naamruimten

Varianten
Handelingen
Navigatie
Community
Toepassingen
Hulpmiddelen