Over DBpedia

DBpedia is een kennisstructuur op internet die door communities in stand gehouden wordt. DBpedia maakt het mogelijk de kennis in Wikipedia te bevragen alsof Wikipedia een database is, en om de verschillende dataverzamelingen op het Web te koppelen aan de data van Wikipedia. Wij hopen dat het door DBpedia gemakkelijker wordt om van de grote hoeveelheid informatie in Wikipedia goed gebruik te maken. Verder kan DBpedia wellicht als inspiratiebron dienen voor het doorzoeken, verrijken en verbeteren van de encyclopedie zelf.

DBpedia als kennisbank

Kennisbanken spelen een steeds belangrijkere rol in het slimmer maken van zoektechnieken op het Web, in de informatievoorziening voor organisaties en ondernemingen, en als hulpmiddel voor het integreren van informatie. In de huidige situatie hebben de meeste kennisbanken alleen betrekking op specifieke kennisdomeinen, worden ze opgebouwd door betrekkelijk kleine groepen van kenniswerkers, en zijn ze duur om up-to-date te houden - want kennisdomeinen veranderen de hele tijd. Tegelijkertijd heeft Wikipedia zich ontwikkeld tot een van de centrale kennisbronnen voor iedereen, een kennisbron die door duizenden medewerkers wordt onderhouden. Het DBpedia-project benut deze geweldige kennisbron door van het tekstmateriaal van Wikipedia gestructureerde informatie te maken en door deze informatie op het Web te ontsluiten onder de voorwaarden van de Creative Commons Attribution-ShareAlike 3.0 Licentie en de GNU Free Documentation Licentie

De Engelstalige versie van de DBpedia-kennisbank beschrijft 4,58 miljoen dingen, waarvan 4,22 miljoen dingen nader zijn getypeerd met behulp van de ontologie van DBpedia. Het gaat hier om 1.445.000 personen, 735.000 plaatsen (waaronder 478.000 menselijke vestigingsplaatsen), 411.000 titels van een scheppend werk (hiervan 123.000 muziekalbums, 87.000 films en 19.000 videospelletjes), 241.000 organisaties (waarvan 58.000 ondernemingen en 49.000 onderwijsinstellingen), 251.000 diersoorten en 6.000 ziekten en aandoeningen.

Naast de Engeltalige versie levert DBpedia gelokaliseerde versies in 125 talen. Al deze versies bij elkaar beschrijven 38,3 miljoen dingen. 23,8 miljoen hiervan zijn de voor een taalgebied aangepaste beschrijvingen die ook bestaan in de Engelstalige versie van DBpedia. De volledige dataset van DBpedia omvat 38 miljoen labels en samenvattingen in 125 verschillende talen, 25,2 miljoen koppelingen naar beeldmateriaal en 29,8 miljoen links naar externe webpagina's, 80,9 miljoen links naar categorieën in Wikipedia en 41,2 miljoen links naar Yago-categorieën.
Dbpedia is door circa 50 miljoen links verbonden met andere Linked-Data gegevensverzamelingen. Al met al bestaat de DBpedia-release van 2014 uit 3 miljard stukjes informatie (RDF triples), waarvan 580 miljoen afkomstig zijn uit de Engelstalige versie van DBpedia, 2.46 miljard zijn geextraheerd uit andere taalversies. Statistieken met meer details over de DBpedia datasets van 24 bekende talen zijn te vinden onder Dataset Statistieken.

De kennisbank van DBpedia heeft verschillende voordelen boven andere kennisbanken: hij dekt een groot aantal domeinen; hij is de uitdrukking van wat de community voor de meest wenselijke vertaling houdt, hij ontwikkelt automatisch met Wikipedia mee en is echt veeltalig. Met de DBpedia kennisbank kun je tamelijk verrassende queries uitvoeren op Wikipedia, zoals "Geef me alle steden in New Jersey met meer dan 10.000 inwoners" of "Geef me alle Italiaanse musici uit de 18e eeuw". De toepassingsmogelijkheden voor de kennisbank van DBpedia zijn veelsoortig en reiken van kennismanagement binnen de onderneming, via zoeken op het Web tot aan volledig nieuwe manieren om Wikipedia te doorzoeken.

Groeikern van het Web van Data

In het kader van de W3C Linking Open Data (LOD) community effort is een toenemend aantal dataleveranciers begonnen om volgens de Linked Data principes van Tim Berners-Lee hun data op het Web te pubulideren en onderling te verknopen. Het Web van Data dat daaruit resulteert bestaat op dit moment uit enkele miljarden RDF triples en bestrijkt kennisdomeinen zoals aardrijkskundige informatie, gegevens over mensen, ondernemingen, in-line communities, films, muziek, boeken en wetenschappelijke publicaties. Naast het publiceren en koppelen van datasets wordt ook gewerkt aan Linked Data browsers, Linked Data crawlers, zoekmachines voor het Web van Data, alsook andere applicaties die hun Linked Data ophalen van het Web.


De DBpedia kennisbank wordt op het Web als Linked Data aangeboden. Omdat DBpedia Linked Data URI's geeft voor miljoenen begrippen, zijn verschillende dataleveranciers ertoe overgegaan om hun eigen datasets te voorzien van uitgaande links naar DBpedia. Als gevolg hiervan is DBpedia uitgegroeid tot een van de centrale knoop- en koppelpunten van het Web van Data in opkomst.

Inhoud

Hieronder meer gedetailleerde informatie over het DBpedia community project:

  • Datasets geeft een overzicht over DBpedia als kennisbank.
  • Ontology geeft een overzicht over de ontologie van DBpedia..
  • Online Access beschrijft hoe de dataset kan worden benaderd via een SPARQL endpoint en als Linked Data bevraagd.
  • Downloads levert de DBpedia datasets om te downloaden.
  • Interlinking beschrijft hoe de dataset van DBpedia gelinkt is met diverse andere datasets op het Web.
  • Use Cases beschrijft verschillende toepassingen van DBpedia als referentiebestand en geeft een model-toepassing
  • Extraction Framework beschrijft de softwarecomponenten die gezamenlijk begrippen in Wikipediatekst herkennen en omzetten naar RDF resources in DBpedia.
  • Data Provision Architecture schildert het landschap van de software en protocollen die door DBpedia worden gebruikt op het Web.
  • Community legt uit hoe de DBpedia community (samen)werkt en hoe mensen kunnen bijdragen aan DBpedia.
  • DBpedia Mapping Wiki bevat de mappings waarmee woorden of woordgroepen in Wikipediateksten worden afgebeeld op de ontologie van DBpedia.
  • DBpedia Internationalization Effort gaat over het werk aan verschillende taalspecifieke versies van DBpedia.
  • DBpedia-Live presenteert het nieuwe DBpedia-Live framework.
  • DBpedia Spotlight presenteert het DBpedia Spotlight softwaretool voor het semantisch annoteren van content van op het Web.
  • Credits benoemt de mensen die tot dusver een belangrijke bijdrage aan DBpedia hebben geleverd.
  • Change Log geeft de lijst van DBpedia releases en een overzicht van de veranderingen die met iedere release zijn doorgevoerd.
  • Publications geeft de lijst van wetenschappelijke publicaties over DBpedia, maar ook van blog posts over DBpedia.
  • Next steps benoemt de ideeën en toekomstplannen voor het DBpedia project.

This material is Open Knowledge

Voor een recent overzicht van de ontwikkeling van DBpedia,zie: