Ontologie

De ontologie van DBpedia heeft een ondiepe structuur en dekt een groot aantal domeinen. Zij komt voort uit de inventarisatie van de meest gebruikte infoboxen binnen Wikipedia, waarna op basis van de kennelijk relevante begrippen handmatig een klassenboom is opgesteld.De DBpedia-ontologie kent op dit moment 685 klassen, die worden beschreven door 2.795 properties. De Nederlandstalige DBpedia gebruikt hiervan 576 klassen en 1795 properties.

Sinds het uitkomen van release 3.2 in 2008 extraheert DBpedia begrippen uit  Wikipedia-infoboxen op basis van handmatige mappings naar de ontologie van DBpedia. Deze mappings bevatten fijnmazige regels voor het herkennen en indelen van waarden in de infobox. Met de mappings kunnen ook onduidelijkheden en overlap in de infoboxen worden gecorrigeerd, zoals het voorkomen van verschillende infoboxen voor dezelfde klasse, verschillende propertynamen voor dezelfde property, en onbestemde datatypes in de alfanumerieke velden van de infobox. Als gevolg daarvan komen de gegevens waarmee de individuele objecten beschreven worden met veel minder ruis, en zijn ze beter gestructureerd dan de velden die vóór deze release werden geëxtraheerd.

Met ingang van release 3.5 hebben medewerkers van DBpedia de beschikking over een wiki-omgeving, waarmee bestaande mappings kunnen worden bewerkt en nieuwe aangemaakt. Ook kan de DBpedia-ontologie met nieuwe klassen en properties worden uitgebreid. Deze ontologie is vanaf release 3.7 (2011) niet langer een klassenboom, maar een gerichte a-cyclische graaf. Klassen kunnen nu meer dan één superklassen hebben, hetgeen de mappings naar  schema.org een stuk gemakkelijker maakt. Je kunt van de DBpedia-klassen nog steeds een taxonomie maken door alle superklassen weg te laten behalve de klasse die vooraan in de lijst van superklassen staat en die als de belangrijkste wordt beschouwd. 

Omdat de ontologie van DBpedia enige wildgroei is gaan vertonen, wordt op dit moment nagedacht over herstructuring van de gehele ontologie. Deze operatie zou dan gecombineerd moeten worden met de omzetting van de mapping-wiki's naar een RML-omgeving.

Bekijk de huidige versie van de ontologie, en de vertaling daarvan naar de infoboxen van de Nederlandstalige Wikipedia.

De DBpedia-ontologie bevat op dit moment ongeveer 4.233.000 instanties (gedefinieerd als subjecten in een triple); in de Nederlandstalige editie zijn er daarvan 3.230.314. 

Onderstaande tabel geeft voor resp. de internationale DBpedia en de Nederlandstalige DBpedia het aantal instanties voor diverse klassen uit de ontologie.:

Klasse Instanties NL cijfers
Instanties per klasse
Resource (zonder onderscheid) 4.233.000 3.230.314
Place 735.000 491.131
Person 1.450.000 98.640
Work 411.000 55.778
Species 251.000 883.683
Organisation 241.000 49.146

 

 

 

 

 

 

 

 

 

 

 

De DBpedia-ontologie kan in vier delen worden gedownload:

  1. DBpedia Ontology T-BOX (Schema)
  2. DBpedia Ontology RDF type statements (Instance Data)
  3. DBpedia Ontology other A-Box properties (Instance Data, mapping-based properties)
  4. DBpedia Ontology other A-Box specific properties (Instance Data, mapping-based properties (specific))


De DBpedia-ontologie kan ook worden bevraagd via het DBpedia SPARQL endpoint. Navigeren door de ontologie kan via het DBpedia Linked Data interface. Voorbeelden: de klasse Place, de property elevation.