DBpedia Dataset
DBpedia ist ein Gemeinschaftsprojekt der Universität Leipzig und anderen Institutionen, mit dem strukturierte Informationen aus Wikipedia extrahiert und Webanwendungen zugänglich gemacht werden können. DBpedia ermöglicht es weiterhin, diese Daten mit Informationen aus anderen Web-Anwendungen zu verbinden.Wikipedia-Artikel bestehen meistens aus normalem Fließtext, enthalten aber andererseits auch strukturierte Informationen, beispielsweise Infoboxen, Tabellen, Kategorien, geographische Koordinaten und Weblinks. Diese Informationen können extrahiert und als Datenbasis für fortgeschrittene Fragen verwendet werden. Als Standard für die Daten wird das Resource Description Framework (RDF) benutzt. Als Quelle werden verschiedene Sprachversionen (Niederländisch, Japanisch, Englisch, Deutsch, Portugiesisch) von Wikipedia verwendet.