Daten

Anhand dieser Daten und der Challenges werden Projektideen entwickeln, die wir im Hackdash sammeln. Wer noch an Coding da Vinci mitarbeiten möchte, kann sich via Mail (helene.hahn@okfn.org noch registrieren.

Wir suchen noch Personen, die z.B. mit den Daten der ZLB oder der Berlinischen Galerie arbeiten wollen. Meldet euch bei uns, wenn ihr dabei sein wollt!

Berlinische Galerie
Landesmuseum für Moderne Kunst, Fotografie und Architektur

Ostberliner Fotoarchiv

Das Fotoarchiv der ehemaligen Ostberliner Magistratsverwaltung für Stadtentwicklung, Wohnen und Verkehr besteht aus Schwarzweiß-Kontaktfotografien von Originalnegativen. Nach Bezirken, Bauaufgaben und Themen gegliedert, wurde hier die Baugeschichte Ostberlins festgehalten. Der Bestand gilt heute als umfassendstes Dokument der dortigen Architektur- und Stadtentwicklung.

Bereitgestellt werden 200 Archivumschläge und Karteikarten mit Kontaktkopien der Originalnegative von Gisela Dutschmann, 1962–75, Silbergelatine auf Archivumschlag, je 18,5 x 24,6 cm sowie Silbergelatine auf Karteikarte, je 18,5 x 24,6 cm oder 21 x 29,7 cm.
Für Coding da Vinci hat die Berlinische Galerie einen Teil von 200 Archivumschlägen und Karteikarten aus dem umfangreichen Gesamtbestand des Ostberliner Fotoarchivs ausgewählt. Es handelt sich hierbei um Aufnahmen von Bauprojekten am Alexanderplatz, entlang der Karl-Marx-Allee, Unter den Linden und auf der Fischerinsel aus der Zeit von Oktober 1962 bis Juni 1975.

Namensnennung
Gisela Dutschmann, Berlinische Galerie
Lizenz
CC-BY
Dateityp
XLS, JPEG
Link Metadaten
https://offenedaten.de/dataset/fotoarchiv-ehemaligen-ostberliner-magistratsverwaltung-fur-stadtentwicklung
Link Fotos
https://www.flickr.com/photos/okfde/sets/72157643263439724/

Botanischer Garten und Botanisches Museum Berlin-Dahlem

Botanischer Garten und Botanisches Museum Berlin-Dahlem

Das Herbarium des BGBM wurde 1819 gegründet und ist mit 3,6 Millionen getrockneten und konservierten Pflanzenbelegen heute das größte Herbarium in Deutschland. Neben den Blütenpflanzen bewahrt das Herbarium Sammlungen von Algen, Moosen, Farnen, Pilzen und Flechten. Ergänzt werden sie durch Sondersammlungen von Früchten, Samen, Holzproben, Gallen, Pflanzenprodukten und eine Nasspräparatesammlung. Seit dem Jahr 2000 werden Belege des Herbariums hochauflösend digitalisiert und im Internet verfügbar gemacht sowie an internationale Forschungsnetzwerke wie BioCASe und GBIF geliefert.

Derzeit sind 170,000 Bilder digital über das Web verfügbar: die Digitalisate über einen Imageviewer und die zugehörigen Metadaten in RDF/XML:

  • Über die Basis-URL erhält man Zugriff auf einen Katalog aller verfügbaren Objekte (g-zipptes RDF/XML-Dokument). Für jedes Objekt sind Titel sowie eine URL aufgeführt, z.B. „Loranthus tubulosus Willd.“.
  • Öffnet man diese URL in einem Browser, wird das Objekt in einer für Menschen geeigneten Art präsentiert: Man kann das Bild betrachten, zoomen, drehen usw. sowie sich die Metadaten anschauen,
  • Nutzt eine Software diese URL, erhält sie die Metadaten im maschinenlesbaren RDF-Format.
  • Die ca. 10.500 Bilder der Farne sind über den Imageviewer hinaus auch komplett als JPG verfügbar. Diese Objekte lassen sich am führenden „B20“ in der Objekt-ID erkennen und enthalten in den Metadaten ein zusätzliches Feld associatedMedia, das die URL zum Bild enthält (Beispiel).
Namensnennung
Botanischer Garten und Botanisches Museum Berlin-Dahlem
Lizenz
Bilder: CC-BY-SA 3.0
Metadaten: CC0
Details
Dateityp
RDF/XML, JPEG
Link
http://herbarium.bgbm.org/object

Ernst-Haeckel-Haus der Friedrich-Schiller-Universität Jena

Ernst-Haeckel-Haus

Das Ernst-Haeckel-Haus der Friedrich-Schiller-Universität Jena hat ein ganz spezifisches Profil. Historisch gewachsen ist die Doppelfunktion als Museum und als wissenschaftshistorisches Universitätsinstitut mit angeschlossenen Archiv- und Sammlungsbeständen. Ein neuer Sammlungsschwerpunkt ist die Experimentelle Wissenschaftsgeschichte. Die in diesem Zusammenhang entstandene, umfangreiche Sammlung von Objekten zeugt von der praktischen Auseinandersetzung mit historischen Experimentalanordnungen – im Zuge der Rekonstruktion nach schriftlich und gedruckt überlieferten Gegebenheiten. Die durch Nachbauten und den Erwerb von Originalen stetig erweiterte Instrumentensammlung soll zu einer kritischen, historischen und methodologischen Reflexion über Wissenschaft im Allgemeinen und Naturwissenschaften im Besonderen anregen.

Die Sammlung Experimentelle Wissenschaftsgeschichte des Ernst-Haeckel-Hauses umfasst derzeit 31 Instrumente. Als Ergebnis eines studentischen Seminars kann die Sammlung im Portal museen.thueringen.de präsentiert werden.

Die Metadaten der Instrumentensammlung liegen im LIDO XML Format vor und sind unter CC-BY-SA Lizenz verfügbar. Die Sachbegriffe, die Personen und Körperschaften und die Orte enthalten jeweils URIs auf die GND der Deutschen Nationalbibliothek. Die Sachbegriffe sind außerdem auf den AAT-LOD Dienst von Getty gemappt. Die Orte haben zusätzlich Verknüpfungen nach Geonames und zu dem TGN von Getty.

Namensnennung
Ernst-Haeckel-Haus der Friedrich-Schiller-Universität Jena
Lizenz
CC-BY-SA
Dateityp
JPG, LIDO XML, DDB API
Links Bilder
JPGs mit max. 1600 Pixeln und Link auf den myCore Viewer der ThULB Jena
Link Metadaten
BBD API: https://www.deutsche-digitale-bibliothek.de/searchresults?query=*&facetValues[]=provider_fct%3DFriedrich-Schiller-Universit%C3%A4t+Jena%3A+Ernst-Haeckel-Haus&offset=0

Ethnologisches Museum
Abteilung Musikethnologie, Medien-Technik und Phonogramm-Archiv

Für den Hackathon haben wir zwei mögliche Themenschwerpunkte ausgesucht. Der erste wären die Tagore-Sammlungsobjekte, zu denen wir CT-Daten, 3D-Modelle, Fotos und Metadaten vorliegen haben. Der zweite Schwerpunkt läge auf der Bestimmung von Musikinstrumenten. Fast alle unserer 3000 Instrumente sind fotografisch erfasst und zu einigen gibt es ergänzend Audio- und Videofiles.

Signatur
hausinterne Identifikationsnummer, die über die besitzende Abteilung und die regionale Herkunft Auskunft gibt
Sachbegriff
Einordnung des Instruments in das Klassifikationssystem von Hornbostel&Sachs
Titel
einheimische Bezeichnung des Instruments
Geografischer Bezug
Information über die Herkunft des Instruments

Die Datensätze tragen jeweils die Signatur des Objektes (zum Beispiel I_C_7722), so dass Fotos, Metadaten, etc einander zugeordnet werden können.

Unter den folgenden Links kann man sich die Datensätze zu den Instrumenten komplett ansehen (Foto, Metadaten und wenn vorhanden Audio/Video), indem die Signatur in das Suche-Feld eingegeben wird: http://www.smb-digital.de, http://www.mimo-db.eu

Namensnennung
siehe Datenzusatz
Lizenz
CC-BY-SA

Fotografien: JPG, die Fotos sind jeweils nach den Urhebern in Alben sortiert: https://www.flickr.com/x/t/0115002/photos/121003427@N03/

Videos: MPG, Urheber Andreas Richter: https://offenedaten.de/de/dataset/video-em-spk

Audios: MP3, Urheber Andreas Richter: https://offenedaten.de/de/dataset/audio-em-spk

3D-Modelle: PLY, Urheber Dana Freyberg, Verena Höhn & Andreas Richter: https://offenedaten.de/de/dataset/3d-modelle-sammlung-tagore

Link Metadaten: XLS, Stiftung Preußischer Kulturbesitz: https://offenedaten.de/de/dataset/metadaten-vii
https://offenedaten.de/de/dataset/metadaten-ic

Gemeinsame Normdatei

Die Gemeinsame Normdatei (GND) ist eine Normdatei für Personen, Körperschaften, Veranstaltungen, Geografika, Sachbegriffe und Werke. Die GND-Datensätze enthalten beschreibende Metadaten und verschiedene Benennungen und Relationen zu anderen Entitäten, um sie eindeutig zu identifizieren und für das Retrieval zur Verfügung zu stellen.

Die GND wird in Bibliotheken für die Erschließung bzw. zur Normierung von Sucheinstiegen zu bibliografischen Ressourcen und anderen Objekten eingesetzt, zunehmend aber auch in anderen Kultureinrichtungen wie Archiven und Museen oder in Verlagen und verschiedenen Web-Anwendungen verwendet. Auf diese Weise existiert ein Netz von miteinander in Beziehung stehender Entitäten und Objekte.

Die GND wird kooperativ von der Deutschen Nationalbibliothek (DNB), allen Bibliotheksverbünden des deutschsprachigen Raums, der Zeitschriftendatenbank (ZDB) und zahlreichen weiteren Institutionen geführt und an der DNB gehalten. Das Datenset für „Coding da Vinci“ umfasst die gesamte GND mit ca. 10 Millionen Datensätzen; es können allerdings auch lediglich Teile des Datensets selektiert und verwendet werden.

Lizenz
CC0; unveränderte Koordinaten aus der Datenbank GeoNames in geografischen Normdaten unter CC BY 3.0.
Namensnennung
Gemeinsame Normdatei (GND)
Dateityp
RDFxml, Turtle, MARC 21-xml
Download GND
assets.okfnlabs.org.s3.amazonaws.com/users/stwe/codingdavinci.de/gnd/GND.rdf.gz
http://assets.okfnlabs.org.s3.amazonaws.com/users/stwe/codingdavinci.de/gnd/GND.ttl.gz
weiterführende Links
GND: http://www.dnb.de/gnd Linked Data Service: http://www.dnb.de/lds Datendienste: http://www.dnb.de/datendienst

Georg-Eckert-Institut für internationale Schulbuchforschung

Alte Weltkarte

Ein Großteil der Werke stammt aus der Zeit des Deutschen Kaiserreichs. Einen besonderen Teil der Sammlung bilden digitalisierten Geschichtsatlanten aus dem 19. und vom Beginn des 20. Jahrhunderts. Geschichtsatlanten stellen als systematisches Werk der Kartographie einen eigenen Typus dar, der zur Visualisierung historischer Ereignisse, Zustände und Entwicklungen dient.

Namensnennung
Georg-Eckert-Institut für internationale Schulbuchforschung
Lizenz
Metadaten CC0, Bilder Public Domain
Dateityp
JPG, XML, METS/MODS
Metadaten
API der DDB
Bilder
http://gei-digital.gei.de/viewer/browse/

Herzog August Bibliothek Wolfenbüttel

Die "Wolfenbütteler Digitale Bibliothek" (WDB) enthält (Voll-)Digitalisate von mittlerweile über 800 vorwiegend mittelalterlichen Handschriften, von über 700 Inkunabeln (=Bücher, die vor 1500 gedruckt wurden) und über 20.000 Drucken von 1500 bis 1850.

Zu allen Digitalisaten gibt es Metadaten unterschiedlichen Umfangs, für die gedruckten Werke sind dies vor allem OPAC -Daten, für die Handschriften stehen teilweise ausführliche Beschreibungen zur Verfügung. Für zahlreiche Inkunabeln gibt es virtuelle Inhaltsverzeichnisse, sogenannte Strukturdaten, die "Besonderheiten" wie z .B. Überschriften, Abbildungen, handschriftliche Einträge usw. im Buch dokumentieren und verlinken. Für immer mehr Drucke vor allem Helmstedter Herkunft werden OCR-generierte Volltexte hinterlegt und mit den Digitalisa ten verknüpft.

Die gesamte Organisation der Daten orientiert sich an den Materialgruppen und den Signaturen der Objekte in der Bibliothek. Aus einer Handschriftensignatur "1. Gud. lat." wird eine "normalisierte" Signatur "1-gud-lat", mit deren Hilfe alle Daten abgerufen werden können:

Bildanzeige: http://diglib.hab.de/mss/1-gud-lat/start.htm
Liste der Bilder: http://diglib.hab.de/mss/1-gud-lat/facsimile.xml
Beschreibung: http://diglib.hab.de/?db=mss&list=ms&id=1-gud-lat
Beschreibung als XML: http://diglib.hab.de/?db=mss&list=ms&id=1-gud-lat&mode=xml

Namensnennung
Herzog August Bibliothek Wolfenbüttel
Lizenz
CC-BY-SA 3.0, Details
Dateityp
JPEG, XML (TEI, METS/MODS)
Links
http://oai.hab.de, http://diglib.hab.de/?db=mss

Landesarchiv Baden-Württemberg

Militärhistorische Bildsammlung

Das Landesarchiv Baden-Württemberg sorgt als landeskundliches Kompetenzzentrum dafür, die archivalische Überlieferung Baden-Württembergs als Teil des kulturellen Erbes und der Erinnerungskultur zu sichern, zu erhalten und jedem Interessierten zugänglich zu machen.

Militärhistorische Bildsammlung

Die Militärhistorische Bildsammlung umfasst vorwiegend vom Heeresarchiv Stuttgart gesammeltes Bildmaterial (Stiche, Zeichnungen, Drucke, Lithografien, Fotografien, etc.). Die Objekte behandeln das württembergische Königshaus, unterschiedliche militärische Persönlichkeiten, sowie die Militär- und Kriegsgeschichte Europas und Deutschlands vom Mittelalter bis zum Ersten Weltkrieg (mit einigen Nachträgen zum Ersten und Zweiten Weltkrieg). Dieser fast durchgängig digitalisierte Bildbestand bietet neben seiner hierarchischen Gliederung durch die Verwendung von Personennormdaten eine Vielzahl an Einstiegsmöglichkeiten. Exemplarisch soll er für über 6.000 unterschiedlich tief erschlossene Bestände des Landesarchivs stehen, von denen über 100 teilweise oder bereits vollständig digitalisiert wurden (so etwa eine Dokumentation der jüdischen Grabsteine in Baden-Württemberg) und über das API der DDB frei verfügbar sind.

Unter seiner Federführung entsteht außerdem das Archivportal-D als DFG-gefördertes Teilprojekt der Deutschen Digitalen Bibliothek, das auf das API der DDB aufbaut.

Namensnennung
Landesarchiv Baden-Württemberg
Lizenz
CC-BY, Details
Dateityp
JPEG, RDF/XML (DDB-API)
Links
DDB API

Max-Planck-Institut für Wissenschaftsgeschichte Berlin

Das MPIWG hat ein Open-Access-Repositorium für Forschungsquellen in den Geisteswissenschaften ECHO–Cultural Heritage Online aufgebaut. Darin sind Quellen verschiedener Content-Provider aus aller Welt virtuell zu thematischen Gruppen und in Kollektionen zusammengeführt.

Es finden sich hochaufgelöste Bilder, Volltexttranskriptionen, Datenbanken mit Forschungsdaten und einige Multimedia-Daten. Für den Hackathon werden bibliografische Metadaten zur Rara-Sammlung des MPIWG (historischer Buchquellen vom 16.-19. Jahrhundert) und exemplarisch einige Metadaten zu Filmen aus der MPWG-Mediathek zur Verfügung gestellt.

URLs für "Videos" stehen in "/archive-path", z.B.:

  <archive-path>http://einstein-virtuell.mpiwg-berlin.mpg.de/VEA/SC-1816523987_MOD355385129_SEQ-610673245_SL2060416494_de.html</archive-path>

Für "Book" setzt sich die URL aus der Serveradresse und der Pfadangabe unter "/archive-path" zusammen:

"http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?url=" + "/archive-path", z.B.:
<archive-path>/mpiwg/online/permanent/archimedes_repository/large/monte_mecha_037_it_1581</archive-path>

Die URL ist dann wie folgt:

http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?url=/mpiwg/online/permanent/archimedes_repository/large/monte_mecha_037_it_1581
Namensnennung
Max-Planck-Institut für Wissenschaftsgeschichte Berlin
Lizenz
CC-BY-SA
Dateityp
XML
Metadaten
https://offenedaten.de/group/quellensammlung-mpiwg

Museum für Naturkunde Berlin

Insektenkasten

Insektenkästen

Für Coding da Vinci stellt das Museum für Naturkunde Berlin Gigapixel-Scans von Insektenkästen für die breite Öffentlichkeit und für die Forschungsgemeinschaft zur Verfügung. Diese Insektenkästen umfassen Schmetterlingen, Käfern, Bienen, Heuschrecken, Wanzen usw.. Es gibt eine Liste der Arten in jedem Insektenkasten, allerdings auch Kästen mit unbestimmten Material. Alle Insektenkästen liegen als krpano-Objekte (Flash oder HTML5) vor, wobei jedes krpano-Objekt sich aus ca. 1400 Einzelbildern (JPG) zusammensetzt und insgesamt eine Auflösung von ca. 18.400 x 14.800 Pixel hat sowie eine Dateigröße von 35 Mb umfasst. 50 dieser Bilder sind unter einer CC-BY 4.0-Lizenz verfügbar, eine Erweiterung der krpano-Objekte ist über eine API möglich.

Hintergrund: Insektenkastenportal mit mehr als 3.000 Insektenkästen (jeden Monat kommen ca. 500 weitere hinzu), Beispielsuche: Scarabaeidae.

Weitere Infos gibt es im Wiki
Namensnennung
Museum für Naturkunde Berlin
Lizenz
CC-BY
Dateityp
JPG
Bilder und Metadaten
http://gbif.naturkundemuseum-berlin.de/hackathon/

Tierstimmen

Auf tierstimmenarchiv.de wird eine große Zahl wissenschaftlich geprüfter, hochqualitativer Tierstimmen bereitsgestellt. Ein großer Teil der geschnittenen Aufnahmen kann nicht unter einer offenen Lizenz zur Verfügung gestellt werden, jedoch existiert ein für Deutschland sehr interessanter Satz von ca. 300 Aufnahmen von Vögeln, Amphibien und Säugetieren, die unter CC BY-SA lizensiert und hier verfügbar sind.

1. Analyse und eventuelle Verbesserung des zur Zeit implementierten Web-basierten Zugriffs (login als "guest" mit Passwort "guest")

2. Nutzung der freien Tierstimmen, z.B. auch in einer Smartphone App.

3. Nutzung der Monitoringaufnahmen (erfordert login wie oben), d.h. an einem Ort sind mehrere Mikrofone installiert und es werden über Tage hinweg kontinuierlich Aufnahmen gemacht

4. Markierung von Abschnitten (z.B. Anfang und Ende eines Vogelgesangs) -> automatisch oder mit Nutzerhilfe (Crowdsourcing)

5. Als Ansporn und maximales Ziel: automatische Arterkennung durch Vergleich von Abschnitten im Monitoring mit Referenzaufnahmen aus dem Tierstimmenarchiv

Namensnennung
Museum für Naturkunde Berlin
Lizenz
CC-BY-SA
Dateityp
mp3
Link Sounds
http://species-id.net/openmedia/Category:Media_by_Tierstimmenarchiv_MfN

NS-Buchverbotsliste

Die „Liste der schädlichen und unerwünschten Schrifttums“ enthält die von den Nationalsozialisten zwischen 1938 bis 1941 zusammengestellten Autoren und ihre Werke, die im Dritten Reich verboten wurden. Diese Liste wurde nur als vertrauliches Schriftstück an die Reichsschrifttumskammer sowie die Vorstände von Buchhandel und Bibliotheken weitergegeben. Hier wird die NS-Verbotsliste erstmals vollständig online zur Verfügung gestellt mit fast 6.000 Einträgen. Nun steht sie zur freien Verwendung und Verknüpfung bereit.

Namensnennung/verföffentlichende Stelle
BerlinOnline Stadtportal GmbH & Co KG
Lizenz
CC-BY
Dateityp
JSON
Metadaten
http://daten.berlin.de/datensaetze/liste-der-verbannten-b%C3%BCcher
Zusatzinformationen
http://www.berlin.de/geschichte/verbannte-buecher/

Staatsbibliothek zu Berlin – Preußischer Kulturbesitz

Europeana Collections 1914-1918-Projekt

Europeana Collections 1914-1918-Projekt

Die Staatsbibliothek zu Berlin – Preußischer Kulturbesitz hat im Rahmen des Europeana Collections 1914-1918-Projekts etwa 7.000 Objekte aus der Zeit des Ersten Weltkriegs im Umfang von über 300.000 Seiten digitalisiert. Diese sind in den Digitalen Sammlungen der Staatsbibliothek weitgehend als Public Domain bereitgestellt. Für einen großen Anteil dieser Digitalisate liegen zudem Volltexte vor. Die zugehörigen Metadaten liegen als METS/MODS-Files vor.

Das breite Spektrum der ausgewählten Objekte dokumentiert umfassend die Lebenswirklichkeit der Zeit zwischen 1914 und 1918 an der Front wie in der Heimat. Digitalisiert wurden Kinder- und Schulbücher, Kriegskochbücher, Erbauungsschriften, persönliche Briefe und Kriegspostkarten, Tagebücher und Fotos ebenso wie Flugblätter und Pamphlete, Karten und Musikalien, Schützengrabenzeitungen, Unterhaltungsliteratur für Gefangene, überlebenspraktische Anleitungen für Frontsoldaten u.v.m.

Unter den Digitalisaten finden sich etwa Überlegungen „Weshalb die Deutschen im Auslande unbeliebt sind!" neben einer Sammlung hilfreicher Anleitungen für „Frauenfleiß in Kriegszeiten", eine Predigt vom Tag nach Kriegsausbruch, überschrieben mit dem Aufruf „Gottes Geist muss uns mobil machen!", neben einem handlichen Büchlein, das „Wissenswertes für jeden aktiven Soldaten, jeden Reservisten, Landwehrmann usw. im Kriegsfalle" zusammenfasst.

Namensnennung
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz
Lizenz
99% Public Domain, Details
Daten
Die Erst-Weltkriegsdigitalisate der SBB sind über die OAI-Schnittstelle der SBB ist über diesen Link aufrufbar: OAI-DC
METS (umfangreicherer Datensatz)

Stadtmuseum Berlin

Berlinischer Schnauze - Heinrich Zille

Stadtmuseum Zille

Grundlage: In der Grafischen Sammlung des Stadtmuseums Berlin befindet sich einer der größten Bestände des Zeichners Heinrich Zille. Mit Ironie und Witz portraitierte er die Berliner Bevölkerung und warf somit einen augenzwinkernden, aber kritischen Blick auf die sozialen Verhältnisse in der Stadt. Häufig sind die Szenen in Zilles Zeichnungen begleitet von ungehobelten Dialogen der dargestellten Personen in typischer Berliner Schnauze.

Die Daten: Im Mittelpunkt des Projektes stehen Stadtansichten aus dem Bestand des Stadtmuseum Berlin. Die Grafiken und Gemälde zeigen Berlin, wie es im 18. und 19.Jahrhundert ausgesehen hat. Diese Abbildungen liegen als JPEGs mit 1200px lange Kante und 72dpi vor. Zusätzlich dazu liegen zu dem Objekt Metadaten im MuseumDat-XML Format vor. Diese Metadaten geben grundlegende Informationen zu den Museumsobjekt (Maße, Technik, Datierung, Künstler etc.) an.

Namensnennung
Stadtmuseum Berlin
Lizenz
Public Domain, Credit Stadtmuseum Berlin
Dateityp
XML, JPEG
Metadaten Zille
https://offenedaten.de/dataset/stadtmuseum-berlin-berliner-schnauze-grafik-von-heinrichzille
Fotos Zille
https://commons.wikimedia.org/wiki/Category:Grafische_Sammlung_%28Stiftung_Stadtmuseum_Berlin%29
(ergänzende Bilder von Zille)

Schichten der Geschichte

Stadtmuseum Schichten der Geschichte

Grundlage: Die Sammlungen des Stadtmuseums Berlin geben in den Bereichen Grafik und Gemälde mehrere 100.000 Ansichten her, die das historische Berlin, bekannte und unbekannte Plätze, Straßen, Gebäude und Wahrzeichen der Stadt zeigen. Einige dieser Spuren der Vergangenheit sind heute in der Stadt noch zu erkennen und haben sich teilweise zu Touristenmagneten entwickelt. Andere Zeugen des historischen Berlins hingegen sind abgerissen, überbaut oder durch den Weltkrieg zerstört worden. Ob nun sichtbar oder unsichtbar, die historischen Orte in Berlin sind Anziehungspunkt für Touristen, Tagesbesucher und Berliner gleichermaßen – wie weinige Städte lädt das Zentrum Berlins dabei zu einem Spaziergang in der Vergangenheit der Stadt ein – durch verschiedene Stadtge-Schichte(n).

Die Daten: Im Mittelpunkt des Projektes stehen Stadtansichten aus dem Bestand des Stadtmuseum Berlin. Die Grafiken und Gemälde zeigen Berlin, wie es im 18. und 19.Jahrhundert ausgesehen hat. Diese Abbildungen liegen als JPEGs mit 1200px lange Kante und 72dpi vor. Zusätzlich dazu liegen zu dem Objekt Metadaten im MuseumDat-XML Format vor. Diese Metadaten geben grundlegende Informationen zu den Museumsobjekt (Maße, Technik, Datierung, Künstler etc.) sowie zu abgebildeten Stadtsituation (welche Gebäude sind zu sehen etc.).

Namensnennung
Stadtmuseum Berlin
Lizenz
Public Domain, Credit: Stadtmuseum Berlin
Dateityp
XML
Link Metadaten
https://offenedaten.de/dataset/stadtmuseum-berlin-schichten-der-geschichte-stadtansichten
Link Bilder
https://commons.wikimedia.org/wiki/Category:Stadtansichten_%28Stiftung_Stadtmuseum_Berlin%29

Steinheim-Institut für deutsch-jüdische Geschichte, Essen

Grabsteine

Grabmale historischer jüdischer Friedhöfe

Das STI stellt für Coding da Vinci mehr als 26.000 Datensätze zu Grabmalen von rund 135 historischen jüdischen Friedhöfen zur Verfügung. Räumlich sind diese auf 12 Regionen verteilt, zeitlich werden 900 Jahre umspannt. Die Datensätze sind offen zugänglich über die epigraphische Datenbank epidat

Namensnennung
Salomon Ludwig Steinheim-Institut für deutsch-jüdische Geschichte – epigraphische Datenbank epidat
Lizenz
CC-BY 4.0
Dateityp
XML

Drei XML-Formate stehen für Coding da Vinci zur Verfügung:

A. RSS Ein RSS-Feed enthält Kurzinfos zu jedem historischen Friedhof: Name, Inschriftenzahl, Geokoordinaten, Projektdetails sowie ein Link, der zum Bestand führt. http://www.steinheim-institut.de/daten/rss.xml

B. KML In einer KML-Datei liegen datierte Grabmale sämtlicher Bestände jeweils mit Geokoordinaten und einem Link zur Volldokumentation vor: http://steinheim-institut.de/daten/epidat.kml Das KML-Format wird zur Zeit für die Visualisierung der epidat Daten im DARIAH-DE Geo-Browser verwendet. Siehe: http://steinheim-institut.de/cgi-bin/epidat?info=e4d

C. EpiDoc – Epigraphic Documents in TEI XML Jeder einzelne epigraphische Datensatz der epigraphischen Datenbank wird auch im EpiDoc Format bereitgestellt. EpiDoc ist ein XML-Standard für epigraphische Daten.

Zusatzinformationen

Jeder Datensatz der epigraphischen Datenbank epidat hat eine eindeutige ID und kann per URL abgerufen werden. Die ID setzt sich aus bis zu drei Teilen – verbunden durch Bindestrich – zusammen: 1. Eine obligatorische dreistellige Bestands-ID („hha“), 2. eine obligatorische ein- bis vierstellige bestandsbezogene nummerische ID („3361“). 3. Fakultativ ist die Angabe zum Format: „teip5“ bzw „t“ für EpiDoc TEI XML für epigraphische Dokumente; „txt“ – für plain-text wenn an dieser Stelle keine Angabe gemacht ist, dann wird html ausgegeben.

Beispiel: http://steinheim-institut.de/cgi-bin/epidat?id=hha-3361-teip5

Zur Syntax siehe auch die Übersichtsseite „How to harvest epidat records“

Eine Einführung in historische jüdische Friedhöfe und Grabsteinepigraphik gibt Spurensuche – Jüdische Friedhöfe in Deutschland

TextGrid’s Digitale Bibliothek

Verne

Bei der Digitalen Bibliothek handelt es sich um eine umfangreiche Sammlung von Texten vom Anfang des Buchdrucks bis zu den ersten Jahrzehnten des 20. Jahrhunderts in digitaler Form. Insgesamt stehen 1267 Texte aus 10 Sachgebieten als Volltexte im Format XML nach den Standards der Text Encoding Iniative zur Verfügung. Metadaten können aus dem und mittels einer OAI-PMH-Schnittstelle aus dem Repository extrahiert werden.
Das Zusammenspiel von Text und homogener Encodierung ermöglicht vielfältige Analysen.

Mittels unserer OAI-PMH Schnittstelle können zunächst die Metadaten aus dem TextGrid Repository abegholt werden. Zum Beispiel: http://textgrid-esx2.gwdg.de/1.0/tgoaipmh/oai?verb=GetRecord&identifier=wr71.0&metadataPrefix=oai_dc In einem der Relations-Felder ist eine URL hinterlegt, welcher direkt zum TEI-Objekt. In diesem Fall also: http://textgrid-esx1.gwdg.de/1.0/aggregator/teicorpus/textgrid:wr71.0

Namensnennung
TextGrid
Lizenz
CC-BY Version 3.0, Details
Förderhinweis
Die vorliegende Textsammlung wurde im Rahmen des Forschungsprojekts TextGrid (www.textgrid.de, Förderkennzeichen: 01UG1203A) mit Mitteln des BMBF (Bundesministerium für Bildung und Forschung) erworben. Wir bitten im Falle der Nachnutzung des Datenbestandes diesen Förderhinweis den Daten beizulegen.
Dateityp
Volltexte: XML

Zentral- und Landesbibliothek Berlin

Adressbucheinträge des Jüdischen Adressbuchs von Groß-Berlin von 1931

Adressbucheinträge des Jüdischen Adressbuchs von Groß-Berlin von 1931

72,231 aufbereitete Adressbucheinträge des Jüdischen Adressbuchs von Groß-Berlin von 1931, mit Informationen zu Familienname, Vorname, Beruf, Straße, Bezirk und Informationen zu Untermiete u.ä. Für diese im Rahmen des Projekts www.stolperstadt.org von Rod Miller erstellten Daten ergeben sich vielfältige Nutzungsmöglichkeiten, von einer attraktiven webbasierten Rechercheoberfläche bis hin zur Anreicherung mit Geo- und Normdaten.

Namensnennung
Zentral- und Landesbibliothek Berlin
Lizenz
CC-BY-SA
Dateityp
CSV
Metadaten
https://offenedaten.de/dataset/adressbuchdaten-des-judischen-adressbuchs-fur-grob-berlin-von-1931

Berliner Adressbuchdaten (1799-1943)

Berliner Adressbuchdaten (1799-1943)

Eine Datenauswahl der Berliner Adressbücher: reichhaltige Struktur- und Metadaten der Adressbücher sowie die mit maschineller OCR erkannten Volltexte dienen als Grundlage für die Verbesserung der Zugänglichkeit dieser Ressource.

Namensnennung
Zentral- und Landesbibliothek Berlin
Lizenz
CC-BY-SA
Dateityp
XML

Daten des NS-Raubgut-Projekts der ZLB

Daten des NS-Raubgut-Projekts der ZLB

Das NS-Raubgut-Projekt der ZLB recherchiert nach Büchern, die ihren rechtmäßigen Eigentümern während der NS-Herrschaft zwischen 1933 und 1945 entzogen wurden, und versucht deren Herkunft zum ermitteln, um diese an die Eigentümer oder deren Erben zurückzugeben.

Die Datensätze enthalten Informationen zu den als Raubgut erkannten Büchern, d.h. neben den bibliographischen Informationen und Fotografien Informationen zu den ermittelten Besitzern und den Wegen der Bücher, d.h. den Stationen, über die diese von den rechtmäßigen Eigentümern - oftmals über NS-Behörden und Bergungsstellen - in die ZLB gelangt sind. Mit den Daten sollen beispielhaft die Wege von NS-Raubgut sichtbar gemacht werden, das in die Bestände deutscher Bibliotheken gelangt ist.

Namensnennung
Zentral- und Landesbibliothek Berlin
Lizenz
CC-BY-SA
Dateityp
CSV
Metadaten
https://offenedaten.de/dataset/ns-raubgut-aus-den-bestanden-der-zentral-und-landesbibliothek-berlin