Kleinanzeigen aus dem Vorwärts von 1891

Einblicke in das Alltagsleben im sozialdemokratischen Milieu vor 130 Jahren
Archiv der sozialen Demokratie
Projekttyp
data enrichment
web app
website

Das Projekt möchte einen genaueren Blick auf Kleinanzeigen ermöglichen, die vor über 100 Jahren aufgegeben wurden. Sie werden in einer Galerie von Zeitungsseiten präsentiert, bei denen die einzelnen Anzeigen anklickbar sind, wodurch sie allein, mit ihrem durch OCR erkannten Text zu sehen sind. Es ist auch möglich nach Wörtern in den Kleinanzeigen zu suchen.

Die Motivation für das Projekt kommt aus einem Interesse an der Textform und was sich daraus über den Alltag zu dieser Zeit erfahren lässt. Es werden viele heute (wahrscheinlich) unbekannte oder unübliche Berufe erwähnt, die Tagungen abhalten. Menschen entschuldigen sich per Kleinanzeige für eine Beleidigung oder lassen wissen, dass sie gerade zur Kur gefahren sind.

Technische Umsetzung: Die OCR-Daten und Metainformationen über die einzelnen Anzeigen wurden in eine Datenbank übertragen, um sie leicht durchsuchbar und darstellbar zu machen. Die einzelnen Bilder der Anzeigen wurden aus den Scans der ganzen Zeitungsseiten freigestellt. Die Webapp wurde mit den Framework Django programmiert.

Durch die Darstellungs- und einfache Suchmöglichkeit gibt es einen neuen Zugang zu den Kleinanzeigen. Die OCR ist leider nicht sehr gut. Hier wäre es interessant Verbesserungsmöglichkeiten zu finden, das könnte technische Ansätze sein, aber vielleicht lässt sich auch ein Weg finden, wie die interessierte "Crowd" einen Beitrag leisten kann.

Wenn die Kleinanzeigen auf thematische klassifiziert werden könnten, wäre das ein weiterer spannender Zugang.

Viele Anzeigen haben einen zeitlichen und räumlichen Bezug. Diese Informationen zu extrahieren bietet weitere Möglichkeiten, die Daten in einen Kontext zu setzen:

* Eine Timeline von Anzeigen, die ein Datum haben

* Eine Karte von Orten, die in Anzeigen erwähnt werden

Links
Lizenz des Quellcodes (falls vorhanden)
MIT license
Lizenz der eigens erstellten Mediendateien
Team

Stephan Klinger

Iwona Izdebska

Datensets / Datasets