Version 1.0

Vortrag: osm_address_db - Adressdaten in der OSM-Datenbank

Event large

Bereits auf der vergangenen FOSSGIS in Münster wurde das Projekt osm_address_db in einem Lighting-Talk vorgestellt. Entstanden ist die Idee für dieses Projekt im Jahr 2013 als mich jemand ansprach und wissen wollte, ob Adressdaten (Land, PLZ, Ort, Straße, Hausnummer, Position) aus der OSM-Datenbank für externe Projekte extrahiert werden können. Daraus entstanden ist eine Sammlung von Shell- und SQL-Skripten, die mithilfe des Tools osm2pgsql und einer PostgreSQL/Postgis-Datenbank eine Tabellenstruktur aufbaut, die für den Export und weiter Auswertungen der Adressdaten in OSM verwendet werden kann.

Im Vortrag wird neben der Datenstruktur, benutzten Tools und Technologien sowie die während der Entwicklung aufgetretenen Schwierigkeiten u.a. mit den verschiedenen Import-Tools von OSM dargelegt. Die OSM-Daten werden nach dem Karlsruher Schema analysiert, dabei werden auch associatedStreet-Relationen für den Aufbau der Tabellen berücksichtigt. Nach dem Import der relevanten Tags werden dann alle fehlenden Daten aus den Grenz-, Postleitzahlen- und associatedStreet-Relationen gefüllt, sodass eine vollständige Tabelle mit Adressen entsteht, die als CSV-Datei exportiert und dann in einem beliebigen Programm importiert werden kann. Bei der Entwicklung der Datenstruktur wurde darauf geachtet, dass eine Aktualisierung der Datenbank mit diff-Dateien möglich ist.

Um eine mögliche Verwendung und die Kontrolle der importierten Daten zu ermöglichen, wurde zunächst ein Prototyp entwickelt, der die Auswahl eines Ortes über die Hierarchieebenen (admin_level) ermöglicht und dann alle Informationen zu einem Ort bzw. Stadt liefern. Dazu zählen neben den Adressen auch die Postleitzahlen, Straßen und untergeordnete Hierarchieebenen (Orts- und Stadtteile). Der Prototyp ermöglicht, auf Basis der analysierten Daten, ebenfalls fehlerhafte Schreibweisen von Orts- und Straßennamen in den Tags der Adressen heraus zu finden.

Derzeit befindet sich eine Webanwendung in Entwicklung, die eine Umsetzung des Prototypen vorsieht. Dabei sind schon viele Ideen zusammen getragen worden. So soll diese Anwendung keine Alternative, sondern eine Ergänzung der Hausnummern- und Straßenlistenauswertung von regio-osm.de sein. Eine Verlinkung zwischen den beiden Projekte ist nach Fertigstellung der ersten Version vorgesehen.

Das Projekt osm_address_db ermöglicht die Aufbereitung der in OSM vorhandenen Adressdaten. Dazu wurden Shell- und SQL-Skripte entwickelt, die eine Tabellenstruktur zur Auswertung und Analyse aufbauen.
Im Vortrag wird die Datenstruktur, benutzten Tools und Technologien von osm_address_db als auch die während der Entwicklung aufgetretenen Probleme eingegangen. Die OSM-Daten werden nach dem Karlsruher Schema analysiert, dabei finden auch associatedStreet-Relationen Berücksichtigung.
Derzeit befindet sich eine Webanwendung zur Auswertung in Entwicklung.

Info

Tag: 05.07.2016
Anfang: 09:00 Uhr
Dauer: 00:30
Raum: GI Studio
Track: Freie Daten

Links: