Haltestellendaten
Für Bahn-Vorhersage mussten wir Informationen über Haltestellen sammeln. Wir hatten mehrere Anforderungen an die Daten, die von keinem einzelnen bereits verfügbaren Datensatz erfüllt wurden:
- vollständige Abdeckung der DB Timetables-API Haltestellen
- Geokoordinaten
- Archiv (stillgelegte oder umbenannte Haltestellen)
Wir aktualisieren den Haltestellendatensatz regelmäßig. Wir durchsuchen unsere Verspätungsdaten nach referenzierten Haltestellen, die wir noch nicht kennen und sammeln sie aus verschiedenen Datenquellen in der folgenden Reihenfolge:
- DB RIS::Stations API
- HAFAS, unter Verwendung des db-vendo-client
- Die Listen von Stationen, die für Travel-Status-DE-IRIS verwendet werden
- Trainlines Stationsdatenbank
- Das deutsche Zentrale Haltestellenverzeichnis (ZHV) von DELFI
- Manuelle Eingaben
Wir erwarten, dass der Datensatz unvollständig ist und einige fehlerhafte Daten enthält, aber dafür passt er zu unseren Zugverspätungsdaten und enthält eine Historie von Änderungen.
Daten
Die Daten sind in der Mobilithek verfügbar:
Haltestellendaten herunterladenDer Datensatz enthält zwei Dateien im Parquet-Format: stations.parquet und stops.parquet. Der vollständige Datensatz ist in stations.parquet enthalten. stops.parquet ist eine GTFS stops.txt ähnliche Datei, die vom geparsten Zugverspätungsdatensatz referenziert wird.
Lizenz
Die Daten sind unter der Open Database License verfügbar. Credits müssen an Bahn-Vorhersage, Deutsche Bahn, Trainline und DELFI zugeordnet werden.
Wenn Du ein Problem mit dieser Dokumentation findest, dann öffne doch bitte ein Issue auf GitLab.