research collection28877/... · terschiedlichen geokodierungszielen runden den bericht ab....

31
Research Collection Report Geokodierung von Adressen Methodik und Erfolgsquoten bei unterschiedlichsten Datenquellen Author(s): Waldner, Urs Jakob; Simonet, Simon; Machguth, Horst; Axhausen, Kay W. Publication Date: 2005 Permanent Link: https://doi.org/10.3929/ethz-a-005226679 Rights / License: In Copyright - Non-Commercial Use Permitted This page was generated automatically upon download from the ETH Zurich Research Collection . For more information please consult the Terms of use . ETH Library

Upload: dotram

Post on 17-Sep-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Research Collection

Report

Geokodierung von AdressenMethodik und Erfolgsquoten bei unterschiedlichstenDatenquellen

Author(s): Waldner, Urs Jakob; Simonet, Simon; Machguth, Horst; Axhausen, Kay W.

Publication Date: 2005

Permanent Link: https://doi.org/10.3929/ethz-a-005226679

Rights / License: In Copyright - Non-Commercial Use Permitted

This page was generated automatically upon download from the ETH Zurich Research Collection. For moreinformation please consult the Terms of use.

ETH Library

0% 20% 40% 60% 80% 100%

2

3

4

5

Anz

ahl

Info

rmat

ions

elem

ente

Anteil Adressen

Hausgenau

Naheliegendes Gebaeude

Strassengenau

PLZ oder Gemeindegenau

Landgenau (im Ausland)

Nicht geokodierbar

Polyprojekt Zukunft urbane Kulturlandschaften Projekt Infrastruktur, Erreichbarkeit und Raumentwicklung

Geokodierung von Adressen: Methodik und Erfolgsquoten bei unterschiedlichsten Datenquellen

Urs Waldner Horst Machguth Simon Simonet Kay W. Axhausen

Arbeitsbericht 3Netzwerk Stadt und Landschaft November 2005

Geokodierung von Adressen __________________________________________________________ November 2006

Inhaltsverzeichnis

1 Einleitung ...............................................................................................................1

2 Datengrundlage .....................................................................................................2

2.1 Adressdaten.............................................................................................................. 2

2.2 Referenzdaten .......................................................................................................... 2

3 Ziele .......................................................................................................................4

4 Methodik ................................................................................................................5

4.1 Hauptarbeitsschritte.................................................................................................. 5

4.2 Verwendete Hilfsmittel .............................................................................................. 5

4.3 Datenorganisation..................................................................................................... 6

4.3.1 Sammeln und Priorisieren .............................................................................. 6

4.3.2 Gruppieren: Duplikatsfreier Adressdatensatz ................................................ 6

4.3.3 Funktionale Feldtypologie .............................................................................. 6

4.4 Standardisieren der Texte ........................................................................................ 7

4.4.1 Aufsplitten und Suche nach PLZ und Ort....................................................... 7

4.4.2 Schreibweise der Strassennamen anpassen................................................. 9

4.5 Matching mit Referenzdaten..................................................................................... 9

4.6 Qualitätssicherung .................................................................................................. 11

5 Resultate..............................................................................................................12

6 Schlussfolgerung und Empfehlungen zur Fragebogengestaltung .......................15

6.1 Empfehlung zu den vorzusehenden Adressfeldnern.............................................. 15

6.1.1 Bei hausgenauer Geokodierung................................................................... 15

6.1.2 Bei gebietsgenauer Geokodierung............................................................... 16

7 Literatur................................................................................................................17

Geokodierung von Adressen __________________________________________________________ November 2006

II

Tabellenverzeichnis

Tabelle 1 Datenquellen .......................................................................................2

Tabelle 2 Referenzdatensätze ............................................................................3

Tabelle 3 Geokodierungsgenauigkeitsstufe (Schlussresultat) ............................4

Tabelle 4 Prioritätscode ......................................................................................4

Tabelle 5 Anzahl Adressen mit und ohne Duplikate ...........................................6

Tabelle 6 Funktionale Feldtypologie ...................................................................7

Tabelle 7 Beispieltexte vor und nach der automatischen Aufsplittung................8

Tabelle 8 Beispieltexte vor und nach der Standardisierung der Strassennamen ...................................................................................9

Tabelle 9 Tabellenliste der Adressdaten...........................................................18

Tabelle 10 Resultatetabelle mit Anzahlen.............................................................1

Tabelle 11 Resultatetabelle mit Anteilen...............................................................3

Tabelle 12 Resultatetabelle mit Typisierungen .....................................................5

Abbildungsverzeichnis

Abbildung 1 Schnittstellen Tabellen und Felder des Programmes "TextAufsplitten" ..................................................................................8

Abbildung 2 Schnittstellen Tabellen und Felder des Programmes "AdressStandardisieren" .....................................................................9

Geokodierung von Adressen __________________________________________________________ November 2006

III

Abbildung 3 Geokodierunggenauigkeitsstufe nach Anzahl Elemente Informationen in den Rohdaten. ........................................................12

Abbildung 4 Geokodierungsgenauigkeitsstufe nach Objektart..............................13

Abbildung 5 Geokodierungsgenauigkeitsstufe nach Auskunftsperson. ................14

Abbildung 6 Geokodierungsgenauigkeitsstufe nach Aktualität. ............................14

Abkürzungen

BfS Bundesamt für Statistik

GWR Eidg. Gebäude- und Wohnungsregister

PLZ Postleitzahl

Geokodierung von Adressen __________________________________________________________ November 2006

Arbeitsbericht Polyprojekt „Zukunft urbane Kulturlandschaften“ 3

Geokodierung von Adressen: Methodik und Erfolgsquoten bei unterschiedlichsten Datenquellen

Urs Jakob Waldner Inst. f. Raum- u. Landschaftsentwicklung Wolfgang-Pauli-Str. 15 ETH Hönggerberg, HIL H 27.3 8093 Zürich

Simon Simonet Stud. Inf. ETH Zürich

Horst Machguth Physical Geography Division Department of Geography University of Zurich - Irchel Winterthurerstr. 190 CH-8057 Zurich, Switzerland

Telefon: +41 44 633 30 04 Telefax: +41 44 633 11 02 e-Mail-Adresse: [email protected]

Telefon: +41-44-635 51 57Telefax: +41-44-635 68 [email protected]

November 2005

Kurzfassung

Dieser Bericht umfasst eine praxisnahe Beschreibung der Methodik der Geokodierung von Ad-ressen. Basierend auf den Resultaten bei unterschiedlichsten Datenquellen können Angaben zu den Geokodierungsquoten in Abhängigkeit des Bezuges zur Auskunftsperson und der Anzahl Adressdatenfelder gemacht werden. Empfehlungen zur optimalen Anzahl Adressfelder bei un-terschiedlichen Geokodierungszielen runden den Bericht ab.

Schlagworte

Geokodierung, Befragung, Fragebogen

Zitierungsvorschlag Waldner, U., H. Machguth, S. Simonet und K.W. Axhausen (2005) Geokodierung von Adressen: Methodik und Erfolgsquoten bei unterschiedlichsten Datenquellen, Arbeitsbericht Polyprojekt Zukunft urbane Kulturlandschaften, 3, NSL, ETH Zürich, Zürich.

Geokodierung von Adressen __________________________________________________________ November 2006

1 Einleitung

Die Geokodierung von Adressen ist eine häufige Aufgabe bei Befragungen mit Raumbezug, die jedoch bei gut strukturierter Vorgehensweise mit entsprechenden Programmen ein grosses Effizienzsteigerungspotential aufweist. Oft werden bei der Gestaltung des Fragebogens schon elementare Fehler gemacht, welche nachträglich nicht mehr korrigiert werden können.

Diesem Bericht liegt eine koordinierte Geokodierungsaktion von rund 96'000 Adressen von 5 verschiedenen Datenquellen aus 23 verschiedenen Tabellen zugrunde. Die Vorgehensweise sowie die Programme zur Standardisierung der Adresstexte werden detailliert beschrieben. Aus dem Vergleich der verschiedenen Geokodierungsraten in Abhängigkeit der Anzahl Da-tenfelder, Geokodierungsaufwand, Auskunftsperson usw. werden Empfehlungen zur Gestal-tung der Adressfelder in einem Fragebogen gegeben.

Geokodierung von Adressen __________________________________________________________ November 2006

2

2 Datengrundlage

2.1 Adressdaten

Aus insgesamt vier Datenquellen (Tabelle 1) in 23 Tabellen (siehe Anhang A) wurden 96'321 Adressdatensätze geokodiert.

Tabelle 1 Datenquellen

Tabellen - Nr Datenquellen Anzahl Tabellen Anzahl Datensätze

A1- A2 Befragung zur Wohnsituation 2 9’851

B1 - B7 Befragung zur Wohngeschichte 7 10’061

C1 - C7 Pretest beider Befragungen 7 690

D1 – D6 Immobilienangebote im Internet 2 75’751

Total 96'321

2.2 Referenzdaten

Einen Überblick über den Stand der Adressdaten in der Schweiz gibt Steudler (2005). Eine Liste von allen Referenztabellen ist in Tabelle 2 dargestellt. Für die Georeferenzierung wurde in erster Linie das Adressverzeichnis und das Strassenverzeichnis des Gebäude- und Woh-nungsregister verwendet (Bundesamt für Statistik, 2005). Als Synonymtabelle für Orts- und Gemeindenamen wurden die Daten aus dem Postleitzahlverzeichnis verwendet (Geopost, 2005). Als Referenzkoordinaten pro Postleitzahlkreis wurden die Koordinaten der Firma Mic-roGIS verwendet, als Referenzkoordinaten der Gemeinde die sogenannten Kirchspitzkoordi-naten des BfS. Als sehr nützlich zur Überprüfung und Auffindung der Adressen erwiesen sich sowohl das elektronische Telefonbuch TelInfo wie auch die Online-Datenbank von tel.search.ch und die dazugehörigen digitalen Karten (Atlas und map.search.ch).

Geokodierung von Adressen __________________________________________________________ November 2006

3

Tabelle 2 Referenzdatensätze

Datensatz Tabellen Beschreibung Verwendeter Schlüssel

Genauigkeit

Gebäude und Wohnungsregister (BfS)

Adress-verzeichnis

Verzeichnis aller Gebäudeeingänge mit/ohne Koordinaten

EGID Gebäudegenau

Gebäude und Wohnungsregister (BfS)

Strassen-verzeichnis

Verzeichnis aller Strassen, Plätze und Ortsteile ohne Strassennamen

ESTRID bzw. DSTRID

Strassengenau

PostMail PLZ_P1 Verzeichnis aller Postleitzahlen (vierstellig und sechsstellig) mit einer Bezeichnung

PLZ4 Postkreisgenau

PostMail PLZ_P2 Synonyme der Ortsbezeichnungen zu den Postleitzahlen

PLZ4 Postkreisgenau

MicroGIS PLZ_Points Koordinaten der Poststellen PLZ6 Postkreisgenau

Gebäude und Wohnungsregister (BfS)

Kirchspitz-koordinaten

Koordinaten eines zentralen Gebäudes jeder Gemeinde

GDENR Gemeindegenau

Telinfo Version 5.2005

CD mit aktuellen Adressen mit Koordinaten

Koor-dinaten

Gebäudegenau (ca: 25 m)

www.tel.search.ch - Adresssuchportal - Qualitäts-sicherung mit aktuellem Foto

Geokodierung von Adressen __________________________________________________________ November 2006

4

3 Ziele

Bei der Geokodierung sollten folgende Ziele erreicht werden:

• Die Adressen sollten so genau wie möglich geokodiert werden.

• Bei unvollständigen Adressangaben oder Referenzdaten sollte ein einheitliches Vor-gehen die Reproduzierbarkeit gewährleistet sein.

• Die Genauigkeit der Geokodierung sollte einfach kategorisiert werden (siehe Tabelle 3).

Ein Prioritätscode (siehe Tabelle 4) pro Ursprungsdatensatz wurde dazu verwendet, um den manuellen Arbeitsaufwand gezielt einzusetzen.

Tabelle 3 Geokodierungsgenauigkeitsstufe (Schlussresultat)

Level Beschreibung Koordinaten von

1 Hausgenau Gebäudemittelpunkt gemäss GWR oder vereinzelte manueller Punktzuweisung (ca: 25 m)

2 naheliegendes Gebäude Gebäudes mit +/- 2 und 4 Hausnummern oder gleichen Unternummern

3 Strassengenau Haus mit der niedrigsten Hausnummer in der Strasse

4 PLZ oder Gemeindegenau Poststelle mit gleicher Postleitzahl oder Kirchspitzkoordinaten (signifikantes zentrales Gebäude) der gleichen Gemeinde

5 Landgenau Hauptstadtkoordinaten

Tabelle 4 Prioritätscode

Prorität Beschreibung

1 Hoch: bis zur Stufe Gebäude manuell georeferenzieren

2 Mittel: bis zur Stufe Strasse manuell georeferenzieren

3 Tief: Keine manuellen Georeferenzierungen sinnvoll

Geokodierung von Adressen __________________________________________________________ November 2006

5

4 Methodik

4.1 Hauptarbeitsschritte

Folgende Hauptarbeitsschritte werden beim systematischen Geokodieren erwähnt (Environ-mental System Research Institute, 2003, und Egnor, 2003):

• Standardisierung

– Aufsplitten in Felder für PLZ, Ort, Strasse und Hausnummer

– Anpassung der Schreibweisen, Ersetzen von Sonderzeichen usw.

• Matching mit Referenzdaten

– Automatische Zuweisung der Gemeinde, Postleitzahl, Strasse und Gebäude

– Manuelle Zuweisung der Strasse oder des Gebäudes

– Koordinaten auf aggregierter Genauigkeitsstufe (z.B. Poststellenkoordinate) zu-weisen

• Manuelle Suche

– Bei wichtigen ungematchten Adressen wird nachgeforscht, ob die Referenzdaten lückenhaft sind.

• Qualitätssicherung

– Vereinheitlichen des Geokodierungsgenauigkeit-Levels

– Kontrolle mit Visualisierung von Stichproben im GIS

In der praktischen Anwendung werden die automatisierbaren Schritte mehrfach ausgeführt, damit die manuellen Arbeiten minimalisiert werden können (siehe Kapitel 4.5).

4.2 Verwendete Hilfsmittel

Die Geokodierung wurde mit Microsoft Access durchgeführt. Das eigentliche Matching zwi-schen Adressdaten und Referenzdaten wurde mit einer Serie von SQL-Abfragen durchgeführt, welche von einem Microsoft Access-Modul aus in der richtigen Reihenfolge gestartet werden.

Geokodierung von Adressen __________________________________________________________ November 2006

6

Die notwendigen Programme ("TextAufsplitten", "AdressStandardisierung", "AtlasKoor-dExtractor") wurden in CSharp verfasst. Für das Ausführen der Programme wird das Micro-soft .NET Framework benötigt. Die Zugriffe auf Microsoft Access erfolgen mittels ODBC. Alle Codeteile die es anzupassen gilt sind als Region „Anpassen“ markiert.

4.3 Datenorganisation

4.3.1 Sammeln und Priorisieren

In einem ersten Schritt werden alle zur Verfügung stehenden Daten in einer Tabelle gesam-melt1 und mit GUID (Global Unique Identifier) markiert. Zudem wird eine Liste der Grundla-gendatensätze2 erstellt und jedem Grundlagedatensatz ein Prioritätslevel zugeteilt, damit die manuellen Arbeiten nur für Datensätze mit hoher Priorität durchgeführt werden.

4.3.2 Gruppieren: Duplikatsfreier Adressdatensatz

Mithilfe einer Gruppierungsabfrage wird aus den Rohdaten ein duplikatsfreier Datensatz er-zeugt (Tabelle: "tblRohdaten_Alle_Adressen" -> Tabelle "HM_Adressen"). Dabei wurde die jeweils höchste Priorität weiterverwendet. Ein hinzugefügter Primärschlüssel im duplikats-freien Datensatz (Feld: "Key") und ein Fremdschlüssel darauf im Rohdatensatz (Feld: "Key") stellt sicher, dass die fertigen geokodierten Adressen auch zurückgeschrieben werden können.

Tabelle 5 Anzahl Adressen mit und ohne Duplikate

Prorität Anzahl Prozent

Rohdaten mit Duplikaten 56'888 100 %

Duplikatsfreie Adressen 30'776 54 %

4.3.3 Funktionale Feldtypologie

Damit es keinen Konflikt zwischen automatisierten und manuellen Bearbeitern gibt, wurden die Schreibrechte mit einer funktionale Feldtypologie kontrolliert.

1 Tabelle "tblRohdaten_Alle" 2 Tabelle "Tabellenliste"

Geokodierung von Adressen __________________________________________________________ November 2006

7

Tabelle 6 Funktionale Feldtypologie

Funktionaler Feldtyp Inhalt und Zweck Prozesse mit Schreibrecht

Schlüsselfelder Gewährleistung der Zuweisung der Resultate zu Rohdaten

Sammeln

Originalfelder Unveränderter Text wie in Quelle

Sammeln, Gruppieren

Automatisch standardisierte Felder

Resultat der automatischen Standardisierung

Automatisches Aufsplitten + Standardisieren

Manuell standardisierte Felder

Resultat der manuellen Standardisierung

Manuelles Aufsplitten + Standardisieren

Zuweisungsfelder Georeferenzierung und Referenzierung zu Objekten (Gebäude, Strasse, PLZ, Gemeinden)

Automatisches Matching (sofern vorher NULL)

Manuelles Matching (sofern vorher NULL)

Manuelle Suche

Qualitätssicherung (sofern vorher NULL)

Qualitätssicherungs-felder

Beschreibung des Zielerreichungsgrades und Markierung des Arbeitsstandes

Alle

4.4 Standardisieren der Texte

4.4.1 Aufsplitten und Suche nach PLZ und Ort

Programm "TextAufsplitten"

Da die Adressen teilweise in Form eines einzigen Textfeldes vorlagen, war es für die automa-tische Georeferenzierung nötig, sie in die Felder Strasse, Hausnummer, PLZ, Ort aufzuteilen.

In einem ersten Schritt wurde eine DataTable erzeugt, in der die Ergebnisse hinzugefügt wur-den.

Aus Microsoft Access wurden dann die zu verarbeitenden Daten in eine weitere DataTable gelesen.

Geokodierung von Adressen __________________________________________________________ November 2006

8

Zeilenweise wurde nun der Text in die verschiedenen Felder aufgeteilt.

Die Erkennung erfolgte mit Hilfe von regulären Ausdrücken bei PLZ (vierstellige Zahl) und Hausnummer (Zahl, zum Teil anschliessend die Buchstaben a bis z).

Für die Ortsbezeichnung wurde eine vollständige Liste aller Schweizer Ortsnamen erstellt und diese dann mit dem Inhalt des Textes auf Übereinstimmungen überprüft.

Im besten Fall bleibt jetzt nur noch der Strassenname übrig. Ist dies nicht der Fall wird dieser mittels häufig in Strassenbezeichnungen vorkommenden Wortteilen gesucht, wie [stras-se],[rue],[via],[gasse][weg],[platz],[ring].[avenue],[chemin].

Tabelle 7 Beispieltexte vor und nach der automatischen Aufsplittung

Abbildung 1 Schnittstellen Tabellen und Felder des Programmes "TextAufsplitten"

tblRohdaten [key] [GanzerText]

tblErgebnisse[key] [GanzerText] [Strasse] [Hausnr] [PLZ] [Ort]

tblCH_Orte_und_PLZ PLZ Ortsbezeichnung Ortsbezeichnung_lang

tblRohdaten tblErgebnisse

[GanzerText] [Strasse] [Hausnr] [PLZ] [Ort]

KSOe, Birchstrasse 107, 8050 Zch Birchstrasse 107 8050 Zürich

Heinz Kaiser AG, Glattalstrasse 516, Rümlang

Glattalstrasse 516 Rümlang

Tramstrasse 35, EWZ, 8050 Zürich Tramstrasse 35 8050 Zürich

Geokodierung von Adressen __________________________________________________________ November 2006

9

4.4.2 Schreibweise der Strassennamen anpassen

Programm "AdressStandardisierung"

Damit sich die gewonnen Strassennamen für das automatische Matching eignen, mussten sie auf eine einheitliche Form gebracht werden. Dazu wurden Sonderzeichen, Umlaute und Leer-zeichen entfernt und zusätzliche Abkürzungen eingeführt.

Tabelle 8 Beispieltexte vor und nach der Standardisierung der Strassennamen

tblAdressen tblErgebnisseStand

[Strasse] [Strasse_stand]

Wilfid-Heusser-Strasse WilfidHeusserStr

Tösstalstrasse Tosstalstr

Route de Saint-Légier rtdeSaintLegier

Anzupassen:

Pfade zu den Microsoft Access Datenbank(en), Tabellennamen und Feldnamen in den SQL-Anweisungen.

Abbildung 2 Schnittstellen Tabellen und Felder des Programmes "AdressStandardisieren"

tblAdressen [key] [ Strasse ]

tblErgebnisseStand [key] [ Strasse ]

4.5 Matching mit Referenzdaten

Nach der Standardisierung der Adresstexte, welche nur für gewisse Adressen notwendig wa-ren, konnte das eigentliche Matching zwischen den Adressendaten und den Referenzdaten für alle Adressen erfolgen. Hierzu wurde eine Serie von Abfragen in Microsoft Access erstellt,

Geokodierung von Adressen __________________________________________________________ November 2006

10

welche durch ein Programm3 gestartet werden. Jede Abfrage durfte nur den Wert NULL über-schreiben, ausser die Resetabfrage am Anfang. Jede Abfrage schrieb einen internen Geoko-dierungsgenauigkeitslevel in ein Textfeld Level.

• 0. Reset aller Einträge in den Zuweisungsfeldern4 auf NULL

• 1. Gemeinde zuweisen -> Feld GDENR

– Automatisch mit Abfragen5

• 2. PLZ zuweisen -> Feld PLZ4

– Automatisch mit Abfragen6

• 3. Strasse zuweisen -> Feld ESTRID

– 3A: Automatisch mit Abfragen: Vergleich originaler oder umformatierter Strassennamen der Adressen mit vier Feldern für Strassennamen im Referenzdatensatz, basierend auf bereits zugewie-senen PLZ oder GDENR.

– 3B: Restmenge duplikatsfrei exportieren Bei Datensätzen der Priorität 1 und 2 ohne Strassenschlüssel ESTRID, aber mit PLZ wird eine duplikatsfreie Kombination von PLZ und Strassennamen in separa-te Tabelle ausgeschrieben

– 3C: Strassennamen formularunterstützt manuell zuweisen Duplikatsfreie Strassentexte mit Formular "Strassen zuweisen" manuell einer Strasse mit gleicher PLZ zuweisen.

– 3D: Zurückschreiben des ESTRID von der duplikatsfreien Tabelle in die Adressen.

• 4. Gebäude zuweisen

– 4A: Automatisch mit Abfragen

– 4B: Restmenge exportieren Datensätze der Priorität 1 mit bereits zugewiesener Strasse in separate Tabelle ex-portieren

3 Microsoft Accessdatenbank "Matchingabfragen.mdb", Modul "modGeoreferenzierung", Sub "RunAdressen" 4 Feld GDENR für Gemeindenummer BFS, Feld PLZ4 für vierstelliger PLZ-Code, Feld ESTRID für Eidg.

Strassenidentifikator, Feld EGID für Eidg. Gebäudeidentifikator, Feld X und Y für die Landeskoordinaten. 5 Microsoft Accessmodul "modGeoreferenzierung", Abfragen "up_11_gdename" bis "up_13_gdename", 6 Microsoft Accessmodul "modGeoreferenzierung", Abfrage "up_21_PLZ"

Geokodierung von Adressen __________________________________________________________ November 2006

11

– 4C: Gebäude formularunterstützt manuell zuweisen Übriggebliebene Adresstexte mit Formular "Adressen zuweisen" manuell einem Gebäude im Unterformular zuweisen, welches an der gleichen Strasse liegt.

– 4D: Zurückschreibendes EGID in die Adressetabelle.

– 4E: Restmenge exportieren

– 4F: Manuelle Suche mit Telinfo oder www.tel.search.ch -> Felder X und Y Die Koordinaten werden mit dem Programm "AtlasKoordExtractor" von Telinfo in die Zwischenablage kopiert. Das Internetportal www.tel.search.ch dient zur Suche und Qualitätssicherung bei sehr aktuellen Datensätzen.

• 5: Koordinaten anhand Restinformationen zuweisen -> Felder X,Y

– 5A: Strassengenaue Koordinaten zuweisen -> Felder X,Y Bei allen Datensätzen, welche einen ESTRID, aber keine Koordinaten haben, wird die Koordinate des Hauses mit der niedrigsten Hausnummer in der Strasse zugewiesen

– 5B: Poststellen-Koordinaten zuweisen Bei allen Datensätzen mit PLZ, aber ohne Koordinaten wird unter den Poststellen mit gleicher vierstelliger Postleitzahl diejenige verwendet, welche am meisten Haushalte bedient.

– 5C: Kirchspitzkoordinaten der Gemeinde zuweisen Bei allen Datensätzen mit GDENR, aber ohne weiteren brauchbaren Angaben wird die Koordinate eines zentralen Gebäudes zugewiesen.

4.6 Qualitätssicherung

Die Gesamtstichprobe wurde im GIS visualisiert. Basierend auf dem internen Geokodie-rungsgenauigkeitsstufencode können gegebenenfalls zu jedem Arbeitsschritt einzelne Stich-proben im GIS visualisiert und mit dem GWR, der Landeskarte und den Strassennamen in www.map.search.ch verglichen werden. Bei nicht aktuellen Referenzdaten waren im Luftbild häufig noch Baugruben oder fehlende Vegetation nach dem Bau der Erschliessungsstrasse zu sehen.

Geokodierung von Adressen __________________________________________________________ November 2006

12

5 Resultate

Der Anteil der Adressen, welche in einem Datensatz hausgenau geokodiert werden können, ist abhängig von der Anzahl Adressdatenfelder in den Rohdaten (siehe Abbildung 3), der Ob-jektart (siehe Abbildung 4), der Auskunftsperson (Abbildung 5) und der Aktualität (Abbildung 6).

Beim Vergleich der Geokodierungsgenauigkeit mit der Anzahl der Adressdatenfelder (Abbildung 3) fällt auf, dass Datensätze, bei denen nur die vier notwendigen Felder Strasse, Hausnummer, PLZ und Ort vorhanden waren, besser geokodiert werden konnten als wenn noch ein fünftes Feld mit dem Namen der Institution/Betrieb vorhanden war. Dies ist darauf zurückzuführen, dass viele Auskunftspersonen dann nur einen nicht verwertbaren Namen an-geben und dafür beispielsweise die Hausnummer weglassen.

Abbildung 3 Geokodierungsgenauigkeitsstufe nach Anzahl der Informationselementen in den Rohdaten

0% 20% 40% 60% 80% 100%

2

3

4

5

Anz

ahl

Info

rmat

ions

elem

ente

Anteil Adressen

Hausgenau

Naheliegendes Gebaeude

Strassengenau

PLZ oder Gemeindegenau

Landgenau (im Ausland)

Nicht geokodierbar

Bezeichnung der Informationselemente in den Rohdaten bzw. Fragebögen: - bei 2 Elemente Informationen: Variante a: PLZ, Ort; Variante b: PLZ, Adresse - bei 3 Elemente Informationen: Strasse mit Hausnummer, PLZ, Ort - bei 4 Elemente Informationen: Strasse, Hausnummer, PLZ, Ort - bei 5 Elemente Informationen: Name, Strasse, Hausnummer, PLZ, Ort

Geokodierung von Adressen __________________________________________________________ November 2006

13

Die Aufschlüsselung nach Objektart und Auskunftsperson zeigt, dass die eigene Wohnadresse am besten bekannt ist, die exakte Adresse aller Ausbildungs- und Arbeitsstätten aller Perso-nen im Haushalt hingegen oft unvollständig angegeben wurde. Bei den Immobilienangeboten in Internet, welche von Immobilienhändlern, Immobilienverwaltungen, Verkäufern, Vermie-tern oder Vormietern aufgeschaltet werden, geben viele die exakte Adresse nicht an (siehe Abbildung 4 und Abbildung 5).

Abbildung 4 Geokodierungsgenauigkeitsstufe nach Objektart

0% 20% 40% 60% 80% 100%

Wohnort

Wohnimmobilie*

Ausbildungs-oder

Arbeitsplatz

Obj

ekta

rt

Anteil Adressen

Hausgenau

Naheliegendes Gebaeude

Strassengenau

PLZ- oder gemeindegenau

Landgenau

Nicht geokodierbar

*Wohnimmobilienangebote im Internet

Geokodierung von Adressen __________________________________________________________ November 2006

14

Abbildung 5 Geokodierungsgenauigkeitsstufe nach Auskunftsperson

0% 50% 100%

Person

Person imHaushalt*

Vermieter**Aus

kunf

tspe

rson

Anteil Adressen

Hausgenau

Naheliegendes Gebaeude

Strassengenau

PLZ oder Gemeindegenau

Landgenau (im Ausland)

Nicht geokodierbar

*Auskunft über alle Personen im Haushalt **Immobilienangebote: Meistens von Immobilienhändler, Immobilienverwaltung, Verkäufer, Vermieter oder Vormieter

In einer Befragung (Beige und Axhausen, 2005) wurde auch nach den Wohnorten der Befrag-ten in den vergangenen 20 Jahren gefragt. Bei früheren Wohnorten waren die Angaben erwar-tungsgemäss ungenauer, sodass weniger Adressen geokodiert werden konnten (Abbildung 6).

Abbildung 6 Geokodierungsgenauigkeitsstufe nach Aktualität

0% 20% 40% 60% 80% 100%

Aktuell

Letzte 20Jahre

Akt

ualit

ät

Anteil Adressen

Hausgenau

Naheliegendes Gebaeude

Strassengenau

PLZ oder Gemeindegenau

Landgenau (im Ausland)

Nicht geokodierbar

Geokodierung von Adressen __________________________________________________________ November 2006

15

6 Schlussfolgerung und Empfehlungen zur Fragebogengestaltung

Die Geokodierungsrate hängt wie a priori vermutet von der Anzahl vorgesehenen Adress-datenfeldern, dem Geokodierungsaufwand, der Auskunftsperson, der Aktivität am Ort (Woh-nen, Arbeiten) und der Aktualität der Angabe ab. Nicht a priori vermutet wurde der Effekt, dass die hausgenaue Geokodierungsrate bei fünf Adressfeldern geringer ist als bei vier Ad-ressfeldern. Dieser Effekt kann damit begründet werden, dass die Möglichkeit, nur den Fir-men bzw. Schulnamen zu nennen, dazu verleitet, die genaue Postadresse wegzulassen. Der Sucherfolg für eine hausgenaue Geokodierung bei Firmennamen oder sonstigen Bezeichnun-gen ist in der Regel gering. Dies hat mehrere Gründe: Grosse Firmen haben in der Regel meh-rere Arbeitsstätten, die typischen Backoffice-Standorte sind jedoch aus verständlichen Grün-den nicht im Telefonbuch aufgeführt, sodass ein Firmennamen oder ein Markennamen oft für die Geokodierung keine Hilfe bietet. Firmenbezeichnungen sind auch sehr schnelllebig, was insbesondere bei den Adressen aus dem Lebensverlaufskalender der letzten 20 Jahre ein Prob-lem war.

6.1 Empfehlung zu den vorzusehenden Adressfeldnern

Bei der Gestaltung der Adressdatenfelder muss unterschieden werden nach der Anwendung der geokodierten Daten, d.h. nach dem Ziel der Befragung. Für Anwendungen im Verkehrs-bereich kann eine Postleitzahl- oder gemeindegenaue Geokodierung ausreichend sein, wäh-rend für die Beschreibung der Standortqualität von Immobilien eine hausgenaue Geokodie-rung meist notwendig ist.

6.1.1 Bei hausgenauer Geokodierung

Wenn das Ziel eine hausgenaue Geokodierung ist, so sollten die vier Adressfelder Strasse, Hausnummer, Postleitzahl und Ort vorgegeben werden. Geringere Geokodierungsraten sind bei 2, 3 und 5 Adressdatenfeldern zu erwarten. Das zusätzliche Feld Name (z.B. eines Betrie-bes) verleitet dazu, die Strasse oder Hausnummer wegzulassen, was nicht immer manuell kor-rigiert werden kann.

Geokodierung von Adressen __________________________________________________________ November 2006

16

6.1.2 Bei gebietsgenauer Geokodierung

Für Anwendungen im Verkehrsbereich kann eine Postleitzahl- oder gemeindegenaue Geoko-dierung ausreichend sein. In diesem Fall können auch fünf Adressfelder vorgesehen werden.

Geokodierung von Adressen __________________________________________________________ November 2006

17

7 Literatur

Beige, S. und K. W. Axhausen (2005) Feldbericht der Befragung zur Wohngeschichte, Arbeitsberichte Verkehrs- und Raumplanung, 315, Institut für Verkehrsplanung und Transportsysteme (IVT), ETH Zürich, Zürich.

Bundesamt für Statistik (2005) Eidg. Gebäude- und Wohnungsregister, http://www.housing-stat.ch/ [Aufgerufen am 25.10.2005]

Egnor D. (2003) Geographic Search, http://dan.egnor.name/google.html [Aufgerufen am 25.10.2005]

Environmental System Research Institute (2003) Geocoding Rule Base Developer Guide, Redlands, California, USA.

Geopost (2005) Gebäudeadressen der ganzen Schweiz mit Koordinaten, http://www.geopost.ch/ [Aufgerufen am 25.10.2005]

Steudler D. (2005) Genereller Überblick über geokodierte Adressdaten, Vortrag bei der Tagung 'Nationale Geokodierte Adressdaten der Schweiz' vom 8. Juni 2005, http://www.cadastre.ch/pub/down/home/referat02_de.pdf [Aufgerufen am 25.10.2005]

Geokodierung von Adressen __________________________________________________________ November 2006

18

Anhang A: Datentabellen

Tabelle 9 Tabellenliste der Adressdaten

Nr Tabelleninhalt Feldliste Anzahl Records

Anzahl Felder

Prio-rität

A1 Aktueller Wohnort Strasse, Hausnummer, PLZ, Ort

3'375 4 1

A2 Aktueller Ausb./Arbeitsort aller Haushaltsmitglieder

PLZ, Adresse 6'476 2 2

B1 Wohnort des Haushaltes Strasse, Hausnummer, PLZ, Ort

710 4 1

B2 Ausbildungsplatz bzw. Arbeits-platz der Haushaltspersonen

PLZ, Ort 1'314 2 1

B3 Ausbildungsplatz der Person Name, Strasse, Hausnum-mer, PLZ, Ort

101 5 1

B4 Arbeitsplatz der Person Name, Strasse, Hausnum-mer, PLZ, Ort

802 5 1

B5 Wohnorte der Person (aus dem Lebensverlaufskalender)

Strasse, Hausnummer, PLZ, Ort

3'510 4 1

B6 Ausbildungsplätze der Person (aus dem Lebensverlaufkskalen-der)

PLZ, Ort 1'199 2 1

B7 Arbeitsplätze der Person (aus dem Lebensverlaufskalender)

PLZ, Ort 2'425 2 1

Geokodierung von Adressen __________________________________________________________ November 2006

19

Nr Tabelleninhalt Feldliste Anzahl Records

Anzahl Felder

Prio-rität

C1 Wohnort des Haushaltes Strasse, Hausnummer, PLZ, Ort

59 4 1

C2 Ausbildungsplatz bzw. Arbeits-platz der Haushaltspersonen

PLZ, Ort 79 2 1

C3 Ausbildungsplatz der Person Name, Strasse, Hausnum-mer, PLZ, Ort

9 5 1

C4 Arbeitsplatz der Person Name, Strasse, Hausnum-mer, PLZ, Ort

53 5 1

C5 Wohnorte der Person (aus dem Lebensverlaufskalender)

Strasse, Hausnummer, PLZ, Ort

264 4 1

C6 Ausbildungsplätze der Person (aus dem Lebensverlaufkskalen-der)

PLZ, Ort 79 2 1

C7 Arbeitsplätze der Person (aus dem Lebensverlaufskalender)

PLZ, Ort 147 2 1

D1 Homegate Strasse mit Hausnr., PLZ, Ort

26'691 3 3

D2 ImmoStreet Strasse mit Hausnr., PLZ, Ort

25'543 3 3

D3 ImmoScout24 Strasse mit Hausnr., PLZ, Ort

13'447 3 3

D4 SwissImmo Strasse mit Hausnr., PLZ, Ort

3'768 3 3

D5 ImmoClick Strasse mit Hausnr., PLZ, Ort

6'269 3 3

D6 www.cubisima.com Strasse mit Hausnr., PLZ, Ort

1 3 3

Geokodierung von Adressen __________________________________________________________ November 2006

Anhang B: Resultatetabellen

Tabelle 10 Resultatetabelle mit Anzahlen

Nr Tabelle Anzahl Felder

Anzahl Record

Haus-genau

Naheliegendes Gebäude

Strassengenau

Postkreis oder Gemeinde-genau

Land-genau

Nicht geoko-dierbar

A1 Aktueller Wohnort 4 3'375 2'927 181 165 92 10

A2 Aktueller Ausb./Arbeitsort aller HH 2 6'476 2'183 340 318 1'823 10 1'802

B1 Wohnort des Haushaltes 4 710 607 50 38 14 0 1

B2 Ausbildungsplatz bzw. Arbeitsplatz der Haushaltspersonen 2 1'314 1 0 5 1'300 8 0

B3 Ausbildungsplatz der Person 5 101 34 11 8 44 1 3

B4 Arbeitsplatz der Person 5 802 488 64 81 163 1 5

B5 Wohnorte der Person (aus dem LVK) 4 3'510 2'167 170 297 576 266 34

B6 Ausbildungsplätze der Person (aus dem LVK) 2 1'199 1 0 1 1'054 134 9

B7 Arbeitsplätze der Person (aus dem LVK) 2 2'425 2 0 5 2'266 130 22

Nr Tabelle Anzahl Felder

Anzahl Record

Haus-genau

Naheliegendes Gebäude

Strassengenau

Postkreis oder Gemeinde-genau

Land-genau

Nicht geoko-dierbar

C1 Wohnort des Haushaltes 4 59 54 2 3 0 0 0

C2 Ausbildungsplatz bzw. Arbeitsplatz der Haushaltspersonen 2 79 0 1 0 78 0 0

C3 Ausbildungsplatz der Person 5 9 4 0 0 4 1 0

C4 Arbeitsplatz der Person 5 53 36 7 3 7 0 0

C5 Wohnorte der Person (aus dem LVK) 4 264 141 9 39 38 32 5

C6 Ausbildungsplätze der Person (aus dem LVK) 2 79 2 0 0 59 16 2

C7 Arbeitsplätze der Person (aus dem LVK) 2 147 3 0 0 135 9 0

D1 Homegate 3 26'691 11'877 1'580 3'216 2'228 7'790 0

D2 ImmoStreet 3 25'543 7'533 668 385 7'566 9'391 0

D3 ImmoScout24 3 13'447 5'535 773 1'478 804 4857 0

D4 SwissImmo 3 3'768 379 62 56 2'428 843 0

D5 ImmoClick 3 6'269 141 3 1 0 6'124 0

D6 www.cubisima.com 3 1 1 0 0 0 0 0

Tabelle 11 Resultatetabelle mit Anteilen

Nr Tabelle

Anteil hausgenau (%)

Anteil Nahe-liegendes Gebäude

Anteil Strassen-genau

Anteil PLZ- oder Gemeinde-genau

Anteil Land-genau

Anteil Nicht geoko-dierbar

A1 Aktueller Wohnort 86.7 5.4 4.9 2.7 0.0 0.3

A2 Aktueller Ausb./Arbeitsort aller HH 33.7 5.3 4.9 28.2 0.2 27.8

B1 Wohnort des Haushaltes 85.5 7.0 5.4 2.0 0.0 0.1

B2 Ausbildungsplatz bzw. Arbeitsplatz der Haushaltspersonen 0.1 0.0 0.4 98.9 0.6 0.0

B3 Ausbildungsplatz der Person 33.7 10.9 7.9 43.6 1.0 3.0

B4 Arbeitsplatz der Person 60.8 8.0 10.1 20.3 0.1 0.6

B5 Wohnorte der Person (aus dem LVK) 61.7 4.8 8.5 16.4 7.6 1.0

B6 Ausbildungsplätze der Person (aus dem LVK) 0.1 0.0 0.1 87.9 11.2 0.8

B7 Arbeitsplätze der Person (aus dem LVK) 0.1 0.0 0.2 93.4 5.4 0.9

C1 Wohnort des Haushaltes 91.5 3.4 5.1 0.0 0.0 0.0

C2 Ausbildungsplatz bzw. Arbeitsplatz der Haushaltspersonen 0.0 1.3 0.0 98.7 0.0 0.0

C3 Ausbildungsplatz der Person 44.4 0.0 0.0 44.4 11.1 0.0

C4 Arbeitsplatz der Person 67.9 13.2 5.7 13.2 0.0 0.0

C5 Wohnorte der Person (aus dem LVK) 53.4 3.4 14.8 14.4 12.1 1.9

C6 Ausbildungsplätze der Person (aus dem LVK) 2.5 0.0 0.0 74.7 20.3 2.5

C7 Arbeitsplätze der Person (aus dem LVK) 2.0 0.0 0.0 91.8 6.1 0.0

Nr Tabelle

Anteil hausgenau (%)

Anteil Nahe-liegendes Gebäude

Anteil Strassen-genau

Anteil PLZ- oder Gemeinde-genau

Anteil Land-genau

Anteil Nicht geoko-dierbar

D1 Homegate 44.5 5.9 12.0 8.3 29.2 0.0

D2 ImmoStreet 29.5 2.6 1.5 29.6 36.8 0.0

D3 ImmoScout24 41.2 5.7 11.0 6.0 36.1 0.0

D4 SwissImmo 10.1 1.6 1.5 64.4 22.4 0.0

D5 ImmoClick 2.2 0.0 0.0 0.0 97.7 0.0

D6 www.cubisima.com 100.0 0.0 0.0 0.0 0.0 0.0

Tabelle 12 Resultatetabelle mit Typisierungen

Nr Tabelle Aktivitätentyp Angaben von Erfassungszeitpunkt Priorität

A1 Aktueller Wohnort Wohnen Person Aktuell 1

A2 Aktueller Ausb./Arbeitsort aller HH Ausb./Arbeit Person im Haushalt Aktuell 2

B1 Wohnort des Haushaltes Wohnen Person Aktuell 1

B2 Ausbildungsplatz bzw. Arbeitsplatz der Haushaltspersonen Ausb./Arbeit Person im Haushalt Aktuell 1

B3 Ausbildungsplatz der Person Ausbildung Person Aktuell 1

B4 Arbeitsplatz der Person Arbeit Person Aktuell 1

B5 Wohnorte der Person (aus dem LVK7) Wohnort Person Letzte 20 Jahre 1

B6 Ausbildungsplätze der Person (aus dem LVK) Ausbildung Person Letzte 20 Jahre 1

B7 Arbeitsplätze der Person (aus dem LVK) Arbeit Person Letzte 20 Jahre 1

C1 Wohnort des Haushaltes Wohnen Person Aktuell 1

C2 Ausbildungsplatz bzw. Arbeitsplatz der Haushaltspersonen Ausbildung Person Aktuell 1

C3 Ausbildungsplatz der Person Ausbildung Person Aktuell 1

C4 Arbeitsplatz der Person Arbeit Person Aktuell 1

C5 Wohnorte der Person (aus dem LVK) Wohnen Person Letzte 20 Jahre 1

C6 Ausbildungsplätze der Person (aus dem LVK) Ausbildung Person Letzte 20 Jahre 1

7 Lebensverlaufskalender

C7 Arbeitsplätze der Person (aus dem LVK) Arbeit Person Letzte 20 Jahre 1

D1 Homegate Wohnen Vermieter Aktuell 3

D2 ImmoStreet Wohnen Vermieter Aktuell 3

D3 ImmoScout24 Wohnen Vermieter Aktuell 3

D4 SwissImmo Wohnen Vermieter Aktuell 3

D5 ImmoClick Wohnen Vermieter Aktuell 3

D6 www.cubisima.com Wohnen Vermieter Aktuell 3

Anhang C: Programm AtlasKoordExtractor

Beschreibung: Da das GWR nicht vollständig ist, war es nötig einigen Adressen manuell Koordinaten zuzuweisen. Dabei wurde das Programm Atlas, wel-ches dem TelInfo beiliegt, zu Hilfe genommen. Allerdings bietet es keine Möglichkeit die Koordinaten zu kopieren. Dies wird mit At-lasKoordExtractor erreicht.

Anwendung: Atlas und AtlasKoordExtractor ausführen. Im Atlas die gewünschte Adresse suchen und mit dem Mauszeiger auf die ge-wünschte Stelle zeigen. Taste F3 drücken. Die Koordinaten werden dann automatisch in die Zwischenablage kopiert.