Admin:Data samenvoegen uit meerdere bronnen: verschil tussen versies
(nieuwe sectie over mergen data ahv gemeentenummer) |
(→Per boom data uit beide bronnen combineren.: plus bestand 'spookbomen') |
||
Regel 41: | Regel 41: | ||
Zowel gemeente als OSM vrijwilligers bepalen de locatie met GPS. Beide zullen de onvermijdelijke meetfouten bevatten, maar misschien heeft de gemeente betere apparatuur, zodat de fouten kleiner zijn. | Zowel gemeente als OSM vrijwilligers bepalen de locatie met GPS. Beide zullen de onvermijdelijke meetfouten bevatten, maar misschien heeft de gemeente betere apparatuur, zodat de fouten kleiner zijn. | ||
Door in een app zoals Go Map!!!, Vespucci, ID of JOSM beide kaarten over elkaar te leggen, en de cirkel uit OSM over de cirkel uit ODG te schuiven kun je dit oplossen | Door in een app zoals Go Map!!!, Vespucci, ID of JOSM beide kaarten over elkaar te leggen, en de cirkel uit OSM over de cirkel uit ODG te schuiven kun je dit oplossen. En een dag later zijn de tiles in OSM aangepast en zie je geen 'spookbomen' meer. | ||
[[Bestand:Spookbomen.png|thumb|left|<small>Gekleurde cirkels zijn door het OBK script boven de tiles (kaartsegmenten)getekend. Groene cirkels zitten in de OSM tiles 'ingebakken'. Door coordinaten in OSM aan te passen naar die van gemeentekaart zijn een dag later (als de tiles ververst zijn) de spookbomen verdwenen.</small>]]<br clear=all> | |||
====omtrek==== | ====omtrek==== | ||
Voor stamomtrek zou ideaal de hoogste waarde moeten prevaleren (even aannemend dat beide metingen correct zijn, dan heeft de meest recente meting natuurlijk de voorkeur. Een script kan hier bij helpen, maar pas als de boom in beide bestanden uniek aan te wijzen is, en daarvoor is het gemeentenummer van de boom nodig. Pas als dat gemeentenummer ook in OSM staat kun je de keuze welke omtrek te kiezen automatiseren. | Voor stamomtrek zou ideaal de hoogste waarde moeten prevaleren (even aannemend dat beide metingen correct zijn, dan heeft de meest recente meting natuurlijk de voorkeur. Een script kan hier bij helpen, maar pas als de boom in beide bestanden uniek aan te wijzen is, en daarvoor is het gemeentenummer van de boom nodig. Pas als dat gemeentenummer ook in OSM staat kun je de keuze welke omtrek te kiezen automatiseren. |
Versie van 23 jan 2022 13:16
Boomgegevens van gemeente en OpenStreetMap samenvoegen
OpenBomenKaart (OBK) bevat kaarten die helemaal van OpenStreetMap (OSM) komen, dus inventarisatie door vrijwilligers. Dat geldt nu voor alle parken. Daarnaast komen er kaarten op basis van open data van de gemeente (ODG), voor een hele gemeente ineens.
De crux is hoe dit samen te voegen. Wat je niet wil is dat de gemeentekaart voor een bepaald park andere bomen toont dan de kaart voor alleen dat park laat zien. Dat zou een beetje verwarrend zijn bij andere boomdiameters, maar heel verwarrend bij andere soortnamen. Ook wil je niet dat bomen alleen op een van beide kaarten voorkomen.
Het samenvoegen kan op verschillende nivo's.
Per boom kiezen voor 1 bron
Relatief makkelijk is het als elke boom maar uit 1 bron wordt gehaald. Ofwel het ODG, ofwel OSM.
Dat gebeurt nu al op de kaart van Voorschoten. De bomen in het Burg. Berkhoutpark die je op die kaart ziet is wat Hans en Sjaan in kaart hebben gebracht.
In het gemeentebestand worden de boomgegevens voor dat park uitgefilterd. Vervolgens wordt de lijst die uit OSM komt er aan toegevoegd, en dat samen als 1 invoerbestand door de scripts ingelezen.
Hoe te bepalen uit welke bron je put?
Eerst deed ik dat op basis van een filter in lengte- en breedtegraden. Dus alles wat binnen deze rechthoek viel: breedtegraad tussen 52.133 en 52.137, lengtegraad tussen 4.459 en 4.464 werd uit het gemeentebestand gefilterd. Nadeel hiervan is dat je alleen in rechthoeken kan werken, maar parken zijn geen rechthoeken. Je moet dan dus ook alle bomen buiten het park, maar binnen die rechthoek, in OSM zetten.
Later bedacht ik dat het gemeentebestand voor elke boom ook een straatnaam bevat. Voor het Berkhoutpark staat in het veld 'straatnaam' gewoon Berkhoutpark. Door dat als uitgangspunt te nemen, filter je precies dat wat je wilt vervangen uit.
Per boom data uit beide bronnen combineren.
Het is flink lastiger om data uit beide bronnen voor 1 boom te combineren. Dus bijvoorbeeld locatie uit het ODG (het gemeentebestand dus), maar soort en stamomtrek uit OSM.
soort
Soort zal meestal hetzelfde zijn, maar soms ook niet, en dan heeft OSM de voorkeur lijkt mij, aannemend dat een van onze boomexperts de naamsverandering (of eigenlijk naamscorrectie) goedkeurt.
locatie
Zowel gemeente als OSM vrijwilligers bepalen de locatie met GPS. Beide zullen de onvermijdelijke meetfouten bevatten, maar misschien heeft de gemeente betere apparatuur, zodat de fouten kleiner zijn.
Door in een app zoals Go Map!!!, Vespucci, ID of JOSM beide kaarten over elkaar te leggen, en de cirkel uit OSM over de cirkel uit ODG te schuiven kun je dit oplossen. En een dag later zijn de tiles in OSM aangepast en zie je geen 'spookbomen' meer.
omtrek
Voor stamomtrek zou ideaal de hoogste waarde moeten prevaleren (even aannemend dat beide metingen correct zijn, dan heeft de meest recente meting natuurlijk de voorkeur. Een script kan hier bij helpen, maar pas als de boom in beide bestanden uniek aan te wijzen is, en daarvoor is het gemeentenummer van de boom nodig. Pas als dat gemeentenummer ook in OSM staat kun je de keuze welke omtrek te kiezen automatiseren.