Perl scripts: verschil tussen versies

Uit wiki.openbomenkaart.org
Naar navigatie springen Naar zoeken springen
 
(33 tussenliggende versies door dezelfde gebruiker niet weergegeven)
Regel 1: Regel 1:
==csv2json.pl==
*[[Perl installeren]]
Perl script '''[https://openbomenkaart.org/scripts/perl/csv2json.pl csv2json.pl]''' voert een aantal bewerkingen uit op een bomenbestand.  
*[[Perl_obk_csv2json.pl|Perl script obk_csv2json.pl]]
**[[Perl_obk_csv2json.pl/Voorbereiding|Voorbereiding]]
*[[Perl_taxons.pl|Perl script taxons.pl]]
*[[Perl diff_revisions.pl|Perl script diff_revisions.pl]]
*[[Perl json2csv.pl|Perl script json2csv.pl]]
*[[Perl obk_filter_region.pl|Perl script obk_filter_region.pl]]


Het is een beetje Q&D (Quick and Dirty). Zo moet je eerst wat regels in het script aanpassen, wanneer je van invoerbestand wilt wisselen.
Intro over [[regular expressions in perl]], en hoe [[ChatGPT perl|ChatGPT]] kan assisteren.
 
Zelfs de naam had beter gekund, want intussen produceert het niet alleen een json bestand, maar ook een csv bestand.
 
'''Meer uitleg gewenst'''
 
==csv_match_revisions.pl==
Perl script '''[https://openbomenkaart.org/scripts/perl/csv_match_revisions.pl csv_match_revisions.pl]''' kan twee CSV bestanden met gemeentelijke data vergelijken en daaruit een aantal verschillenlijsten produceren. Er zijn verschillende bestandsformaten voor gemeentelijke bomenbestanden. Het eenvoudigste voor ons doel is een CSV (Comma Separated Values) of XLS(X) bestand (Excel spreadsheet). Een Excel bestand kan je heel eenvoudig exportereen naar een CSV bestand. Het script verwacht dat de invoerbestanden al (oplopend) zijn gesorteerd op het eerste veld Id (dit kan in Excel).
 
(''Terzijde: de naam Comma Separated Values kan misleidend zijn. Excel hanteert verschillende scheidingstekens in verschillende landen. In de Nederlandse versie van Excel is het een punt-komma. Dit script verwacht echt komma's als scheidingstekens.'')
 
===Taxonnamen===
Twee van de verschillenlijsten gaan over taxonnamen:
*een tekst bestand '''[https://openbomenkaart.org/data/diffs/Leiden%20Matched%20Revisions%20Diff%20Species.txt Leiden Matched Revisions Diff Species.txt]''', bedoeld als leesbaar overzicht
*een csv bestand '''[https://openbomenkaart.org/data/diffs/Leiden%20Matched%20Revisions%20Diff%20Taxon.csv Leiden Matched Revisions Diff Taxon.csv]''', bedoeld om verder te verwerken met'''csv2json.pl'''. Dat script voegt in het json bestand extra tags toe waarmee je verschillen tussen gemeentelijke soortnamen in oude en nieuw bestand op een kaart kan markeren tijdens nalopen kan registreren wat de juiste naam is (de oude, of de nieuwe, of toch weer iets anders). Als je zo'n json bestand hebt met deze extra tags kun je die op de kaart zichtbaar maken door een extra parameter aan de url toe te voegen: '''checktaxon'''. Zie [https://openbomenkaart.org/obk_beta_3.htm?data=leiden&checktaxon dit voorbeeld] (beta versie) van  de kaart van Leiden.
 
De kaart laat nu alle bomen als witte cirkels zien, behalve die waar de taxonnaam ter discussie staat, die cirkels zijn als volgt gekleurd
*<font color=#FF0000>rood</font>: oude en nieuwe taxonnaam verschillen qua geslacht
*<font color=#FF00FF>violet</font>: oude en nieuwe taxonnaam verschillen qua soort
*<font color=#0000FF>blauw</font>: oude en nieuwe taxonnaam verschillen qua cultivar
Het is dus mogelijk om eerst de belangrijkste verschillen na te lopen. Veel meer mensen zullen over een foutieve  geslachtsnaam vallen dan over een verschil in cultivar.
 
[[Bestand:Taxon diffs overview.png|thumb|400px|left|]]<br clear=all>
 
[[Bestand:taxonnaam verschillen.png|thumb|400px|left|Verschillen in taxonnamen tussen oud en nieuw gemeentebestand gemarkeerd, naar nivo van verschil: oude en nieuwe taxonnaam verschillen qua <font color=#FF0000>geslacht</font>, <font color=#FF00FF>soort</font> of <font color=#0000FF>cultivar (of ondersoort)</font>]]<br clear=all>
 
Klik je dan op zo'n gekleurde cirkel, dan krijg je in de popup box een keuzemenu te zien. Kies welke naam je weet/denkt dat juist is: de oude, de nieuwe, of nog weer een andere (te specificeren) naam. Als je voor een of meer bomen de taxonnaam bepaald hebt kun je jezelf een mail sturen met het verzamelde lijstje verschillen. Klik eerst het mail logo, en dan <font color='blue'>Zend mail</font>. Als het goed is (en je hebt een mailprogramma geconfigureerd op je phone of tablet) verschijnt de mail daarna in je mailprogramma en kun je ook daar op Zend drukken. Dat interne lijstje wordt na verzenden weer leeggemaakt. Vergeet niet aan het eind van je wandeling de laatste wijzigingen op te sturen. Als je de kaart afsluit of opnieuw downloadt in de browser ben je ze kwijt (nog wel). 
 
[[Bestand:Taxonnaam verschillend popup box.png|thumb|400px|left|Kies welke naam je weet/denkt dat juist is: de oude, de nieuwe, of nog weer een andere (te specificeren) naam]]<br clear=all>
[[Bestand:Taxon diffs send mail.png|thumb|400px|left|Mail (jezelf) de lijst van namen die je bepaald hebt]]<br clear=all>
 
Thuis kun je de wijzigingen in een overzichtslijst toevoegen voor feedback naar de gemeeente. En/of toevoegen/aanpassen in OpenStreetMap.

Huidige versie van 27 jan 2024 om 14:37