populR: επέκταση της R για την αναμόρφωση χωρικών πληθυσμιακών δεδομένων
2021-11-14, 10:30–11:00 (Europe/Athens), Room 2

Η πιο διαδεδομένη πηγή παροχής πληθυσμιακών στοιχείων είναι η Εθνική Απογραφή, η οποία διενεργείται από την Ελληνική Στατιστική Αρχή κάθε δέκα χρόνια με έτος έναρξης το 1951. Κατά τη διάρκεια της απογραφής πληθώρα πληροφοριών συλλέγεται σε επίπεδο νοικοκυριού, ωστόσο, λόγω νομικών και κανονιστικών περιορισμών που αφορούν στην προστασία προσωπικών δεδομένων και του απορρήτου των στατιστικών μονάδων παρέχονται συγκεντρωμένα σε χονδροειδείς χωρικές οντότητες όπως οικοδομικά τετράγωνα, απογραφικοί τομείς, δημοτικές ενότητες, δήμοι κ.α.
Πολλές μελέτες/έρευνες έχουν ανάγκη για παροχή πληθυσμιακών δεδομένων σε λεπτομερέστερη κλίμακα και για το λόγο αυτό κρίνεται απαραίτητος ο υποβιβασμός χωρικής κλίμακας (spatial down-scaling) των πληθυσμιακών δεδομένων της απογραφής. Στόχος της παρούσας εργασίας είναι η δημιουργία ενός εργαλείου υποβιβασμού χωρικής κλίμακας πληθυσμιακών δεδομένων από ένα σύνολο χονδροειδών χωρικών οντοτήτων (source) σε ένα σύνολο οντοτήτων λεπτομερέστερης κλίμακας (target) στο προγραμματιστικό περιβάλλον της R. Αναπτύχθηκαν δύο μέθοδοι υποβιβασμού κλίμακας οι οποίες στηρίζονται σε τεχνικές σταθμισμένης χωρικής παρεμβολής: α) χωρομετρικής και β) ογκομετρικής. Στην πρώτη περίπτωση τα βάρη καθορίζονται με κριτήριο το εμβαδό των οντοτήτων επιφάνειας target, ενώ στη δεύτερη περίπτωση τα βάρη υπολογίζονται αξιοποιώντας το εμβαδό της επιφάνειας target επί τον αριθμό των ορόφων (ή του ύψους) για κάθε οντότητα target.
Η αποτελεσματικότητα του προτεινόμενου εργαλείου εξετάζεται χρησιμοποιώντας πραγματικά δεδομένα για την πόλη της Μυτιλήνης, Λέσβου. Ως επιφάνεια source χρησιμοποιούνται τα Οικοδομικά Τετράγωνα της πόλης (συμπεριλαμβανομένων των πληθυσμιακών μετρήσεων) ενώ ως επιφάνεια target χρησιμοποιούνται τα κτήρια της πόλης (συμπεριλαμβανομένου του αριθμού των ορόφων και του εμβαδού κάτοψης). Τα αποτελέσματα της βιβλιοθήκης populR συγκρίνονται με παρόμοιες λειτουργίες άλλων βιβλιοθηκών της R όπως η areal και sf όπως επίσης γίνεται και αξιολόγηση των παραπάνω με μια λεπτομερέστερη κατανομή πληθυσμού η οποία στηρίζεται στην ογκομετρική μέθοδο χρησιμοποιώντας σαν επιπρόσθετη πληροφορία την χρήση κάθε ορόφου. Τα αποτελέσματα αναδεικνύουν την αποτελεσματικότητα της ογκομετρικής μεθόδου επιτυγχάνοντας τα χαμηλότερα σφάλματα χρησιμοποιώντας τη ρίζα του μέσου τετραγωνικού σφάλματος και το μέσο τετραγωνικό σφάλμα με τιμές 1,45 και 0.94 αντίστοιχα ενώ πέτυχε τη μεγαλύτερη τιμή του συντελεστή συσχέτισης R2 με τιμή 0.9878.


Η σύγχρονη επιστημονική έρευνα μπορεί να επωφεληθεί σημαντικά από την ύπαρξη πληθυσμιακών δεδομένων σε λεπτομερέστερη κλίμακα. Η παροχή πληθυσμιακών δεδομένων με σεβασμό στις κείμενες νομοθεσίες προστασίας δεδομένων προσωπικού χαρακτήρα και προστασίας του στατιστικού απορρήτου γίνεται αυτηρά σε επίπεδο λεπτομέρειας που δεν επιτρέπει την αναγνώριση προσώπων ή καταστάσεων. Οι επιστήμονες (ή και άλλοι ενδιαφερόμενοι) καλούνται να αναμορφώσουν τα πληθυσμιακά δεδομένα από χονδροειδής χωρικές οντότητες σε λεπτομερέστερη κλίμακα. Παρότι πολλές μέθοδοι αναμόρφωσης πληθυσμιακών δεδομένων απαντώνται στη διεθνή επιστημονική βιβλιογραφία, μόνο ελάχιστα εργαλεία αυτόματης εκτέλεσης υπάρχουν. Η εργασία αυτή επιδιώκει την τυποποίηση βασικών μεθόδων αναμόρφωσης πληθυσμιακών δεδομένων με απώτερο στόχο τη δημιουργία μιας επέκτασης, ονόματι populR, για τη γλώσσα προγραμματισμου R.

See also: Presentation

Ο Μάριος Μπάτσαρης είναι Υποψήφιος Διδάκτορας στον τομέα της Γεωγραφικής Ανάλυσης και Γεωπληροφορικής στο τμ. Γεωγραφίας του Πανεπιστημίου Αιγαίου. Έχει απασχοληθεί σε ερευνητικά προγράμματα σχετικά με την Γεψπληροφορική και τα Συστήματα Γεωγραφικών Πληροφοριών όπως επίσης και σχετικά με την Υπολογιστική Όραση και Τεχνητή Νοημοσύνη. Έχει συμβάλλει στη συγγραφή επιστημονικών εργασιών και ανακοινώσεων σε έγκριτα επιστημονικά περιοδικά και διεθνή συνέδρια.