22
ΚΑΙΝΟΤΟΜΙΑ
ΕΡΕΥΝΑ & ΤΕΧΝΟΛΟΓΙΑ | 03- 05/2014
Αφιέρωμα
υπευθυνότητας και της λογοδοσίας από την πλευρά των φορέων άσκη-
σης της δημόσιας εξουσίας". Τόσο το περιεχόμενο των αποφάσεων
όσο και τα μεταδεδομένα είναι διαθέσιμα ανοικτά (με άδειες Creative
Commons Αναφορά) προς τρίτους και μέσω προγραμματιστικής διεπα-
φής (API), ώστε να είναι νομικά και τεχνικά δυνατή η ανάπτυξη εφαρμο-
γών προστιθέμενης αξίας. Χάρη σε αυτό έχουν δημιουργηθεί διάφορες
εφαρμογές προστιθέμενης αξίας, όπως η Υπερδιαύγεια, μία πύλη που
προσφέρει επαυξημένες λειτουργίες αναζήτησης στη Διαύγεια και σε άλ-
λες δημόσιες πηγές ή το
, επιτρέποντας τη συλλογή
και παρουσίαση οικονομικών στοιχείων σε μορφή που να είναι ξεκάθαρη
και χρηστική για όλους.
Κεντρική πλατφόρμα για τη δημοσίευση των δεδομένων της δημόσιας
διοίκησης είναι το
που ακολουθεί το παράδειγμα και άλλων
χωρών όπως
,
κ.λπ., ο επίσημος διαδικτυακός τό-
πος για τα γεωχωρικά δεδομένα και την εφαρμογή της οδηγίας INSPIRE
, το
ενώ σταδιακά κάνουν την εμ-
φάνισή τους και κάποιες πύλες για τα δεδομένα της περιφερειακής και
τοπικής αυτοδιοίκησης (π.χ.
). Τα σύνολα δεδομένων
που μπορεί κανείς να βρει αφορούν π.χ. τις τιμές των καυσίμων, στοιχεία
διαγωνισμών του Δημοσίου, τις τιμές των καταναλωτικών προϊόντων και
τα μεταδεδομένα των αρχείων της δημόσιας ραδιοτηλεόρασης.
Επίσης στη διεύθυνση open-data.okfn.gr διατίθεται η Πύλη Ανοικτών
Δεδομένων που υποστηρίζει το Ίδρυμα Ανοικτής Γνώσης Ελλάδας Open
Knowledge Foundation Greece. Σημειώνεται ότι στο πλαίσιο της ΕΕΛ/ΛΑΚ
λειτουργεί Ομάδα Εργασίας για τα Ανοιχτά Δεδομένα
.
Δεδομένα και Τεχνολογικές Δυνατότητες
Η σημασία της ανοικτής διάθεσης των δεδο-
μένων αναδείχθηκε σε μεγάλο βαθμό μαζί
με τη διάδοση και νεότερων
τεχνολογιών
όπως: οι προγραμματιστικές διεπαφές (APIs
-
Application Programming Interface) που
επιτρέπουν τη δημιουργία mash-ups πληρο-
φορίας και μάλιστα σε πραγματικό χρόνο, οι
τεχνικές εξόρυξης πληροφορίας μέσα από τη
μαζική επεξεργασία μεγάλων συνόλων δεδο-
μένων, οι σύγχρονες τεχνικές οπτικοποίησης
της πληροφορίας π.χ. μέσω χαρτών, τα Ανοικτά
Διασυνδεδεμένα Δεδομένα και η χρήση της
γνώσης του κοινού (πληθοπορισμός) για τη
δημιουργία ή και τη βελτίωση των δεδομένων.
Τα
APIs
αποτελούν πλέον έναν πολύ διαδε-
δομένο τρόπο εξαγωγής των δεδομένων σε
πραγματικό χρόνο, ώστε να επιτρέπεται η
ενσωμάτωσή τους σε τρίτες εφαρμογές. Ένα
διαδεδομένο API είναι εκείνο της εφαρμογής
Open Street Map (OSM), το οποίο επιτρέπει
σε οποιαδήποτε εφαρμογή να "τραβάει" τους
χάρτες από την εφαρμογή και να παρουσιάζει
πάνω σε αυτούς άλλα δεδομένα που διαθέτουν
γεωγραφικές συντεταγμένες. Ο συνδυασμός
πολλαπλών πηγών δεδομένων ονομάζεται
data mash-up
.
Μία εφαρμογή μπορεί, π.χ.
να συνδυάζει τα δεδομένα για τις τοποθεσίες
των σχολείων μίας πόλης, με τα δεδομένα της
εγκληματικότητας των διαφόρων γειτονιών
της, και αυτά να οπτικοποιούνται με τη βοήθεια
ενός χάρτη. Με αυτό τον τρόπο οι γονείς μπο-
ρούν, π.χ. να επιλέξουν ένα σχολείο για το παιδί
τους, που βρίσκεται σε μία περιοχή με χαμηλό
δείκτη εγκληματικότητας.
Τα
Διασυνδεδεμένα Δεδομένα
,
αποτελούν
μία ακόμη μέθοδο δημοσίευσης των δεδο-
μένων. Αντίθετα με τα APIs, μέσω των οποίων
πραγματοποιείται αναζήτηση και ανάκτηση
των δεδομένων σε πραγματικό χρόνο, τα Δι-
ασυνδεδεμένα Δεδομένα δημοσιεύονται ως
σύνολα, με την ταυτόχρονη δημιουργία σημα-
σιολογικών συνδέσεων μεταξύ διαφορετικών
συνόλων δεδομένων, και κατά τρόπο ώστε να
είναι αντιληπτές εκτός από τους ανθρώπινους
χρήστες και από τους υπολογιστές. Το δεδομέ-
νο, π.χ. "Ντα Βίντσι" συνδέεται με το δεδομένο
"
Μόνα Λίζα" μέσω της σχέσης "ζωγράφος". Το
δεδομένο "Μόνα Λίζα" συνδέεται με το δεδο-
μένο "Τζιοκόντα" μέσω της σχέσης «εναλλακτι-
κή ονομασία». Έτσι κάποιος ο οποίος πραγμα-
τοποιεί αναζήτηση για τη Μόνα Λίζα θα βρει
ως αποτελέσματα και εκείνα που αναφέρονται
στην ονομασία Τζιοκόντα, κάτι το οποίο δεν
ήταν δυνατό στην προηγούμενη εκδοχή του
παγκόσμιου ιστού.
Τα Διασυνδεδεμένα Δεδομένα υπόσχονται την
επόμενη επανάσταση στον Παγκόσμιο Ιστό
καθότι προσθέτουν ένα επίπεδο "αντίληψης"
και "κατανόησης" πάνω σε αυτό. Ενώ, δηλαδή,
η πρώτη εκδοχή του Παγκόσμιου Ιστού βασί-
στηκε στα κείμενα και τις ιστοσελίδες και τις
μεταξύ τους διασυνδέσεις μέσω υπερκειμένων
(
hyperlinks), η εξέλιξη του Παγκόσμιου Ιστού
αξιοποιεί τα μεμονωμένα δεδομένα και τις λο-
γικές μεταξύ τους επαγωγικές και παραγωγικές
σχέσεις (που ονομάζονται τριπλέτες), επιτρέ-
ποντας στον χρήστη να πλοηγείται από έννοια
σε έννοια ακολουθώντας αυτές τις σχέσεις. Οι
σχέσεις και οι συνδέσεις αυτές μπορεί να είναι
άπειρες και η αξία του σημασιολογικού δια-
δικτύου, όπως υποστηρίζει και ο ιδρυτής του
Παγκόσμιου Ιστού Tim Berners Lee, έγκειται,
κατ’αυτόν τον τρόπο στο γεγονός της ανάδει-
ξης νέων σχέσεων που δεν γνωρίζαμε πριν.
O Tim Berners-Lee, ο ιδρυτής του Παγκόσμιου
Ιστού συνοψίζει τα βασικά δομικά στοιχεία των
Ανοικτών Διασυνδεδεμένων Δεδομένων
με
βάση την εξής βαθμιδωτή κλίμακα:
I.
δημοσίευση των δεδομένων στον Ιστό (σε
οποιαδήποτε μορφή) με μία ανοικτή άδεια
II.
δημοσίευση των δεδομένων ως δομημένων
δεδομένων
III.
δημοσίευση των δεδομένων με τη χρήση
ανοικτών μορφότυπων (π.χ. CSV αντί για Excel)
IV.
χρήση URIs (Uniform Resource Identifiers)
για τον προσδιορισμό πραγμάτων ώστε και
άλλοι να μπορούν να παραπέμψουν στα
ίδια πράγματα
V.
σημασιολογική διασύνδεση των δεδομένων
με άλλα σύνολα ανοικτών δεδομένων.
Με την αυξημένη ικανότητα των μηχανών να
παράγουν, να καταγράφουν και να μεταδίδουν
δεδομένα με αυτόματο τρόπο, τα τελευταία
χρόνια, και με το κόστος της αποθήκευσης
να μειώνεται δραματικά, γίνεται λόγος για τα
μεγάλα δεδομένα
(
big data). Ο όρος μεγάλα
δεδομένα χρησιμοποιείται για να δηλώσει σύ-
νολα δεδομένων με τεράστιο όγκο. Η κρίσιμη
αυτή "μάζα" των δεδομένων μπορεί να ανέρχε-
ται σε αρκετά petabytes (1015 bytes) και ενδέ-
χεται να οδηγεί στην αδυναμία χειρισμού τους,
μέσα από τις παραδοσιακές σχεσιακές βάσεις
δεδομένων.
Ο μεγάλος τους όγκος, όμως, απαιτεί νέες
προσεγγίσεις αναφορικά με την αποθήκευ-
ση αλλά και την επεξεργασία τους μέσα από
αλγοριθμικές τεχνικές και τεχνικές εξόρυξης
και ανάλυσης δεδομένων. Το παράδειγμα,
π.χ. του Μεγάλου Αδρονικού Επιταχυντή στο
CERN είναι χαρακτηριστικό: 150 εκατ. αισθη-
τήρες παράγουν δεδομένα 40 εκατ. φορές το
δευτερόλεπτο για τις 600 εκατ. προσκρούσεις
που πραγματοποιούνται το δευτερόλεπτο.
Η πύλη δημοπρασιών και αγορών eBay.com,
χρησιμοποιεί δύο λεγόμενες "αποθήκες" δε-
δομένων (data warehouses) χωρητικότητας 7,5
petabytes για να διαχειριστεί τον όγκο των εκα-
τομμυρίων αναζητήσεων, των συστάσεων των
χρηστών και των ηλεκτρονικών κινήσεων των
εμπορευμάτων που πραγματοποιούνται σε κα-
θημερινή βάση. Όλα τα ανοικτά δεδομένα δεν
είναι απαραίτητα μεγάλα δεδομένα, αλλά ούτε
και όλα τα μεγάλα δεδομένα είναι απαραίτητα
ανοικτά.
Το άνοιγμα των δεδομένων επιτρέπει μέχρι και
την εμπλοκή του κοινού στη χωρίς προηγού-
μενο επαύξηση και βελτίωσή τους μέσα από
ενέργειες που δεν είναι δυνατό να γίνουν από