Art through the eyes of the data
Ως μεταπτυχιακοί φοιτητές του Πανεπιστημίου Μακεδονίας στα πλαίσια του μαθήματος “Καινοτόμα συστήματα η-Επιχειρείν” παρουσιάζουμε τις δυνατότητες που μας παρέχει η γλώσσα SPARQL μέσω του endpoint wikidata και εξάγουμε μερικά ενδιαφέροντα αποτελέσματα με κεντρικό θέμα τις εικαστικές τέχνες.
Η βάση Wikidata προέρχεται από την Wikipedia την μεγαλύτερη παγκοσμίως ηλεκτρονική εγκυκλοπαίδεια , με τον ιδιαίτερο σκοπό να διαχειριστεί τα ζητήματα που παρουσιάζονται στα άρθρα της Wikipedia. Για παράδειγμα ένα τέτοιο ζήτημα είναι ο αριθμός που αφορά στην πληροφορία για τον πληθυσμό των Ηνωμένων Πολιτειών της Αμερικής. Η πρόκληση είναι το γεγονός ότι η πληροφορία αυτή δεν παρουσιάζεται μόνο στο άρθρο την έκδοσης στην αγγλική γλώσσα αλλά σε 264 διαφορετικές γλώσσες. Ο αριθμός που αφορά στον πληθυσμό των Ηνωμένων Πολιτειών διαφέρει στην αγγλική και στην γερμανική έκδοση του άρθρου. Εδώ έρχεται να παρέμβει η κοινότητα της Wikidata παρέχοντας ένα κεντρικό χώρο όπου τέτοια δεδομένα μπορούν να αποθηκευτούν. Έτσι λοιπόν αντί να γίνονται διορθώσεις στις διαφορετικές εκδόσεις ξεχωριστά στην Wikidata αποθηκεύεται ο αριθμός και παρέχεται αυτόματα σε όλες τις εκδόσεις της Wikipedia. Η Wikidata έχει σαν σκοπό να δημιουργήσει μια ελεύθερη δομημένης γνώσης βάση που μπορεί να είναι κατανοητή και επεξεργάσιμη τόσο από τον άνθρωπο αλλά και από τις μηχανές.(Müller-Birn et al., 2015)

Το Wikidata είναι ένα κεντρικό αποθετήριο στο οποίο μπορούν να έχουν πρόσβαση όλοι. Το περιεχόμενο το οποίο φορτώνεται δυναμικά από το Wikidata δεν χρειάζεται να διατηρείται σε κάθε μεμονωμένο wiki project. Για παράδειγμα, στατιστικά στοιχεία, ημερομηνίες, τοποθεσίες και άλλα κοινά δεδομένα μπορούν να συγκεντρωθούν στο Wikitata.
Το αποθετήριο του Wikitata
Τα στοιχεία και τα δεδομένα των στοιχείων είναι διασυνδεδεμένα. Το αποθετήριο Wikitata αποτελείται κυρίως από αντικείμενα, καθένα από τα οποία έχει ετικέτα, περιγραφή και οποιοδήποτε αριθμό ψευδωνύμων. Τα στοιχεία προσδιορίζονται με μοναδικό τρόπο από ένα Q που ακολουθείται από έναν αριθμό, όπως για παράδειγμα ο Douglas Adams έχει (Q42). Οι δηλώσεις περιγράφουν λεπτομερή χαρακτηριστικά ενός στοιχείου και αποτελούνται από μια ιδιότητα και μια αξία. Οι ιδιότητες στο Wikitata έχουν ένα P ακολουθούμενο από έναν αριθμό, όπως για παράδειγμα η έκφραση “φοίτησε στο” έχει (P69).
Για ένα άτομο, μπορείτε να προσθέσετε μια ιδιότητα όπως για παράδειγμα να καθορίσετε το που εκπαιδεύτηκαν, προσδιορίζοντας μια τιμή για το σχολείο/πανεπιστήμιο. Για τα κτίρια, μπορείτε να ορίσετε ιδιότητες γεωγραφικών συντεταγμένων καθορίζοντας τις τιμές γεωγραφικού μήκους και γεωγραφικού πλάτους. Οι ιδιότητες μπορούν επίσης να συνδέονται με εξωτερικές βάσεις δεδομένων. Μια ιδιότητα που συνδέει ένα στοιχείο με μια εξωτερική βάση δεδομένων, όπως μια βάση δεδομένων ελέγχου αρχής που χρησιμοποιείται από βιβλιοθήκες και αρχεία, ονομάζεται αναγνωριστικό. Οι Ειδικοί Σύνδεσμοι Ιστοτόπου συνδέουν ένα στοιχείο με το αντίστοιχο περιεχόμενο σε wikis του πελάτη, όπως το Wikipedia, Wikibooks ή Wikiquote.
Όλες αυτές οι πληροφορίες μπορούν να εμφανιστούν σε οποιαδήποτε γλώσσα, ακόμη και αν τα δεδομένα προέρχονται από διαφορετική γλώσσα. Κατά την πρόσβαση σε αυτές τις τιμές, τα wikis του πελάτη θα εμφανίζουν τα πιο ενημερωμένα δεδομένα.
Το μοντέλο δεδομένων Wikidata βρίσκεται στο απλούστερο επίπεδο που ταιριάζει με το RDF, καθώς τα περισσότερα δεδομένα κωδικοποιούνται μέσω ενός στοιχείου (rdf: subject), μιας ιδιότητας (rdf: predicate) και μιας τιμής για αυτήν την ιδιότητα (rdf: object). Ο παρακάτω πίνακας σημειώνει μερικά από τα τυπικά αναγνωριστικά ιδιότητας σε wikidata που ταιριάζουν με τα πρότυπα RDF και RDFS.

Στατιστικά στοιχεία της Wikidata
