ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ - ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ SITE MAP | ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ - ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΛΛΗΝΙΚΑ | ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ - ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ENGLISH
Παρασκευή, 10/02/2017   -   Ομιλίες
Σεμινάριο Τμήματος με τίτλο:"H αναδιοργάνωση αντιγράφων ως μηχανισμός βελτίωσης της απόδοσης σε κατανεμημένα NoSQL αποθετήρια δεδομένων", Κωνσταντίνος Μαγκούτης

Στο πλαίσιο της διοργάνωσης των σεμιναρίων του τμήματος, θα πραγματοποιηθεί την Παρασκευή 10/02/2017 και ώρα 12:00 στην αίθουσα Σεμιναρίων του Τμήματος Μηχανικών Η/Υ και Πληροφορικής, ομιλία με τίτλο "H αναδιοργάνωση αντιγράφων ως μηχανισμός βελτίωσης της απόδοσης σε κατανεμημένα NoSQL αποθετήρια δεδομένων". Ομιλητής θα είναι ο κ. Κωνσταντίνος Μαγκούτης, Επίκουρος Καθηγητής του Τμήματος Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστημίου Ιωαννίνων.

ΠΕΡΙΛΗΨΗ

Οι συνεχώς αυξανόμενες ανάγκες των διαδικτυακών εφαρμογών για υψηλή απόδοση και διαθεσιμότητα στην αποθήκευση δεδομένων έχουν οδηγήσει στη δημιουργία μιας νέας κατηγορίας αποθετηρίων δεδομένων (data stores) γνωστή με τον όρο NoSQL. Tα συστήματα NoSQL επιτυγχάνουν κλιμακωσιμότητα και υψηλή διαθεσιμότητα βασιζόμενα στην οριζόντια διαμέριση (horizontal partitioning) των αποθηκευμένων πινάκων και της αναπαραγωγής/ομοιοτυπίας (replication) τους σε αντίγραφα διαμοιρασμένα στους κόμβους του συστήματος. Πρωτόκολλα ασθενούς συνέπειας (weak consistency) έχουν γίνει αποδεκτά τα τελευταία χρόνια στη σχεδίαση και υλοποίηση αποθετηρίων δεδομένων μεγάλης κλίμακας λόγω της εμφάνισης εφαρμογών, κύριως στον χώρο των υπηρεσιών Διαδικτύου, στις οποίες το κόστος της μη διαθεσιμότητας είναι υψηλότερο από αυτό της περιστασιακής ασυνέπειας της αποθηκευμένης κατάστασης. Ωστόσο η πλειοψηφία των εφαρμογών συνεχίζει να απαιτεί αυστηρή συνέπεια. Έτσι, μια σημαντική πρόκληση για την έρευνα στον χώρο των κατανεμημένων NoSQL αποθετηρίων δεδομένων είναι η επίτευξη υψηλής απόδοσης και διαθεσιμότητας ταυτόχρονα με την ισχυρή συνέπεια στην πρόσβαση δεδομένων.
Η παρούσα ομιλία θα εστιάσει σε πρόσφατα ερευνητικά αποτελέσματα καινοτόμων χρήσεων των μηχανισμών ομοιοτυπίας σε συστήματα αποθήκευσης δεδομένων. Το πρώτο μέρος εισάγει στην σχεδίαση και υλοποίηση ενός αποθετηρίου δεδομένων κλειδιού-τιμής το οποίο ονομάζουμε ACaZoo, και το οποίο προσφέρει ισχυρή συνέπεια, υψηλή απόδοση και διαθεσιμότητα, εφαρμόζοντας ατομική πολυεκπομπή πρωτεύοντος-εφεδρικών αντιγράφων σε ένα ημερολόγιο προεγγραφών (write-ahead log) το οποίο καταγράφει μεταβολές στην κατάσταση μιας δομής δεδομένων τύπου log-structured merge tree (LSM-Tree). Περιοδικές συμπυκνώσεις (compactions) στα LSM-Trees επηρεάζουν αρνητικά την απόδοση όταν συμβαίνουν στα πρωτεύοντα αντίγραφα. Το ACaZoo προσφέρει λύση σε αυτό το πρόβλημα αλλάζοντας την ταυτότητα του πρωτεύοντος αντιγράφου πριν από συμπύκνωση δεδομένων εκεί, επιτυγχάνοντας αύξηση της ρυθμοαπόδοσης μέχρι και 40% σε περιπτώσεις με υψηλό ποσοστό εγγραφών. Εκτενής πειραματική αξιολόγηση συνέκρινε αποτελέσματα του Yahoo Cloud Service Benchmark πάνω από ερευνητικό πρωτότυπο του ACaZoo, της Oracle NoSQL Database, και εκδόσεων του Apache Cassandra που προσφέρουν ισχυρά επίπεδα συνέπειας.
Στο δεύτερο μέρος της ομιλίας θα παρουσιαστούν πρόσφατα αποτελέσματα από δύο επιπλέον ερευνητικές δραστηριότητες στο χώρο της χρήσης ομοιοτυπίας δεδομένων σε συστήματα αποθήκευσης δεδομένων. Αρχικά θα περιγραφεί η χρήση της τεχνικής της αναδιοργάνωσης αντιγράφων στην υλοποίηση ενός συστήματος διαχείρισης φόρτου σε συστήματα NoSQL. Χρησιμοποιώντας ενημερώσεις γεγονότων από σύστημα διαχείρισης υπολογιστικής υποδομής, προδραστικές (proactive) αναδιοργανώσεις ομάδων αντιγράφων μπορούν να προσφέρουν γρήγορη αντιμετώπιση σε επερχόμενα γεγονότα όπως κατάρρευση ή περιστασιακή μείωση των διαθέσιμων πόρων ενός κόμβου του αποθετηρίου δεδομένων. Αποτελέσματα πειραματικής αξιολόγησης ερευνητικού πρωτοτύπου με χρήση του Yahoo Cloud Serving Benchmark στο Google Cloud Platform καταδεικνύουν τα πλεονεκτήματα του μηχανισμού. Στο τελευταίο μέρος της ομιλίας θα παρουσιαστούν οι αρχές μιας αρχιτεκτονικής γενικού σκοπού, την οποία ονομάζουμε RMS, για την υλοποίηση υπηρεσιών μεταδεδομένων υψηλής διαθεσιμότητας. Πειραματική αξιολόγηση δημοφιλών κατανεμημένων συστημάτων αρχειοθέτησης (HDFS, PVFS) των οποίων η υπηρεσία μεταδεδομένων υλοποιήθηκε με βάση τις αρχές της αρχιτεκτονικής RMS καταδεικνύει ότι οι RMS εκδόσεις έχουν συγκρίσιμη απόδοση και διαθεσιμότητα με τις αρχικές εκδόσεις των συστημάτων αυτών κάτω από σημαντικό φόρτο μεταδεδομένων. Η επιλογή της αρχιτεκτονικής RMS για την υλοποίηση υψηλά διαθέσιμων υπηρεσιών μεταδεδομένων μπορεί να μειώσει σημαντικά την πολυπλοκότητα της ανάπτυξης μελλοντικών κατανεμημένων συστημάτων.

©2010 DEPARTMENT OF COMPUTER SCIENCE & ENGINEERING - UNIVERSITY OF IOANNINA
created by data|SCIENCE

Valid XHTML 1.0 Strict Valid CSS!