Security and privacy issues in federated learning systems
Abstract
Η έννοια του Federated Learning (FL) περιλαμβάνει την κατάρτιση στατιστικών μοντέλων σε κέντρα δεδομένων, όπως κινητά τηλέφωνα ή νοσοκομεία, διατηρώντας ταυτόχρονα τα δεδομένα τοπικά. Η εκπαίδευση σε ετερογενή και δυνητικά τεράστια δίκτυα εισάγει πολλές προκλήσεις που απορρέουν από την απόκλιση από το βασικό πρότυπο προσέγγισης για μεγάλης κλίμακας μηχανική μάθηση (machine learning), κατανεμημένης βελτιστοποίησης και ανάλυσης δεδομένων για τη διατήρηση της ιδιωτικής ζωής.
Το federated Learning (FL) περιλαμβάνει την αποκεντρωμένη μηχανική μάθηση σε ενιαίο στατιστικό μοντέλο από δεδομένα αποθηκευμένα σε δεκάδες έως δυνητικά εκατομμύρια απομακρυσμένες συσκευές. Η επικοινωνία είναι ένα κρίσιμο σημείο όσο αφορά την ασφάλεια του συστήματος για τα ενοποιημένα δίκτυα, τα οποία όταν συνδέονται με ζητήματα σχετικά με το απόρρητο ή με την ασφαλή αποστολή πρωτογενή δεδομένα απαιτούν την παραμονή τους στη συσκευή όπου δημιουργούνται.
Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η μελέτη της σχετικής βιβλιογραφίας και η κωδικοποίηση των ζητημάτων ασφάλειας και ιδιωτικότητα των συστημάτων Federated Learning (FL). Επιπρόσθετα, γίνεται πρόταση και συζήτηση λύσεων για την αντιμετώπιση αυτών των θεμάτων. Στη συνέχεια, γίνεται ανάπτυξη πειραματικής εφαρμογής για τη μελέτη στη βάση σεναρίων για την αντιμετώπιση του data poisoning με βάση το model averaging. Τέλος, τα βασικά ερευνητικά ερωτήματα είναι η εύρεση των απειλών για την ασφάλεια, για την ιδιωτικότητα αλλά και τα κριτήρια που αξιολογούνται οι παραπάνω απειλές. Επιπρόσθετα, ποιά είναι τα χαρακτηριστικά των διαφόρων συστημάτων FL που επηρεάζουν τη διαμόρφωση του μοντέλου απειλών αλλά και οι τρόποι με τους οποίους μπορούν να αντιμετωπιστούν οι παραπάνω απειλές.