Επιλογή χαρακτηριστικών δικτυακής κίνησης και ανίχνευση εισβολών με χρήση του Microsoft Azure Machine Learning Studio
Abstract
Σκοπός της έρευνας είναι η εισαγωγή της αυτοματοποιημένης πλατφόρμας μηχανικής μάθησης Microsoft Azure Machine Learning Studio στη Κυβερνοασφάλεια με στόχο την εκμετάλλευση των υπολογιστικών πόρων της, τη χρήση των προσφερόμενων και παραμετροποιήσιμων αλγόριθμων μηχανικής μάθησης, καθώς και των δυνατοτήτων οπτικοποίησης των αποτελεσμάτων. Το πλήθος των διαθέσιμων συνόλων δεδομένων δικτυακής κίνησης (Network Traffic Datasets) απαιτεί ισχυρή προεπεξεργασία ώστε να μπορεί ο ερευνητής ασφάλειας να τα χρησιμοποιήσει προς την κατεύθυνση της ανίχνευσης εισβολών σε δικτυακό περιβάλλον. Η πλατφόρμα Microsoft Azure Machine Learning Studio συγκεντρώνει χαρακτηριστικά βελτιστοποίησης και επιτάχυνσης της ερευνητικής μελέτης ακολουθώντας μια καλά ορισμένη μεθοδολογία. Στην παρούσα μεταπτυχιακή διατριβή εξερευνούμε τα διαθέσιμα σύνολα δεδομένων δικτυακής κίνησης, τα οποία προεπεξεργάζονται κατάλληλα επιλέγοντας τα σημαντικότερα χαρακτηριστικά τους(Feature Selection). Στη συνέχεια εισάγονται ως είσοδος σε αλγόριθμο μηχανικής μάθησης με σκοπό την ανίχνευση ανωμαλιών (Anomaly Detection). Ο αλγόριθμος PCA (Principal Component Analysis) χρησιμοποιείται στο στάδιο της προεπεξεργασίας των δεδομένων καθώς και στο τελικό στάδιο της εξαγωγής συμπερασμάτων. Η παρουσίαση των αποτελεσμάτων πραγματοποιείται με εκτενή χρήση διαγραμματικών εργαλείων απεικόνισης που προσφέρει η πλατφόρμα.