Απόκρυψη κανόνων συσχέτισης (Association Rule Hiding) με τεχνικές αναδόμησης βάσης δεδομένων
Προβολή/ Άνοιγμα
Ημερομηνία
2013-06-26Συγγραφέας
Μουμούρης, Ιωάννης
Μεταδεδομένα
Εμφάνιση πλήρους εγγραφήςΕπιτομή
Από τη στιγμή της γέννησής της, η διατήρηση της ιδιωτικότητας κατά την εξόρυξη δεδομένων
είναι ένα πολύ ενεργό και ενδιαφέρον πεδίο έρευνας στην ευρύτερη περιοχή του Data Mining,
που επικεντρώνεται στην διερεύνηση εκείνων των συνεπειών και παρενεργειών της
υπάρχουσας τεχνολογίας του Data Mining, οι οποίες πηγάζουν από την διείσδυση στην
ιδιωτικότητα προσώπων και οργανισμών. Η απόκρυψη των κανόνων συσχέτισης, αποτελεί
προφανώς ένα από τα επί μέρους προβλήματα που συναντώνται σ’ αυτήν ακριβώς την
επιστημονική περιοχή (της διατήρησης της ιδιωτικότητας κατά την εξόρυξη δεδομένων), για την
επίλυση του οποίου έχουν προταθεί μέχρι σήμερα διάφορες τεχνικές.
Σκοπός της διατριβής, είναι η συγκριτική μελέτη ορισμένων τεχνικών που έχουν προταθεί για
την επίλυση του προβλήματος της απόκρυψης των κανόνων συσχέτισης, οι οποίες στηρίζονται
στην μέθοδο της Αναδόμησης της Βάσης Δεδομένων, αλλά και η πρόταση νέων βελτιωμένων
τεχνικών με βάση πάντα την Αναδόμηση της Βάσης Δεδομένων.
Για την επίτευξη του παραπάνω στόχου, αφού μελετήθηκαν αρκετές τεχνικές, επιλέχθηκαν δύο
που έχουν παρουσιασθεί αρκετά πρόσφατα, οι οποίες αφού μελετήθηκαν αναλυτικά,
εντοπίσθηκαν τα προβλήματα και οι αδυναμίες του και στη συνέχεια οι βελτιωμένοι αλγόριθμοι
που προτείνουμε, υλοποιήθηκαν στην γλώσσα προγραμματισμού R και δοκιμάσθηκαν σε
αρκετά σύνολα συναλλαγών, ώστε να παραχθούν όσο το δυνατόν πιο αντιπροσωπευτικά
αποτελέσματα και να εξαχθούν πιο αξιόπιστα αποτελέσματα.
Επίσης, ακριβώς λόγω της μεγάλης πολυπλοκότητας των διαφόρων τεχνικών, είναι πολύ
σημαντικό να υπάρξει ένα εργαλείο που θα δίνει στον χρήστη την δυνατότητα να αξιολογήσει τις
διάφορες τεχνικές σε σχέση με την ακρίβεια των αποτελεσμάτων αλλά και την πολυπλοκότητά
τους, ώστε να είναι σε θέση να επιλέξει αυτήν που ταιριάζει καλύτερα στις δικές του ανάγκες
κάθε φορά.