Έρευνα αλγορίθμων και προσεγγίσεων εξόρυξης βιοϊατρικών δεδεμένων.
Abstract
Στις μέρες μας, η ιατρική βιομηχανία εξελίσσεται ραγδαία, με αποτέλεσμα την συντριπτική αύξηση του όγκου δεδομένων που παράγονται και αποθηκεύονται καθημερινά στα υποστατικά υγείας. Ο όγκος δεδομένων που παράγεται, απαιτείται να επεξεργάζεται κατάλληλα έτσι ώστε να μην είναι αχρείαστος και η επεξεργασία στην οποία πρέπει να υπόκειται, θα πρέπει να παράγει χρήσιμες πληροφορίες για την μελέτη, πρόγνωση και θεραπεία ασθενειών που αφορούν την βιοϊατρική και τον κλάδο της υγείας. Η επεξεργασία ιατρικών δεδομένων, όπως είναι οι ιατρικές εικόνες, τα αποτελέσματα ιατρικών εξετάσεων και τα χαρακτηριστικά των ασθενών, γίνεται εξαιρετικά δύσκολη, λόγω του τεράστιου όγκου και των σχέσεων αλληλοεξάρτησης μεταξύ των ιατρικών δεδομένων, που είναι πολύ δύσκολο να εντοπιστούν λόγω της μεγάλης πολυπλοκότητας τους. Στόχος είναι η εξεύρεση λύσεων αλλά και βελτίωση των υφιστάμενων λύσεων διαχείρισης δεδομένων για να επιτύχουμε σωστή οργάνωση, αποθήκευση, ανάκτηση και προσθαφαίρεση των ιατρικών δεδομένων που παράγονται καθημερινά.
Αυτή τη δυσκολία στην επεξεργασία, στην αναζήτηση και εύρεση των βιοϊατρικών δεδομένων και των μεταξύ τους σχέσεων, καλείται να λύσει η εξόρυξη βιοϊτρικών δεδομένων (Biomedical Data Mining), που πρόκειται για ένα νέο επιστημονικό/ερευνητικό πεδίο, το οποίο επικεντρώνεται στην μελέτη, ανάλυση δεδομένων και εξαγωγής συμπερασμάτων, μέσω της ανακάλυψης προτύπων, μοντέλων και αλγορίθμων που θα χρησιμοποιηθούν από τους επιστήμονες στον τομέα της υγείας για την καλύτερη διάγνωση, πρόληψη και θεραπεία νόσων καθώς η γνώση που θα παραχθεί θα είναι σημαντική και για την ανάπτυξη φαρμάκων. Στόχος της εξόρυξης δεδομένων είναι η ανακάλυψη προτύπων και αλγορίθμων που θα χρησιμοποιηθούν για την ανακάλυψη και επαλήθευση ιατρικών μεθόδων από τους επαγγελματίες πληροφορικής και υγείας.
Σημαντικό και αναπόσπαστο κομμάτι της Εξόρυξης Βιοϊατρικών Δεδομένων αποτελεί η επεξεργασία Ιατρικών Εικόνων (πχ Μαγνητική Τομογραφία-MRI)και η αποκωδικοποίησή τους. Η εξόρυξη νέας πληροφορίας από τις εικόνες, αποτελεί, μία δύσκολη και παράλληλα σύνθετη διαδικασία, η οποία επιφέρει φυσικά τεράστια αποτελέσματα αφού μπορεί να αποκαλύψει νέα μοτίβα και συμπεριφορές που υπάρχουν στα δεδομένα και η ανακάλυψη αυτή μπορεί να αναβαθμίσει την ποιότητα της έρευνας αλλά και της περίθαλψης των ασθενών, και κατ’ επέκταση φυσικά την αναβάθμιση της ποιότητας της ανθρώπινης ζωής.
Η παρούσα διατριβή αναμένεται να παρουσιάσει, να επεξηγήσει και να αξιολογήσει αλγορίθμους και έρευνες, μεθόδους και προσεγγίσεις εξόρυξης βιοιατρικών δεδομένων και να τονίσει την σημαντικότητα ύπαρξης, ανάπτυξης αλλά και εξέλιξης της ύπαρξης συστημάτων διαχείρισης των δεδομένων αυτών. Η σύγκριση αλγορίθμων που θα ακολουθήσει στο παρόν έγγραφο, θα διασαφηνίσει τον ρόλο, την προσέγγιση, την λειτουργία αλλά και τον σκοπό χρήσης του κάθε αλγορίθμου ξεχωριστά.
Λέξεις Κλειδιά: Εξόρυξη Βιοϊατρικών Δεδομένων (Data Mining), Classification, Classification Αlgorithms, Δέντρα Απόφασης (Decision Trees), KNN Algorithm, Neural Networks, Bayesian Ταξινομητές, Πλατφόρμες Ανοικτού Λογισμικού, Επιλογή Χαρακτηριστικών, Τεχνικές και Μέθοδοι Αξιολόγησης, Accuracy, Κάππα (K) Στατιστικά, Confusion Matrix, F-Measure, Sensitivity, Specificity, Error Rates