Εφαρμογή υπαρχόντων αλγορίθμων συστάσεων, σε εκπαιδευτικά σύνολα δεδομένων, απο αποθετήρια μαθησιακών αντικειμένων
Abstract
Τα συστήματα συστάσεων στο διαδίκτυο, έχουν ως στόχο τη συλλογή των πληροφοριών, που θα αποτυπώσουν τις προτιμήσεις του εκάστοτε χρήστη και θα του προσφέρουν την ιδανικότερη για αυτόν σύσταση. Μελετήθηκε ο τομέας των συστημάτων συστάσεων στην εκπαίδευση. Κάθε σύστημα σύστασης στηρίζεται σε έναν αλγόριθμο, ο οποίος λαμβάνει ως είσοδο, δεδομένα και προτιμήσεις του χρήστη και παράγει την ιδανικότερη για αυτόν σύσταση. Αυτό που προσπαθεί να επιτύχει το κάθε σύστημα σύστασης, είναι η σειρά των αποτελεσμάτων που θα παράξει, να έχει άμεση σχέση και συνάφεια, με αυτό που ζήτησε ο χρήστης.
Η παρούσα διπλωματική εργασία επιχειρεί μια εμβάθυνση στο τομέα των συστάσεων, μέσα από βιβλιογραφική ανασκόπηση και παράλληλα γίνεται μία προσπάθεια παρουσίασης, των τεχνικών που χρησιμοποιούνται για να συσταθούν τα συστήματα, στα οποία αναπτύσσονται. Γίνεται μια ανάλυση τριών κατηγοριών αλγορίθμων συστάσεων, των αλγορίθμων συστάσεων που εστιάζουν στο περιεχόμενο, των αλγορίθμων συνεργατικών φίλτρων και των αλγορίθμων συστάσεων ανάλυσης γράφων.
Παρουσιάζεται μια πλήρης περιγραφή των εκπαιδευτικών συνόλων δεδομένων, στα οποία εφαρμόζονται οι αλγορίθμοι συστάσεων. Μελετήθηκε η μορφή τους καθώς και ο τρόπος με τον οποίο συλλέγονται οι πληροφορίες που τα απαρτίζουν. Αναλύθηκαν οι μέθοδοι με τις οποίες αυτά διαχωρίζονται και διαιρούνται σε κλάσεις και στην συνέχεια πως επεξεργάζονται.
Χρησιμοποιήθηκε το λογισμικό recommender101, για την εφαρμογή των αλγορίθμων στα σύνολα δεδομένων MovieLens 100K, 1M, 10M, και για τη εξαγωγή των αποτελεσμάτων. Οι αλγόριθμοι που επιλέχθηκαν ώστε να αξιολογηθούν είναι ο Κ-ΝΝ, Slope One, Funk SVD, BPRMF Naïve Bayes.
Η εκτέλεση τους, σε διαφορετικά σύνολα δεδομένων, η δομή και το περιεχόμενο των οποίων περιγράφεται αναλυτικά στην εργασία, απέδειξε ότι οι γράφοι ανήκουν στην κατηγορία εκείνη των αλγορίθμων που σημειώνουν τα μεγαλύτερα ποσοστά. Παρουσίασαν διακυμάνσεις στην επίδοσή τους γεγονός το οποίο οφείλεται στα ιδιαίτερα χαρακτηριστικά των συνόλων δεδομένων. Αξιολογήθηκαν διάφορες μετρικές, από τα αποτελέσματα του κάθε αλγορίθμου, πάνω σε διαφορετικά σύνολα δεδομένων, για να γίνουν γνωστές οι συνθήκες υπό τις οποίες λειτουργούν καλύτερα.