Δημιουργία συνόλων από δεδομένα για χρήση αξιολόγησης αλγορίθμων ταύτισης αντικειμένων
Abstract
Το πρόβλημα της ταυτοποίησης αντικειμένων συνεχίζει να προβληματίζει την ερευνητική κοινότητα. Με την ραγδαία εξάπλωση του διαδικτύου δεν μπορεί να ελεγχτεί η καταχώρηση πληροφοριών σε βάσεις δεδομένων με αποτέλεσμα την δημιουργία εγγραφών που αναφέρονται είτε το ίδιο πρόσωπο, είτε στην ίδια ταινία, είτε στο ίδιο άρθρο κτλ. αλλά με διαφορετικό τρόπο. Αυτός είναι και ο ορισμός της ταυτοποίησης αντικειμένων. Πολλοί ερευνητές έχουν δημιουργήσει αλγόριθμους με σκοπό την ταύτιση αντικειμένων. Το πρόβλημα όμως είαι η έλλειψη συνόλων από δεδομένα για την αξιολόγηση αλγορίθμων ταύτισης αντικειμένων. Αρχικά έγινε ο καθορισμός των οικογενειών των συνόλων δεδομένων και στη συνέχεια δημιουργήθηκαν. Χρησιμοποιήθηκαν δεδομένα και ιδιότητες που συνήθως χρησιμοποιούνται στην ερευνητική κοινότητα. Η κάθε οικογένεια περιέχει συλλογές όπου κάθε μια διαφέρει σε κάποιες παραμέτρους ή στον αριθμό των παρατηρήσεων, έτσι ώστε να υπάρχουν σύνολα δεδομένων που μπορούν καλύπτουν ευρέως την αξιολόγηση ενός αλγορίθμου ταύτισης αντικειμένων.