dc.contributor.advisor | Κατάκης, Ιωάννης | |
dc.contributor.author | Αγαθαγγέλου, Παντελής | |
dc.contributor.other | Agathangelou, Pantelis | |
dc.coverage.spatial | Κύπρος | el_GR |
dc.date.accessioned | 2013-06-26 | |
dc.date.accessioned | 2013-06-26T11:22:45Z | |
dc.date.available | 2013-06-26T11:22:45Z | |
dc.date.copyright | 2013-06 | |
dc.date.issued | 2013-06-26 | |
dc.identifier.other | ΠΛΗ/2013/00082 | el_GR |
dc.identifier.uri | http://hdl.handle.net/11128/1194 | |
dc.description | Περιέχει βιβλιογραφικές παραπομπές. | el_GR |
dc.description.abstract | Κύριος στόχος της διπλωματικής είναι η εξόρυξη λέξεων γνώμης και της αντίστοιχης πολικότητας τους μέσα από κείμενο που περιλαμβάνει γνώμες. Για το σκοπό αυτό επιστρατεύτηκαν μεθοδολογίες ανάλυσης κειμένου και πρότυπα, ώστε ο αλγόριθμος που σχεδιάστηκε να αναγνωρίζει λέξεις γνώμης και να κατατάσσει την πολικότητα τους ανάλογα με το συναίσθημα που αυτές εκφράζουν μέσα σε μία πρόταση.
Συγκεκριμένα για την επίτευξη των παραπάνω στόχων ο αλγόριθμος που σχεδιάστηκε χρησιμοποιεί μεθοδολογίες τόσο επιβλεπόμενης όσο και μη επιβλεπόμενης μάθησης έτσι όπως αυτές ορίζονται μέσα από τα κείμενα της βιβλιογραφίας. Ο αλγόριθμος που προτείνεται αναπτύσσεται σε τρία στάδια. Αρχικά εφαρμόζεται μια μεθοδολογία επιβλεπόμενης μάθησης κατά την οποία τροφοδοτείται με λέξεις γνώμης γνωστής πολικότητας, καθώς και γραμματικές και συντακτικές σταθερές οι οποίες θα αποτελέσουν τους κανόνες και τα πρότυπα μάθησης. Στο δεύτερο στάδιο (ημί – επιβλεπόμενη μάθηση) εξορύσσονται νέες λέξεις γνώμης στηριζόμενοι στη συνέπεια συναισθήματος έτσι όπως αυτή ορίζεται από λέξεις γνώμης και λέξεις συνδέσεως μέσα στο κείμενο. Στο τρίτο στάδιο (Μη επιβλεπόμενη μάθηση) ο αλγόριθμος χρησιμοποιεί τη μέθοδο της διπλής διάδοσης για την εύρεση νέων λέξεων γνώμης, ενώ δίνεται η δυνατότητα μέσω φιλτραρίσματος να ενισχυθούν οι πραγματικές από τις άσχετες λέξεις.
Τέλος μελετήθηκαν τα πλεονεκτήματα και τα μειονεκτήματα των παραπάνω προσεγγίσεων. Έγινε χρήση κατάλληλων μετρικών για την αξιολόγηση του προτασσόμενου αλγορίθμου, ενώ τα δεδομένα για τη διεξαγωγή των συμπερασμάτων λήφθηκαν από συλλογή γνωμών από γνωστό ελληνικό κατάστημα δια-δικτυακής πώλησης ηλεκτρονικών συσκευών. | el_GR |
dc.format.extent | vi, 121 σ. εικ., 30 εκ. | el_GR |
dc.language | gr | el_GR |
dc.language.iso | gr | el_GR |
dc.subject | Λεξικά όρων γνώμης | el_GR |
dc.title | Εξόρυξη λεξικού όρων γνώμης απο αξιολογήσεις χρηστών | el_GR |
dc.type | Μεταπτυχιακή Διατριβή | el_GR |
dc.description.translatedabstract | The main goals of the present M.Sc. dissertation can be accumulated as the effort of mining opinion words and their polarity in an opinion document. In order to achieve these goals, there have been gathered various methodologies including rules of artificial learning and patterns as well. A suitable algorithm designed in order to recognize opinion words and stream their polarity according to the emotion used by an opinion writer to the opinion word in a sentence.
Specifically in order to attain the above mentioned goals, the designed algorithm makes use of supervised and un-supervised learning methodologies. The opinion words exploration is based upon three steps. Initially a method of supervising learning is applied. At that step the algorithm is supplied with a list of opinion words of known polarity. A set of grammatical and syntactic patterns will constitute the rules of learning during the exploration steps. At the second step (a semi – supervised method) new opinion words are discovered based on sentiment consistency and conjunction words. At the third step (un – supervised) the algorithm makes use of the double propagation method for the exploration of new opinion words. Moreover, a mechanism of filtering these words empowers the separation of true opinion words form irrelative ones.
Lastly, the advantages and disadvantages of the proposed approach were studied. To evaluate the proposed algorithm we exploited well-known evaluation metrics and utilized a set of opinions extracted from a Greek e-shop with electronic devises. | el_GR |
dc.format.type | pdf | el_GR |