FaceWallGrap: Χρήση Machine Learning για παρακολούθηση και συλλογή πληροφοριών από το Facebook
Abstract
Η επικοινωνία μεταξύ των ανθρώπων έχει γίνει πολύ πιο εύκολη με την χρήση των κοινωνικών μέσων δικτύωσης. Σε ένα πλανήτη με 2 δισεκατομμύρια ανθρώπους όπου ένα μεγάλο ποσοστό είναι ενεργοί χρήστες στα μέσα κοινωνικής δικτύωσης και κυρίως στο Facebook. Τα μέσα κοινωνικής δικτύωσης αποτελούν βασικό ρόλο στον τρόπο της επικοινωνίας μεταξύ των χρηστών αλλά και την έκφραση συναισθημάτων μέσα από τα μέσα κοινωνικής δικτύωσης. Η άμεση επικοινωνία που έχουν οι χρήστες καθημερινά αποτελεί ένα τεράστιο όγκο πληροφορίων που ανταλλάζονται με τις πλατφόρμες κοινωνικής δικτύωσης. Αναπόφευκτα η χρήση των μέσων κοινωνικής δικτυώσεις οδηγεί τους χρήστες στην αποκάλυψη των προσωπικών τους δεδομένων αφού είναι απαραίτητα για την δημιουργία λογαριασμού στην οποιαδήποτε πλατφόρμα. Επιπλέων για τις εταιρίες που ασχολούνται με National Security οι πληροφορίες από τα profiles των χρηστών, όπου μπορούν να χρησιμοποιηθούν για να αποτρέψουν insider threats. Με αφορμή του μεγάλου όγκου πληροφοριών που προσφέρονται από τους χρήστες του Facebook παρέχοντας τα προσωπικά τους στοιχεία αλλά και το πώς εκφράζονται μέσα από τα μέσα κοινωνικής δικτύωσης, θέτουμε το ερευνητικό ερώτημα της άντλησης των πληροφοριών με αυτοματοποιημένο και μη ανιχνεύσιμο τρόπο όπου θα συμβάλει στην βοήθεια εταιριών που ασχολούνται με National Security να μαζέψουν τις πληροφορίες που χρειάζονται.
Στην απάντηση του παραπάνω ερευνητικού ερωτήματος, η παρούσα διατριβή πραγματοποιεί την άντληση πληροφοριών με ένα web crawler για OSINT, από το δημοφιλή μέσο κοινωνικής δικτύωσης, Facebook. Επιπλέων δημιουργώντας μια βάση δεδομένων με τα στοιχεία που θα συλλεχθούν από την πλατφόρμα κοινωνικής δικτύωσης που επιλέξαμε αναπτύσσεται μια μέθοδος με την οποία δημιουργείται μια learning machine για να μπορούν κάποιες λέξεις να φιλτράρονται. Οι λέξεις που φιλτράρονται χρησιμοποιούνται για ένα και μόνο σκοπό, να καταλάβουμε την ψυχολογία του χρήστη. Επίσης, τα αποτελέσματα δείχνουν ότι ο τρόπος χρήσης του Facebook μπορεί να αποτελέσει αντικείμενο εκμετάλλευσης αφού παρέχονται ευάλωτα προσωπικά δεδομένα των χρηστών (φωτογραφίες, τοποθεσίες και συναισθήματα χρηστών). Τέλος, αξίζει ότι οι εταιρίες National Security θα ήθελαν να γνωρίζουν την ψυχολογία των χρηστών. Τα αποτελέσματα για τις εναλλαγές της ψυχοσύνθεσης τους σε διάφορες χρονικές περιόδους παρουσιάζονται σε Ngrams γραφήματα και μπορούν να χρησιμοποιηθούν για πρόληψη από Insider Threats.