Monitoring Incendiary Speech Online

Yiannis Konnaris
Jul 9, 2020
3 min read

Research Notes as part of the ongoing workings of the ON-OFF Project funded by the REC Programme of the EU.

In recent years a dominant rash of incendiary speech is bubbling to the surface of European societies, propagating xenophobia and intolerance towards others whilst deepening existing divisions and damaging social cohesion.

Most approaches in identifying and monitoring the various forms of hate speech over the internet have been focused and largely dependent on human analysts’ skills, including a number of noted practices such as Real time/Retrospective monitoring and mapping as well as Discourse and content analysis.

According to their methodology context, all these approaches aim to manually spot, read and classify suspected messages of Hate speech in order to enable a reaction for incidents as they occur, to serve as an early warning system for future incidents and to better interpret the hidden context and the ideological motivation behind their chosen vocabulary.

The potentially beneficial appliance of these practices is being restricted though by the fact that they are in their largest part labour – intensive and thus inadequate of processing large sets of data and messages in real time.

Considering the above, Interfusion considers a media-monitoring concept linked with programmatic activities, capable of primarily collecting and examining multi-lingual incidences of hate and dangerous speech in the EU’s online space by incorporating a two faced methodological approach that will:

i. At first rely on a manual human process in order to collect and categorize online content found in particular blogs, forums, online newspapers, Facebook and Twitter (tweets, status updates and comments, posts, and blog entries). The element of human input in this stage is considered vital for accurately reviewing local vernacular languages and local vocabulary that will enable the project team to create a database of inflammatory speech.

ii. Secondly, developing and applying automated techniques of Machine Learning (ML) and Natural Language Processing (NLP) that will have the capacity to use large databases of texts, statistical methods, and machine learning in order to identify patterns and trends in language use with the potential of processing massive amounts of data that can be collected through monitoring social media whilst operating in real time.

Παρακολούθηση της ρητορικής μίσους (μελλοντική ιδέα συγγραφής έργου)

Τα τελευταία χρόνια, ένα κυρίαρχο ρεύμα ρητορικής μίσους διοχετεύεται στην επιφάνεια των ευρωπαϊκών κοινωνιών, μεταδίδοντας αισθήματα ξενοφοβίας και μισαλλοδοξίας απέναντι σε άλλους ενώ ταυτόχρονα εμβαθύνει τις υφιστάμενες διαιρέσεις και καταστρέφει την κοινωνική συνοχή.

Οι περισσότερες προσεγγίσεις που αφορούν τον εντοπισμό και την παρακολούθηση των διαφόρων μορφών ρητορικής μίσους στο Διαδίκτυο έχουν επικεντρωθεί και εξαρτώνται σε μεγάλο βαθμό από τις ικανότητες αναλυτών, συμπεριλαμβανομένων και ορισμένων πρακτικών όπως η παρακολούθηση και χαρτογράφηση σε πραγματικό χρόνο / αναδρομικά, καθώς και η ανάλυση του λόγου και του περιεχομένου.

Σύμφωνα με το μεθοδολογικό τους πλαίσιο, όλες αυτές οι προσεγγίσεις αποσκοπούν στην αναγνώριση, ανάγνωση και ταξινόμηση των ύποπτων μηνυμάτων ρητορικής μίσους. Σκοπός αυτού είναι η έγκαιρη ανταπόκριση για περιστατικά που υφίστανται, η λειτουργία ενός συστήματος έγκαιρης προειδοποίησης για μελλοντικά περιστατικά και η όσο το δυνατόν καλύτερη ερμηνεία του πλαισίου και του ιδεολογικού κίνητρου πίσω από το επιλεγμένο λεξιλόγιο.

Η δυνητικά επωφελής χρήση αυτών των πρακτικών περιορίζεται από το γεγονός ότι είναι κατά το μεγαλύτερο μέρος τους ανθρωπογενής εργασία και επομένως ανεπαρκής στην επεξεργασία μεγάλου αριθμού δεδομένων και μηνυμάτων σε πραγματικό χρόνο.

Λαμβάνοντας υπόψη τα παραπάνω, η Interfusion εξετάζει μια μέθοδο παρακολούθησης των διαδικτυακών μέσων που συνδέεται με προγραμματικές δραστηριότητες, και η οποία είναι ικανή να συλλέγει και να εξετάζει πολυγλωσσικές ενδείξεις ρητορικής μίσους και επικίνδυνης ομιλίας στον διαδικτυακό χώρο της ΕΕ, ενσωματώνοντας μια διεπιστημονική μεθοδολογική προσέγγιση που:

i. Αρχικά, βασίζετε σε μια ανθρωπογενή διαδικασία, συλλογής και κατηγοριοποίησης διαδικτυακού περιεχομένου που βρίσκεται σε συγκεκριμένα, φόρουμ, ηλεκτρονικές εφημερίδες, πλατφόρμες διαδικτυακής σύνδεσης όπως Facebook και Twitter (tweets, ενημερώσεις κατάστασης και σχόλια, αναρτήσεις και καταχωρήσεις). Το στοιχείο της ανθρώπινης συνεισφοράς σε αυτό το στάδιο θεωρείται ζωτικής σημασίας για την ακριβή ανασκόπηση του λεξιλογίου που εξετάζεται και το οποίο θα επιτρέψει στην ομάδα του έργου να δημιουργήσει μια βάση δεδομένων που σχετίζονται με την ρητορική μίσους.

ii. Δεύτερον, ανάπτυξη και εφαρμογή αυτοματοποιημένων τεχνικών Μηχανικής Μάθησης (ML) και Επεξεργασίας Φυσικής Γλώσσας (NLP) που θα έχουν την ικανότητα να χρησιμοποιούν μεγάλες βάσεις δεδομένων κειμένων, στατιστικών μεθόδων και μηχανικής εκμάθησης, προκειμένου να εντοπίζουν τα πρότυπα και τις τάσεις στη χρήση της γλώσσας με την προοπτική επεξεργασίας μεγάλων ποσοτήτων δεδομένων που μπορούν να συλλεχθούν διαμέσου της παρακολούθησης κοινωνικών μέσων μαζικής επικοινωνίας, λειτουργόντας σε πραγματικό χρόνο.

Monitoring Incendiary Speech Online

Παρακολούθηση της ρητορικής μίσους (μελλοντική ιδέα συγγραφής έργου)

Recent Posts

Comments