Stefania Cataudella

UniCa Ateneo Docenti e ricercatori Stefania Cataudella Ricerca Prodotti della Ricerca (IRIS)

Stefania Cataudella

Resources and benchmark corpora for hate speech detection: a systematic review

Poletto Fabio;Basile Valerio;Sanguinetti Manuela;Bosco Cristina;Patti Viviana

2021-01-01

Abstract

Hate Speech in social media is a complex phenomenon, whose detection has recently gained significant traction in the Natural Language Processing community, as attested by several recent review works. Annotated corpora and benchmarks are key resources, considering the vast number of supervised approaches that have been proposed. Lexica play an important role as well for the development of hate speech detection systems. In this review, we systematically analyze the resources made available by the community at large, including their development methodology, topical focus, language coverage, and other factors. The results of our analysis highlight a heterogeneous, growing landscape, marked by several issues and venues for improvement.

Scheda breve

Scheda completa

Scheda completa (DC)

         Anno di pubblicazione 
       
        2021 
       
         Anno di prima pubblicazione on line 
       
        2020 
       
         Lingua/e 
       
        Inglese 
       
         Titolo della Rivista 
       
        LANGUAGE RESOURCES AND EVALUATION 
       
         Volume 
       
        55 
       
         Da pagina 
       
        477 
       
         A pagina 
       
        523 
       
         Numero di pagine 
       
        47 
       
         Codice DOI 
       
        https://dx.doi.org/10.1007/s10579-020-09502-8 
       
         Codice UT ISI 
       
        WOS:000573743500001 
       
         Codice Scopus 
       
        2-s2.0-85091728772 
       
         URL 
       
        https://link.springer.com/article/10.1007/s10579-020-09502-8 
       
         Referee 
       
        Esperti anonimi 
       
         Rilevanza della rivista 
       
        internazionale 
       
         Caratterizzazione prevalente 
       
        scientifica 
       
         Parole chiave 
       
        Hate speech detection,;Benchmark corpora; Natural Language Processing shared tasks; Systematic review 
       
         Presenza di coautori internazionali 
       
        no 
       
         Tutti gli autori 
       
        Poletto, Fabio; Basile, Valerio; Sanguinetti, Manuela; Bosco, Cristina; Patti, Viviana
         
         Tipologia 
       
        1.1 Articolo in rivista 
       
         Tipologia 
       
        info:eu-repo/semantics/article 
       
         Tipologia 
       
        1 Contributo su Rivista::1.1 Articolo in rivista 
       
         Tipologia sito docente 
       
        262 
       
         Numero autori 
       
        5 
       
         Fulltext 
       
        open 
       
         Tipologia: 
       
        1.1 Articolo in rivista

File in questo prodotto:

File	Dimensione	Formato
lrev2021_hs.pdf accesso aperto Descrizione: articolo online Tipologia: versione editoriale (VoR) Dimensione 590.84 kB Formato Adobe PDF Visualizza/Apri	590.84 kB	Adobe PDF	Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Università degli Studi di Cagliari

Università degli Studi di Cagliari