Francesco Delogu

UniCa Ateneo Docenti e ricercatori Francesco Delogu Ricerca Prodotti della Ricerca (IRIS)

Francesco Delogu

On the robustness of adversarial training against uncertainty attacks

Ledda, Emanuele^Primo;Scodeller, Giovanni;Angioni, Daniele;Piras, Giorgio;Cinà, Antonio Emanuele;Fumera, Giorgio;Biggio, Battista;Roli, Fabio^Ultimo

2026-01-01

Abstract

In learning problems, the noise inherent to the task at hand hinders the possibility to infer without a certain degree of uncertainty. Quantifying this uncertainty, regardless of its wide use, assumes high relevance for security-sensitive applications. Within these scenarios, it becomes fundamental to guarantee good (i.e., trustworthy) uncertainty measures, which downstream modules can securely employ to drive the final decision-making process. However, an attacker may be interested in forcing the system to produce either (i) highly uncertain outputs jeopardizing the system’s availability or (ii) low uncertainty estimates, making the system accept uncertain samples that would instead require a careful inspection (e.g., human intervention). Therefore, it becomes fundamental to understand how to obtain robust uncertainty estimates against these kinds of attacks. In this work, we reveal both empirically and theoretically that defending against adversarial examples, i.e., carefully perturbed samples that cause misclassification, additionally guarantees a more secure, trustworthy uncertainty estimate under common attack scenarios without the need for an ad-hoc defense strategy. To support our claims, we evaluate multiple adversarial-robust classification models from the publicly available benchmark RobustBench on the CIFAR-10 and ImageNet datasets, and on a robust semantic segmentation model evaluated on Pascal-VOC. The code for the reproducibility of the experiments is available at the following link:https://github.com/pralab/UncertaintyAdversarialRobustness.

Scheda breve

Scheda completa

Scheda completa (DC)

         Anno di pubblicazione 
       
        2026 
       
         Anno di prima pubblicazione on line 
       
        2025 
       
         Lingua/e 
       
        Inglese 
       
         Titolo della Rivista 
       
        PATTERN RECOGNITION 
       
         Volume 
       
        172 
       
         Article Number 
       
        112519 
       
         Da pagina 
       
        1 
       
         A pagina 
       
        13 
       
         Numero di pagine 
       
        13 
       
         Codice DOI 
       
        https://dx.doi.org/10.1016/j.patcog.2025.112519 
       
         Codice UT ISI 
       
        WOS:001598819400001 
       
         Codice Scopus 
       
        2-s2.0-105018576614 
       
         Referee 
       
        Esperti anonimi 
       
         Rilevanza della rivista 
       
        internazionale 
       
         Caratterizzazione prevalente 
       
        scientifica 
       
         Parole chiave 
       
        Uncertainty quantification; Adversarial machine learning; Neural networks 
       
         Presenza di coautori internazionali 
       
        no 
       
         Tutti gli autori 
       
        Ledda, Emanuele; Scodeller, Giovanni; Angioni, Daniele; Piras, Giorgio; Cinà, Antonio Emanuele; Fumera, Giorgio; Biggio, Battista; Roli, Fabio
        ...espandi 
         
         Tipologia 
       
        1.1 Articolo in rivista 
       
         Tipologia 
       
        info:eu-repo/semantics/article 
       
         Tipologia 
       
        1 Contributo su Rivista::1.1 Articolo in rivista 
       
         Tipologia sito docente 
       
        262 
       
         Numero autori 
       
        8 
       
         Fulltext 
       
        partially_open 
       
         Titolo del progetto 
       
           Titolo Progetto  European Lighthouse on Secure and Safe AI 
         
           Acronimo  ELSA 
         
           Nome finanziatore  European Commission 
         
           Finanziamento  Horizon Europe Framework Programme 
         
           N. Contratto  101070617 
         
           Titolo Progetto  A COMPREHENSIVE TRUSTWORTHY FRAMEWORK FOR CONNECTED MACHINE LEARNING AND SECURE INTERCONNECTED AI SOLUTIONS 
         
           Acronimo  CoEvolution 
         
           Nome finanziatore  European Commission 
         
           Finanziamento  Horizon Europe Framework Programme 
         
           N. Contratto  101168560 
         
         Tipologia: 
       
        1.1 Articolo in rivista

File in questo prodotto:

File	Dimensione	Formato
1-s2.0-S0031320325011823-main.pdf accesso aperto Tipologia: versione editoriale (VoR) Dimensione 7.16 MB Formato Adobe PDF Visualizza/Apri	7.16 MB	Adobe PDF	Visualizza/Apri
2410.21952v2.pdf Solo gestori archivio Tipologia: versione pre-print Dimensione 973.15 kB Formato Adobe PDF Visualizza/Apri Richiedi una copia	973.15 kB	Adobe PDF	Visualizza/Apri Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Università degli Studi di Cagliari

Università degli Studi di Cagliari