
[lid] Lo strumento di ricerca SecureLoop identifica in modo efficiente progetti sicuri per hardware in grado di migliorare le prestazioni di attività di intelligenza artificiale complesse, richiedendo meno energia.
Con la proliferazione di applicazioni di apprendimento automatico ad alta intensità di calcolo, come i chatbot che eseguono la traduzione linguistica in tempo reale, i produttori di dispositivi spesso incorporano componenti hardware specializzati per spostare ed elaborare rapidamente le enormi quantità di dati richiesti da questi sistemi.
Scegliere il design migliore per questi componenti, noti come acceleratori di reti neurali profonde, è impegnativo perché possono avere una vasta gamma di opzioni di progettazione. Questo difficile problema diventa ancora più spinoso quando un progettista cerca di aggiungere operazioni crittografiche per mantenere i dati al sicuro dagli aggressori.
Ora, i ricercatori del MIT hanno sviluppato un motore di ricerca in grado di identificare in modo efficiente progetti ottimali per acceleratori di reti neurali profonde, che preservano la sicurezza dei dati aumentando al tempo stesso le prestazioni.
Il loro strumento di ricerca, noto come SecureLoop , è progettato per considerare in che modo l’aggiunta di misure di crittografia e autenticazione dei dati influirà sulle prestazioni e sul consumo energetico del chip acceleratore. Un ingegnere potrebbe utilizzare questo strumento per ottenere la progettazione ottimale di un acceleratore su misura per la propria rete neurale e il compito di apprendimento automatico.
Rispetto alle tecniche di pianificazione convenzionali che non considerano la sicurezza, SecureLoop può migliorare le prestazioni dei progetti di acceleratori mantenendo i dati protetti.
L’utilizzo di SecureLoop potrebbe aiutare un utente a migliorare la velocità e le prestazioni di applicazioni AI impegnative, come la guida autonoma o la classificazione delle immagini mediche, garantendo al tempo stesso che i dati sensibili degli utenti rimangano al sicuro da alcuni tipi di attacchi.
“Se sei interessato a fare un calcolo preservando la sicurezza dei dati, le regole che usavamo prima per trovare il progetto ottimale ora vengono infrante. Quindi tutta questa ottimizzazione deve essere personalizzata per questo nuovo e più complicato insieme di vincoli. E questo è ciò che [l’autore principale] Kyungmi ha fatto in questo articolo”, afferma Joel Emer, professore del MIT specializzato in informatica e ingegneria elettrica e coautore di un articolo su SecureLoop.
Emer è affiancato nell’articolo dall’autore principale Kyungmi Lee, uno studente laureato in ingegneria elettrica e informatica; Mengjia Yan, professore assistente per lo sviluppo della carriera di Homer A. Burnell di ingegneria elettrica e informatica e membro del Laboratorio di informatica e intelligenza artificiale (CSAIL); e l’autore senior Anantha Chandrakasan, preside della Scuola di Ingegneria del MIT e Professore di Ingegneria Elettrica e Informatica di Vannevar Bush. La ricerca sarà presentata al Simposio internazionale IEEE/ACM sulla microarchitettura.
“La comunità ha accettato passivamente che l’aggiunta di operazioni crittografiche a un acceleratore comporterà un sovraccarico. Pensavano che avrebbe introdotto solo una piccola variazione nello spazio di compromesso del design. Ma questo è un malinteso. In effetti, le operazioni crittografiche possono distorcere in modo significativo lo spazio di progettazione degli acceleratori ad alta efficienza energetica. Kyungmi ha fatto un lavoro fantastico identificando questo problema”, aggiunge Yan.
Accelerazione sicura
Una rete neurale profonda è costituita da molti strati di nodi interconnessi che elaborano i dati. In genere, l’output di uno strato diventa l’input dello strato successivo. I dati sono raggruppati in unità chiamate tessere per l’elaborazione e il trasferimento tra la memoria off-chip e l’acceleratore. Ogni livello della rete neurale può avere la propria configurazione di affiancamento dei dati.
Un acceleratore di rete neurale profonda è un processore con una serie di unità computazionali che parallelizza le operazioni, come la moltiplicazione, in ogni strato della rete. La pianificazione dell’acceleratore descrive il modo in cui i dati vengono spostati ed elaborati.
Poiché lo spazio su un chip acceleratore è limitato, la maggior parte dei dati viene archiviata nella memoria esterna al chip e recuperata dall’acceleratore quando necessario. Ma poiché i dati sono archiviati off-chip, sono vulnerabili a un utente malintenzionato che potrebbe rubare informazioni o modificare alcuni valori, causando il malfunzionamento della rete neurale.
“Come produttore di chip, non puoi garantire la sicurezza dei dispositivi esterni o dell’intero sistema operativo”, spiega Lee.
I produttori possono proteggere i dati aggiungendo la crittografia autenticata all’acceleratore. La crittografia codifica i dati utilizzando una chiave segreta. Quindi l’autenticazione taglia i dati in blocchi uniformi e assegna un hash crittografico a ciascun blocco di dati, che viene archiviato insieme al blocco di dati nella memoria esterna al chip.
Quando l’acceleratore recupera un blocco di dati crittografato, noto come blocco di autenticazione, utilizza una chiave segreta per recuperare e verificare i dati originali prima di elaborarli.
Ma le dimensioni dei blocchi di autenticazione e dei riquadri di dati non corrispondono, quindi potrebbero esserci più riquadri in un blocco oppure un riquadro potrebbe essere diviso tra due blocchi. L’acceleratore non può catturare arbitrariamente una frazione di un blocco di autenticazione, quindi potrebbe finire per catturare dati extra, che utilizzano energia aggiuntiva e rallentano il calcolo.
Inoltre, l’acceleratore deve comunque eseguire l’operazione crittografica su ciascun blocco di autenticazione, aggiungendo ulteriori costi computazionali.
Un motore di ricerca efficiente
Con SecureLoop, i ricercatori del MIT hanno cercato un metodo in grado di identificare il programma di accelerazione più veloce ed efficiente dal punto di vista energetico, uno che riduca al minimo il numero di volte in cui il dispositivo deve accedere alla memoria off-chip per acquisire blocchi extra di dati grazie alla crittografia e all’autenticazione.
SecureLoop è un motore di ricerca sviluppato dal MIT in grado di identificare un progetto ottimale per un acceleratore di rete neurale profonda che preservi la sicurezza dei dati migliorando al tempo stesso l’efficienza energetica e aumentando le prestazioni. Ciò potrebbe consentire ai produttori di dispositivi di aumentare la velocità delle impegnative applicazioni IA, garantendo al tempo stesso che i dati sensibili rimangano al sicuro dagli aggressori.
Hanno iniziato potenziando un motore di ricerca esistente sviluppato in precedenza da Emer e dai suoi collaboratori, chiamato Timeloop. Innanzitutto, hanno aggiunto un modello che potesse tenere conto dei calcoli aggiuntivi necessari per la crittografia e l’autenticazione.
Quindi, hanno riformulato il problema di ricerca in una semplice espressione matematica, che consente a SecureLoop di trovare la dimensione ideale del blocco autentico in un modo molto più efficiente rispetto alla ricerca tra tutte le opzioni possibili.
“A seconda di come assegni questo blocco, la quantità di traffico non necessario potrebbe aumentare o diminuire. Se assegni il blocco crittografico in modo intelligente, puoi recuperare solo una piccola quantità di dati aggiuntivi”, afferma Lee.
Infine, hanno incorporato una tecnica euristica che garantisce che SecureLoop identifichi una pianificazione che massimizza le prestazioni dell’intera rete neurale profonda, anziché di un solo livello.
Alla fine, il motore di ricerca genera un programma di accelerazione, che include la strategia di affiancamento dei dati e la dimensione dei blocchi di autenticazione, che fornisce la migliore velocità ed efficienza energetica possibili per una specifica rete neurale.
“Gli spazi di progettazione per questi acceleratori sono enormi. Ciò che Kyungmi ha fatto è stato trovare modi molto pragmatici per rendere trattabile quella ricerca in modo da poter trovare buone soluzioni senza dover cercare in modo esaustivo lo spazio”, afferma Emer.
Quando è stato testato in un simulatore, SecureLoop ha identificato pianificazioni fino al 33,2% più veloci e ha mostrato un prodotto di ritardo energetico migliore del 50,2% (un parametro correlato all’efficienza energetica) rispetto ad altri metodi che non prendevano in considerazione la sicurezza.
I ricercatori hanno utilizzato SecureLoop anche per esplorare come cambia lo spazio di progettazione degli acceleratori quando si considera la sicurezza. Hanno imparato che allocare un po’ più di area del chip per il motore crittografico e sacrificare un po’ di spazio per la memoria su chip può portare a prestazioni migliori, afferma Lee.
In futuro, i ricercatori vogliono utilizzare SecureLoop per trovare progetti di acceleratori resistenti agli attacchi del canale laterale, che si verificano quando un utente malintenzionato ha accesso all’hardware fisico. Ad esempio, un utente malintenzionato potrebbe monitorare il modello di consumo energetico di un dispositivo per ottenere informazioni segrete, anche se i dati sono stati crittografati. Stanno anche estendendo SecureLoop in modo che possa essere applicato ad altri tipi di calcolo.
Questo lavoro è finanziato, in parte, da Samsung Electronics e dalla Korea Foundation for Advanced Studies.
