
[lid] Justin Solomon applica moderne tecniche geometriche per risolvere problemi di visione artificiale, apprendimento automatico, statistica e altro ancora.
Più di 2000 anni fa, il matematico greco Euclide, noto a molti come il padre della geometria, cambiò il modo in cui pensiamo alle forme.
Basandosi su quelle antiche basi e su millenni di progresso matematico, Justin Solomon utilizza moderne tecniche geometriche per risolvere problemi spinosi che spesso sembrano non avere nulla a che fare con le forme.
Ad esempio, forse uno statistico vuole confrontare due set di dati per vedere come l’utilizzo di uno per l’addestramento e l’altro per i test potrebbe influire sulle prestazioni di un modello di apprendimento automatico.
Il contenuto di questi set di dati potrebbe condividere alcune strutture geometriche a seconda di come i dati sono disposti nello spazio ad alta dimensione, spiega Solomon, professore associato presso il Dipartimento di Ingegneria Elettrica e Informatica (EECS) del MIT e membro del Computer Science and Laboratorio di Intelligenza Artificiale (CSAIL). Confrontandoli utilizzando strumenti geometrici è possibile comprendere, ad esempio, se lo stesso modello funzionerà su entrambi i set di dati.
“Il linguaggio che usiamo per parlare di dati spesso implica distanze, somiglianze, curvatura e forma, esattamente il tipo di cose di cui parliamo da sempre in geometria. Quindi, i geometri hanno molto da offrire ai problemi astratti nella scienza dei dati”, afferma.
L’ampiezza dei problemi che è possibile risolvere utilizzando le tecniche geometriche è la ragione per cui Solomon ha dato al suo gruppo di elaborazione dati geometrici un nome “intenzionalmente ambiguo”.
Circa la metà del suo team lavora su problemi che coinvolgono l’elaborazione di dati geometrici bi e tridimensionali, come l’allineamento delle scansioni di organi 3D nell’imaging medico o l’abilitazione dei veicoli autonomi a identificare i pedoni nei dati spaziali raccolti dai sensori LiDAR.
Il resto conduce ricerche statistiche ad alta dimensione utilizzando strumenti geometrici, in modo da costruire modelli di intelligenza artificiale generativa migliori. Ad esempio, questi modelli imparano a creare nuove immagini campionando alcune parti di un set di dati riempito con immagini di esempio. Mappare lo spazio delle immagini è, in sostanza, un problema geometrico.
“Gli algoritmi che abbiamo sviluppato per mirare alle applicazioni nell’animazione al computer sono quasi direttamente rilevanti per l’intelligenza artificiale generativa e le attività di probabilità che sono popolari oggi”, aggiunge Solomon.
Un precoce interesse per la computer grafica ha avviato Solomon nel suo viaggio per diventare professore del MIT.
Essendo uno studente delle superiori con una mentalità matematica cresciuto nel nord della Virginia, ha avuto l’opportunità di fare uno stage in un laboratorio di ricerca fuori Washington, dove ha contribuito a sviluppare algoritmi per il riconoscimento facciale 3D.
Quell’esperienza lo ha ispirato a conseguire una doppia specializzazione in matematica e informatica presso l’Università di Stanford, ed è arrivato al campus desideroso di immergersi in più progetti di ricerca. Ricorda di aver partecipato alla fiera del lavoro del campus al primo anno e di essersi fatto strada per uno stage estivo presso i Pixar Animation Studios.
“Alla fine hanno ceduto e mi hanno concesso un’intervista”, ricorda.
Ha lavorato alla Pixar ogni estate durante il college e la scuola di specializzazione. Lì si è concentrato sulla simulazione fisica di tessuti e fluidi per migliorare il realismo dei film d’animazione, nonché sulle tecniche di rendering per modificare il “look” dei contenuti animati.
“La grafica è davvero divertente. È guidato dal contenuto visivo, ma oltre a ciò presenta sfide matematiche uniche che lo distinguono da altre parti dell’informatica”, afferma Solomon.
Dopo aver deciso di avviare una carriera accademica, Solomon rimase a Stanford per conseguire un dottorato di ricerca in informatica. Come studente laureato, alla fine si concentrò su un problema noto come trasporto ottimale, in cui si cerca di spostare una distribuzione di un elemento in un’altra distribuzione nel modo più efficiente possibile.
Ad esempio, forse qualcuno vuole trovare il modo più economico per spedire sacchi di farina da un insieme di produttori a un insieme di panifici sparsi in una città. Più lontano si spedisce la farina, più costa; il trasporto ottimale ricerca il costo minimo per la spedizione.
“La mia attenzione era originariamente limitata alle sole applicazioni di computer grafica con trasporto ottimale, ma la ricerca è decollata in altre direzioni e applicazioni, il che è stata una sorpresa per me. Ma, in un certo senso, questa coincidenza ha portato alla struttura del mio gruppo di ricerca al MIT”, afferma.
Solomon afferma di essere stato attratto dal MIT per l’opportunità di lavorare con studenti brillanti, dottorandi e colleghi su problemi complessi ma pratici che potrebbero avere un impatto su molte discipline.
Come membro della facoltà, sfrutta con passione la sua posizione al MIT per rendere il campo della ricerca geometrica accessibile a persone che di solito non ne sono esposte, in particolare agli studenti meno abbienti che spesso non hanno l’opportunità di condurre ricerche alle scuole superiori. o università.
A tal fine, Solomon ha lanciato la Summer Geometry Initiative, un programma di ricerca retribuito di sei settimane per studenti universitari, per lo più provenienti da contesti sottorappresentati. Il programma, che fornisce un’introduzione pratica alla ricerca sulla geometria, ha completato la sua terza estate nel 2023.
“Non sono molte le istituzioni che hanno qualcuno che lavora nel mio campo, il che può portare a squilibri. Ciò significa che il tipico dottorando proviene da un insieme ristretto di scuole. Sto cercando di cambiare la situazione e di assicurarmi che persone assolutamente brillanti ma che non hanno avuto il vantaggio di essere nate nel posto giusto abbiano ancora l’opportunità di lavorare nella nostra zona”, afferma.
Il programma ha ottenuto risultati concreti. Dal suo lancio, Solomon ha visto cambiare la composizione delle classi di dottorandi in arrivo, non solo al MIT, ma anche in altre istituzioni.
Oltre alla computer grafica, esiste un elenco crescente di problemi nell’apprendimento automatico e nelle statistiche che possono essere affrontati utilizzando tecniche geometriche, il che sottolinea la necessità di un campo più diversificato di ricercatori che portino nuove idee e prospettive, afferma.
Da parte sua, Solomon non vede l’ora di applicare gli strumenti della geometria per migliorare i modelli di apprendimento automatico senza supervisione. Nell’apprendimento automatico non supervisionato, i modelli devono imparare a riconoscere i modelli senza dover etichettare i dati di addestramento.
La stragrande maggioranza dei dati 3D non è etichettata e pagare gli esseri umani per etichettare manualmente gli oggetti nelle scene 3D è spesso proibitivo. Ma modelli sofisticati che incorporano informazioni geometriche e inferenze dai dati possono aiutare i computer a immaginare scene 3D complesse e senza etichetta, in modo che i modelli possano apprendere da esse in modo più efficace.
Quando Solomon non riflette su questo e su altri dilemmi di ricerca, spesso lo si trova a suonare musica classica al pianoforte o al violoncello. È un fan del compositore Dmitri Shostakovich.
Musicista appassionato, ha preso l’abitudine di unirsi a un’orchestra sinfonica in qualunque città si trasferisca e attualmente suona il violoncello con la New Philharmonia Orchestra a Newton, Massachusetts.
In un certo senso, è una combinazione armoniosa dei suoi interessi.
“La musica è di natura analitica e ho il vantaggio di trovarmi in un campo di ricerca – la computer grafica – che è strettamente connesso alla pratica artistica. Quindi i due sono reciprocamente vantaggiosi”, afferma.
