
[lid] DataCebo, una spin-off del MIT, assiste le aziende nel potenziare i propri set di dati mediante la creazione di dati sintetici che emulano quelli reali. L’intelligenza artificiale generativa sta ricevendo notevole attenzione per la sua abilità nel generare testi e immagini, ma questi media rappresentano solo una piccola parte dei dati presenti nella nostra società. I dati si generano ogni volta che un paziente attraversa un sistema medico, una tempesta colpisce un volo o una persona interagisce con un’applicazione software.
L’utilizzo dell’intelligenza artificiale generativa per creare dati sintetici realistici in contesti come questi può aiutare le organizzazioni a curare i pazienti in modo più efficace, gestire il traffico aereo o migliorare le piattaforme software, specialmente quando i dati del mondo reale sono limitati o sensibili.
In passato tre anni, DataCebo, spin-off del MIT, ha sviluppato un software generativo chiamato Synthetic Data Vault (SDV) per aiutare le organizzazioni a generare dati sintetici per testare applicazioni software e addestrare modelli di apprendimento automatico.
Il Synthetic Data Vault, o SDV, ha registrato oltre un milione di download, con oltre 10.000 data scientist che utilizzano questa libreria open source per generare dati tabulari sintetici. I fondatori, il ricercatore principale Kalyan Veeramachaneni e l’ex studentessa Neha Patki ’15, SM ’16, ritengono che il successo dell’azienda sia dovuto alla capacità di SDV di rivoluzionare i test del software.
Nel 2016, il gruppo di Veeramachaneni presso il Data to AI Lab ha presentato una suite di strumenti di intelligenza artificiale generativa open source per aiutare le organizzazioni a creare dati sintetici che rispecchino le proprietà statistiche dei dati reali.
Le aziende possono utilizzare dati sintetici al posto di informazioni sensibili nei programmi, preservando comunque le relazioni statistiche tra i punti dati. Possono anche utilizzare dati sintetici per eseguire simulazioni su nuovi software e valutarne il comportamento prima del rilascio pubblico.
DataCebo, rimanendo fedele alle sue radici al MIT, continua a crescere con tutti i suoi attuali dipendenti che sono ex studenti del MIT. Mentre i loro strumenti open source sono utilizzati in una varietà di casi d’uso, l’azienda ha focalizzato l’attenzione sulla crescente popolarità nei test del software.
I modelli generativi di DataCebo permettono ai clienti di creare facilmente scenari specifici e casi limite per testare le loro applicazioni, risparmiando tempo rispetto alla creazione manuale di dati sintetici. La privacy è una preoccupazione importante, e l’utilizzo di dati sintetici si dimostra spesso una soluzione più sicura, specialmente in contesti con dati sensibili.
DataCebo sta avanzando il campo dei dati aziendali sintetici, generati dal comportamento degli utenti sulle applicazioni software delle grandi aziende. La società ha recentemente rilasciato nuove funzionalità per migliorare l’utilità di SDV, inclusi strumenti per valutare il “realismo” dei dati generati e per confrontare le prestazioni dei modelli.
Mentre le aziende abbracciano sempre più l’intelligenza artificiale e gli strumenti di data science, DataCebo contribuisce a questo progresso in modo trasparente e responsabile, prevedendo che nel prossimo futuro il 90% delle operazioni aziendali potrebbe essere svolto con dati sintetici generati da modelli generativi.