Streaming Machine Learning methods for time-dependent evolving data
Applicare modelli di Machine Learning in un contesto streaming in cui i dati provengono da un flusso illimitato, pone diverse problematiche. Poiché i dati non sono disponibili dall'inizio ma vengono prodotti nel tempo, non è possibile applicare il classico paradigma di Machine Learning che suddivide la vita del modello in fase di training e fase di inferenza. Il modello deve essere, perciò, in grado di imparare continuamente e aggiornarsi sulla base dei dati che riceve. Col passare del tempo, inoltre, la distribuzione dei dati può variare. Per questo motivo, è necessario riconoscere i cambiamenti e adattarsi ad essi. Un'ulteriore problematica da affrontare è la possibile dipendenza temporale. Il dato corrente può, infatti, dipendere dai dati agli istanti di tempo precedenti. Infine, si richiede di evitare il problema noto come "catastrophic forgetting" a causa del quale, durante l'apprendimento di nuova conoscenza, il modello dimentica la conoscenza precedentemente imparata.
Nonostante questi problemi siano noti in letteratura e siano affrontati singolarmente da diverse metodologie, non esiste al momento una soluzione complessiva che li risolva contemporaneamente. Nello specifico, durante il lavoro di ricerca si vogliono diverse tecnologie per la costruzione di una soluzione globale. L'area di ricerca dello Streaming Machine Learning si focalizza sull'allenamento continuo e la gestione del cambio di distribuzione. L'area del Continual Learning applica metodologie specifiche a modelli di Deep Learning per la gestione del catastrophic forgetting e l'apprendimento da data stream suddivisi in batch di dati definiti esperienze. All'interno dei modelli di Deep Learning per la gestione delle dipendenze temporali trovano ampio spazio le Recurrent Neural Network.
Back to Current Students