Cos'è il deep learning, cosa signifca, come funziona e quali sono le sue applicazioni. Una breve e utile guida per capirne di più


Quando ricorriamo a sistemi di traduzione simultanea del linguaggio o a un software per il riconoscimento e la classificazione delle immagini, oppure quando ci troviamo di fronte a un veicolo a guida autonoma, in realtà abbiamo a che fare con applicazioni di deep learning (detto anche “apprendimento profondo”), sottocategoria del machine learning (o “apprendimento automatico”), segmento della più ampia branca che rimanda all’ambito di studi dell’intelligenza artificiale.

In grado, grazie ai suoi algoritmi, di analizzare automaticamente dati quali immagini, video e audio, questo dominio dell’AI sta vivendo un momento di rapido progresso, arrivando anche, in molti casi, a superare le prestazioni dell’attività cerebrale umana.

Il filo rosso che lega deep learning, machine learning e intelligenza artificiale non deve, però, indurre a utilizzare i tre termini quali sinonimi, poiché essi esprimono tre concetti assai diversi. E di seguito spieghiamo perché, soffermandoci con più attenzione sul funzionamento e sull’utilizzo del primo.

Cos’è il deep learning

Tecnica di apprendimento in cui reti neurali artificiali vengono esposte a grandi quantità di dati, in modo che possano imparare a svolgere compiti predefiniti. Reti neurali artificiali, a loro volta, organizzate in diversi strati, ognuno dei quali calcola i valori per quello successivo, in modo da elaborare l’informazione in maniera sempre più completa e “in profondità”. È questa, in breve sintesi, la definizione di deep learning, in cui il concetto di “deep” (= profondo) riveste di significato tutto il processo di “apprendimento su più livelli”. Che cosa si intende?

Il meccanismo ricalca il funzionamento del cervello umano, dove, nel momento in cui all’apprendimento di una nozione ne segue un’altra, vi è un’elaborazione della prima insieme alla seconda, trasformandola e astraendola sempre di più. L’apprendimento che, così, si realizza ricorda la forma di una piramide, in cui i concetti posti più in alto vengono appresi a partire dai livelli più bassi, dai livelli più profondi.

Alla base del processo – come accennato – ci sono le reti neurali artificiali, ossia modelli matematici che riproducono, appunto, l’attività cerebrale, interpretando, elaborando e organizzando i dati gerarchicamente.

I neuroni artificiali si dispongono su “strati”, paragonabili ai “piani” di un palazzo, in cui i neuroni rappresentano le stanze presenti su ciascun piano. Stanze che non comunicano tra loro sullo stesso livello, ma che possono essere connesse a stanze (ovvero a neuroni) dello strato precedente e dello strato successivo. Dunque, un palazzo all’interno del quale si può solo salire o scendere, ma non muoversi sul medesimo piano.

L’azione del deep learning è un tipo di apprendimento che non deriva da un input umano, bensì si attiva tramite algoritmi di calcolo statistico, vale a dire algoritmi di deep learning, tra cui qui ricordiamo le reti neurali convoluzionali e le reti neurali ricorrenti.

Nel primo caso, si tratta di algoritmi sviluppati per lavorare con le immagini, dove il termine “convoluzione” fa riferimento al processo che applica un filtro su ogni elemento di un’immagine, aiutando il computer a individuare (e a rispondervi) gli elementi all’interno dell’immagine stessa.

Questo algoritmo di deep learning è utile quando è necessario fare la scansione di una grande quantità di immagini, all’interno delle quali si cerca un elemento o una funzione specifici: ad esempio, immagini del fondo dell’oceano a rappresentare un naufragio.

Le reti neurali ricorrenti introducono, invece, l’elemento della memoria, consentendo alla macchina di “tenere a mente” dati e decisioni passate e di considerarli durante le revisioni dei dati più attuali, introducendo, così, la contestualizzazione.

Questo tipo di algoritmo di apprendimento profondo ha un ruolo focale, ad esempio, nel processo di elaborazione del linguaggio naturale, nell’ambito del quale – grazie ad esso – è in grado di comprendere in modo più puntuale un testo, potendo avere accesso al “tono” del linguaggio e al contenuto che lo precedono.

Linguaggio scritto a parte, nel futuro del deep learning c’è l’obiettivo di poter essere compresi dalle macchine attraverso il linguaggio verbale e addirittura, in un futuro più lontano, attraverso i gesti.

E anche se sono ancora tanti gli step necessari al raggiungimento di traguardi così ambiziosi, possiamo ritenere che l’apprendimento approfondito sia, oggi, uno strumento prezioso nell’automatizzare molti processi e operazioni, a partire da quelli più semplici della vita quotidiana fino al mondo del lavoro, del business, della sicurezza e del medicale.

Quali sono le sue applicazioni

Il deep learning trova applicazione in molteplici settori e contesti. A cominciare dalla sicurezza IT, ambito in cui i sistemi basati su algoritmi di apprendimento profondo sono in grado di identificare non solo le minacce conosciute, ma anche quelle sconosciute, rilevate come “anomalie” del modello di riconoscimento della rete neurale.

Restando sul terreno security, anche le soluzioni antifrode trovano nel deep learning un alleato capace di rilevare i truffatori seriali che evadono i controlli e di creare modelli predittivi e avanzati. Così come la sicurezza fisica – e, più in particolare, la videosorveglianza – con telecamere provviste di software di riconoscimento facciale che sfruttano la tecnica dell’apprendimento profondo.

Quello dell’assistenza clienti per mezzo di chatbot – che, orientandosi sulla base di parole chiave contenute nella richiesta del cliente, sono in grado di guidarlo verso le informazioni desiderate – rappresenta un’altra applicazione, così come la messa a punto di sistemi capaci di imparare a scrivere in una determinata lingua, apprendendone grammatica, punteggiatura e ortografia.

E gli ormai noti assistenti vocali come Alexa, Siri e Google Assistant, si basano su algoritmi di apprendimento profondo, con l’obiettivo di implementare le proprie prestazioni a seconda delle richieste e dei comportamenti dell’utente.

Un’altra attività che sfrutta il deep learning è quella della traduzione automatica, di cui è un esempio Google Neural Machine Translation, capace di colmare del 55-85% il divario con le traduzioni realizzate dagli esseri umani.

Anche medici e biologi – in particolare, nelle attività di diagnostica e ricerca – si avvalgono degli algoritmi di deep learning, a partire dal rilevamento dei tumori fino al supporto nell’identificazione di sequenze genetiche di virus e patologie e allo sviluppo di terapie personalizzate.

I veicoli a guida autonoma, grazie all’elevata capacità di elaborazione delle immagini da parte di algoritmi di apprendimento profondo, possono servirsi della computer vision (o visione artificiale) per riconoscere gli elementi presenti nell’ambiente e muoversi, così, in sicurezza. Ma non solo.

Diverse soluzioni di deep learning, addestrate a riconoscere specifici segni e pericoli, vengono implementate anche all’interno dei più recenti modelli di automobili, aiutando il conducente durante la guida e permettendo spostamenti più sicuri.

Per quanto riguarda, nello specifico, la visione artificiale, questa ormai è lontana dall’essere considerata uno scenario fantascientifico, ma è ormai sempre più parte del nostro quotidiano. Twitter, ad esempio, ha la capacità di riconoscere le immagini pornografiche, eliminandole all’istante, senza la necessità di un supervisore umano. E Google, nella sezione dedicata alle foto, cataloga le immagini, inserendole nelle sezioni più pertinenti.

All’interno delle fabbriche, grazie all’apprendimento profondo, è possibile permettere ai robot di “imparare osservando” in maniera rapida e in tempo reale, riproducendo una specifica azione e chiedendo alla macchina di ripeterla.

Tra le altre applicazioni, ricordiamo anche che, conoscendo gli interessi e le ricerche dell’utente, le tecniche di deep learning consentono di filtrare le notizie, facendogli visualizzare quelle per lui più utili e rilevanti. Meccanismo, questo, che sta dietro anche agli algoritmi adoperati dai diversi social network e che determina quali sono i post che un utente vede nella home page.

Sempre grazie a un esteso database che ne consente l’addestramento e il costante affinamento, vi sono poi soluzioni di deep learning che, riconoscendo cosa è rappresentato in un’immagine, sono in grado di scrivere una didascalia in linea con quanto mostrato o addirittura di scegliere un brano musicale che esprime lo stato d’animo che quell’immagine suscita in chi la osserva.

Quelle elencate non sono, naturalmente, le uniche applicazioni oggi diffuse. Ve ne sono molte altre. E l’evoluzione continua di questo settore fa prevedere che, in un prossimo futuro, gli utilizzi concreti dell’apprendimento profondo saranno ancora maggiori.

Machine learning vs deep learning

Come accennato all’inizio, il deep learning è una modalità di apprendimento che rientra nell’ambito del machine learning, pur possedendo, però, tratti distintivi diversi e basandosi su un processo differente.

Machine Learning - Deep Learning
Il deep learning è una sottocategoria del machine learning

Iniziamo col dire che l’apprendimento automatico è una tecnologia più antica, che ha preceduto l’apprendimento profondo e, che, rispetto a questo, è più semplice. Il suo processo di apprendimento necessita di una fase di pre-processamento dei dati. Che cosa significa nel concreto?

Poniamo l’esempio dei sistemi di computer vision basati sull’apprendimento automatico: al sistema, in questo caso, vanno fornite le caratteristiche di un determinato oggetto, in modo tale che la macchina possa costruire un modello capace di riconoscere e di categorizzare gli oggetti proprio sulla base delle informazioni che le sono state date, selezionate manualmente.

Quindi, il sistema viene prima alimentato con dati strutturati e categorizzati e, successivamente, arriva ad “apprendere” come classificare i nuovi dati a seconda della tipologia. E, in base alla classificazione, esegue le attività programmate. Ed è il feedback che riceve dall’essere umano a indicare al sistema le classificazioni errate e le quelle corrette.

Nel caso del deep learning, invece, i dati strutturati non sono necessari, in quanto è il sistema stesso che identifica nei dati quelle caratteristiche che li distinguono, senza la necessità di una categorizzazione dall’esterno: a ogni livello, l’input viene controllato per un’altra caratteristica e il sistema usa questo procedimento per decidere come categorizzare il dato in questione.

In virtù di tali peculiarità, l’apprendimento profondo è indicato nell’ambito di quei compiti in cui non tutti gli aspetti degli oggetti possono essere categorizzati anticipatamente.

Inoltre, presenta un’altra differenza che lo rende diverso dal machine learning e cioè la scalabilità. I sistemi di apprendimento profondo, infatti, migliorano le proprie prestazioni con l’aumentare dei dati ricevuti in input. Diversamente, i sistemi basati sull’apprendimento automatico, una volta raggiunto un determinato livello di prestazioni non sono più scalabili.