3 Classi del Machine Learning e Applicazioni Predittive

Corrado Paitoni

13 Aprile 2022

Il più delle volte siamo inconsapevoli. La nostra vita scorre tra mille impegni, tra appuntamenti fisici e virtuali, attività professionali e di puro svago, ma anche se ne parliamo a volte, non sembriamo preoccupati, oramai ci sembra normale e fatta eccezione di qualche voce fuori dal coro, lo abbiamo, più o meno consapevolmente, accettato tutti.

Cosa?

Il fatto che quasi ogni nostro movimento e ogni nostra azione, persino pensieri ed emozioni, siano tracciati e sono il carburante degli algoritmi di machine learning (ML) che elaborano Big Data con fini predittivi. Questi algoritmi ci consigliano quale libro acquistare, quale film guardare alla TV la sera, il miglior viaggio che dovrebbe corrispondere alle nostre preferenze.

Siamo tutti, o quasi, interconnessi e osservati mediante i social, le carte di credito, le carte fedeltà e così via. Ogni giorno Peta byte di dati (Giga di Giga) vengono memorizzati ed elaborati da intelligenze artificiali (IA) nelle diverse forme, per ottenere informazioni preziose a livello commerciale.

Come per ogni tecnologia dirompente che si rispetti anche il ML ha il rovescio della medaglia. Le prime considerazioni sembrano sconcertarci, ma questa tecnologia ha anche aspetti positivi alla base di varie attività e di servizi assistenziali spesso molto utili o addirittura salvavita.

In ambito commerciale, la possibilità di elaborare dati reali, esenti da influssi emozionali che ogni essere vivente suo malgrado ha, produce informazioni utilizzabili per migliorare prodotti e servizi. Il quantitativo di dati da elaborare per fare una previsione il più possibile utile, come le previsioni meteo, è troppo elevata per poterla delegare e ha una velocità impensabile per un essere umano.

Prima di addentrarci nei dettagli va ricordato che, almeno per il momento, la predizione del comportamento del singolo individuo è ancora impresa ardua anche da parte del ML, mentre l’elaborazione dei Big Data produce risultati efficaci sui comportamenti delle masse. Comunque, tali elaborazioni sono sempre da interpretarsi come informazioni previsionali statistiche dipendenti dalla qualità dei dati in entrata.

Un esempio estremamente positivo è l’elaborazione del genoma umano (DNA) a fini preventivi in ambito medico. Pertanto, il ML è da considerarsi una tecnica a supporto dei metodi analitici classici e non una loro completa sostituzione.

Gli scettici si dovranno ricredere ben presto di fronte ai risultati ottenuti in pochi anni di utilizzo di queste tecnologie. Considerando che l’incremento dell’affidabilità dei risultati è esponenziale.

Il mondo del ML è veramente vasto, argomenti come Deep Learning, Neural Networks, Cognitive Computing, Natural Language Processing, sono sempre più attuali e così complessi da non comprendere bene tutti gli aspetti e le potenzialità delle applicazioni quotidiane, fatta eccezione dei tecnici addetti ai lavori.

Il risultato di questa corsa all’informatizzazione dei processi può portare alla sostituzione dell’uomo? Più volte in passato si è stati portati a pensare che l’IA avrebbe sostituito in toto le attività antropiche, ma come abbiamo potuto notare, questo non è successo, almeno finora. Possiamo tutti affermare che i computer sanno elaborare enormi quantità di informazioni, in un tempo ridotto, attività che non riescono molto bene all’essere umano, ma quest’ultimo è ancora necessario per verificare i dati ottenuti.

Possiamo identificare tre classi di ML in base alle varie metodologie di apprendimento ed elaborazione dei dati.

SUPERVISED LEARNING SL

Questa tecnica prevede che l’algoritmo prenda esempio da un modello predefinito di Input-Output, per poter elaborare compiti analoghi. SL applica un’etichetta a un certo dato di input. La macchina impara da esempi definiti dal programmatore ovvero l’essere umano è determinante nella definizione dell’impostazione di come elaborare le informazioni. Tutti i dati di input sono etichettati con corrispondenti dati di output.

Le maggiori applicazioni del SL sono la prevenzione delle frodi in internet, il riconoscimento testuale e d’immagini; la manutenzione predittiva di apparecchi e macchinari; le attività promozionali di prodotti alimentari, assicurazioni e servizi bancari.

In alcuni casi è possibile definire un Semi-Supervised Learning, dove non tutti i dati di input sono relazionati a dati di output, parte di quest’ultimi sono lasciti a discrezione dell’algoritmo. In questo campo troviamo i traduttori automatici e la catalogazione di pagine web.

UNSUPERVISED LEARNING UL

Questo algoritmo non vincola rigidamente dati d’ingresso con quelli di uscita. Come l’essere umano prende decisioni in base alla propria esperienza, così UL apprende dall’osservazione dei dati man mano che questi aumentano o variano, aumentando l’efficacia e la qualità della risposta. Un esempio è avere un elenco di 100.000 animali e doverli raggruppare per caratteristiche fisiche e comportamentali o meglio sul DNA. Gli algoritmi che usano UL possono fornici dati interessanti e magari anche inaspettati.

Le applicazioni in questo campo sono l’elaborazione dei profili personali in base alle potenziali aspettative e la selezione di prodotti effettuata sulla ricerca e sugli acquisti precedenti.

REINFORCED LEARNING RL

RL a differenza degli altri framework elabora dati senza affibbiare etichette ma con lo scopo di trovare le migliori operazioni in sequenza per ottenere il migliore risultato in quel determinato istante, ovvero in modo dinamico. Questo metodo impara per errori e tentativi, ovvero una tecnica simile ai centri di ricerca e ai rispettivi ricercatori. I sistemi di navigazione lavorano con questi concetti. Per fare un esempio anche le formiche utilizzano naturalmente questi “algoritmi”. Maggiore è il numero di formiche che percorre una determinata strada per reperire il cibo, maggiore è il feromone lasciato sul percorso e maggiori saranno le formiche che lo seguiranno.

Il RL è uno strumento estremamente potente per risolvere ardui problemi e anche se non ha ancora raggiunto l’apice, è considerato il miglior metodo di calcolo in futuro per elaborare sistemi complessi.

Qui siamo nell’ambito della robotica, dei sistemi di navigazione e del gaming.

Per chi vuole approfondire l’argomento, consiglio le seguenti letture.

Per approfondire l’argomento:

Potrebbe interessarti anche