Home

topics

AutoML

Che cos'è AutoML?
Esplora la soluzione AutoML di IBM Iscriviti per ricevere gli aggiornamenti sull'AI
Illustrazione con collage di pittogrammi di nuvole, grafico a torta, pittogrammi grafici
Che cos'è AutoML?

Il machine learning automatizzato (AutoML), indipendentemente dal fatto che tu stia creando classificatori o eseguendo il training di regressioni, può essere considerato come un concetto di ricerca generalizzato, con algoritmi di ricerca specializzati per trovare le soluzioni ottimali per ogni componente della pipeline di ML.

Negli ultimi anni AutoML è diventato un argomento popolare nella ricerca di settore e accademica sull'AI (intelligenza artificiale).AutoML è molto promettente per quanto riguarda la proposta di soluzioni per l'AI in settori regolamentati, garantendo risultati spiegabili e riproducibili. AutoML consente un maggiore accesso allo sviluppo dell'AI per chi non è in possesso del background teorico attualmente necessario per il ruolo nella data science.

Ogni fase dell'attuale pipeline prototipica di data science, come la preelaborazione dei dati, la progettazione delle funzioni e l'ottimizzazione degli iperparametri, deve essere eseguita manualmente da esperti dell'apprendimento automatico. A confronto, l'adozione dell'AutoML consente un processo di sviluppo più semplice attraverso il quale poche righe di codice possono generare il codice necessario per iniziare a sviluppare un modello di apprendimento automatico.

Costruendo un sistema che permette di automatizzare solo tre parti chiave dell'automazione (progettazione di funzioni, l'ottimizzazione degli iperparametri e la ricerca dell'architettura neurale) AutoML promette un futuro in cui l'apprendimento automatico democratizzato è una realtà.

AI generativa e apprendimento automatico (ML) per le imprese

Scopri i principali vantaggi dell'AI generativa e come le organizzazioni possono incorporare l'AI generativa e il machine learning nel proprio business.

Contenuti correlati Registrati per ricevere l'ebook sugli storage dei dati AI
Tipi di AutoML

 

In una pipeline di data science, sono molti i passaggi che un team di data science deve seguire per creare un modello predittivo. Anche i team di data scientist esperti e gli ingegneri ML possono trarre vantaggio dalla maggiore velocità e trasparenza offerte da AutoML. Un data scientist deve partire da un'ipotesi, raccogliere il set di dati corretto, provare la visualizzazione dei dati, progettare funzionalità extra per sfruttare tutto il segnale disponibile, addestrare un modello con iperparametri (link esterno a ibm.com) e per un deep learning all'avanguardia deve progettare l'architettura ottimale per una Deep Neural Networks, possibilmente su una GPU se disponibile.

 

Progettazione automatizzata delle funzioni


Una funzionalità di dati fa parte dei dati di input per un modello di apprendimento automatico e la progettazione di funzioni si riferisce al processo di trasformazione in cui un data scientist ricava nuove informazioni dai dati esistenti. La progettazione di funzioni è uno dei processi chiave che aggiunge valore a un workflow di ML e le buone funzionalità fanno la differenza tra un modello con prestazioni accettabili e un modello con prestazioni brillanti. Queste trasformazioni matematiche dei dati non elaborati vengono lette nel modello e costituiscono il cuore del processo di apprendimento automatico. La progettazione delle funzioni automatizzata (AFE) (link esterno a ibm.com) è il processo di esplorazione dello spazio delle possibili combinazioni di funzionalità in modo meccanico, piuttosto che manuale.

La progettazione delle funzioni manuale è un'alchimia moderna che ha un costo elevato in termini di tempo: la creazione di una singola funzionalità può spesso richiedere ore, e il numero di funzionalità necessarie per ottenere un punteggio di precisione minimo (per non parlare di una linea di base di precisione a livello di produzione) può raggiungere le centinaia. Automatizzando l'esplorazione di uno spazio di funzionalità, AutoML riduce da giorni a minuti il tempo che un team di data science trascorre in questa fase.

Ridurre le ore di intervento manuale da parte di un data scientist non è l'unico vantaggio derivante dalla progettazione automatizzata delle funzioni. Le funzioni generate sono spesso chiaramente interpretabili.  In settori strettamente regolamentati come la sanità o la finanza, questa spiegabilità è importante perché riduce le barriere per l'adozione dell'AI attraverso l'interpretabilità. Inoltre, un data scientist o un analista dei dati trae vantaggio dalla chiarezza di queste funzioni, perché rendono i modelli di alta qualità più convincenti e perseguibili. Le funzioni generate automaticamente hanno inoltre il potenziale di trovare nuovi KPI che un'organizzazione può monitorare e su cui agire. Una volta che un data scientist ha completato la progettazione delle funzioni, deve ottimizzare i suoi modelli con una selezione strategica delle funzioni. 

 

Ottimizzazione automatizzata degli iperparametri


Gli iperparametri fanno parte degli algoritmi di apprendimento automatico meglio compresi per analogia come leve per la messa a punto delle prestazioni del modello, anche se spesso le regolazioni incrementali hanno un impatto enorme. Nella modellazione della data science su piccola scala, gli iperparametri possono essere facilmente impostati manualmente e ottimizzati per tentativi ed errori.

Per le applicazioni di deep learning, il numero di iperparametri cresce in modo esponenziale, il che rende la loro ottimizzazione al di sopra delle capacità di un team di data science di realizzarla in modo manuale e tempestivo. L'ottimizzazione automatizzata degli iperparametri (HPO) (link esterno a ibm.com) solleva i team dall'intensa responsabilità di esplorare e ottimizzare l'intero spazio degli eventi per gli iperparametri e consente invece loro di iterare e sperimentare funzionalità e modelli.

Un altro punto di forza dell'automazione del processo di apprendimento automatico è che ora i data scientist possono concentrarsi sul perché della creazione del modello piuttosto che sul come. Considerando le enormi quantità di dati disponibili per molte aziende e l'enorme numero di domande a cui è possibile rispondere con questi dati, un team di analytics può prestare attenzione a quali aspetti del modello dovrebbe ottimizzare, come il classico problema della riduzione al minimo dei falsi negativi nei test medici.

Ricerca dell'architettura neurale


Il processo più complesso e dispendioso in termini di tempo nel deep learning è la creazione dell'architettura neurale. I team di data science dedicano molto tempo a selezionare i livelli e i tassi di apprendimento appropriati che alla fine riguardano spesso solo i pesi del modello, come in molti modelli linguistici. La ricerca sull'architettura neurale (NAS) (link esterno a ibm.com) è stata descritta come "utilizzo di reti neurali per progettare reti neurali" ed è una delle aree più ovvie del machine learning che traggono vantaggio dall'automazione.

Le ricerche NAS iniziano con la scelta delle architetture da provare. L'esito delle ricerche NAS è determinato dalla metrica in base alla quale viene giudicata ogni architettura. Esistono diversi algoritmi comuni da utilizzare nella ricerca di un'architettura neurale. Se il numero potenziale di architetture è ridotto, le scelte per i test possono essere casuali. Gli approcci basati sul gradiente, in cui lo spazio di ricerca discreto viene trasformato in una rappresentazione continua, si sono dimostrati molto efficaci. I team di data science possono inoltre testare algoritmi evolutivi in cui le architetture vengono valutate in modo casuale e le modifiche vengono applicate lentamente, propagando così le architetture figlio che hanno più successo ed eliminando quelle che non lo sono.

Le ricerche sull'architettura neurale sono uno degli elementi chiave di AutoML che promettono di democratizzare l'AI. Tuttavia, queste ricerche hanno spesso un'impronta di carbonio molto elevata.Non è stato ancora effettuato un esame di questi compromessi e l'ottimizzazione dei costi ecologici è un'area di ricerca costanti negli approcci NAS.

Link correlati Data science Apprendimento automatico AutoAI
Strategie per l'utilizzo di AutoML

L'apprendimento automatico automatizzato sembra una panacea di soluzioni tecniche che un'organizzazione può utilizzare per sostituire i costosi data scientist ma, in realtà, il suo utilizzo richiede strategie intelligenti per un'organizzazione. I data scientist ricoprono ruoli fondamentali nella progettazione di esperimenti, nella traduzione dei risultati in risultati aziendali e nella gestione dell'intero ciclo di vita dei loro modelli di apprendimento automatico. In che modo i team interfunzionali possono sfruttare AutoML per ottimizzare i tempi e ridurre i tempi necessari per ricavare valore dai loro modelli?

Il workflow ottimale per includere le API AutoML è quello che le utilizza per parallelizzare i workflow e ridurre il tempo dedicato ad attività manuali intense. Invece di dedicare giorni all'ottimizzazione degli iperparametri, un data scientist potrebbe automatizzare questo processo su più tipi di modelli contemporaneamente per poi testare quello più performante.

Inoltre, ci sono funzionalità AutoML che ora consentono ai membri del team con diversi livelli di competenza di contribuire alla pipeline di data science. Un analista di dati senza esperienza in Python potrebbe utilizzare un toolkit, come AutoAI su Watson Studio, per addestrare un modello predittivo utilizzando i dati che è in grado di estrarre autonomamente tramite query. Utilizzando AutoML, un analista di dati può ora pre-elaborare i dati, creare una pipeline di machine learning e produrre un modello completamente addestrato che può utilizzare per convalidare le proprie ipotesi senza richiedere l'attenzione di un intero team di data science.

AutoML e IBM Research

I ricercatori e gli sviluppatori IBM contribuiscono alla crescita e allo sviluppo di AutoML. Lo sviluppo costante del prodotto con AutoAI su IBM Watson e il lavoro dei ricercatori IBM su Lale (link esterno a ibm.com), una libreria open source automatizzata per la data science, sono solo alcuni dei modi con cui IBM aiuta a creare la prossima generazione di approcci di AI. Sebbene Lale sia un progetto open source, in realtà è fondamentale per numerose funzionalità di AutoAI.

Per i team di data science che lavorano con Python come fulcro del loro stack di apprendimento automatico (ML), Lale offre una libreria semiautomatica che si integra perfettamente all'interno delle pipeline scikit-learn (link esterno a ibm.com), diversa da auto-sklearn (link esterno a ibm.com) o da una libreria come TPOT (link esterno a ibm.com). Lale va oltre scikit-learn con automazione, controlli di correttezza e interoperabilità. Pur essendo basato sul paradigma scikit-learn, ha un numero crescente di trasformatori e operatori provenienti da altre librerie Python e da librerie in linguaggi come Java e R.  

Soluzioni correlate
watsonx.ai

Sperimenta con i foundation model e crea automaticamente modelli di machine learning nel nostro studio di prossima generazione per builder AI.

Esplora watsonx.ai Guarda la demo interattiva
AutoAI

Crea e addestra velocemente modelli predittivi di alta qualità. Semplifica la gestione del ciclo di vita dell'AI.

Esplora l'AutoAI
IBM Watson Studio

Crea e scala un'IA attendibile su qualsiasi cloud. Automatizza il ciclo di vita dell'IA per ModelOps.

Scopri di più su IBM Watson Studio
Risorse Usa AutoML per trovare e distribuire i migliori modelli in pochi minuti

Scopri come Watson AutoAI, l'AutoML di nuova generazione, scopre e crea le pipeline di modellazione più adatte ai tuoi dati.

IBM Research: AutoML graduale con Lale

Lale è una libreria compatibile con sklearn per AutoML. È open source e risponde alla necessità di un'automazione graduale dell'apprendimento automatico invece di offrire uno strumento AutoML black box.

Crea facilmente modelli ottimali con AutoAI di IBM Watson Studio

IBM Watson Studio è un potente strumento di data science a uso opzionale di codice su IBM Cloud Pak for Data. In questo laboratorio pratico, scoprirai come la funzionalità AutoAI di Watson Studio semplifica la creazione di modelli.

Fai il passo successivo

Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e una minima quantità di dati.

Esplora watsonx.ai Prenota una demo live