Home topics Deviazione del modello Cos'è la deviazione del modello?
Esplora la piattaforma AI di IBM Abbonati per ricevere gli aggiornamenti sull'AI
Illustrazione con collage di pittogrammi di nuvole, grafico a torta, URL di pittogrammi grafici

Data di pubblicazione: 18 gennaio 2024
Autore: Jim Holdsworth

Cos'è la deviazione del modello?

La deriva del modello fa riferimento al calo delle prestazioni del modello a causa delle modifiche ai dati o ai rapporti tra le variabili di input e output. La deriva del modello, nota anche come decadimento del modello, può avere un impatto negativo sulle prestazioni del modello, con conseguenti previsioni e processi decisionali errati.

Per rilevare e mitigare la deriva, le organizzazioni possono monitorare e gestire le prestazioni sulla piattaforma di dati e AI. All'inizio, le prestazioni del modello potrebbero essere in linea ma, se non adeguatamente monitorate nel tempo, anche il modello AI meglio addestrato e più imparziale può "deviare" rispetto ai suoi parametri originali e produrre risultati indesiderati una volta implementato.

Se l'addestramento di un modello AI non è allineato con i dati in entrata, questo non è in grado di interpretarli accuratamente o di utilizzarli in tempo reale per eseguire previsioni puntuali in modo affidabile. Se la deriva non viene rilevata e mitigata in tempi rapidi, può aumentare ulteriormente, con conseguente maggiore danno alle operazioni.

I modelli creati utilizzando dati storici possono diventare rapidamente statici. In molti casi, ci sono sempre nuovi punti dati come nuove variazioni, nuovi modelli, nuove tendenze, che i vecchi dati storici non sono in grado di catturare.

Perché la governance dell'AI è un imperativo aziendale per scalare l'AI aziendale

Scopri gli ostacoli all'adozione dell'AI, in particolare la mancanza di soluzioni di governance e gestione del rischio dell'AI.

Contenuti correlati

Registrati per leggere la guida sui foundation model

Cause della deriva del modello

Il mondo è in continua evoluzione quindi, con i dati in continua evoluzione, perché i modelli utilizzati siano in linea con il mondo, devono essere costantemente rivisti e aggiornati. Ecco tre tipi di deviazione del modello che devono essere affrontati, ciascuno con una causa diversa.

Deriva del concetto

Il primo è la deriva del concetto, che si verifica in occasione di una modifica tra le variabili di input e la variabile di destinazione, in quel punto l'algoritmo inizia a fornire risposte errate perché le definizioni non sono più valide. Il cambiamento nelle variabili indipendenti può avere effetto su una serie di intervalli di tempo, che sono:

Stagionale

La deriva di concetto si ripresenta e scompare a intervalli regolari, come nel caso della stagionalità del comportamento di acquisto in risposta ai cambiamenti climatici. Nei Paesi dai climi invernali, le vendite di pale da neve e spazzaneve normalmente aumentano nel tardo autunno e all'inizio dell'inverno. Anche per le nevicate previste devono essere effettuati.della clientela.

Improvviso

Uno sviluppo improvviso può portare a nuovi modelli di acquisto. Un esempio potrebbe essere l'improvvisa pubblicità di un ChatGPT che ha provocato un aumento della domanda di prodotti hardware e software per l'AI e un aumento del valore delle azioni delle società legate all'AI. Un modello di previsione addestrato prima della pubblicazione di tali notizie non poteva prevedere i risultati successivi. Un altro esempio è l'arrivo della pandemia di Covid-19, che ha anche creato un improvviso cambiamento nei comportamenti: le vendite di giochi e di attrezzature per l'esercizio fisico sono aumentate, mentre ristoranti e hotel hanno subito una riduzione.della clientela.

 

Graduale

Alcune derive si verificano gradualmente o a un ritmo previsto. Ad esempio, spammer e hacker negli anni hanno utilizzato una serie di strumenti e trucchi. Con il miglioramento dei software di protezione e dei filtri antispam, i malintenzionati hanno dovuto alzare il tiro. Qualsiasi AI progettata per fornire protezione per le interazioni digitali deve essere al passo con i tempi; un modello statico presto risulterà inutile.

Deriva dei dati

Il secondo è la deriva dei dati, in cui la distribuzione dei dati sottostanti dei dati di input è cambiata. Nella vendita al dettaglio, la vendita di un prodotto potrebbe essere influenzata dall'immissione nel mercato di un altro nuovo prodotto o dal ritiro di un prodotto concorrente. Oppure, se inizialmente un sito Web viene adottato dai giovani ma poi viene accettato dalle persone più in là con l'età, il modello originale basato sui modelli di utilizzo degli utenti più giovani potrebbe non funzionare altrettanto bene con la base di utenti più in là con l'età.

Modifica dei dati a monte

Il terzo è una modifica dei dati a monte, che si verifica in caso di modifica alla pipeline dei dati. Ad esempio, i dati a monte potrebbero essere modificati in una valuta diversa, ad esempio USD e non euro, oppure misurazioni in miglia anziché chilometri o temperature in Fahrenheit anziché Celsius. Una modifica di questo tipo eliminerebbe un modello che non era stato creato per tenere conto del cambiamento nel modo in cui i dati sono stati contrassegnati.

Best practice per evitare la deriva del modello

Affinché le organizzazioni possano rilevare e aiutare a correggere la deriva del modello, è necessario considerare quanto segue.

Automatizza il rilevamento della deriva

L'accuratezza di un modello AIpuò peggiorare in pochi giornidall'implementazione in quanto i dati di produzione deviano dai dati di addestramento del modello. Ciò può portare a previsioni errate e a un'esposizione significativa al rischio. Le organizzazioni dovrebbero utilizzare strumenti di monitoraggio e un programma di AI in grado di rilevare automaticamente quando la precisione di un modello diminuisce (o si sposta) al di sotto di una soglia preimpostata. Questo programma utilizzato per rilevare la deriva del modello dovrebbe anche tenere traccia delle transazioni che hanno causato la deriva, consentendo loro di essere contrassegnate nuovamente e utilizzate per riqualificare il modello, ripristinando il suo potere predittivo durante il tempo di esecuzione.

Esistono due modi per misurare la deriva. Il primo è statistico e utilizza parametri statistici. Questo modo spesso è più facile da implementare in quanto la maggior parte delle metriche di solito sono già in uso all'interno dell'azienda. Il secondo è basato su modelli. Questo modo misura la somiglianza tra un punto o gruppi di punti rispetto alla linea di base di riferimento.

Automatizza il test dei modelli

Le organizzazioni devono testare periodicamente i propri modelli AI durante l'intero ciclo di vita. Questo test idealmente include:

  1. Convalida dei modelli in pre-produzione con test per rilevare distorsioni e derive, per poi generare report di prova.
  2. Trasferimento delle configurazioni eseguite correttamente di test pre-implementazione di un modello alla versione implementata del modello e proseguimento dei test automatizzati.
  3. Sincronizzazione di modelli, dati e informazioni sui risultati dei test con sistemi di registrazione.
  4. Automazione in grado di fornire notifiche coerenti e affidabili e di dare ai team più tempo per concentrarsi sullo sviluppo del modello invece che sul suo monitoraggio.
Gestisci in un ambiente unificato

Secondo unostudio sull'impatto economico complessivo condotto da Forrester, "Costruendo, eseguendo e gestendo modelli in un ambiente unificato di dati e AI, le organizzazioni possono essere sicure che i modelli AI rimangano equi, spiegabili e conformi ovunque. Questo approccio end-to-end all'AI consente inoltre a un'organizzazione di individuare e correggere le derive e le distorsioni del modello e di gestire il rischio del modello quando questo è in produzione."

Una best practice consiste nel gestire tutti i modelli da una dashboard centrale. Unapproccio integratopuò aiutare un'organizzazione a monitorare costantemente le metriche e avvisare i team in caso di derive in termini di accuratezza e coerenza dei dati attraverso lo sviluppo, la convalida e l'implementazione. Una visione centralizzata e olistica può aiutare le organizzazioni ad abbattere i silos e a fornire maggiore trasparenza lungo l'intera data lineage.

Monitora costantemente

Rileva gli scenari di derive e l'entità attraverso un modello AI che confronta i dati di produzione e addestramento e le previsioni di modelli in tempo reale. In questo modo è possibile individuare rapidamente le derive e intervenire subito. Questo rilevamento è iterativo, proprio come leoperazioni di apprendimento automatico(MLOps) che sono iterative.

Analizza la causa principale

L'analisibasata sul tempo è utile per vedere come si è evoluta la deriva e quando si è verificata. Ad esempio, se i controlli vengono eseguiti ogni settimana, questo mostrerà come si è evoluta la deriva giorno dopo giorno. L'analisi dei tempi può essere utile anche per determinare se la deriva è stata graduale o improvvisa.

Addestra i modelli

Utilizza un nuovo set di dati di addestramento a cui sono stati aggiunti campioni più recenti e pertinenti. L'obiettivo è quello di far rientrare rapidamente e correttamente in produzione i tuoimodelli linguistici di grandi dimensioni (LLM). Se il nuovo addestramento del modello non risolve il problema, potrebbe essere necessario un nuovo modello.

Aggiorna i modelli di apprendimento automatico (ML) in tempo reale

Invece di addestrare un modello con i dati in batch, le organizzazioni possono esercitarsi nell'"apprendimento online" utilizzando i proprimodelli di apprendimento automatico (ML) aggiornati utilizzando i dati del mondo reale più recenti non appena disponibili.

Verifica i dati di input

Può sembrare che un modello subisca una deriva in quanto i dati utilizzati per addestrarlo sono significativamente diversi dai dati di produzione effettivi che verranno utilizzati. In un caso d'uso medico, se le scansioni ad alta risoluzione vengono utilizzate durante l'addestramento e sul campo sono disponibili solo scansioni a bassa risoluzione, i risultati allora non saranno corretti.

Soluzioni correlate
IBM watsonx.governance

Accelera la creazione di workflow AI responsabili, trasparenti e spiegabili per i modelli di AI generativa e machine learning.

Esplora watsonx.governance

IBM Watson Studio

Traccia le prestazioni del modello. Ricevi avvisi quando si verificano deviazioni nell'accuratezza del modello e coerenza dei dati.

Esplora IBM Watson Studio

Risorse Porta la tua organizzazione a un livello superiore con dati affidabili

Ottieni un vantaggio competitivo con le strategie di governance dei dati.

Qual è la tua strategia sui dati?

Sblocca gli insight dei CDO e dei leader di data science per creare una strategia di dati affidabile che acceleri la crescita dei ricavi.

Tre passaggi per la qualità dei dati e le prestazioni dell'AI

Sblocca prospettive di esperti su come la tua organizzazione può migliorare la qualità dei dati, le prestazioni dell'AI e la fiducia.

Fai il passo successivo

Accelera i workflow di AI responsabili, trasparenti e spiegabili attraverso il ciclo di vita dei modelli generativi e di apprendimento automatico. Assimila, gestisci e monitora le attività di AI della tua organizzazione per gestire meglio le crescenti normative in materia di AI e rilevare e ridurre i rischi.

Esplora watsonx.governance Prenota una demo live