Grafici di valutazione

I grafici di valutazione sono simili agli istogrammi o ai grafici di raccolta. I grafici di valutazione mostrano la precisione dei modelli nella previsione di risultati particolari. Essi operano ordinando i record in base al valore previsto e alla confidenza della previsione, suddividendo i record in gruppi di dimensione uguale (quantili) e quindi tracciando il valore del criterio per ogni quantile, dal più alto al più basso. I modelli multipli sono mostrati nel grafico come linee separate.

I risultati vengono gestiti definendo un valore specifico o un intervallo di valori come un "hit". I riscontri in genere indicano un qualche successo (ad esempio una vendita a un cliente) o un evento significativo (ad esempio una diagnosi medica specifica).

Contrassegno
I campi di output sono semplici; gli hit corrispondono ai valori true .
Nominale
Per i campi di output nominali, il primo valore dell'insieme definisce un risultato.
Continuo
Per i campi di output continui, i risultati sono uguali ai valori maggiori del punto centrale dell'intervallo del campo.

I grafici di valutazione possono anche essere cumulati in modo che ogni punto sia uguale al valore per il quantile corrispondente più tutti i quantili superiori. I grafici cumulativi in genere offrono una rappresentazione migliore delle performance globali dei modelli, mentre i grafici non cumulativi risultano spesso più efficaci per mettere in evidenza particolari aree problematiche dei modelli.

Creazione di un grafico di valutazione semplice

  1. Nella sezione Tipo di grafico , fare clic su Valutazione .

    L'area di disegno viene aggiornata per visualizzare un modello di grafico Valutazione.

  2. Impostare le variabili Campo obiettivo, Campo previsione e Campo confidenza . Il campo di destinazione può essere qualsiasi indicatore istanziato o campo nominale con due o più valori. Il campo di previsione definisce la variabile utilizzata come valore previsto. Il campo confidenza definisce la variabile utilizzata per stabilire la confidenza della previsione.
    Nota: il tipo di variabile Campo di previsione deve corrispondere al tipo di variabile selezionato per il Campo di destinazione.
  3. Specificare una condizione personalizzata utilizzata per indicare l' hit definito dall'utente. Questa opzione è utile per definire il risultato desiderato anziché dedurlo dal tipo di campo obiettivo e dall'ordine dei valori.

    È necessario specificare un'espressione CLEM per una condizione hit. Ad esempio, @TARGET = "YES" è una condizione valida che indica che un valore Yes per il campo obiettivo viene conteggiato come un risultato nella valutazione. La condizione specificata viene usata per tutti i campi obiettivo.

  4. Fare clic su Salva visualizzazione nel progetto . Selezionare Crea un nuovo asset o Accoda all'asset esistente. Fornire un nome asset di visualizzazione, una descrizione facoltativa e un nome grafico.
  5. Fare clic su Applica per salvare la visualizzazione nel progetto. Il nuovo asset di visualizzazione è ora disponibile sulla scheda Asset .

Opzioni

Campo di destinazione
Elenca le variabili flag o campo nominale istanziate con due o più valori.
Risultato definito dall'utente
Specificare un valore hit. Gli hit indicano eventi di interesse (ad esempio, una diagnosi medica specifica).
Campo di previsione
Elenca le variabili che possono essere utilizzate come valore previsto.
Campo di confidenza
Elenca le variabili che possono stabilire la confidenza della previsione.
Grafico cumulativo
Creare un grafico cumulato quando abilitato. I valori presenti nei grafici cumulativi vengono rappresentati per ogni quantile più tutti i quantili superiori.
Modalità di visualizzazione
Le impostazioni controllano quali grafici vengono visualizzati in modalità anteprima e nell'output.
Modalità singola
Se selezionato, il grafico di ottimizzazione della classificazione del modello si trova nell'unico grafico che viene visualizzato in modalità anteprima e nell'output.
Modalità classica
Quando selezionato, i grafici di ottimizzazione della classificazione del modello, cutoff, barra della matrice, ROC, guadagni, ROI e profitto vengono visualizzati in modalità di anteprima e nell'output.
Modalità completa
Quando selezionato, i grafici di ottimizzazione della classificazione del modello, cutoff, barra matrice, ROC, guadagni, ROI, profitto, GINI, guadagno cumulativo e risposta vengono visualizzati in modalità anteprima e nell'output.
Grafici di valutazione
Taglio
Il grafico di interruzione mostra i valori previsti rispetto ai valori effettivi per le variabili selezionate per un valore di interruzione specificato.
Barra matrice
I grafici a barre della matrice sono un buon metodo per determinare se esistono correlazioni lineari tra più variabili.
ROC
ROC (Receiver Operating Characteristic) valuta le prestazioni degli schemi di classificazione in base ai quali i soggetti vengono classificati per una variabile con due categorie.
Guadagni
I guadagni sono rappresentati dalla percentuale di riscontri complessivi in ogni quantile. I guadagni vengono calcolati come (number of hits in quantile / total number of hits) × 100%.
ROI
Il valore ROI (Return On Investment) è simile al profitto in quanto implica la definizione di entrate e costi. Il ROI confronta i profitti con i costi per il quantile. ROI viene calcolato come (profits for quantile / costs for quantile) × 100%.
Profitto
Il profitto equivale alle entrate relative a ciascun record meno il costo del record. I profitti per un quantile sono la somma dei profitti per tutti i record nel quantile. Si presuppone che le entrate vengano applicate solo ai riscontri, mentre i costi vengono applicati a tutti i record. Profitti e costi possono essere fissi oppure definiti da campi nei dati. I profitti sono calcolati come (somma delle entrate per i record nel quantile − somma dei costi per i record nel quantile).
Kolmogorov-Smirnov
Confronta la funzione di distribuzione cumulativa osservata per una variabile con una distribuzione teorica specificata, che può essere normale, uniforme, esponenziale o Poisson.
GINI
GINI misura la dispersione statistica ed è destinato a rappresentare la distribuzione del reddito o della ricchezza. È la misura più comunemente usata della disuguaglianza.
Guadagno cumulativo
Il grafico guadagno cumulativo confronta la percentuale di record che in ogni quantile corrispondono a riscontri con la percentuale globale di riscontri nei dati di addestramento. Viene calcolato come (hits in quantile / records in quantile) / (total hits / total records).
Risposta
La risposta è la percentuale di record nel quantile che sono risultati positivi. La risposta viene calcolata come (hits in quantile / records in quantile) × 100%.
Impostazioni del grafico di valutazione
Le seguenti impostazioni si applicano solo ai grafici di profitto e ROI.
Costi
Specificare il costo fisso associato a ciascun record.
Ricavi
Specificare le entrate fisse associate a ciascun record che rappresenta un risultato.
Peso
Se i record nei dati rappresentano più di una unità, è possibile utilizzare i pesi per modificare i risultati. Specificare il peso fisso associato a ciascun record.