Grafici di valutazione
I risultati vengono gestiti definendo un valore specifico o un intervallo di valori come un "hit". I riscontri in genere indicano un qualche successo (ad esempio una vendita a un cliente) o un evento significativo (ad esempio una diagnosi medica specifica).
- Contrassegno
- I campi di output sono semplici; gli hit corrispondono ai valori
true. - Nominale
- Per i campi di output nominali, il primo valore dell'insieme definisce un risultato.
- Continuo
- Per i campi di output continui, i risultati sono uguali ai valori maggiori del punto centrale dell'intervallo del campo.
I grafici di valutazione possono anche essere cumulati in modo che ogni punto sia uguale al valore per il quantile corrispondente più tutti i quantili superiori. I grafici cumulativi in genere offrono una rappresentazione migliore delle performance globali dei modelli, mentre i grafici non cumulativi risultano spesso più efficaci per mettere in evidenza particolari aree problematiche dei modelli.
Creazione di un grafico di valutazione semplice
- Nella sezione Tipo di grafico , fare clic su Valutazione .
L'area di disegno viene aggiornata per visualizzare un modello di grafico Valutazione.
- Impostare le variabili Campo obiettivo, Campo previsione e Campo confidenza . Il campo di destinazione può essere qualsiasi indicatore istanziato o campo nominale con due o più valori. Il campo di previsione definisce la variabile utilizzata come valore previsto. Il campo confidenza definisce la variabile utilizzata per stabilire la confidenza della previsione.Nota: il tipo di variabile Campo di previsione deve corrispondere al tipo di variabile selezionato per il Campo di destinazione.
- Specificare una condizione personalizzata utilizzata per indicare l' hit definito dall'utente. Questa opzione è utile per definire il risultato desiderato anziché dedurlo dal tipo di campo obiettivo e dall'ordine dei valori.
È necessario specificare un'espressione CLEM per una condizione hit. Ad esempio,
@TARGET = "YES"è una condizione valida che indica che un valoreYesper il campo obiettivo viene conteggiato come un risultato nella valutazione. La condizione specificata viene usata per tutti i campi obiettivo. - Fare clic su Salva visualizzazione nel progetto . Selezionare Crea un nuovo asset o Accoda all'asset esistente. Fornire un nome asset di visualizzazione, una descrizione facoltativa e un nome grafico.
- Fare clic su Applica per salvare la visualizzazione nel progetto. Il nuovo asset di visualizzazione è ora disponibile sulla scheda Asset .
Opzioni
- Campo di destinazione
- Elenca le variabili flag o campo nominale istanziate con due o più valori.
- Risultato definito dall'utente
- Specificare un valore hit. Gli hit indicano eventi di interesse (ad esempio, una diagnosi medica specifica).
- Campo di previsione
- Elenca le variabili che possono essere utilizzate come valore previsto.
- Campo di confidenza
- Elenca le variabili che possono stabilire la confidenza della previsione.
- Grafico cumulativo
- Creare un grafico cumulato quando abilitato. I valori presenti nei grafici cumulativi vengono rappresentati per ogni quantile più tutti i quantili superiori.
- Modalità di visualizzazione
- Le impostazioni controllano quali grafici vengono visualizzati in modalità anteprima e nell'output.
- Modalità singola
- Se selezionato, il grafico di ottimizzazione della classificazione del modello si trova nell'unico grafico che viene visualizzato in modalità anteprima e nell'output.
- Modalità classica
- Quando selezionato, i grafici di ottimizzazione della classificazione del modello, cutoff, barra della matrice, ROC, guadagni, ROI e profitto vengono visualizzati in modalità di anteprima e nell'output.
- Modalità completa
- Quando selezionato, i grafici di ottimizzazione della classificazione del modello, cutoff, barra matrice, ROC, guadagni, ROI, profitto, GINI, guadagno cumulativo e risposta vengono visualizzati in modalità anteprima e nell'output.
- Grafici di valutazione
- Taglio
- Il grafico di interruzione mostra i valori previsti rispetto ai valori effettivi per le variabili selezionate per un valore di interruzione specificato.
- Barra matrice
- I grafici a barre della matrice sono un buon metodo per determinare se esistono correlazioni lineari tra più variabili.
- ROC
- ROC (Receiver Operating Characteristic) valuta le prestazioni degli schemi di classificazione in base ai quali i soggetti vengono classificati per una variabile con due categorie.
- Guadagni
- I guadagni sono rappresentati dalla percentuale di riscontri complessivi in ogni quantile. I guadagni vengono calcolati come
(number of hits in quantile / total number of hits) × 100%. - ROI
- Il valore ROI (Return On Investment) è simile al profitto in quanto implica la definizione di entrate e costi. Il ROI confronta i profitti con i costi per il quantile. ROI viene calcolato come
(profits for quantile / costs for quantile) × 100%. - Profitto
- Il profitto equivale alle entrate relative a ciascun record meno il costo del record. I profitti per un quantile sono la somma dei profitti per tutti i record nel quantile. Si presuppone che le entrate vengano applicate solo ai riscontri, mentre i costi vengono applicati a tutti i record. Profitti e costi possono essere fissi oppure definiti da campi nei dati. I profitti sono calcolati come (somma delle entrate per i record nel quantile − somma dei costi per i record nel quantile).
- Kolmogorov-Smirnov
- Confronta la funzione di distribuzione cumulativa osservata per una variabile con una distribuzione teorica specificata, che può essere normale, uniforme, esponenziale o Poisson.
- GINI
- GINI misura la dispersione statistica ed è destinato a rappresentare la distribuzione del reddito o della ricchezza. È la misura più comunemente usata della disuguaglianza.
- Guadagno cumulativo
- Il grafico guadagno cumulativo confronta la percentuale di record che in ogni quantile
corrispondono a riscontri con la percentuale globale di riscontri nei dati di addestramento. Viene calcolato come
(hits in quantile / records in quantile) / (total hits / total records). - Risposta
- La risposta è la percentuale di record nel quantile che sono risultati positivi. La risposta viene calcolata come
(hits in quantile / records in quantile) × 100%.
- Impostazioni del grafico di valutazione
- Le seguenti impostazioni si applicano solo ai grafici di profitto e ROI.
- Costi
- Specificare il costo fisso associato a ciascun record.
- Ricavi
- Specificare le entrate fisse associate a ciascun record che rappresenta un risultato.
- Peso
- Se i record nei dati rappresentano più di una unità, è possibile utilizzare i pesi per modificare i risultati. Specificare il peso fisso associato a ciascun record.