Preparación automática de datos (ADP)

La preparación de los datos para el análisis es uno de los pasos más importantes en cualquier proyecto de minería de datos y, tradicionalmente, uno de los que exigen más tiempo. El nodo Preparación automática de datos (ADP) gestiona esta función, analiza los datos e identifica los valores fijos, criba los campos problemáticos o que no serán útiles, deriva nuevos atributos cuando es necesario y mejora el rendimiento mediante técnicas de cribado inteligente. Puede utilizar el nodo de forma totalmente automática, permitiendo que el nodo seleccione y aplique valores fijos, o bien puede tener una vista previa de los cambios antes de que se apliquen y aceptarlos o rechazarlos.

El uso del nodo ADP le permite preparar sus datos de forma rápida y simple para la minería de datos, sin necesidad de tener un conocimiento previo de los conceptos estadísticos necesarios. Si ejecuta el nodo con los valores predeterminados, los modelos tenderán a construir y puntuar más rápidamente.

Este ejemplo utiliza la ruta denominada ADP_basic_demo.str, que hace referencia al archivo de datos denominado telco.sav para demostrar la precisión aumentada que pueden encontrarse utilizando la configuración del nodo ADP predeterminado cuando se construyen modelos. Estos archivos están disponibles en el directorio Demos de la instalación de IBM® SPSS Modeler. Puede acceder desde el grupo de programas IBM SPSS Modeler en el menú Inicio de Windows. El archivo ADP_basic_demo.str se encuentra en el directorio streams.

Siguiente