Clasificación de clientes de telecomunicaciones (Regresión logística multinomial)

La regresión logística es una técnica de estadístico para clasificar los registros en función los valores de los campos de entrada. Es análoga a la regresión lineal pero utiliza un campo objetivo categórico en lugar de uno numérico.

Por ejemplo, imagine que un proveedor de telecomunicaciones ha segmentado su base de clientes por patrones de uso de servicio, y ha categorizado a los clientes en cuatro grupos. Si los datos demográficos se pueden utilizar para predecir la pertenencia a un grupo, se pueden personalizar las ofertas para cada uno de los posibles clientes.

Este ejemplo utiliza la ruta denominada telco_custcat.str, que hace referencia al archivo de datos denominado telco.sav. Estos archivos están disponibles en el directorio Demos de la instalación de IBM® SPSS Modeler. Puede acceder desde el grupo de programas IBM SPSS Modeler en el menú Inicio de Windows. El archivo telco_custcat.str está ubicado en el directorio streams.

Este ejemplo se centra en la utilización de datos demográficos para predecir patrones de uso. El campo objetivo catpers tiene cuatro posibles valores que corresponden a los cuatro grupos de clientes:

Valor Label
1 Servicio básico
2 Servicio electrónico
3 Servicio Plus
4 Servicio Total

Como el objetivo tiene varias categorías, se utiliza un modelo multinomial. En el caso de un objetivo con dos categorías distintas, como sí/no, verdadero/falso, o abandono/no abandono, se puede crear un modelo binomial. Consulte el tema Abandono de clientes de telecomunicaciones (Regresión logística binomial) para obtener más información.

Siguiente