Niveles de medición

El nivel de medición (antes conocido como "tipo de datos" o "tipo de uso") describe el uso de los campos de datos en IBM® SPSS Modeler. El nivel de medición puede especificarse en la pestaña Tipos de un nodo de origen o Tipo. Por ejemplo, puede que desee definir el nivel de medición para un campo de enteros con valores de 1 y 0 para una Marca. Esto suele indicar que 1=Verdadero y 0=Falso.

Almacenamiento frente a medición. Tenga en cuenta que el nivel de medición de un campo difiere de su tipo de almacenamiento, que indica si los datos están almacenados como una cadena, un número entero, un número real, una fecha, una hora o una marca de tiempo. Los tipos de datos se pueden modificar en cualquier punto de una ruta mediante un nodo Tipo, mientras que el almacenamiento ha de definirse en el origen, al leer los datos en IBM SPSS Modeler (si bien posteriormente puede cambiarse a través de una función de conversión). Consulte el tema Configuración de almacenamiento de campos y formato para obtener más información.

Algunos nodos de modelado indican los tipos de nivel de medición permitidos para sus campos de entrada y objetivo por iconos en su pestaña Campos.

Iconos de nivel de medición

Tabla 1. Iconos de nivel de medición
Icono Nivel de medición
Valor predeterminado
Continuo
Categórica
Señalar
Nominal
Ordinal
Sin tipo
Colección
Geoespacial

Los siguientes niveles de medición están disponibles:

  • Valor predeterminado: los datos cuyo tipo de almacenamiento y valores son desconocidos (por ejemplo, porque aún no se han leído) se muestran como <Valor predeterminado>.
  • Continuo: Se usa para describir valores numéricos, como el rango de 0–100 o de 0,75–1,25. Un valor continuo pueden ser un número entero, un número real o la fecha/hora.
  • Categórico: Se utiliza en el caso de los valores de cadenas, cuando se desconoce un número exacto de valores distintos. Se trata de un tipo de datos sin instanciar, lo que significa que toda la información posible acerca del almacenamiento y utilización de los datos aún no se conoce. Una vez leídos los datos, el nivel de medición será Marca, Nominal o Sin tipo, dependiendo del número máximo de campos nominales especificado en el cuadro de diálogo Propiedades de la ruta.
  • Marca Se utiliza para datos con dos valores distintos que indican la presencia o ausencia de un rasgo, como true y false, y No o 0 y 1. Los valores utilizados pueden variar, pero uno siempre debe designarse como el valor verdadero y el otro como el valor falso. Los datos pueden representarse como texto, número entero, número real, fecha, hora o marca de tiempo.
  • Nominal: Se usa para describir datos con varios valores distintos, cada uno tratado como un miembro de un conjunto (por ejemplo pequeño/medio/grande). Los datos nominales pueden tener cualquier almacenamiento: numérico, cadena o fecha/hora. Tenga en cuenta que el establecimiento del nivel de medida a Nominal no cambia de forma automática los valores a almacenamiento de cadena.
  • Ordinal: Se usa para describir datos con varios valores diferentes que tienen un orden inherente. Por ejemplo, las categorías salariales o las clasificaciones de satisfacción pueden escribirse como datos ordinales. El orden se define a través del orden de clasificación natural de los elementos de datos. Por ejemplo, 1, 3, 5 es el orden de clasificación predeterminado de un conjunto de números enteros, mientras que ALTO, BAJO, NORMAL (orden alfabético ascendente) es el orden de un conjunto de cadenas. El nivel de medición ordinal le permite definir un conjunto de datos categóricos como datos ordinales para la visualización, generación de modelos y la exportación a otras aplicaciones (como IBM SPSS Statistics), que reconoce los datos ordinales como un tipo distinto. Puede utilizar un campo ordinal en cualquier punto donde pueda utilizarse un campo nominal. Además, los campos de cualquier tipo de almacenamiento (real, entero, cadena, fecha, hora, etc.) pueden definirse como ordinal.
  • Sin tipo: Se utiliza para datos que no se ajustan a ninguno de los tipos anteriores, para campos con un único valor, o para datos nominales donde el conjunto tiene más miembros que el máximo definido. Resulta también útil con los casos en los que, de lo contrario, el nivel de medición sería un conjunto con demasiados miembros (como un número de cuenta). Cuando seleccione Sin tipo para un campo, el rol se establece automáticamente en Ninguno, con el ID de registro como la única alternativa. El tamaño máximo predeterminado de los conjuntos es de 250 valores exclusivos. Este número puede ajustarse o desactivarse en la pestaña Opciones del cuadro de diálogo Propiedades de la ruta, que puede abrirse desde el menú Herramientas.
  • Recopilación: Se utiliza para identificar los datos que no son geoespaciales y que se registran en una lista. Una recopilación es, en la práctica, un campo de lista con una profundidad de cero, en la que los elementos de dicha lista tienen uno de los otros niveles de medición.

    Para obtener más información acerca de las listas, consulte Almacenamiento de lista y niveles de medición asociados.

  • Geoespacial: Se utiliza con el tipo de almacenamiento de lista para identificar los datos geoespaciales. Las listas pueden ser el campo Lista de enteros o Lista de reales con una profundidad de lista entre cero y dos, inclusive.

    Para obtener más información, consulte Subniveles de medición geoespacial.

Puede especificar manualmente los niveles de medición o bien dejar que el software lea los datos y determine el nivel de medición según los valores que lee.

Asimismo, si tiene varios campos de datos continuos que deberían tratarse como datos categóricos, puede seleccionar una opción para convertirlos. Consulte el tema Conversión de datos continuos para obtener más información.

Para utilizar la escritura automática

  1. En el nodo Tipo o en la pestaña Tipos de un nodo de origen, establezca la columna Valores en <Leer> para los campos deseados. Así se pondrán los metadatos a disposición de todos los nodos que se encuentran a continuación en la ruta. Puede establecer rápidamente todos los campos en <Leer> o <Pasar> usando los botones de gafas del cuadro de diálogo.
  2. Pulse Leer valores para leer inmediatamente los valores del origen de datos.

Para establecer manualmente el nivel de medición para un campo

  1. Seleccione un campo de la tabla.
  2. En la lista desplegable de la columna Medición seleccione un nivel de medición para el campo.
  3. Si lo prefiere, puede pulsar Ctrl-A o Ctrl mientras pulsa en un campo para seleccionar varios campos antes de utilizar la lista desplegable con objeto de seleccionar un nivel de medición.