Configuración de correlación

IBM® SPSS Modeler puede caracterizar correlaciones con etiquetas descriptivas para ayudarle a resaltar relaciones importantes. La correlación mide la fuerza de la relación entre dos campos continuos (rango numérico). Toma valores entre –1.0 y 1.0. Los valores cercanos a +1,0 indican una fuerte asociación positiva, de forma que los valores altos de un campo están asociados con los valores altos del otro y los valores bajos están asociados con los valores bajos. Los valores cercanos a –1,0 indican una asociación negativa fuerte, de forma que los valores altos para un campo están asociados con los valores bajos para el otro y viceversa. Los valores cercanos a 0,0 indican una asociación débil, de forma que los valores para los dos campos son más o menos independientes.

Mediante el cuadro de diálogo Configuración de correlación, puede controlar la visualización de las etiquetas de correlación, cambiar los umbrales que definen las categorías y cambiar las etiquetas utilizadas para cada rango. Ya que la forma de caracterizar los valores de correlación depende en gran parte del dominio del problema, puede que desee personalizar los rangos y las etiquetas para que se ajusten a su situación en particular.

Mostrar etiquetas de fuerza de correlación en salida. Esta opción está seleccionada de forma predeterminada. Anule la selección para anular las etiquetas descriptivas del resultado.

Fuerza de correlación. Hay dos opciones para definir y etiquetar la fuerza de las correlaciones:

  • Definir fuerza de correlación por importancia (1-p). Etiqueta las correlaciones según la importancia, que se define como 1 menos la significación o 1 menos la probabilidad de que la diferencia de las medias se pueda explicar por el azar solo. Cuanto más cerca está dicho valor a 1, mayor es la probabilidad de que los dos campos no sean independientes; es decir, que exista alguna relación entre ellos. El etiquetado de correlaciones por importancia se recomienda generalmente en vez del valor absoluto ya que tiene en cuenta la variabilidad de los datos; por ejemplo, un coeficiente de 0,6 puede ser altamente significativo en un conjunto de datos y nada significativo en otro. De forma predeterminada, los valores de importancia 0,0 y 0,9 se etiquetan como Débil, los valores entre 0,9 y 0,95 se etiquetan como Media y entre 0,95 y 1,0 se etiquetan como Fuerte.
  • Definir fuerza de correlación por valor absoluto. Etiqueta las correlaciones según el valor absoluto del coeficiente de correlación de Pearson, que varía entre –1 y 1, como se ha descrito anteriormente. Cuanto más cerca de 1 está el valor de esta medida, más fuerte es la correlación. De forma predeterminada, las correlaciones entre 0,0 y 0,3333 (en valores absolutos) se etiquetan como Débil, entre 0,3333 y 0,6666 se etiquetan como Media y entre 0,6666 y 1,0 se etiquetan como Fuerte. Tenga en cuenta, sin embargo, que la significación de cualquier valor es difícil de generalizar de un conjunto de datos a otro. Por ello, se recomienda en la mayoría de los casos definir correlaciones según la probabilidad en lugar de por el valor absoluto.