Статистики в процедуре Частоты

Значения процентилей. Значение процентили - это значение количественной переменной, которое разделяет упорядоченные данные на группы таким образом, что определенный процент наблюдений имеет значения этой количественной переменной меньше значения процентили, а другой процент наблюдений имеет значения этой количественной переменной больше значения процентили. Квартили - это 25%-е, 50%-е и 75%-е процентили, которые разделяют наблюдения на четыре группы одинакового объема. Если вы хотите получить разбивку на иное число равных групп, воспользуйтесь пунктом Процентили для n равных групп. Можно также задать отдельные процентили (например, 95%-й процентиль - значение, меньше которого значения 95% наблюдений).

Расположение (центральная тенденция). Статистики, описывающие расположения распределений, включают среднее, медиану, моду и сумму всех значений.

  • Среднее. Мера центральной тенденции. Арифметическое среднее; сумма, деленная на число наблюдений.
  • Медиана. Значение, выше и ниже которого попадает по половине наблюдений, иначе 50-й процентиль. Если число наблюдений четно, медиана есть арифметическое среднее двух находящихся в середине значений, если выборку упорядочить по убыванию или по возрастанию. Медиана представляет собой меру центральной тенденции, которая нечувствительна к выбросам, в отличие от среднего значения, которое могут исказить несколько экстремально больших или малых значений.
  • Мода. Чаще всего встречающееся значение. Если таких значений несколько, каждое из них является модой. Процедура Частоты выдает только наименьшее из этих значений.
  • Sum. Сумма или итог для всех значений по всем наблюдениям, имеющим непропущенные значения.

Разброс. Статистики, которые измеряют вариацию или разброс в данных, включают стандартное отклонение, дисперсию, размах, минимальное значение, максимальное значение и стандартную ошибку среднего.

  • Среднеквадратичное отклонение. Мера дисперсии вокруг среднего, выраженная в тех же единицах измерения, что и наблюдения. Равна корню квадратному из дисперсии. При нормальном распределении 68% наблюдений укладываются в одно стандартное отклонение от среднего, и 95% - в два стандартных отклонения. Если, например, средний возраст равен 45 годам со стандартным отклонением 10, то 95% наблюдений должны оказаться между 25 и 65 годами при нормальном распределении.
  • Дисперсия. Мера дисперсии относительно среднего значения. Равна сумме квадратов отклонений от среднего, деленной на число, на единицу меньшее числа наблюдений. Дисперсия измеряется в единицах, которые равны квадратам единиц измерения самой переменной.
  • Range . Разность между наибольшим и наименьшим значениями числовой переменной; максимум минус минимум.
  • Минимум. Наименьшее значение числовой переменной.
  • Максимум. Наибольшее значение числовой переменной.
  • Среднеквадратическая ошибка среднего. Мера того, как сильно могут отличаться значения среднего от выборки к выборке, извлекаемых из одного и того же распределения. Можно применять для грубого сравнения наблюденного среднего с гипотетическим значением (то есть можно заключить, что два значения различаются, если отношение их разности к стандартному отклонению меньше -2 или больше +2).

Распределение. Асимметрия и эксцесс - это статистики, описывающие форму и симметричность распределения. Эти статистики выводятся вместе с их стандартными ошибками.

  • Асимметрия. Мера асимметрии распределения. Нормальное распределение симметрично, и для него асимметрия равна 0. Распределение со значимой положительной асимметрией имеет длинный хвост справа. Распределение со значимой отрицательной асимметрией имеет длинный хвост слева. В качестве грубого правила можно сказать, что значение асимметрии, более чем вдвое превышающее ее стандартную ошибку, указывает на наличие асимметрии распределения.
  • Эксцесс. Мера интенсивности выбросов. Для нормального распределения значение эксцесса равно 0. Положительный эксцесс означает, что выбросы в данных интенсивнее, чем для нормального распределения. Отрицательный эксцесс означает, что в данных наблюдается меньше выбросов, чем в нормальном распределении.

Значения - центры групп. Если значения анализируемых данных представлены средними точками групп (например, возраст всех людей от 30 до 40 лет закодирован числом 35), можно пометить этот элемент, чтобы получить оценки медианы и процентилей исходных, несгруппированных данных.

Как получить статистики в процедуре Частоты

Для этой функциональной возможности требуется модуль База статистики.

  1. Выберите в меню:

    Анализ > Описательные статистики > Частоты...

  2. В диалоговом окне Частоты нажмите кнопку Статистики .
  3. Выберите необходимые статистики.