Статистики в процедуре Частоты
Значения процентилей. Значение процентили - это значение количественной переменной, которое разделяет упорядоченные данные на группы таким образом, что определенный процент наблюдений имеет значения этой количественной переменной меньше значения процентили, а другой процент наблюдений имеет значения этой количественной переменной больше значения процентили. Квартили - это 25%-е, 50%-е и 75%-е процентили, которые разделяют наблюдения на четыре группы одинакового объема. Если вы хотите получить разбивку на иное число равных групп, воспользуйтесь пунктом Процентили для n равных групп. Можно также задать отдельные процентили (например, 95%-й процентиль - значение, меньше которого значения 95% наблюдений).
Расположение (центральная тенденция). Статистики, описывающие расположения распределений, включают среднее, медиану, моду и сумму всех значений.
- Среднее. Мера центральной тенденции. Арифметическое среднее; сумма, деленная на число наблюдений.
- Медиана. Значение, выше и ниже которого попадает по половине наблюдений, иначе 50-й процентиль. Если число наблюдений четно, медиана есть арифметическое среднее двух находящихся в середине значений, если выборку упорядочить по убыванию или по возрастанию. Медиана представляет собой меру центральной тенденции, которая нечувствительна к выбросам, в отличие от среднего значения, которое могут исказить несколько экстремально больших или малых значений.
- Мода. Чаще всего встречающееся значение. Если таких значений несколько, каждое из них является модой. Процедура Частоты выдает только наименьшее из этих значений.
- Sum. Сумма или итог для всех значений по всем наблюдениям, имеющим непропущенные значения.
Разброс. Статистики, которые измеряют вариацию или разброс в данных, включают стандартное отклонение, дисперсию, размах, минимальное значение, максимальное значение и стандартную ошибку среднего.
- Среднеквадратичное отклонение. Мера дисперсии вокруг среднего, выраженная в тех же единицах измерения, что и наблюдения. Равна корню квадратному из дисперсии. При нормальном распределении 68% наблюдений укладываются в одно стандартное отклонение от среднего, и 95% - в два стандартных отклонения. Если, например, средний возраст равен 45 годам со стандартным отклонением 10, то 95% наблюдений должны оказаться между 25 и 65 годами при нормальном распределении.
- Дисперсия. Мера дисперсии относительно среднего значения. Равна сумме квадратов отклонений от среднего, деленной на число, на единицу меньшее числа наблюдений. Дисперсия измеряется в единицах, которые равны квадратам единиц измерения самой переменной.
- Range . Разность между наибольшим и наименьшим значениями числовой переменной; максимум минус минимум.
- Минимум. Наименьшее значение числовой переменной.
- Максимум. Наибольшее значение числовой переменной.
- Среднеквадратическая ошибка среднего. Мера того, как сильно могут отличаться значения среднего от выборки к выборке, извлекаемых из одного и того же распределения. Можно применять для грубого сравнения наблюденного среднего с гипотетическим значением (то есть можно заключить, что два значения различаются, если отношение их разности к стандартному отклонению меньше -2 или больше +2).
Распределение. Асимметрия и эксцесс - это статистики, описывающие форму и симметричность распределения. Эти статистики выводятся вместе с их стандартными ошибками.
- Асимметрия. Мера асимметрии распределения. Нормальное распределение симметрично, и для него асимметрия равна 0. Распределение со значимой положительной асимметрией имеет длинный хвост справа. Распределение со значимой отрицательной асимметрией имеет длинный хвост слева. В качестве грубого правила можно сказать, что значение асимметрии, более чем вдвое превышающее ее стандартную ошибку, указывает на наличие асимметрии распределения.
- Эксцесс. Мера интенсивности выбросов. Для нормального распределения значение эксцесса равно 0. Положительный эксцесс означает, что выбросы в данных интенсивнее, чем для нормального распределения. Отрицательный эксцесс означает, что в данных наблюдается меньше выбросов, чем в нормальном распределении.
Значения - центры групп. Если значения анализируемых данных представлены средними точками групп (например, возраст всех людей от 30 до 40 лет закодирован числом 35), можно пометить этот элемент, чтобы получить оценки медианы и процентилей исходных, несгруппированных данных.
Как получить статистики в процедуре Частоты
Для этой функциональной возможности требуется модуль База статистики.
- Выберите в меню:
- В диалоговом окне Частоты нажмите кнопку Статистики .
- Выберите необходимые статистики.