Меню Закрыть

Чему равно среднеквадратическое отклонение

Содержание

Состояние отпатрулирована

Среднеквадрати́ческое отклоне́ние (среднее квадрати́ческое отклоне́ние, среднеквадрати́чное отклоне́ние, квадрати́чное отклоне́ние, станда́ртное отклоне́ние, станда́ртный разбро́с) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания. Обычно указанные термины означают квадратный корень из дисперсии случайной величины, но иногда могут означать тот или иной вариант оценки этого значения.

В литературе обычно обозначают греческой буквой σ <displaystyle sigma > (сигма).

Содержание

Основные сведения [ править | править код ]

Среднеквадратическое отклонение определяется как квадратный корень из дисперсии случайной величины: σ = D [ X ] <displaystyle sigma =<sqrt >> .

Среднеквадратическое отклонение измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

На практике, когда вместо точного распределения случайной величины в распоряжении имеется лишь выборка, стандартное отклонение, как и математическое ожидание, оценивают (выборочная дисперсия), и делать это можно разными способами. Термины «стандартное отклонение» и «среднеквадратическое отклонение» обычно применяют к квадратному корню из дисперсии случайной величины (определённому через её истинное распределение), но иногда и к различным вариантам оценки этой величины на основании выборки.

В частности, если x i <displaystyle x_> i -й элемент выборки, n <displaystyle n> — объём выборки, x ¯ <displaystyle <ar >> — среднее арифметическое выборки (выборочное среднее — оценка математического ожидания величины):

x ¯ = 1 n ∑ i = 1 n x i = 1 n ( x 1 + … + x n ) , <displaystyle <ar >=<frac <1>>sum _^x_=<frac <1>>(x_<1>+ldots +x_),>

то два основных способа оценки стандартного отклонения записываются нижеследующим образом.

Оценка стандартного отклонения на основании смещённой оценки дисперсии (иногда называемой просто выборочной дисперсией [1] ):

S = 1 n ∑ i = 1 n ( x i − x ¯ ) 2 . <displaystyle S=<sqrt <<frac <1>>sum _^left(x_-<ar >
ight)^<2>>>.>

Это в буквальном смысле среднее квадратическое разностей измеренных значений и среднего.

Оценка стандартного отклонения на основании несмещённой оценки дисперсии (подправленной выборочной дисперсии [1] , в ГОСТ Р 8.736-2011 — «среднее квадратическое отклонение»):

S 0 = n n − 1 S 2 = 1 n − 1 ∑ i = 1 n ( x i − x ¯ ) 2 . <displaystyle S_<0>=<sqrt <<frac >S^<2>>>=<sqrt <<frac <1>>sum _^left(x_-<ar >
ight)^<2>>>.>

Само по себе, однако, S 0 <displaystyle S_<0>> не является несмещённой оценкой квадратного корня из дисперсии, то есть извлечение квадратного корня «портит» несмещённость.

Кроме того, среднеквадратическим отклонением называют математическое ожидание квадрата разности истинного значения случайной величины и её оценки для некоторого метода оценки [2] . Если оценка несмещённая (выборочное среднее — как раз несмещённая оценка для случайной величины), то эта величина равна дисперсии этой оценки.

Правило трёх сигм [ править | править код ]

Правило трёх сигм ( 3 σ <displaystyle 3sigma > ) гласит: вероятность того, что любая случайная величина отклонится от своего среднего значения менее чем на 3 σ <displaystyle 3sigma > , — P ( | ξ − E ξ ∣ 3 σ ) ≥ 8 9 <displaystyle P(|xi -Exi mid .

Практически все значения нормально распределённой случайной величины лежат в интервале ( μ − 3 σ ; μ + 3 σ ) <displaystyle left(mu -3sigma ;mu +3sigma
ight)> , где μ = E ξ <displaystyle mu =Exi > — математическое ожидание случайной величины. Более строго — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале.

Интерпретация величины среднеквадратического отклонения [ править | править код ]

Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

Например, у нас есть три числовых множества: <0, 0, 14, 14>, <0, 6, 8, 14>и <6, 6, 8, 8>. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения — значения внутри множества сильно расходятся со средним значением.

В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.

Практическое применение [ править | править код ]

На практике среднеквадратическое отклонение позволяет оценить, насколько значения из множества могут отличаться от среднего значения.

Экономика и финансы [ править | править код ]

Среднее квадратическое отклонение доходности портфеля σ = D [ X ] <displaystyle sigma =<sqrt >> отождествляется с риском портфеля.

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера, расчёта волатильности.

Климат [ править | править код ]

Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой на равнине. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

Спорт [ править | править код ]

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

Пример вычисления стандартного отклонения оценок учеников [ править | править код ]

Предположим, что интересующая нас группа (генеральная совокупность) это класс из восьми учеников, которым выставляются оценки по 10-бальной системе. Так как мы оцениваем всю группу, а не её выборку, можно использовать стандартное отклонение на основании смещённой оценки дисперсии. Для этого берём квадратный корень из среднего арифметического квадратов отклонений величин от их среднего значения.

Читайте также:  Как отправить контакты с телефона в гугл

Пусть оценки учеников класса следующие:

2 , 4 , 4 , 4 , 5 , 5 , 7 , 9. <displaystyle 2, 4, 4, 4, 5, 5, 7, 9.>

Тогда средняя оценка равна:

μ = 2 + 4 + 4 + 4 + 5 + 5 + 7 + 9 8 = 5 <displaystyle mu =<frac <2+4+4+4+5+5+7+9><8>>=5>

Вычислим квадраты отклонений оценок учеников от их средней оценки:

( 2 − 5 ) 2 = ( − 3 ) 2 = 9 ( 5 − 5 ) 2 = 0 2 = 0 ( 4 − 5 ) 2 = ( − 1 ) 2 = 1 ( 5 − 5 ) 2 = 0 2 = 0 ( 4 − 5 ) 2 = ( − 1 ) 2 = 1 ( 7 − 5 ) 2 = 2 2 = 4 ( 4 − 5 ) 2 = ( − 1 ) 2 = 1 ( 9 − 5 ) 2 = 4 2 = 16 <displaystyle <egin(2-5)^<2>=(-3)^<2>=9&&(5-5)^<2>=0^<2>=0\(4-5)^<2>=(-1)^<2>=1&&(5-5)^<2>=0^<2>=0\(4-5)^<2>=(-1)^<2>=1&&(7-5)^<2>=2^<2>=4\(4-5)^<2>=(-1)^<2>=1&&(9-5)^<2>=4^<2>=16\end>>

Среднее арифметическое этих значений называется дисперсией:

σ 2 = 9 + 1 + 1 + 1 + 0 + 0 + 4 + 16 8 = 4 <displaystyle sigma ^<2>=<frac <9+1+1+1+0+0+4+16><8>>=4>

Стандартное отклонение равно квадратному корню дисперсии:

σ = 4 = 2 <displaystyle sigma =<sqrt <4>>=2>

Эта формула справедлива только если эти восемь значений и являются генеральной совокупностью. Если бы эти данные были случайной выборкой из какой-то большой совокупности (например, оценки восьми случайно выбранных учеников большого города), то в знаменателе формулы для вычисления дисперсии вместо n = 8 нужно было бы поставить n − 1 = 7:

σ 2 = 9 + 1 + 1 + 1 + 0 + 0 + 4 + 16 7 ≈ 4 , 57 <displaystyle sigma ^<2>=<frac <9+1+1+1+0+0+4+16><7>>approx 4,57>

и стандартное отклонение равнялось бы:

σ = 4 , 57 ≈ 2 , 14 <displaystyle sigma =<sqrt <4,57>>approx 2,14>

Этот результат называется стандартным отклонением на основании несмещённой оценки дисперсии. Деление на n − 1 вместо n даёт неискажённую оценку дисперсии для больших генеральных совокупностей.

Измеряется в единицах измерения самой случайной величины. Равно корню квадратному из дисперсии случайной величины. Среднеквадратическое отклонение используют при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

Стандартное отклонение (оценка среднеквадратического отклонения случайной величины Пол, стены вокруг нас и потолок, x относительно её математического ожидания на основе несмещённой оценки её дисперсии):

где — дисперсия; — Пол, стены вокруг нас и потолок, i -й элемент выборки; — объём выборки; — среднее арифметическое выборки:

Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной [1] .

Правило трёх сигм

Правило трёх сигм () — практически все значения нормально распределённой случайной величины лежат в интервале . Более строго — не менее чем с 99,7 % достоверностью значение нормально распределенной случайной величины лежит в указанном интервале (при условии, что величина истинная, а не полученная в результате обработки выборки).

Если же истинная величина неизвестна, то следует пользоваться не , а Пол, стены вокруг нас и потолок, s . Таким образом, правило трёх сигм преобразуется в правило трёх Пол, стены вокруг нас и потолок, s .

Интерпретация величины среднеквадратического отклонения

Большое значение среднеквадратического отклонения показывает большой разброс значений в представленном множестве со средней величиной множества; маленькое значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

Например, у нас есть три числовых множества: <0, 0, 14, 14>, <0, 6, 8, 14>и <6, 6, 8, 8>. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения — значения внутри множества сильно расходятся со средним значением.

В общем смысле среднеквадратическое отклонение можно считать мерой неопределенности. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.

Практическое применение

На практике среднеквадратическое отклонение позволяет определить, насколько значения в множестве могут отличаться от среднего значения.

Климат

Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой внутри континента. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

Спорт

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

Технический анализ

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера.

См. также

Литература

Эта статья предлагается к удалению.

* Боровиков, В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. — СПб. : Питер, 2003. — 688 с. — ISBN 5-272-00078-1 .

Статистические показатели
Описательная
статистика
Непрерывные
данные
Коэффициент сдвига Среднее (Арифметическое, Геометрическое, Гармоническое) · Медиана · Мода · Размах
Вариация Ранг · Среднеквадратическое отклонение · Коэффициент вариации · Квантиль (Дециль, Процентиль/Перцентиль/Центиль)
Моменты Математическое ожидание · Дисперсия · Асимметрия · Эксцесс
Дискретные
данные Частота · Таблица контингентности Статистический
вывод и
проверка
гипотез
Статистический
вывод Доверительный интервал (Частотная вероятность) · Достоверный интервал (Байесовский вывод) · Статистическая значимость · Мета-анализ Планирование
эксперимента Генеральная совокупность · Планирование выборки · Районированная выборка · Репликация · Группировка · Чувствительность и специфичность Объём выборки Статистическая мощность · Мера эффекта · Стандартная ошибка Общая оценка Байесовская оценка решения · Метод максимального правдоподобия · Метод моментов нахождения оценок · Оценка минимального расстояния · Оценка максимального интервала Статистические
критерии Z-тест · t-критерий Стьюдента · Критерий Фишера · Критерий Пирсона (Хи-квадрат) · Критерий согласия Колмогорова · Тест Вальда · U-критерий Манна — Уитни · Критерий Уилкоксона · Критерий Краскела — Уоллиса · Критерий Кохрена · Критерий Лиллиефорса Анализ выживания Функция выживания · Оценка Каплана — Мейера · Логранк-тест · Интенсивность отказов · Пропорциональная модель опасностей Корреляция

Читайте также:  Как подключить пс4 к монитору компьютера
Коэффициент корреляции Пирсона · Ранг корреляций (Коэффициент Спирмана для ранга корреляций, Коэффициент тау Кендалла для ранга корреляций) · Переменная смешивания Линейные модели Основная линейная модель · Обобщённая линейная модель · Анализ вариаций · Ковариационный анализ Регрессия Линейная · Нелинейная · Непараметрическая регрессия · Полупараметрическая регрессия · Логистическая регрессия Столбчатая диаграмма · Совмещённая диаграмма · Диаграмма управления · Лесная диаграмма · Гистограмма · Q-Q диаграмма · Диаграмма выполнения · Диаграмма разброса · Стебель-листья · Ящик с усами
  1. Обе вышеупомянутые оценки — состоятельные

Wikimedia Foundation . 2010 .

Смотреть что такое "Среднеквадратическое отклонение" в других словарях:

Среднеквадратическое отклонение — мера отклонения опытных данных от выборочного среднего значения или от функциональной зависимости, выражаемая в абсолютных единицах, вычисляется по формулам (4), (12). Источник: ГОСТ 20522 96: Грунты. Методы статистической обработки результатов… … Словарь-справочник терминов нормативно-технической документации

Среднеквадратическое отклонение — показатель связи результатов деятельности взаимного фонда с общей ситуацией на рынке или динамикой соответствующего базового индекса. Если среднеквадратическое отклонение равно 1, то стоимость портфеля фонда в точности повторяет изменения… … Финансовый словарь

Среднеквадратическое отклонение — повторяемости: среднеквадратическое отклонение результатов измерений, полученных в условиях повторяемости (является мерой рассеяния результатов измерений в условиях повторяемости). Источник: ГОСУДАРСТВЕННАЯ СИСТЕМА ОБЕСПЕЧЕНИЯ ЕДИНСТВА… … Официальная терминология

Среднеквадратическое отклонение — * сярэднеквадратычнае адхіленне * mean square deviation or standard deviation описательная статистика (параметр), являющаяся мерой рассеяния для приближенно нормально распределенных данных. Если распределение не соответствует закону нормального… … Генетика. Энциклопедический словарь

среднеквадратическое отклонение — v >Automatikos terminų žodynas

Среднеквадратическое отклонение воспроизводимости — Среднеквадратическое отклонение воспроизводимости: среднеквадратическое отклонение результатов измерений, полученных в условиях воспроизводимости (является мерой рассеяния результатов измерений в условиях воспроизводимости). Источник:… … Официальная терминология

среднеквадратическое отклонение воспроизводимости — 3.6.5.1 среднеквадратическое отклонение воспроизводимости: Среднеквадратическое отклонение результатов измерений, полученных в условиях воспроизводимости (является мерой рассеяния результатов измерений в условиях воспроизводимости). Источник:… … Словарь-справочник терминов нормативно-технической документации

среднеквадратическое отклонение воспроизводимости результатов испытаний — 3.21 среднеквадратическое отклонение воспроизводимости результатов испытаний sR:Среднеквадратическое отклонение результатов испытаний, полученных в условиях воспроизводимости (см. 3.19) [5]. Источник … Словарь-справочник терминов нормативно-технической документации

среднеквадратическое отклонение повторяемости (сходимости) результатов испытаний — 3.24 среднеквадратическое отклонение повторяемости (сходимости) результатов испытаний sr: Среднеквадратическое отклонение результатов испытаний, полученных в условиях повторяемости (сходимости) (см. 3.22) [5]. Источник … Словарь-справочник терминов нормативно-технической документации

среднеквадратическое отклонение (совокупности), стандартное отклонение (совокупности) — 3.13 среднеквадратическое отклонение (совокупности), стандартное отклонение (совокупности) [(population) standard deviation] σ: Положительный квадратный корень из дисперсии совокупности σ2. Источник: ГОСТ Р ИСО 12491 2011: Материалы и изделия… … Словарь-справочник терминов нормативно-технической документации

Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение ( ) равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической:

Среднее квадратическое отклонение простое:

Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:

Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение:

Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.

Дисперсия, ее виды, среднеквадратическое отклонение.

Дисперсия случайной величины — мера разброса данной случайной величины, т. е. её отклонения отматематического ожидания. В статистике часто употребляется обозначение или . Квадратный корень из дисперсии называется среднеквадратичным отклонением, стандартным отклонением или стандартным разбросом.

Общая дисперсия (σ 2 ) измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Вместе с тем, благодаря методу группировок можно выделить и измерить вариацию, обусловленную группировочным признаком, и вариацию, возникающую под влиянием неучтенных факторов.

Межгрупповая дисперсия (σ 2 м.гр) характеризует систематическую вариацию, т. е. различия в величине изучаемого признака, возникающие под влиянием признака – фактора, положенного в основание группировки.

Среднеквадратическое отклонение (синонимы: среднее квадратическое отклонение, среднеквадратичное отклонение, квадратичное отклонение; близкие термины: стандартное отклонение, стандартный разброс) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величиныотносительно её математического ожидания. При ограниченных массивах выборок значений вместо математического ожидания используется среднее арифметическоесовокупности выборок.

Среднеквадратическое отклонение измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами. Определяется какквадратный корень из дисперсии случайной величины.

Среднеквадратическое отклонение:

Стандартное отклонение (оценка среднеквадратического отклонения случайной величины x относительно её математического ожидания на основе несмещённой оценки её дисперсии):

где — дисперсия; i-й элемент выборки; — объём выборки; — среднее арифметическое выборки:

Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной.

Сущность, область применения и порядок определения моды и медианы.

Кроме степенных средних в статистике для относительной характеристики величины варьирующего признака и внутреннего строения рядов распределения пользуются структурными средними, которые представлены ,в основном, модой и медианой.

Мода — это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является варианта, обладающая наибольшей частотой. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем — значение модальной величины признака по формуле:

где:

— значение моды

— нижняя граница модального интервала

— величина интервала

— частота модального интервала

— частота интервала, предшествующего модальному

— частота интервала, следующего за модальным

Медиана — это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части.

Для определения медианы в дискретном ряду при наличии частот сначала вычисляют полусумму частот , а затем определяют, какое значение варианта приходится на нее. (Если отсортированный ряд содержит нечетное число признаков, то номер медианы вычисляют по формуле:

Ме = (n(число признаков в совокупности) + 1)/2,

в случае четного числа признаков медиана будет равна средней из двух признаков находящихся в середине ряда).

Читайте также:  Miflash синтаксическая ошибка в имени файла

При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем — значение медианы по формуле:

где:

— искомая медиана

— нижняя граница интервала, который содержит медиану

— величина интервала

— сумма частот или число членов ряда

— сумма накопленных частот интервалов, предшествующих медианному

— частота медианного интервала

Пример. Найти моду и медиану.

Возрастные группы Число студентов Сумма накопленных частот ΣS
До 20 лет
20 — 25
25 — 30
30 — 35
35 — 40
40 — 45
45 лет и более
Итого

Решение:
В данном примере модальный интервал находится в пределах возрастной группы 25-30 лет, так как на этот интервал приходится наибольшая частота (1054).

Рассчитаем величину моды:

Это значит что модальный возраст студентов равен 27 годам.

Вычислим медиану. Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (Σfi/2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:

Это значит что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.

Кроме моды и медианы могут быть использованы такие показатели, как квартили, делящие ранжированный ряд на 4 равные части, децили — 10 частей и перцентили — на 100 частей.

Понятие выборочного наблюдения и область его применения.

Выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив — генеральную совокупность (ГС). При этом числоединиц ввыборке обозначают n, а во всей ГС — N. Отношение n/N называется относительныйразмер или долявыборки.

Качество результатов выборочного наблюдения зависит от репрезентативности выборки, то есть от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.

Существует 4 способа случайного отбора в выборку:

  1. Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.
  2. Механический отбор, согласно которому отбирается каждая (N/n)-я величина генеральной совокупности. Например, если она содержит 100 000 величин, а требуется выбрать 1 000, то в выборку попадет каждая 100 000 / 1000 = 100-я величина. Причем, если они не ранжированы, то первая выбирается наугад из первой сотни, а номера других будут на сотню больше. Например, если первой оказалась единица № 19, то следующей должна быть № 119, затем № 219, затем № 319 и т.д. Если единицы генеральной совокупности ранжированы, то первой выбирается № 50, затем № 150, затем № 250 и так далее.
  3. Отбор величин из неоднородного массива данных ведется стратифицированным (расслоенным) способом, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.
  4. Особый способ составления выборки представляет собой серийный отбор, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.

Качество выборочных наблюдений зависит и от типа выборки: повторная или бесповторная.

При повторном отборе попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку.

Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.

Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.

Предельная ошибка выборки наблюдения, средняя ошибка выборки, порядок их расчета.

Рассмотрим подробно перечисленные выше способы формирования выборочной совокупности и возникающие при этом ошибки репрезентативности.
Собственно-случайная выборка основывается на отборе единиц из генеральной совокупности наугад без каких-либо элементов системности. Технически собственно-случайный отбор проводят методом жеребьевки (например, розыгрыши лотерей) или по таблице случайных чисел.

Собственно-случайный отбор «в чистом виде» в практике выборочного наблюдения применяется редко, но он является исходным среди других видов отбора, в нем реализуются основные принципы выборочного наблюдения. Рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.

Ошибка выборочного наблюдения – это разность между величиной параметра в генеральной совокупности, и его величиной, вычисленной по результатам выборочного наблюдения. Для средней количественного признака ошибка выборки определяется


Показатель называется предельной ошибкой выборки.
Выборочная средняя является случайной величиной, которая может принимать различные значения в зависимости от того, какие единицы попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки , которая зависит от:

— объема выборки: чем больше численность, тем меньше величина средней ошибки;

— степени изменения изучаемого признака: чем меньше вариация признака, а, следовательно, и дисперсия, тем меньше средняя ошибка выборки.

При случайном повторном отборе средняя ошибка рассчитывается:
.
Практически генеральная дисперсия точно не известна, но в теории вероятности доказано, что
.
Так как величина при достаточно больших n близка к 1, можно считать, что . Тогда средняя ошибка выборки может быть рассчитана:
.
Но в случаях малой выборки (при n 0 или равномерное падение при b1 1 или замедляющееся падение при b1

Гипербола Замедляющееся падение при b1 > 0 или замедляющийся рост при b1

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Да какие ж вы математики, если запаролиться нормально не можете. 8558 — | 7410 — или читать все.

Рекомендуем к прочтению

Добавить комментарий

Ваш адрес email не будет опубликован.