При статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.
Среднеквадратическое отклонение:
Стандартное отклонение (оценка среднеквадратического отклонения случайной величины Пол, стены вокруг нас и потолок,x относительно её математического ожидания на основе несмещённой оценки её дисперсии):
где - дисперсия ; - Пол, стены вокруг нас и потолок,i -й элемент выборки; - объём выборки; - среднее арифметическое выборки:
Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной .
Правило трёх сигм
Правило трёх сигм () - практически все значения нормально распределённой случайной величины лежат в интервале . Более строго - не менее чем с 99,7 % достоверностью значение нормально распределенной случайной величины лежит в указанном интервале (при условии, что величина истинная, а не полученная в результате обработки выборки).
Если же истинная величина неизвестна, то следует пользоваться не , а Пол, стены вокруг нас и потолок,s . Таким образом, правило трёх сигм преобразуется в правило трёх Пол, стены вокруг нас и потолок,s .
Интерпретация величины среднеквадратического отклонения
Большое значение среднеквадратического отклонения показывает большой разброс значений в представленном множестве со средней величиной множества; маленькое значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.
Например, у нас есть три числовых множества: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8}. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения - значения внутри множества сильно расходятся со средним значением.
В общем смысле среднеквадратическое отклонение можно считать мерой неопределенности. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.
Практическое применение
На практике среднеквадратическое отклонение позволяет определить, насколько значения в множестве могут отличаться от среднего значения.
Климат
Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой внутри континента. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.
Спорт
Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.
Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.
Технический анализ
См. также
Литература
Эта статья предлагается к удалению.
Пояснение причин и соответствующее обсуждение вы можете найти на странице Википедия:К удалению/17 декабря 2012.
|
* Боровиков, В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. - СПб. : Питер, 2003. - 688 с. - ISBN 5-272-00078-1 .
Статистические показатели | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Описательная статистика |
|
||||||||||
Статистический вывод и проверка гипотез |
|
По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:
Определите:
1) размах вариации;
2) средний размер вклада;
3) среднее линейное отклонение;
4) дисперсию;
5) среднее квадратическое отклонение;
6) коэффициент вариации вкладов.
Решение:
Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.
Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.
1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:
Размах вариации размера вклада равен 1000 рублей.
2) Средний размер вклада определим по формуле средней арифметической взвешенной.
Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.
Среднее значение первого интервала будет равно:
второго - 500 и т. д.
Занесём результаты вычислений в таблицу:
Размер вклада, руб. | Число вкладчиков, f | Середина интервала, х | xf |
---|---|---|---|
200-400 | 32 | 300 | 9600 |
400-600 | 56 | 500 | 28000 |
600-800 | 120 | 700 | 84000 |
800-1000 | 104 | 900 | 93600 |
1000-1200 | 88 | 1100 | 96800 |
Итого | 400 | - | 312000 |
Средний размер вклада в Сбербанке города будет равен 780 рублей:
3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:
Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:
1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).
2. Определяются абсолютные отклонения вариант от средней:
3. Полученные отклонения умножаются на частоты:
4. Находится сумма взвешенных отклонений без учёта знака:
5. Сумма взвешенных отклонений делится на сумму частот:
Удобно пользоваться таблицей расчётных данных:
Размер вклада, руб. | Число вкладчиков, f | Середина интервала, х | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 480 | 15360 |
400-600 | 56 | 500 | -280 | 280 | 15680 |
600-800 | 120 | 700 | -80 | 80 | 9600 |
800-1000 | 104 | 900 | 120 | 120 | 12480 |
1000-1200 | 88 | 1100 | 320 | 320 | 28160 |
Итого | 400 | - | - | - | 81280 |
Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.
4) Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.
Расчёт дисперсии в интервальных рядах распределения производится по формуле:
Порядок расчёта дисперсии в этом случае следующий:
1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).
2. Находят отклонения вариант от средней:
3. Возводят в квадрат отклонения каждой варианты от средней:
4. Умножают квадраты отклонений на веса (частоты):
5. Суммируют полученные произведения:
6. Полученная сумма делится на сумму весов (частот):
Расчёты оформим в таблицу:
Размер вклада, руб. | Число вкладчиков, f | Середина интервала, х | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 230400 | 7372800 |
400-600 | 56 | 500 | -280 | 78400 | 4390400 |
600-800 | 120 | 700 | -80 | 6400 | 768000 |
800-1000 | 104 | 900 | 120 | 14400 | 1497600 |
1000-1200 | 88 | 1100 | 320 | 102400 | 9011200 |
Итого | 400 | - | - | - | 23040000 |
Первичные описательные статистики - это наиболее простые характеристики, которыми можно описать психологические данные, которые были получены в ходже тестирования испытуемых.
К наиболее часто используемым в курсовых и дипломных по психологии описательным статистикам можно отнести:
- среднее значение;
- стандартное отклонение.
Среднее значение
Простейшая математическая процедура, которую необходимо освоить студенту-психологу при написании диплома - расчет среднего значения.
Среднее значение или среднее арифметическое - это число, получаемое как сумма нескольких показателей, деланная на количество этих показателей. Например, в результате тестирования были получены показатели тревожности в группе из 10-ти человек. Чтобы получить среднее значение тревожности по группе нужно сложить показатели всех испытуемых, а затем получившуюся сумму разделить на 10.
Среднее значение характеризует группу целиком. Зная среднее можно оценить показатели каждого испытуемого относительно остальных. Например, измеряемая в приведённом выше примере тревожность могла быть от 1 до 5 баллов. Пусть средняя по группе тревожность оказалась 3,5 балла. Тогда, показатель испытуемого в 4 балла можно считать относительно высоким, а в 2 балла- относительно низким.
Среднее значение относится к показателям центральной тенденции и отражает степень выраженности показателя в группе. Стандартное отклонение отражает степень изменчивости признака в группе, но о нем речь впереди.
Среднее значение какого-либо показателя характеризует группу в целом и позволяет сравнивать ее с другими группами. Например, проведена диагностика уровня эмпатии в группе мужчин и женщин. Как узнать, влияет ли пол на способность к эмпатии. Один из способов - найти средний уровень этого показателя в группах мужчин и женщин. Например, в группе женщин средний уровень эмпатии равен 23,5 баллов, а в группе мужчин - 17,7 баллов. Как видно, в среднем у женщин эмпатия выше, чем у мужчин.
Важно отметить, среднее значение - это не просто число, а - статистическое - полученное в результате особой процедуры. Поэтому и сравнивать средние значения как обычные числа нельзя. Для сравнения средних значений используются дополнительные процедуры - расчет статистических критериев. Например, U-критерий Манна-Уитни или t-критерий Стъюдента .
Среднее - это не единственный статистический показатель, который отражает выраженность переменной в группе. Аналогичную функцию выполняют мода и медиана. Однако они редко используются в дипломах по психологии.
Средние значения выраженности психологических показателей в курсовой или дипломной по психологии представляются в виде таблиц и диаграмм. В таблицах среднее обозначается буквой «М».
Стандартное отклонение
Если среднее арифметическое отражает выраженность показателя в группе, то стандартное отклонение (среднеквадратичное отклонение) показывает его разброс данных или изменчивость. Чем больше величина стандартного отклонения, тем больше разброс показателей в группе испытуемых.
Например, группу мальчиков протестировали методикой на выявление уровня эгоцентризма, показатели которого изменяются от 1 до 10. Расчет среднего показал М=6,5, а стандартное отклонение σ=3 (стандартное отклонение обозначается буквой «сигма»). Эти данные позволяют нам говорить о том, что подавляющее большинство показателей эгоцентризма мальчиков укладываются в диапазон от 3,5 до 9,5 (среднее плюс/минус стандартное отклонение - М ± σ).
Если при тестировании группы девочек среднее значение М=5, а стандартное отклонение σ=1, то большинство испытуемых этой группы имеют эгоцентризм в диапазоне от 4 до 6 (5 ± 1).
Анализирую такие данные в дипломе по психологии можно указать, что средний уровень эгоцентризма у мальчиков больше, чем у девочек. При этом разброс показателей эгоцентризма у мальчиков также больше, чем у девочек, то есть, в группе мальчиков есть испытуемые с очень низкими и очень высокими показателями относительно среднего. У девочек показатели менее «разбросаны» относительно среднего.
Расчет среднего и стандартного отклонения
Формула расчета среднего очень проста и этот параметр можно рассчитать вручную.
Пример расчёта среднего
В таблице приведены показатели, полученные по тесту диагностики уровня одиночества у 64-х испытуемых.
№ исп. |
Уровень одиночества |
Найдем средний уровень переживания одиночества в группе.
М=(13 + 14+ 5+ 11+ 17+ 9+ 18+ 6+ 9+ 15+ 14+ 7+ 9+ 8+ 13+ 12+ 14+ 19+ 15+ 11+ 15+ 6+ 8+ 8+ 8+ 5+ 20+ 5+ 9+ 7+ 7+ 11+ 15+ 7+ 7+ 9+ 8+ 11+ 17+ 10+ 18+ 15+ 14+ 15+ 4+8+15+17+14+4+8+18+14+14+9+1+7+11+4+14+11+6+17) / 64=10,92
Как видим, если испытуемых достаточно много, то рассчитывать среднее вручную задача трудоемкая.
Еще более трудоемкий процесс - расчёт стандартного отклонения. Не буду утомлять вас формулами, скажу лишь, что расчёт этого показателя сводится к тому, что суммируются квадраты разности показателей со средним значением. Затем эта сумма делится на число показателей и из полученного числа извлекается квадратный корень. Вручную такие вычисления делать хлопотно, и не нужно.
Чаще всего расчеты среднего и стандартного отклонения можно делать в статистических программах STATISTICA, SPSS и электронных таблицах Exс el .
Надеюсь, эта статья поможет вам написать работу по психологии самостоятельно. Если понадобится помощь, обращайтесь (все виды работ по психологии; статистические расчеты).
Среднеквадрати́ческое отклоне́ние (синонимы: среднее квадрати́ческое отклоне́ние , среднеквадрати́чное отклоне́ние , квадрати́чное отклоне́ние ; близкие термины: станда́ртное отклоне́ние , станда́ртный разбро́с ) - в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания . При ограниченных массивах выборок значений вместо математического ожидания используется среднее арифметическое совокупности выборок.
Энциклопедичный YouTube
-
1 / 5
Среднеквадратическое отклонение измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического , при построении доверительных интервалов , при статистической проверке гипотез , при измерении линейной взаимосвязи между случайными величинами. Определяется как квадратный корень из дисперсии случайной величины .
Среднеквадратическое отклонение:
s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; {\displaystyle s={\sqrt {{\frac {n}{n-1}}\sigma ^{2}}}={\sqrt {{\frac {1}{n-1}}\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}}};}- Примечание: Очень часто встречаются разночтения в названиях СКО (Среднеквадратического отклонения) и СТО (Стандартного отклонения) с их формулами. Например, в модуле numPy языка программирования Python функция std() описывается как "standart deviation", в то время как формула отражает СКО (деление на корень из выборки). В Excel же функция СТАНДОТКЛОН() другая (деление на корень из n-1).
Стандартное отклонение (оценка среднеквадратического отклонения случайной величины x относительно её математического ожидания на основе несмещённой оценки её дисперсии) s {\displaystyle s} :
σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . {\displaystyle \sigma ={\sqrt {{\frac {1}{n}}\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}}}.}где σ 2 {\displaystyle \sigma ^{2}} - дисперсия ; x i {\displaystyle x_{i}} - i -й элемент выборки; n {\displaystyle n} - объём выборки; - среднее арифметическое выборки:
x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}={\frac {1}{n}}(x_{1}+\ldots +x_{n}).}Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной .
В соответствии с ГОСТ Р 8.736-2011 среднеквадратическое отклонение считается по второй формуле данного раздела. Пожалуйста, сверьте результаты.
Правило трёх сигм
Правило трёх сигм ( 3 σ {\displaystyle 3\sigma } ) - практически все значения нормально распределённой случайной величины лежат в интервале (x ¯ − 3 σ ; x ¯ + 3 σ) {\displaystyle \left({\bar {x}}-3\sigma ;{\bar {x}}+3\sigma \right)} . Более строго - приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале (при условии, что величина x ¯ {\displaystyle {\bar {x}}} истинная, а не полученная в результате обработки выборки).
Если же истинная величина x ¯ {\displaystyle {\bar {x}}} неизвестна, то следует пользоваться не σ {\displaystyle \sigma } , а s . Таким образом, правило трёх сигм преобразуется в правило трёх s .
Интерпретация величины среднеквадратического отклонения
Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.
Например, у нас есть три числовых множества: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8}. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения - значения внутри множества сильно расходятся со средним значением.
В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить. отождествляется с риском портфеля.
Климат
Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой на равнине. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.
Спорт
Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.
Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.
Определение
Среднеквадратическое отклонение (англ. Standard Deviation, SD ) является показателем, который используется в теории вероятности и математической статистике для оценки степени рассеивания случайной величины относительно ее математического ожидания. В инвестировании стандартное отклонение доходности ценных бумаг или портфеля используется для оценки меры риска. Чем выше степень рассеивания доходности ценной бумаги относительно ожидаемого доходности (математическое ожидание доходности), тем выше риск инвестирования, и наоборот.
Среднеквадратическое отклонение как правило обозначается греческой буквой σ (сигма), а стандартное отклонение латинской буквой S или как Std(X), где X – случайная величина.
Формула
Истинное значение среднеквадратического отклонения
Если известно точное распределение дискретной случайной величины, а именно, известно ее значение при каждом исходе и может быть оценена вероятность каждого исхода, то формула расчета среднеквадратического отклонения будет выглядеть следующим образом.
Где X i – значение случайной величины X при i-ом исходе; M(X) математическое ожидание случайной величины X; p i – вероятность i-го исхода; N – количество возможных исходов.
При этом математическое ожидание случайной величины рассчитывается по формуле:
Стандартное отклонение генеральной совокупности
На практике вместо точного распределение случайной величины обычно доступна только выборка данных. В этом случае рассчитывается оценочное значение среднеквадратического отклонения, которое в этом случае называют стандартным отклонением (S). Если оценка основывается на всей генеральной совокупности данных, необходимо использовать следующую формулу.
Где X i – i-ое значение случайной величины X; X – среднеарифметическое генеральной совокупности; N – объем генеральной совокупности.
Стандартное отклонение выборки
Если используется не вся генеральная совокупность данных, а выборка из нее, то формула расчета стандартного отклонения основывается на несмещенной оценке дисперсии.
Где X i – i-ое значение случайной величины X; X – среднеарифметическое выборки; N – объем выборки.
Примеры расчета
Пример 1
Портфельный менеджер должен оценить риски инвестирования в акции двух компаний А и Б. При этом он рассматривает 5 сценариев развития событий, информация по которым представлена в таблице.
Поскольку нам известно точное распределение доходности каждой из акций, мы можем рассчитать истинное значение среднеквадратического отклонения доходности для каждой из них.
Шаг 1. Рассчитаем математическое ожидание доходности для каждой из акций.
M(А) = -5%×0,02+6%×0,25+15%×0,40+24%×0,30+34%×0,03 = 15,62%
M(Б) = -18%×0,02+2%×0,25+16%×0,40+27%×0,30+36%×0,03 = 22,14%
Шаг 2. Подставим полученные данные в первую формулу.
Как мы можем видеть, акции Компании А характеризуются меньшим уровнем риска, поскольку у них ниже среднеквадратическое отклонение доходности. Следует также отметить, что и ожидаемая доходность у них ниже, чем у акций Компании Б.
Пример 2
Аналитик располагает данными о доходности двух ценных бумаг за последние 5 лет, которые представлены в таблице.
Поскольку точное распределение доходности неизвестно, а в распоряжении аналитика есть только выборка из генеральной совокупности данных, мы можем рассчитать стандартное отклонение выборки на основании несмещенной дисперсии.
Шаг 1. Рассчитаем ожидаемую доходность для каждой ценной бумаги как среднеарифметическое выборки.
X А = (7 + 15 + 2 – 5 + 6) ÷ 5 = 5%
X Б = (3 – 2 + 12 + 4 +8) ÷ 5 = 5%
Шаг 2. Рассчитаем стандартное отклонение доходности для каждой из ценных бумаг по формуле для выборки из генеральной совокупности данных.
Следует отметить, что обе ценные бумаги имеют равную ожидаемую доходность 5%. При этом стандартное отклонение доходности у ценной бумаги Б ниже, что при прочих равных делает ее более привлекательным объектом инвестирования в следствие лучшего профиля риск-доходность.
Стандартное отклонение в Excel
В Excel предусмотрено две функции для расчета стандартного отклонения выборки и генеральной совокупности.
Для выборки воспользуйтесь функцией «СТАНДОТКЛОН.В»:
- В диапазоне ячеек B1:F1
- Выберите выходную ячейку B2 .
- fx , во всплывшем окне «Вставка функции » выберите Категорию «Полный алфавитный перечень » и выберите функцию «СТАНДОТКЛОН.В ».
- В поле «Число1 » выберите диапазон ячеек B1:F1 , поле «Число2 OK ».
Для генеральной совокупности используется функция «СТАНДОТКЛОН.Г»:
- В диапазоне ячеек B1:F1 введены значения случайной величины X.
- Выберите выходную ячейку B2 .
- В командной строке нажмите кнопку fx , во всплывшем окне «Вставка функции » выберите Категорию «Полный алфавитный перечень » и выберите функцию «СТАНДОТКЛОН.Г ».
- В поле «Число1 » выберите диапазон ячеек B1:F1 , поле «Число2 » оставьте пустым и нажмите кнопку «OK ».
Интерпретация
В инвестировании стандартное отклонение доходности используется в качестве меры волатильности. Чем выше его значение, тем выше риск, связанный с инвестированием в этот актив, и наоборот. При прочих равных параметрах, предпочтение следует отдавать тому активу, у которого этот показатель будет минимальным.