Кредитование

Коэффициент вариации что означает. Коэффициенты вариации

Как доказать, что закономерность, полученная при изучении экспериментальных данных, не является результатом совпадения или ошибки экспериментатора, что она достоверна? С таким вопросом сталкиваются начинающие исследователи.Описательная статистика предоставляет инструменты для решения этих задач. Она имеет два больших раздела – описание данных и их сопоставление в группах или в ряду между собой.

Показатели описательной статистики

Существует несколько показателей, которые использует описательная статистика.

Итак, представим, что перед нами стоит задача описать рост всех студентов в группе из десяти человек. Вооружившись линейкой и проведя измерения, мы получаем маленький ряд из десяти чисел (рост в сантиметрах):

168, 171, 175, 177, 179, 187, 174, 176, 179, 169.

Если внимательно посмотреть на этот линейный ряд, то можно обнаружить несколько закономерностей:

  • Ширина интервала, куда попадает рост всех студентов, – 18 см.
  • В распределении рост наиболее близок к середине этого интервала.
  • Встречаются и исключения, которые наиболее близко расположены к верхней или нижней границе интервала.

Совершенно очевидно, что для выполнения задачи по описанию роста студентов в группе нет необходимости приводить все значения, которые будут измеряться. Для этой цели достаточно привести всего два, которые в статистике называются параметрами распределения. Это среднеарифметическое и стандартное отклонение от среднего арифметического. Если обратиться к росту студентов, то формула будет выглядеть следующим образом:

Среднеарифметическое значение роста студентов = (Сумма всех значений роста студентов) / (Число студентов, участвовавших в измерении)

Если свести все к строгим математическим терминам, то определение среднего арифметического (обозначается греческой буквой – μ («мю»)) будет звучать так:

Среднее арифметическое – это отношение суммы всех значений одного признака для всех членов совокупности (X) к числу всех членов совокупности (N).

Если применить эту формулу к нашим измерениям, то получаем, что μ для роста студентов в группе 175,5 см.

Если присмотреться к росту студентов, который мы измерили в предыдущем примере, то понятно, что рост каждого на сколько-то отличается от вычисленного среднего (175,5 см). Для полноты описания нужно понять, какой является разница между средним ростом каждого студента и средним значением.

На первом этапе вычислим параметр дисперсии. Дисперсия в статистике (обозначается σ 2 (сигма в квадрате)) – это отношение суммы квадратов разности среднего арифметического (μ) и значения члена ряда (Х) к числу всех членов совокупности (N). В виде формулы это рассчитывается понятнее:

Значения, которые мы получим в результате вычислений по этой формуле, мы будем представлять в виде квадрата величины (в нашем случае – квадратные сантиметры). Характеризовать рост в сантиметрах квадратными сантиметрами, согласитесь, нелепо. Поэтому мы можем исправить, точнее, упростить это выражение и получим среднеквадратичное отклонение формулу и расчёт, пример:

Таким образом, мы получили величину стандартного отклонения (или среднего квадратичного отклонения) – квадратный корень из дисперсии. С единицами измерения тоже теперь все в порядке, можем посчитать стандартное отклонение для группы:

Получается, что наша группа студентов исчисляется по росту таким образом: 175,50±5,25 см.

Среднее квадратичное отклонение хорошо работает с рядами, в которых разброс значений не очень велик (это хорошо прослеживалось на примере роста, где интервал был всего 18 см). Если бы ряд наших измерений был значительнее, а варьирование роста было сильнее, то стандартное отклонение стало непоказательным и нам потребовался бы критерий, который может отразить разброс в относительных единицах (т. е. в процентах, относительно средней величины).

Для этих целей предусмотрены абсолютные и относительные показатели вариации в статистике, характеризующие вариационные масштабы:

  • Размах вариации.

Квадратический коэффициент вариации (обозначается как Vσ) – это отношение среднеквадратичного отклонения к среднеарифметическому значению, выраженное в процентах.

Для нашего примера со студентами, определить Vσ несложно - он будет равен 3,18%. Основная закономерность – чем больше будет изменяться значение коэффициента, тем больше разброс вокруг среднего значения и тем менее однородна выборка.

Преимущество коэффициента вариации в том, что он показывает однородность значений (асимметрия) в ряду наших измерений, кроме того, на него не оказывают влияния масштаб и единицы измерения. Эти факторы делают коэффициент вариации особенно популярным в биомедицинских исследованиях. Будет считаться , что эксцесс значения Vσ =33% отделяет однородные выборки от неоднородных.

Если найти в ряду значений роста (первый пример) максимальное и минимальное значения, то получим размах вариации (обозначается как R, иногда ещё называется колеблемостью). В нашем примере – это значение будет равно 18 см. Эта характеристика используется для расчёта коэффициента осцилляции:

Коэффициент осцилляции – показывает как размах вариации будет относиться к среднему арифметическому ряда в процентном отношении.

Расчёты в Microsoft Ecxel 2016

* — в таблице указан диапазон A1:A10 для примера, при расчётах нужно указать требуемый диапазон.

Итак, обобщим информацию :

  1. Среднее арифметическое – это значение, позволяющее найти среднее значение показателя в ряду данных.
  2. Дисперсия – это среднее значение отклонений возведенное в квадрат.
  3. Стандартное отклонение (среднеквадратичное отклонение) – это корень квадратный из дисперсии, для приведения единиц измерения к одинаковым со среднеарифметическим.
  4. Коэффициент вариации – значение отклонений от среднего, выраженное в относительных величинах (%).

Отдельно следует отметить, что все приведённые в статье показатели, как правило, не имеют собственного смысла и используются для того, чтобы составлять более сложную схему анализа данных. Исключение из этого правила — коэффициент вариации, который является мерой однородности данных.

Квадратный корень из дисперсии носит название среднего квадратического отклонения от средней, которое рассчитывается следующим образом:

Элементарное алгебраическое преобразование формулы среднего квадратического отклонения приводит ее к следующему виду:

Эта формула часто оказывается более удобной в практике расчетов.

Среднее квадратическое отклонение так же, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные значения признака от среднего их значения. Среднее квадратическое отклонение всегда больше среднего линейного отклонения. Между ними имеется такое соотношение:

Зная это соотношение, можно по известному показатели определить неизвестный, например, но (I рассчитать а и наоборот. Среднее квадратическое отклонение измеряет абсолютный размер колеблемости признака и выражается в тех же единицах измерения, что и значения признака (рублях, тоннах, годах и т.д.). Оно является абсолютной мерой вариации.

Для альтернативных признаков, например наличия или отсутствия высшего образования, страховки, формулы дисперсии и среднего квадратического отклонения такие:

Покажем расчет среднего квадратического отклонения по данным дискретного ряда, характеризующего распределение студентов одного из факультетов вуза по возрасту (табл. 6.2).

Таблица 6.2.

Результаты вспомогательных расчетов даны в графах 2-5 табл. 6.2.

Средний возраст студента, лет, определен по формуле средней арифметической взвешенной (графа 2):

Квадраты отклонения индивидуального возраста студента от среднего содержатся в графах 3-4, а произведения квадратов отклонений на соответствующие частоты - в графе 5.

Дисперсию возраста студентов, лет, найдем по формуле (6.2):

Тогда о = л/3,43 1,85 *ода, т.е. каждое конкретное значение возраста студента отклоняется от среднего значения на 1,85 года.

Коэффициент вариации

По своему абсолютному значению среднее квадратическое отклонение зависит не только от степени вариации признака, но и от абсолютных уровней вариантов и средней. Поэтому сравнивать средние квадратические отклонения вариационных рядов с различными средними уровнями непосредственно нельзя. Чтобы иметь возможность для такого сравнения, нужно найти удельный вес среднего отклонения (линейного или квадратического) в среднем арифметическом показателе, выраженном в процентах, т.е. рассчитать относительные показатели вариации.

Линейный коэффициент вариации вычисляют по формуле

Коэффициент вариации определяют по следующей формуле:

В коэффициентах вариации устраняется не только несопоставимость, связанная с различными единицами измерения изучаемого признака, но и несопоставимость, возникающая вследствие различий в величине средних арифметических. Кроме того, показатели вариации дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

По данным табл. 6.2 и полученным выше результатам расчетов определим коэффициент вариации, %, по формуле (6.3):

Если коэффициент вариации превышает 33%, то это свидетельствует о неоднородности изучаемой совокупности. Полученное в пашем случае значение говорит о том, что совокупность студентов по возрасту однородна по своему составу. Таким образом, важная функция обобщающих показателей вариации - оценка надежности средних. Чем меньше с1, а2 и V, тем однороднее полученная совокупность явлений и надежнее полученная средняя. Согласно рассматриваемому математической статистикой "правилу трех сигм" в нормально распределенных или близких к ним рядах отклонения от средней арифметической, не превосходящие ±3ст, встречаются в 997 случаях из 1000. Таким образом, зная х и а, можно получить общее первоначальное представление о вариационном ряде. Если, например, средняя заработная плата работника по фирме составила 25 000 руб., а а равна 100 руб., то с вероятностью, близкой к достоверности, можно утверждать, что заработная плата работников фирмы колеблется в пределах (25 000 ± ± 3 х 100) т.е. от 24 700 до 25 300 руб.

В этом же документе приводятся правила определения коэффициента вариации. Разработано несколько методик выявления НМЦК: нормативная, тарифная, проектно-сметная, затратная. Самым приоритетным считается метод сопоставимых рыночных цен. Именно его рекомендуется использовать при определении стартовой цены. Он предполагает сравнение коммерческих предложений, предоставляемых потенциальными поставщиками по запросу заказчика. Для проведения такого анализа и применяется коэффициент вариации. Он выражается в процентах. Под коэффициентом вариации понимается мера относительного разброса предлагаемых цен. Он показывает, какую долю занимает средний разброс цен от среднего значения цены. Этот показатель может принимать следующие значения:

  1. Меньше 10%. В таком случае разница в ценах признается незначительной.
  2. От 10% до 20%. Разброс считается средним.
  3. От 20% до 33%.

Коэффициент вариации

Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке. Показатель асимметрии Показатель асимметрии (A) и его ошибка (ma) рассчитывается по следующим формулам: , где А — показатель асимметрии, — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге.


Показатель эксцесса Показатель эксцесса (E) и его ошибка (me) рассчитывается по следующим формулам: , где Е — показатель эксцесса, — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Если А < 0, то больше данных с меньшими значениями, чем среднеарифметическое.
Если Е < 0, то данные сконцентрированы около среднеарифметического значения.

Инфо

X – отдельные значения, X̅– среднее арифметическое по выборке. Примечание. Для расчета дисперсии в Excel предусмотрена специальная функция.


Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. В то же время не все так плохо.
При увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной. Поэтому при работе с большими размерами выборок можно использовать формулу выше.
Язык знаков полезно перевести на язык слов. Получится, что дисперсия — это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности.

Что характеризует коэффициент вариации

Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой: , где 2 — дисперсия,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Среднеквадратическое отклонение Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического.
В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле: , где — среднеквадратическое отклонение,a — среднее арифметическое,n — число измерений параметра,ai — измеренное значение на i-м шаге. Коэффициент вариации Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического: , где V — коэффициент вариации, — среднеквадратическое отклонение,a — среднее арифметическое.

Вариация (статистика)

Для полноты описания нужно понять, какой является разница между средним ростом каждого студента и средним значением. На первом этапе вычислим параметр дисперсии. Дисперсия в статистике (обозначается σ2 (сигма в квадрате)) – это отношение суммы квадратов разности среднего арифметического (μ) и значения члена ряда (Х) к числу всех членов совокупности (N).

В виде формулы это рассчитывается понятнее: Значения, которые мы получим в результате вычислений по этой формуле, мы будем представлять в виде квадрата величины (в нашем случае – квадратные сантиметры). Характеризовать рост в сантиметрах квадратными сантиметрами, согласитесь, нелепо. Поэтому мы можем исправить, точнее, упростить это выражение и получим среднеквадратичное отклонение формулу и расчёт, пример: Таким образом, мы получили величину стандартного отклонения (или среднего квадратичного отклонения) – квадратный корень из дисперсии.

Коэффициент вариации в статистике: примеры расчета

Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя.

Внимание

Разгадка заключается всего в трех словах. Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который необходим для других видов статистического анализа.


У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных. Без бутылки, как говорится, не разберешься.

Статистические параметры

Было получено четыре коммерческих предложения цен: 2500 рублей, 2800 рублей, 2450 рублей и 2600 рублей. В первую очередь необходимо рассчитать среднеарифметическое значение цены Следующим шагом становится расчет среднеквадратичного отклонения Осталось только рассчитать коэффициент вариации Полученное значение коэффициента меньше 33%, следовательно, все собранные данные подходят для расчета стартовой цены контракта. Расчет НМЦК и коэффициента вариации оформляются в форме отчета, который становится обязательной частью закупочной документации. Коэффициент вариации – важный инструмент, позволяющий оценить правильность ценовых предложений, полученных от поставщиков. Поэтому при составлении документации заказчикам необходимо учитывать правила расчета этого показателя и особенности его применения.

Для чего нужен коэффициент вариации

Как доказать, что закономерность, полученная при изучении экспериментальных данных, не является результатом совпадения или ошибки экспериментатора, что она достоверна? С таким вопросом сталкиваются начинающие исследователи.Описательная статистика предоставляет инструменты для решения этих задач. Она имеет два больших раздела – описание данных и их сопоставление в группах или в ряду между собой. Оглавление:

  • Показатели описательной статистики
  • Среднее арифметическое
  • Стандартное отклонение
  • Коэффициент вариации
  • Расчёты в Microsoft Ecxel 2016

Любая статистическая совокупность состоит из единиц, значения признака которых варьируют. Для того, чтобы судить об однородности совокупности и типичности средней величины изучаемого признака, анализ следует дополнять исчислением показателей вариации.

Вариация - это колеблемость, многообразие, изменяемость величины признака у отдельных единиц совокупности.

К абсолютным показателям вариации относят: размах вариации, среднее линейное отклонение, дисперсию и среднее квадратическое отклонение.

Размах вариации - характеристика границ вариации изучаемого признака. Показывает, сколь велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака, основан на крайних значениях варьирующего признака и не отражает отклонений всех вариант в ряду. Определяется по формуле:

R=Xmax-Xmin, (5.4)

где Xmax - максимальное значение вариационного ряда;

Xmin - минимальное.

Среднее линейное отклонение показывает, на какую величину отклоняется признак в изучаемой совокупности от средней величины признака. Находится по формуле:

где - индивидуальные значения варьирующего признака (варианты); - частоты, веса; - среднее значение варьирующего признака;

Дисперсия - средний квадрат отклонения индивидуальных значений признака от их средней величины. Вычисляется по следующим формулам.

Первый способ определения дисперсии:

Второй способ определения дисперсии (по средней арифметической):

где - средняя из квадратов индивидуальных значений; - квадрат средней величины признака.

Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности. Показывает, на какую величину в среднем значение признака отличается от стандартного значения, определяется по формуле:

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.

Рассчитаем показатели вариации для группировки транспортных организаций по грузообороту автомобильного транспорта (таблица 5.1).

Найдем размах вариации (по формуле 5.4):

Разброс значений грузооборота транспорта общественного пользования достаточно высок.

Вычислим среднее линейное отклонение (по формуле 5.5):


Значения грузооборота автомобильного транспорта отличались от среднего значения на 508,8 млн. т. км.

Рассчитаем дисперсию двумя способами (по формулам 5.6 - 5.7). Первый способ:



Вычислим среднее квадратическое отклонение (по формуле 5.8):

Это значит, что грузооборот транспорта общественного пользования в среднем отличается от стандартного значения на 23,68 млн. т. км.

Найдем показатели вариации для группировки площадей жилых помещений (таблица 5.3), используя формулы 5.4 - 5.8

Вычислим размах вариации:

Размах вариации в 3,1 м2 показывает нам, что разброс значений площадей жилых помещений не очень высок.

Рассчитаем среднее линейное отклонение:

Таким образом, значения площадей жилых помещений в изучаемой совокупности отклоняются от средней величины на 1,19 м2.

Рассчитаем дисперсию двумя способами.

Первый способ:


Второй способ (по средней арифметической):

Вычислим среднее квадратическое отклонение:

Оно показывает, что значения площадей жилых помещений в среднем отличается от стандартного значения на 1,3 м2 .

Коэффициенты вариации

Вариация измеряется с помощью относительных величин, называемых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине. Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Значения коэффициента вариации изменяются от 0 до 100% и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации:

Коэффициент вариации:

где - среднее квадратическое отклонение, - средняя арифметическая.

Линейный коэффициент вариации:

где - среднее линейное отклонение.

Коэффициент осцилляции:

где - размах вариации.

Вычислим коэффициенты вариации для группы организаций по грузообороту автомобильного транспорта (таблица 5.1) по формулам 5.9, 5.10, 5.11

Коэффициент вариации будет равен: , что превышает 33%, следовательно, совокупность неоднородна.

Вычислим линейный коэффициент вариации: . Следовательно, доля усредненного значения абсолютных отклонений организаций от средней величины равна 30,7%

Найдем коэффициент осцилляции: . Из этого следует, что разница между максимальным и минимальным значениями организаций превышает среднее значение почти в 1,078 раз.

Определим коэффициенты вариации для группировки площадей жилых помещений (в среднем на одного жителя) (таблица 5.3).

Вычислим коэффициент вариации по формуле (5.9):

Это значит что коэффициент вариации не превышает 33%, следовательно, совокупность однородна.

Рассчитаем линейный коэффициент вариации по формуле (5.10):

Это значит, что доля усредненного значения абсолютных отклонений площадей жилых помещений от средней величины равна 5,56%.

Найдем коэффициент осцилляции по формуле (5.11):

Разница между максимальным и минимальным значениями площадей жилых помещений не превышает среднее значение.

Показатели вариации. При изучении варьирующего признака у единиц совокупности нельзя ограничиваться лишь расчетом средней величины из отдельных вариантов, так как одна и та же средняя может относиться далеко не к одинаковым по составу совокупностям.

Вариацией признака называется различие индивидуальных значений признака внутри изучаемой совокупности.

Термин «вариация» произошел от латинского variatio – изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией.

Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Колеблемость отдельных значений характеризуют показатели вариации. Чем больше вариация, тем дальше в среднем отдельные значения лежат друг от друга.

Различают вариацию признака в абсолютных и относительных величинах.

К абсолютным показателям относятся: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. Все абсолютные показатели имеют ту же размерность, что и изучаемые величины.

К относительным показателям относятся коэффициенты осцилляции, линейного отклонения и вариации.

Показатели абсолютные. Рассчитаем абсолютные показатели, характеризующие вариацию признака.

Размах вариации, представляет собой разность между максимальным и минимальным значением признака.

R = Xmax – Xmin.

Показатель размаха вариации не всегда применим, так как он учитывает только крайние значения признака, которые могут сильно отличаться от всех других единиц.

Более точно можно определить вариацию в ряду при помощи показателей, учитывающих отклонения всех вариантов от средней арифметической.

Таких показателей в статистике два: среднее линейное и среднее квадратическое отклонение.

Среднее линейное отклонение (L) представляет собой среднее арифметическое из абсолютных значений отклонений отдельных вариантов от средней.

Практическое использование среднего линейного отклонения заключается в следующем, с помощью этого показателя анализируется состав работающих, ритмичность производства, равномерность поставок материалов.

Недостаток этого показателя заключается в том, что он усложняет расчеты вероятного типа, затрудняет применение методов математической статистики.

Среднее квадратическое отклонение () является наиболее распространенным и общепринятым показателем вариации. Оно несколько больше среднего линейного отклонения. Для умеренно асимметричных распределений установлено следующее соотношение между ними

Для его исчисления каждое отклонение от средней возводится в квадрат, все квадраты суммируются (с учетом весом), после чего сумма квадратов делится на число членов ряда и из частного извлекается корень квадратный.

Все эти действия выражает следующая формула

т.е. среднее квадратическое отклонение представляет собой корень квадратный из средней арифметической квадратов отклонений от средней.

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше σ, тем лучше среднее арифметическое отражает собой всю представляемую совокупность.

Средняя арифметическая из квадратов отклонений вариантов значений признака от средней величины носит название дисперсии (), которая рассчитывается по формулам

Отличительной особенностью данного показатели является то, что при возведении в квадрат () удельный вес малых отклонений уменьшается, а больших увеличивается в общей сумме отклонений.

Дисперсия обладает рядом свойств, некоторые из них позволяют упростить её вычисление:

1. Дисперсия постоянной величины равна 0.

Если , то и .

Тогда .

2. Если все варианты значений признака (x) уменьшить на одно и то же число, то дисперсия не уменьшится.

Пусть , но тогда в соответствии со свойствами средней арифметической и .

Дисперсия в новом ряду будет равна

Т.е. дисперсия в ряду равна дисперсии первоначального ряда .

3. Если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.

Пусть , тогда и .

Дисперсия же нового ряда будет равна

4. Дисперсия, рассчитанная по отношению к средней арифметической, является минимальной. Средний квадрат отклонений, рассчитанный относительно произвольного числа , больше дисперсии, рассчитанной по отношению к средней арифметической, на квадрат разности между средней арифметической и числом , т.е. . Дисперсия от средней имеет свойство минимальности, т.е. она всегда меньше дисперсий, исчисленных от любых других величин. В этом случае, когда приравниваем к 0 и, следовательно, не вычисляем отклонения, формула принимает такой вид:

Выше был рассмотрен расчет показателей вариации для количественных признаков, но в экономических расчетах может ставиться задача оценки вариации качественных признаков. Например, при изучении качества изготовленной продукции, продукцию можно разделить на качественную и бракованную.

В таком случае речь идет об альтернативных признаках.

Альтернативными признаками называются такие, которыми одни единицы совокупности обладают, а другие нет. Например, наличие производственного стажа у абитуриентов, ученая степень у преподавателей ВУЗов и т.д. Наличие признака у единиц совокупности условно обозначаем через 1, а отсутствие – 0. Тогда, если долю единиц, обладающих признаком (в общей численности единиц совокупности), обозначить через р, а долю единиц, не обладающих признаком, через q, дисперсию альтернативного признака можно рассчитать по общему правилу. При этом p + q = 1 и, значит, q = 1– p.

Сначала рассчитываем среднее значение альтернативного признака:

Рассчитаем среднее значение альтернативного признака

,

т.е. среднее значение альтернативного признака равно доле единиц, обладающих данным признаком.

Дисперсия же альтернативного признака будет равна:

Таким образом, дисперсия альтернативного признака равняется произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих данным признаком.

А среднее квадратическое отклонение будет равно =.

Показатели относительные. Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях представляют интерес показатели вариации, выраженные в относительных величинах. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане.

Чаще всего они выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Различают следующие относительные показатели вариации:

1. Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней.

3. Коэффициент вариации оценивает типичность средних величин.

.

Чем меньше , тем однороднее совокупность по изучаемому признаку и типичнее средняя. Если ≤33%, то распределение близко к нормальному, а совокупность считается однородной. Из приведенного примера вторая совокупность однородна.

Виды дисперсий и правило сложения дисперсий. Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.

При этом можно определить три показателя колеблемости признака в совокупности:

1. Общую вариацию совокупности, которая является результатом действия всех причин. Эта вариация может быть измерена общей дисперсией (), характеризующей отклонения индивидуальных значений признака совокупности от общей средней

.

2. Вариацию групповых средних, выражающих отклонения групповых средних от общей средней и отражающих влияние того фактора, по которому произведена группировка. Эта вариация может быть измерена так называемой межгрупповой дисперсией (δ2)

,

где - групповые средние, а -общая средняя для всей совокупности, и - численность отдельных групп.

3. Остаточную (или внутригрупповую) вариацию, которая выражается в отклонении отдельных значений признака в каждой группе от их групповой средней и, следовательно, отражает влияние всех прочих факторов кроме положенного в основу группировки. Поскольку вариацию в каждой группе отражает групповая дисперсия

,

то для всей совокупности остаточную вариацию будет отражать средняя из групповых дисперсий. Эту дисперсию называют средней из внутригрупповых дисперсий () и рассчитывается она по формуле

Это равенство, имеющее строго математическое доказательство, известно, как правило сложения дисперсий.

Правило сложения дисперсий позволяет находить общую дисперсию по её компонентам, когда индивидуальные значения признака неизвестны, а в распоряжении имеются только групповые показатели.

Коэффициент детерминации. Правило сложения дисперсии позволяет выявить зависимость результатов от определенных факторов при помощи коэффициента детерминации.

Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Корреляционное отношение изменяется в пределах от 0 до 1. Если , то группировочный признак не оказывает влияния на результативный. Если , то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю.

Показатели асимметрии и эксцесса. В области экономических явлений строго симметричные ряды встречаются крайне редко, чаще приходится иметь дело с асимметричными рядами.

В статистике для характеристики асимметрии пользуются несколькими показателями. Если учесть, что в симметричном ряду средняя арифметическая совпадает по значению с модой и медианой, то наиболее простым показателем асимметрии () будет разность между средней арифметической и модой, т.е.

Величину эксцесса рассчитывают по формуле

Если >0, то эксцесс считают положительным (распределение островершинно), если <0, то эксцесс считается отрицательным (распределение низковершинно).