Ряды распределения. Классификация рядов распределения

Наименование параметра Значение
Тема статьи: Вариационный ряд
Рубрика (тематическая категория) Производство

Наблюдаемые значения случайной величины х 1 , х 2 , …, х k называются вариантами .

Частотой варианты х i принято называть число n i (i =1,…,k ), показывающее, сколько раз эта варианта встречается в выборке.

Частостью (относительной частотой, долей) варианты х i (i =1,…,k ) принято называть отношение ее частоты n i к объёму выборки n .

Частоты и частости называютвесами .

Накопленной частотой принято называть количество вариант, значения которых меньше данного х :

Накопленной частостью принято называть отношение накопленной частоты к объёму выборки:

Вариационным рядом (статистическим рядом) – принято называть последовательность вариант, записанных в порядке возрастания и соответствующих им весов.

Вариационный ряд должна быть дискретным (выборка значений дискретной случайной величины) и непрерывным (интервальным) (выборка значений непрерывной случайной величины).

Дискретный вариационный ряд имеет вид:

Когда число вариант велико или признак является непрерывным (случайная величина может принимать любые значения в некотором интервале), составляют интервальный вариационный ряд.

Для построения интервального вариационного ряда проводят группировку вариант – их разбивают на отдельные интервалы:

Число интервалов иногда определяют с помощью формулы Стерджеса :

Затем подсчитывается число вариант, попавших в каждый интервал – частоты n i (или частости n i /n ). В случае если варианта находится на границе интервала, то ее присоединяют к правому интервалу.

Интервальный вариационный ряд имеет вид :

Варианты
Частоты

Эмпирической (статистической) функцией распределœения принято называть функция, значение которой в точке х равно относительной частоте того, что варианта примет значение, меньшее х (накопительной частости для х ):

Полигоном частот называют ломанную, отрезки которой соединяют точки с координатами (х 1 ; n 1), (х 2 ; n 2), …, (х k ; n k ). Аналогично строится полигон частостей , который является статистическим аналогом многоугольника распределœений.

Стоит сказать, что для непрерывного вариационного ряда полигон можно построить, в случае если в качестве значений х 1 , х 2 , …, х k взять середины интервалов.

Интервальный вариационный ряд графически обычно изображают с помощью гистограммы .

Гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых являются частичные интервалы длины h = x i +1 – x i , i = 0,…,k -1, а высоты равны частотам (или частостям) интервалов n i (w i ).

Кумулята (кумулятивная кривая) – кривая накопленных частот (частостей). Для дискретного ряда кумулята представляет ломанную, соединяющую точки или , . Для интервального ряда кумулята начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной нулю. Другие точки этой ломанной соответствуют концам интервалов.

Вариационный ряд - понятие и виды. Классификация и особенности категории "Вариационный ряд" 2017, 2018.

  • - Вариационный ряд распределения

    Распределение розничного товарооборота Российской Федерации в 1995 году по формам собственности, млн. руб. Виды рядов распределения Лекция VIII. Ряды распределения В результате обработки и систематизации первичных статистических данных получают... .


  • - Вариационный ряд

    Простейшее преобразование статистических данных является их упорядочивание по величине. Выборка объёма из генеральной совокупности, упорядоченная в порядке неубывания элементов, т.е. , называется вариационным рядом: . В том случае, когда объем наблюдений... .


  • - Задание 2. Интервальный вариационный ряд

    1. По заданной выборке, соответствующей варианту задания построить интервальный вариационный ряд; построить гистограмму и кумуляту (используйте два способа: вставку диаграммы Excel и режим «Гистограмма» пакета «Анализ данных»). 2. Проанализировать полученную гистограмму. ... .


  • - Составить вариационный ряд изменчивости признака семян фасоли или листьев какого-либо растения одного возраста. Выявить закономерности изменчивости признака.

    Популяция - структурная единица вида. Численность популяций. Причины колебания численности популяций. Взаимоотношения особей в популяциях и между различными популяциями одного и разных видов. 1. Важный признак вида - расселение его группами, популяциями в...

  • Ряды, построенные по количественному признаку , называются вариационным .

    Ряды распределений состоят из вариантов (значений признака) и частот (численности групп). Частоты, выраженные в виде относительных величин (долей, процентов) называются частостями . Сумма всех частот называется объёмом ряда распределения.

    По виду ряды распределения делятся на дискретные (построены по прерывным значениям признака) и интервальные (построены на непрерывных значениях признака).

    Вариационный ряд представляет собой две колонки (или строки); в одной из которых приводятся отдельные значения варьирующего признака, именуемые вариантами и обозначаемые Х; а в другой – абсолютные числа, показывающие сколько раз (как часто) встречается каждый вариант. Показатели второй колонки называются частотами и условно обозначают через f. Еще раз заметим, что во второй колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуются частостями и условно обозначают через ω Сумма всех частостей в этом случае равна единице. Однако частоты можно выражать и в процентах, и тогда сумма всех частостей дает 100%.

    Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд именуют дискретным.

    Для непрерывных признаков вариационные ряды строятся как интервальные , то есть значения признака в них выражаются «от… до …». При этом минимальны значения признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей.

    Интервальные вариационные ряды строят и для дискретных признаков, варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами.

    Рассмотрим как определяется величина равных интервалов. Введем следующие обозначения:

    i – величина интервала;

    - максимальное значение признака у единиц совокупности;

    – минимальное значение признака у единиц совокупности;

    n – число выделяемых групп.

    , если n известно.

    Если число выделяемых групп трудно заранее определить, то для расчета оптимальной величины интервала при достаточном объеме совокупности может быть рекомендована формула, предложенная Стерджессом в 1926 году:

    n = 1+ 3.322 lg N, где N – число единиц в совокупности.

    Величина неравных интервалов определяется в каждом отдельном случае с учетом особенностей объекта изучения.

    Статистическим распределением выборки называют перечень ва­риант и соответствующих им частот (или относительных частот).

    Статистическое распределение выборки можно задать в виде таблицы, в первой графе которой располагаются варианты, а во второй - соот­ветствующие этим вариантам частоты ni , или относительные частоты Pi .

    Статистическое распределение выборки

    Интервальными называются вариационные ряды, в которых значе­ния признаков, положенных в основу их образования, выражены в определенных пределах (интервалах). Частоты в этом случае относятся, не к отдельным значениям признака, а ко всему интервалу.

    Интервальные ряды распределения строятся по непрерывным количе­ственным признакам, а также по дискретным признакам, варьирующим в значительных пределах.

    Интервальный ряд можно представить статистическим распределени­ем выборки с указанием интервалов и соответствующих им частот. При этом в качестве частоты интервала принимают сумму частот вариант, по­павших в этот интервал.

    При группировке по количественным непрерывным признакам важ­ное значение имеет определение размера интервала.

    Кроме выборочной средней и выборочной дисперсии применяются и другие характеристики вариационного ряда.

    Модой называют варианту, которая имеет наибольшую частоту.

    Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определённому варьирующему признаку.
    В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения .

    Наличие общего признака является основой для образования статистической совокупности, которая представляет собой результаты описания или измерения общих признаков объектов исследования.

    Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки или статистические признаками.

    Виды статистических признаков .

    Атрибутивными называют ряды распределения , построенные по качественным признакам. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
    Ряд распределения принято оформлять в виде таблиц. В табл. 2.8 приведён атрибутивный ряд распределения.
    Таблица 2.8 - Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ.

    Вариационный ряд – это значения признака (или интервалы значений) и их частоты.
    Вариационными рядами называют ряды распределения , построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
    Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду.
    Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, её объём.
    Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %. Вариационный ряд позволяет по фактическим данным оценить форму закона распределения.

    В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды .
    Пример дискретного вариационного ряда приведен в табл. 2.9.
    Таблица 2.9 - Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ.

    В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй – помещены частоты вариационного ряда, в третьей – показатели частости.

    Вариационный ряд

    В генеральной совокупности исследуется некоторый количественный признак. Из нее случайным образом извлекается выборка объема n , то есть число элементов выборки равно n . На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел x 1 , x 2 , …, x n по возрастанию. Каждое наблюдаемое значение x i называется вариантой . Частота m i – это число наблюдений значения x i в выборке. Относительная частота (частость) w i – это отношение частоты m i к объему выборкиn : .
    При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x , называется накопленной частотой: для x i n называется накопленной частостью w i max .
    Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом.

    Таблица 1. Общий вид дискретного вариационного ряда частот

    Значения признака x i x 1 x 2 x n
    Частоты m i m 1 m 2 m n

    Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд для такого признака называется интервальным.

    Таблица 2. Общий вид интервального вариационного ряда частот

    Таблица 3. Графические изображения вариационного ряда

    Ряд Полигон или гистограмма Эмпирическая функция распределения
    Дискретный
    Интервальный
    Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности a i – a i +1 называются частичными интервалами. Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i -го интервала принимают за вариант x i , а соответствующую интервальную частоту m i – за частоту этого интервала.
    Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулятивная кривая и эмпирическая функция распределения.

    В табл. 2.3 (Группировка населения России по размеру среднедушевого дохода в апреле 1994г.) представлен интервальный вариационный ряд .
    Удобно ряды распределения анализировать при помощи графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма .
    Полигон используется при изображении дискретных вариационных рядов .
    Изобразим, например графически распределение жилого фонда по типу квартир, (табл. 2.10).
    Таблица 2.10 - Распределение жилого фонда городского района по типу квартир (цифры условные).


    Рис. Полигон распределения жилого фонда


    На оси ординат могут наноситься не только значения частот, но и частостей вариационного ряда.
    Гистограмма принимается для изображения интервального вариационного ряда . При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. Гистограмма – график, на котором ряд изображен в виде смежных друг с другом столбиков.
    Изобразим графически интервальный ряд распределения, приведённый в табл. 2.11.
    Таблица 2.11 - Распределение семей по размеру жилой площади, приходящейся на одного человека (цифры условные).
    N п/п Группы семей по размеру жилой площади, приходящейся на одного человека Число семей с данным размером жилой площади Накопленное число семей
    1 3 – 5 10 10
    2 5 – 7 20 30
    3 7 – 9 40 70
    4 9 – 11 30 100
    5 11 – 13 15 115
    ВСЕГО 115 ----


    Рис. 2.2. Гистограмма распределения семей по размеру жилой площади, приходящейся на одного человека


    Используя данные накопленного ряда (табл. 2.11), построим кумуляту распределения.


    Рис. 2.3. Кумулята распределения семей по размеру жилой площади, приходящейся на одного человека


    Изображение вариационного ряда в виде кумуляты особенно эффективно для вариационных рядов, частоты которых выражены в долях или процентах к сумме частот ряда.
    Если при графическом изображении вариационного ряда в виде кумуляты оси поменять, то мы получим огиву . На рис. 2.4 приведена огива, построенная на основе данных табл. 2.11.
    Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями. Полученный полигон распределения изображён на рис. 2.2 пунктирной линией.
    При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах.
    Плотность распределения – это частота, рассчитанная на единицу ширины интервала, т.е. сколько единиц в каждой группе приходится на единицу величины интервала. Пример расчета плотности распределения представлен в табл. 2.12.
    Таблица 2.12 - Распределение предприятий по числу занятых (цифры условные)
    N п/п Группы предприятий по числу занятых, чел. Число предприятий Величина интервала, чел. Плотность распределения
    А 1 2 3=1/2
    1 До 20 15 20 0,75
    2 20 – 80 27 60 0,25
    3 80 – 150 35 70 0,5
    4 150 – 300 60 150 0,4
    5 300 – 500 10 200 0,05
    ВСЕГО 147 ---- ----

    Для графического изображения вариационных рядов может также использоваться кумулятивная кривая . При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательно суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.


    Рис. 2.4. Огива распределения семей по размеру жилой площади, приходящейся на одного человека

    При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты.

    Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.

    Различают атрибутивные и вариационные ряды распределения.

    Атрибутивный - это ряд распределения, построенный по качественным признакам. Он характеризует состав совокупности по различным существенным признакам.

    По количественному признаку строится вариационный ряд распределения. Он состоит из частоты (численности) отдельных вариантов или каждой группы вариационного ряда. Данные числа показывают, насколько часто встречаются различные варианты (значения признака) в ряду распределения. Сумма всех частот определяет численность всей совокупности.

    Численности групп выражаются в абсолютных и относительных величинах. В абсолютных величинах выражается числом единиц совокупности в каждой выделенной группе, а в относительных величинах - в виде долей, удельных весов, представленных в процентах к итогу.

    В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения. В дискретном вариационном ряде распределения группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

    В интервальном вариационном ряде распределения группиро-вочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения.

    Вариационные ряды состоят из двух элементов: частоты и варианты.

    Вариантой называют отдельное значение варьируемого признака, которое он принимает в ряду распределения.

    Частота - это численность отдельных вариант или каждой группы вариационного ряда. Если частоты выражены в долях единицы или в процентах к итогу, то их называют частостями.

    Правила и принципы построения интервальных рядов распределения строятся по аналогичным правилам и принципам построения статистических группировок. Если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. Для проведения сравнительного анализа заполненности интервалов определяют показатель, который будет характеризовать плотность распределения.

    Плотность распределения - это отношение числа единиц совокупности к ширине интервала.

    Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т е. конкретное значение варьирующего признака. Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.

    Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

    В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.

    Как известно, вариация количественных признаков может быть дискретной (прерывной) или непрерывной.

    В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный рядхарактеризует распределение единиц совокупности по дискретному признаку. Примером дискретного вариационного ряда является распределение семей по числу комнат в отдельных квартирах, приведенное в табл. 3.12.

    В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй - помещены частоты вариационного ряда, а в третьей - показаны частости.

    В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационныхрядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико. В табл. 3.3 представлен интервальный вариационный ряд.

    Графическое изображение рядов распределения

    Анализ рядов распределения можно проводить на основе их графического изображения. Линейчатые и круговые диаграммы строятся для отображения структуры совокупности.

    Применяются вместе с диаграммами и такие линии, как полигон, кумулята, огива, гистограмма. При изображении дискретных вариационных рядов используется полигон.

    Полигон - ломаная кривая, строится на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - частоты.

    Гладкая кривая, соединяющая точки - это эмпирическая плотность распределения.

    Кумулята - ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - накопленные частоты.

    Для дискретных рядов на оси откладываются сами значения признака, а для интервальных - середины интервалов.

    На основе гистограмм можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения.

    Метод группировок позволяет также измерить вариацию (изменчивость, колеблемость) признаков. При относительно малом числе единиц совокупности вариация измеряется на основе ранжированного ряда единиц, образующих совокупность. Ряд называется ранжированным, если единицы расположены по возрастанию (убыванию) признака.

    Однако ранжированные ряды довольно малопоказательны тогда, когда необходима сравнительная характеристика вариации. Кроме того, во многих случаях приходится иметь дело со статистическими совокупностями, состоящими из большого числа единиц, которые практически трудно представить в виде конкретного ряда. В связи с этим для первоначального общего ознакомления со статистическими данными и особенно для облегчения изучения вариации признаков исследуемые явления и процессы обычно объединяют в группы, а результаты группировки оформляют в виде групповых таблиц.

    Если в групповой таблице имеется всего две графы - группы по выделенному признаку (варианты) и численности групп (частоты или частости), она называется рядом распределения.

    Ряд распределения - простейшая разновидность структурной группировки по одному признаку, отображенная в групповой таблице с двумя графами, в которых содержатся варианты и частоты признака. Во многих случаях с такой структурной группировки, т.е. с составления рядов распределения, начинается изучение исходного статистического материала.

    Структурная группировка в виде ряда распределения может быть превращена в подлинную структурную группировку, если выделенные группы будут охарактеризованы не только частотами, но и другими статистическими показателями. Главное предназначение рядов распределения - изучение вариации признаков. Теорию рядов распределения подробно разрабатывает математическая статистика.

    Ряды распределения делят на атрибутивные (группировка по атрибутивным признакам, например деление населения по полу, национальности, семейному положению и т.д.) и вариационные (группировка по количественным признакам).

    Вариационный ряд представляет собой групповую таблицу, которая содержит две графы: группировку единиц по одному количественному признаку и численность единиц в каждой группе. Интервалы в вариационном ряду образуются обычно равные и закрытые. Вариационным рядом является следующая группировка населения России по величине среднедушевых денежных доходов (табл. 3.10).

    Таблица 3.10

    Распределение численности населения России по величине среднедушевых доходов в 2004-2009 гг.

    Группы населения по величине среднедушевых денежных доходов, руб./мес

    Численность населения в группе, в % к итогу

    8 000,1-10 000,0

    10 000,1-15 000,0

    15 000,1-25 000,0

    Свыше 25 000,0

    Все население

    Вариационные ряды в свою очередь подразделяются на дискретные и интервальные. Дискретные вариационные ряды объединяют варианты дискретных признаков, изменяющихся в узких пределах. Примером дискретного вариационного ряда может служить распределение российских семей по числу имеющихся детей.

    Интервальные вариационные ряды объединяют варианты либо непрерывных признаков, либо изменяющихся в широких пределах дискретных признаков. Интервальным является вариационный ряд распределения населения России по величине среднедушевых денежных доходов.

    Дискретные вариационные ряды на практике применяются не слишком часто. Между тем составление их несложно, поскольку состав групп определяется конкретными вариантами, которыми реально обладают изучаемые группировочные признаки.

    Более широко распространены интервальные вариационные ряды. При их составлении возникает сложный вопрос о количестве групп, а также о величине интервалов, которые должны быть установлены.

    Принципы решения этого вопроса изложены в главе о методологии построения статистических группировок (см. параграф 3.3).

    Вариационные ряды представляют собой средство свертывания или сжатия многообразной информации в компактную форму, по ним можно составить достаточно ясное суждение о характере вариации, изучить различия признаков явлений, входящих в исследуемую совокупность. Но важнейшее значение вариационных рядов состоит в том, что на их основе исчисляются особые обобщающие характеристики вариации (см. главу 7).