Как посчитать объем выборки. Объем выборки - выборочный метод социологического исследования

Перед непосредственным проведением выборочного наблюдения всегда решается вопрос, сколько единиц исследуемой совокупности необходимо отобрать для выборки. Формулы для определения ее численности выводят из формул предельных ошибок выборки в соответствии со следующими исходными положениями:

  • видом предлагаемой выборки;
  • способом отбора (повторный или бесповторный);
  • выбором оценивания параметра (среднего значения или доли).

Кроме того, необходимо заранее определиться со значением доверительной вероятности, которая устраивала бы потребителя информации, и с размером допустимой предельной ошибки выборки. Задать Д и I (соответствующих доверительной вероятности), как правило, не представляет особых трудностей, поскольку они связаны с природой изучаемой совокупности.

Однако надо помнить, что большая доверительная вероятность весьма увеличивает объем выборки. Аналогична ситуация с предельной ошибкой выборки: ее снижение вдвое увеличивает размер выборки вчетверо. Вопрос о том, какая точность удовлетворяет исследователя, становится принципиальным, если обследование еще одной единицы наблюдения приводит к большим финансовым и материальным затратам (при территориальной удаленности единиц наблюдения, конфиденциальности собираемых данных, сложности программы наблюдения и т.д.), и непринципиальным, если затраты на обследование одной единицы сравнительно небольшие.

Формулы для расчета необходимого объема выборки для разных способов отбора показаны в табл. 13.10.

При использовании приведенных в таблице формул рекомендуется получаемую численность выборки округлять в большую сторону для обеспечения некоторого «запаса» точности.

Кроме того, в статистической практике распространен вариант, когда величина предельной ошибки выборки задается в процентах (относительная предельная ошибка выборки). В этом случае абсолютное значение ошибки делят на среднее значение признака и умножают на 100%. Тогда для применения формул таблицы следует найти абсолютное значение предельной ошибки следующим образом:

Таблица 13.10

Формулы для нахождения объема выборочной совокупности

Способ отбора

Повторный отбор

Бесповторный отбор

При оценивании среднего значения

Собственно-случайный

Механический

Типический

Серийный с равными сериями

При оценивании доли

Собственно-случайный

Механический

Окончание

Способ отбора

Повторный отбор

Бесповторный отбор

Типический

Серийный с равными сериями

Если в качестве исходных параметров для определения объема выборки заданы относительная ошибка Д % и коэффициент вариации

изучаемого признака, исчисленный как F„=^100%, то формулу

собственно-случайной выборки при повторном отборе можно преобразовать следующим образом:

Реальную сложность для определения объема выборки представляет определение размера вариации признака - дисперсии. На практике эта величина чаще всего остается неизвестной до проведения обследования. Как поступить в каждом конкретном случае, решает сам исследователь.

Иногда дисперсию оценивают прямыми способами:

  • проводят плотные обследования до начала основного наблюдения с целью выяснения величины о 2 ;
  • принимают условно величину дисперсии из прошлых аналогичных обследований (чаще всего используемый на практике способ). Подобный подход оправдан, если генеральная совокупность в силу своей природы не подтверждена значительными динамичными процессами или их проявления не столь ярки.

Существует также ряд «косвенных» способов нахождения дисперсии изучаемого признака, представляющих собой определенные математические приемы, которые базируются на свойствах статистических совокупностей. Поскольку распределения большинства из них близки к нормальному закону, значение дисперсии приблизительно можно определить следующим образом.

Так как все значения варианта признака при нормальном законе распределения размещаются на За в одну и другую сторону от среднего, имеет место приблизительное равенство R « 6а, где R - размах вариации признака, определяемый как R = x max - x min .

Следовательно,

На практике для получения некоторого «запаса» выборочных единиц для обеспечения требуемой точности часто предпочитают пользоваться соотношением

Величины х тах и x min при наблюдении за социально-экономическими процессами обычно известны или определяются действующим законодательством. Например, среднесписочная численность работающих на малых предприятиях строго ограничена законодательно.

Для социально-экономических явлений, если некоторым образом (например, из данных прошлых обследований) известно значение среднего, для приближенной оценки среднего квадратичного отклонения используют соотношение

Дисперсия альтернативного признака зависит от доли единиц, которые обладают изучаемым признаком (свойством) w. Если эта доля неизвестна, берется максимально возможное значение дисперсии - 0,25, достигаемое при w = 0,5.

Из формул табл. 13.10 следует, что численность выборки прямо пропорциональна дисперсии изучаемого признака. Действительно, с увеличением колеблемости единиц, для того чтобы уловить вариацию, требуется все большее их количество для отбора и включения в выборку.

Итак, рассмотрено определение объема выборки при одном наблюдаемом признаке. Но как быть, если характерных признаков несколько и вариация этих признаков различна или некоторые их них альтернативные. Логично было бы выбрать тот признак, расчеты по которому приводят к наибольшему среди остальных объему выборки (этим признаком будет тот, по которому требуется получить наименьшую величину относительной ошибки выборки при одной и той же доверительной вероятности). Действительно, в этом случае определение генеральных параметров других признаков будет сопровождаться большей точностью, чем требуется, т.е. появится некоторый «запас» точности.

Надо также отметить, что на практике зачастую объем выборки корректируется в соответствии с имеющимися финансовыми и кадровыми ресурсами, тогда принимают во внимание необходимость достижения оптимального соотношения затрат и точности получаемых результатов. При трудностях с финансированием статистических наблюдений, особенно если снижение расходов происходит довольно значительно при допускаемых потерях в точности, подобный шаг более чем оправдан.

На определение объема выборки также оказывает влияние весьма распространенное при статических наблюдениях явление, связанное с неответами опрашиваемых единиц. В случае больших генеральных совокупностей, измеряемых сотнями и миллионами (например, совокупность населения страны), можно сделать определенную поправку на неответы, увеличив объем выборки. Однако при обработке результатов обследования и особенно при использовании на их основе конкретных рекомендаций следует помнить о произведенных при сборе данных допущениях.

Рассмотрим примеры задач на определение необходимой численности выборочной совокупности.

Пример 13. 7. Сколько объектов из совокупности 507 фирм надо проверить налоговой инспекции, чтобы с вероятностью 0,997 определить долю фирм с нарушениями в уплате налогов? По данным прошлого обследования величина среднего квадратичного отклонения составила 0,15; размер ошибок выборки должен быть не выше чем 0,15.

При повторном случайном отборе следует проверить

При бесповторном случайном отбое необходимо проверить

Как видим, использование бесповторного отбора приводит к обследованию гораздо меньшего числа объектов.

Пример 13.8. Администрация одного из субъектов РФ решила провести выборочное обследование 366 малых фирм, в процессе проведения которого предполагалось определить:

  • долю лиц с высшим образованием, работающих в малых фирмах (размер предельной ошибки не должен превышать 0,1);
  • долю работающих в малых фирмах женщин (размер предельной ошибки не должен превышать 0,12);
  • средний возраст работающих в малых фирмах (размер предельной ошибки не должен превышать два года).

Распределение малых фирм по отраслям экономики таково

Администрация города предполагает, что значение изучаемых признаков существенно варьируется в зависимости от отраслевой принадлежности фирмы, поэтому была выбрана типическая выборка, пропорциональная объему типических групп.

Определим, какова при этом должна быть ее численность и сколько единиц наблюдения следует извлечь из каждой типической группы при доверительной вероятности 0,954. Первые два признака - альтернативные, тогда оценкой неизвестной дисперсии является ее максимальное значение - 0,25.

Необходимый объем выборки при оценивании доли лиц с высшим образованием будет иметь следующее значение:

Оценивание доли работающих женщин требует обследовать

Можно было бы сразу определить, по какому признаку следует проводить расчеты. Им всегда является тот, который имеет большую точность (меньшую ошибку при одной и той же доверительной вероятности). Однако третий признак в нашем примере - количественный. Определим, какой объем выборки потребуется, чтобы оценить его. Приблизительное значение дисперсии получим исходя из свойств нормального распределения:

(при максимальном и минимальном возрасте, равном соответственно 60 и 18 лет, что является наиболее вероятным разбросом).

Откуда ст 2 = 49.

Проведем расчет:

Итак, для достижения заданной точности по всем наблюдаемым признакам следует выбрать максимальную численность, полученную по всем трем показателям, т.е. п = 65 фирм.

Отрасль экономики

Число фирм, отбираемых в выборочную совокупность

Промышленность

Сельское хозяйство

Строительство

Транспорт и связь

Торговля и общественное питание

Общая коммерческая деятельность

Жилищно-коммунальное хозяйство и непроизводственные виды бытового обслуживания населения

Другие отрасли

Неформализованные способы формирования выборки. Вопрос об оптимальном размере выборки всегда был спорным в среде исследователей. Решение относительно размера выборочной совокупности принимают с учетом целого ряда факторов, среди которых самую существенную роль играют два: 1) ценность и новизна получаемой в результате исследования информации; 2) затраты на проведение исследования (включая и временные) при заданном размере выборки.

Во многих случаях можно руководствоваться сложившейся практикой, т.е. размером выборки, использовавшейся в аналогичных исследованиях. Кроме того, существуют следующие простейшие правила для определения объема выборочной совокупности.

Размер выборки растет, если:

  • необходимо получить данные для отдельных подгрупп (размеры подвыборок при этом суммируются и выборка в целом растет пропорционально числу подгрупп);
  • уже имеющаяся информация по ключевым вопросам недостаточна и степень неопределенности значительна.

К тому же практикой многочисленных исследований уже отработаны «типические» размеры выборок. Так, для общенациональных опросов населения эти объемы варируют в пределах 1000-2500 респондентов (в зависимости от числа анализируемых групп). Для региональных опросов и опросов специальных популяций - от 200 до 500 (при анализе многочисленных подгрупп размер региональной или специальной выборки обычно возрастает как минимум до 1000 человек). Указанные значения, разумеется, могут служить лишь самым общим ориентиром для определения оптимального размера выборки.

Приведенная ниже формула для расчета объема выборки используется в тех случаях, когда опрашиваемым (респондентам) задается только один вопрос, на который существует только два варианта ответа. Например, «Да» и «Нет»; «Пользуюсь» и «Не пользуюсь». Конечно, данную формулу можно применять только при проведении простейших исследований. Если Вам нужно определить объем выборки при проведении более масштабных исследований, например анкетирования, то следует использовать другие формулы.

Простая формула для расчета объема выборки

где: n – объем выборки;

z – нормированное отклонение, определяемое исходя из выбранного уровня доверительности. Этот показатель характеризует возможность, вероятность попадания ответов в специальный - доверительный интервал. На практике уровень доверительности часто принимают за 95% или 99%. Тогда значения z будут соответственно 1,96 и 2,58;

p – вариация для выборки, в долях. По сути, p - это вероятность того, что респонденты выберут той или иной вариант ответа. Допустим, если мы считаем, что четверть опрашиваемых выберут ответ «Да», то p будет равно 25%, то есть p = 0,25;

q = (1 – p);

e – допустимая ошибка, в долях.

Пример расчета объема выборки

Компания планирует провести социологическое исследование с целью выявить долю курящих лиц в населении города. Для этого сотрудники компании будут задавать прохожим один вопрос: «Вы курите?». Возможных вариантов ответа, таким образом, только два: «Да» и «Нет».

Объем выборки в этом случае рассчитывается следующим образом. Уровень доверительности принимается за 95%, тогда нормированное отклонение z = 1,96 . Вариацию принимаем за 50%, то есть условно считаем, что половина респондентов может ответить на вопрос о том, курят ли они - «Да». Тогда p = 0,5 . Отсюда находим q = 1 – p = 1 – 0,5 = 0,5 . Допустимую ошибку выборки принимаем за 10%, то есть e = 0,1 .

Подставляем эти данные в формулу и считаем:

Получаем объем выборки n = 96 человек .

Область применения данной формулы

При проведении простых исследований, когда нужно получить ответ всего на один простой вопрос. При этом шкала ответов, как правило, дихотомического характера. То есть предлагаются (или подразумеваются) варианты ответов по типу «Да» - «Нет», «Черное» - «Белое», и т.д.

Особенности данной формулы расчета объема выборки

Галяутдинов Р.Р.


© Копирование материала допустимо только при указании прямой гиперссылки на

Если тип выборки говорит о том, как попадают люди в выборочную совокупность , то объем выборки сообщает о том, какое их количество попало сюда .

Объем выборки количество единиц выборочной совокупности .

Поскольку выборочная совокупность (или выборка, что одно и то же) – это часть генеральной совокупности, отобранной с помощью специальных методов, – ее объем всегда меньше объема генеральной . Поэтому так важно, чтобы часть не искажала представления о целом, т.е. была репрезентативной.

Социологов, особенно проводящих эмпирические исследования, часто волнует вопрос о том, какое количество человек следует опросить для получения достоверной информации. Институт Гэллапа в США проводит регулярные опросы по национальной выборке объемом в 1500 ч еловек и достигает поразительной точности (ошибка выборки составляет от 1 до 1,5%)1. Центр <Социо-Экспресс> Института социологии РАН проводит исследования на выборке объемом в 2000 человек, при этом ошибка выборки не превышает 3%.

7. Репрезентативность – свойство выборочной совокупности представлять основные параметры генеральной совокупности.

Если совпадения нет, говорят об ошибке репрезентативности –мере отклонения статистической структуры выборки от структуры соответствующей генеральной совокупности.

Предположим, что средний ежемесячный семейный доход пенсионеров в генеральной совокупности составляет 2 тыс. руб., а в выборочной - 6 тыс. руб. Это означает, что социолог опрашивал только зажиточную часть пенсионеров, в его исследование вкралась ошибка репрезентативности. Иными словами, ошибкой репрезентативности называется расхождение между двумя совокупностями – генеральной и выборочной. Последняя выступает и как объект обследования и как средство получения информации о генеральной совокупности.

8. Ошибка выборки – отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.

На практике она определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними величинами. В социологии при обследованиях взрослого населения чаще всего используют данные переписей населения, текущего статистического учета, результаты предшествующих опросов.

В опросах института Дж. Гэллапа репрезентативность контролируется по имеющимся в национальных переписях данным о распределении населения по

· полу,

· возрасту,

· образованию,

· доходу,

· профессии,

· расовой принадлежности,

· месту проживания,

· величине населенного пункта.

Всероссийский центр изучения общественного мнения (ВЦИОМ ) использует для подобных целей такие показатели, как



· пол,

· возраст,

· образование,

· тип поселения,

· семейное положение,

· сфера занятости,

· должностной статус респондента ,

которые заимствуют в Государственном комитете по статистике РФ. В том и другом случае известна генеральная совокупность. Ошибку выборки невозможно установить, если неизвестны значения переменной в выборочной и генеральной совокупностях.

Ошибки выборки подразделяются на два типа – случайные и систематические.

Случайная ошибка – это статистические погрешности, присущие самому выборочному методу. Они уменьшаются при возрастании объема выборочной совокупности.

Систематические ошибки результат деятельности самого исследователя; вызваны неконтролируемыми перекосами в распределении выборочных наблюдений; предумышленным смещением выборки.

Например, если социолог решил узнать мнение всех жителей города о проводимой местными органами власти социальной политике, а опросил только тех, у кого есть телефон, то возникает предумышленное смещение выборки в пользу зажиточных слоев, т.е. систематическая ошибка .

Систематические ошибки возникают, когда:

1) выборка не соответствует задачам исследования (социолог решил изучить только работающих пенсионеров, а опросил всех подряд);

2) незнание характера генеральной совокупности (социолог думал, что 70% всех пенсионеров не работает, неработающих оказалось только 10%);

3) отбираются только «выигрышные» элементы генеральной совокупности (например, только обеспеченные пенсионеры). Для исследователя оценить последствия систематической ошибки – задача непростая.

Чтобы избежать ошибки репрезентативности :

1) каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;

2) отбор желательно производить из однородных совокупностей;

3) надо знать характеристики генеральной совокупности;

4) при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.

Если выборочная совокупность (или просто выборка) составлена правильно, то социолог получает надежные результаты, характеризующие всю генеральную совокупность. Если неправильно, то возникшая на этапе составления выборки ошибка возрастает на каждом следующем этапе проведения социологического исследования и достигает в конечном счете такой величины, которая обесценивает проведенное исследование.

Социометрический опрос существенно отличается от других видов социологического опроса по характеру исходных данных, способам их представления, процедуре опроса и методам анализа собранной информации. В данном виде опроса результатом измерения здесь является не характеристика респондента, а отношение между респондентами. Метод социометрии исследует межличностные отношения в малых группах. Социометрия, по определению Морено, является одной из трех составных частей социономии - науки о социальных законах и представляет собой науку об измерении межличностных отношений. В узком смысле под социометрическими методами понимаются методы исследования структуры межличностных отношений в малой группе путем изучения выборов, сделанных членами группы по тому или иному критерию.

Метод опроса изобретен не социологами, его активно используют медики, юристы, журналисты, педагоги и др. Он имеет в социологии давние традиции. Специфика опроса состоит прежде всего в том, что при его использовании источником первичной социологической информации является человек (респондент) – непосредственный участник исследуемых социальных явлений. Преимущества опроса заключаются: а) в максимально коротких сроках сбора информации; б) в возможности получения разнообразной информации; в) в возможности охвата больших совокупностей людей; г) в широте охвата различных областей социальной практики. А несовершенство - в возможности искажения информации в силу субъективного восприятия и оценки социального факта респондентами.

Чтобы полученная первичная социологическая информация начала активно служить, ее необходимо обработать, обобщить, проанализировать и научно проинтерпретировать. Только после этих процедур появится реальная возможность сформулировать выводы и практические рекомендации, которые и откроют социологической информации выход на практику.

Обработка информации осуществляется вручную или с помощью ЭВМ, ее результат – социологические данные, т.е. показатели ответов на вопросы в числовом и процентном выражении. Обобщение информации идет путем группировки ответивших на вопросы и через ряды распределений (в том числе с помощью таблиц). Анализ и интерпретация данных проводятся в рамках теоретической обработки полученной информации и впрямую зависят от профессионализма социологов, их гипотез, проверка которых и производится прежде всего.

Итоги работы выливаются в служебные документы: отчет, приложение к отчету и аналитическая справка, содержащая выводы и рекомендации.

Использование результатов социологического исследования зависит от актуальности изучаемой социальной проблемы, анализа достоверности собранной информации и заинтересованности в ней общества.

НАБЛЮДЕНИЕ–

На практике решение вопроса об объеме выборки является компромиссным между предположением о точности результатов обследования и возможностями их практической реализации (т.е. исходя из затрат на проведение опроса).

На практике используется несколько подходов к определению объема выборки. Обратим внимание на самые простые из них. Первый из них называется произвольным подходом и основан он на применении «правила большого пальца».

Например, бездоказательно принимается, что для получения точных результатов выборка должна составлять 5 % от совокупности. Данный подход простой и доступный в исполнении, не позволяет получать точные результаты. Его достоинством является относительная дешевизна затрат. В соответствии со вторым подходом объем выборки может быть установлен исходя из заранее оговоренных условий. Заказчик маркетингового исследования, например, знает, что при изучении общественного мнения выборка обычно составляет 1000 – 1200 человек, поэтому он рекомендует исследователю придерживаться данной цифры.

Третий подход означает, что в некоторых случаях главным аргументом при определении объема выборки может быть стоимость проведения опроса. Хотя при этом ценность и достоверность получаемой информации не принимается в расчет.

В случае четвертого подхода объем выборки определяется на основе статистического анализа. Данный подход предполагает определение минимального объема выборки с учетом требований к надежности и достоверности получаемых результатов.

Пятый подход считается наиболее теоретически обоснованным и правильным подходом в определении объема выборки. Он основан на расчете доверительного интервала.

Доверительный интервал – это диапазон, крайние точки которого характеризуют процент определенных ответов на какой-то вопрос. Данное понятие тесто связано с понятием «среднее квадратичное отклонение получаемого признака в генеральной совокупности». Чем оно больше, тем шире должен быть доверительный интервал, чтобы включить в свой состав, например 9,5 % ответов.

Из свойств нормальной кривой распределения вытекает, что конечные точки доверительного интервала, равного к примеру 9,5 % определяются как произведение: 1,96 (нормированное отклонение) и среднего квадратичного отклонения.

Числа 1,96 и 2,58 (для 99 % доверительного интервала) обозначаются как z.

Существуют таблицы «Значение интеграла вероятности», которые дают возможность определить величины z для различных доверительных интервалов. Доверительный интервал равный 95% или 99% является стандартным при проведении маркетинговых исследований.

Например, проведено исследование числа визитов автовладельцев в сервисные мастерские за год. Доверительный интервал для среднего числа визитов был рассчитан равным 5 – 7 визитам при 99 % уровне доверительности. Это означает, что если появится возможность, провести независимо 100 раз выборочные исследования, то для 99 выборочных исследований среднее значение числа визитов попадут в диапазон от 5 до 7 визитов, Если сказать иначе, то 99 % автовладельцев попадут в доверительный интервал.

Допустим, было проведено исследование до 50 независимых выборок. Средние оценки для этих выборок образовали нормальную кривую распределения, которое называется выборочным распределением.

Средняя оценка для совокупности в целом равна средней оценке кривой распределения. Понятие «выборочное распределение» рассматривается также в качестве одного из базовых понятий теоретической концепции, лежащее в основе определения V выборки.

Естественно ни одна компания не в состоянии сформировать 10, 20, 50 независимых выборок. Обычно используется только одна выборка.

Математическая статистика позволяет получить некую информацию о выборочном распределении, владея точными данными о вариации единственной выборки.

Индикатором степени отличия оценки, истинной для совокупности в целом, которая ожидается для типичной выборки, является средне квадратическая ошибка . К примеру, исследуется мнение потребителей о новом товаре и заказчик данного исследования указал, что его устроит точность полученных результатов, равная плюс минус 5%.

Предположим, что 30 % членов выборки высказались за новый продукт. Это означает, что диапазон возможных оценок для всей совокупности составляет 25 – 35 %. Причем, чем больше объем выборки, тем меньше ошибка. Высокое значение вариации обусловливает высокое значение ошибки и наоборот.

Определим объем выборки на основе расчета доверительного интервала. Исходной информацией, необходимой для реализации данного подхода, является:

  • · величина вариации, которой, как считается, обладает совокупность;
  • · желаемая точность;
  • · уровень достоверности, которому должны удовлетворять результаты проводимого обследования.

Когда на заданный вопрос существует только два варианта ответов, выраженных в процентах (используется процентная мера), объем выборки определяется по следующей формуле:

где n – объем выборки;

z – нормированное отклонение, определяемое исходя из выбранного уровня доверительности (табл. 7);

р – найденная вариация для выборки;

q = (100 – p);

е – допустимая ошибка.

Таблица 7

Значение нормированного отклонения оценки z от среднего значения

в зависимости от доверительной вероятности (а) полученного результата

Например, предприятием, выпускающим покрышки, проводится опрос автолюбителей, использующих радиальные покрышки.

Поэтому на вопрос: «Используете ли Вы радиальные покрышки?» возможны только 2 ответа: «Да» или «Нет». Если предположить, что совокупность автолюбителей обладает низким показателем вариации, то это означает, что почти каждый опрошенный использует радиальные покрышки. В данном случае может быть сформирована выборка достаточно малых размеров. В формуле (1) произведение pg выражает вариацию, свойственную совокупности. Например, пусть 90 % единиц совокупности используют радиальные покрышки. Это означает, что pg = 900. Если принять, что показатель вариации выше (р = 70 %), то pg = 2100. Наибольшая вариация достигается в случае, когда одна половина совокупности (50 %) использует радиальные покрышки, а другие не используют. В этом случае произведение достигает значения равного 2500.

При проведении опроса важно указывать точность полученных оценок. Например, было установлено, что 44 % респондентов используют радиальные покрышки. Результаты измерения необходимо представить в виде: процент автолюбителей, использующих радиальные покрышки, составляет 44 плюс – минус е %. Величина допустимой ошибки заранее совместно определяется заказчиком исследования и исполнителем.

Уровень достоверности при проведении маркетинговых исследований обычно оценивается с учетом двух его значений: 95% или 99%. Первому значению соответствует значение z = 1,96; второму – z = 2,58. Если выбирается уровень доверительности равный 99 %, то это говорит о следующем: мы уверены на 99 % (иными словами доверительная вероятность равна 0,99) в том, что процент членов совокупности, попавший в диапазон плюс – минус е %, равен проценту членов выборки, попавших в тот же диапазон ошибки. Принимая вариацию равной 50 %, точность равной 10 % при 95 %-м уровне доверительности рассчитаем размер выборки:

n = 1,962 (50 х 50) / 102 = 96.

При уровне доверительности равном 99 %, и е = ±3 %, n = 1067.

При определении показателя вариации для конкретной совокупности целесообразно проводить предварительно качественный анализ исследуемой совокупности и установить схожесть единиц совокупности в демографическом, социальном и других отношениях, представляющих интерес для исследователя. Возможно определение объема выборки на основе использования средних значений, а не процентных величин. Предположим, что выбран уровень достоверности равный 95 % (z = 1.96,), среднеквадратическое отклонение (S) рассчитано и равно 100, и желаемая точность (погрешность) составляет ±10. Тогда объем выборки составит

Реально на практике, если выборка формируется заново и схожие опросы не проводились, S неизвестно.

В этом случае целесообразно задавать погрешность е в долях от среднеквадратического отклонения. Расчетная формула преобразуется и приобретает следующий вид:

Мы в основном говорили о совокупности очень больших размеров, характерных для рынков потребительских товаров. Но в отдельных случаях совокупности не являются столь большим, и например на рынках отдельных видов продукции производственного назначения.

Обычно, если выборка составляет менее 5 % совокупности, то совокупность считается большой, и расчеты проводятся по вышеприведенным правилам.

Если же V выборки превышает 5 % совокупности, то последняя считается малой, и в вышеприведенные формулы вводится поправочный коэффициент. Объем выборки в данном случае определяется следующим образом:

где n1 – объем выборки для малой совокупности,

n – объем выборки (или для процентных мер или для средних), рассчитанный по приведенным выше формулам,

N – объем генеральной совокупности.

Например, изучается мнение членов совокупности, состоящей из 1000 компаний, относительно строительства химического комбината в границах города Томска. Вследствие отсутствия информации о вариации принимается наихудший случай: 50:50. Исследователь вынес решение использовать уровень доверительности равный 95 %. Заказчик исследования указал, что его устроит точность результатов плюс минус 5 %. В этом случае используется следующая формула для процентной меры:

Данный подход к формированию V выборки с определенными оговорками может быть использован и при расчете численности панели и экспертной группы.

Приведенные формулы расчета выборки основаны на предположении, что все правила формирования выборки были соблюдены, и единственной ошибкой является ошибка, обусловленная ее объемом.

Глава из книги "Маркетинговые исследования"

  • Психология: личность и бизнес