Меню

При увеличении объема выборки статистическая мощность исследования

Влияние размера статистической выборки на качество научного исследования

Любая научная работа (особенно в психологии, медицине) предполагает проведение некоего эксперимента для сбора доказательств и оценки реальной ситуации. Притом чем больше факторов учитывает автор, тем точнее результаты исследования и возможности их использования в дальнейшем.

Влияние размера статистической выборки на качество научного исследования

Любая научная работа (особенно в психологии, медицине) предполагает проведение некоего эксперимента для сбора доказательств и оценки реальной ситуации. Притом чем больше факторов учитывает автор, тем точнее результаты исследования и возможности их использования в дальнейшем.

В любом эксперименте важно определить оптимальный объем выборки, который бы позволили получить достоверный результат. В этой статье Вы узнаете, какое число испытуемых считается достаточным, и как грамотно подобрать объем выборки для собственного исследования.

Влияет ли объем выборки на результаты исследования?

Результаты исследования зависят от множества факторов: объем и достоверность первоначальных данных, цель (достижимая и реалистичная или не поддающаяся измерению и достижению), качество материалов (достоверные, актуальные и пр.) и т.д. Если научное изыскание предполагает проведение практических мероприятий, то одним из важнейших моментов являются определение объема выборки.

Построение выборки

От чего зависит качество проводимого исследования?

Объем выборки представляет собой число испытуемых, которое будет принимать участие в эксперименте и подлежать оценке. Количество респондентов, их действия напрямую отражаются на результатах исследования. Если в эксперименте будет участвовать малая часть испытуемых, то не всегда будет возможно получить репрезентативные результаты.

Большое число участников же в значительной степени усложняет ход исследования, но позволяет получить более точные результаты при условии, если исследователь внимательно следит за ходом событий и учитывает все факторы, погрешности и отклонения и пр.

Таким образом, объем выборки влияет не только на точность измерений, но и качество исследования.

Нужна помощь преподавателя?

Мы всегда рады Вам помочь!

Больше – лучше, или наоборот?

Казалось бы, чем больше число испытуемых, тем точнее результаты. На самом деле, здесь палка о двух концах.

Объем выборки

Как определить объем выборки для исследования?

С одной стороны, большое число испытуемых позволяет получить более точные результаты исследования, определить динамику или тенденции развития событий. В то же время внушительное количество респондентов требует более пристального внимания со стороны автора: моментальное фиксирование результатов, контроль за каждым индивидом, оценка всех действий и достижений/итогов и пр. Сможет ли автор в одиночку уследить за 100-200 и более испытуемыми.

Во-вторых, большой объем выборки провоцирует рождение более высоких затрат на организацию и проведение эксперимента: привлечение сторонних экспертов для контроля за ходом исследования, подготовка дополнительных материалов для испытуемых (анкеты или опросники, задания, создание специальных условий (например, для проживания и пр.)) и т.д.

Небольшой объем выборки – самый оптимальный в плане затратности, но он дает менее точные результаты. Если в эксперименте принимает участие всего 2-4 человека, то это не значит, что выборка будет репрезентативной. В данной ситуации автор оценит лишь частный случай, но не данные генеральной совокупности.

Поэтому чтобы результаты исследования были пригодными для более широкой аудитории, важно, чтобы выборка оказалась репрезентативной, а для этого необходимо подобрать оптимальное число испытуемых.

Какой объем выборки считается оптимальным?

Объем выборки зависит не только от вида исследования, но и его масштабов. Например, в социологических опросах принято проводить соответствующие мероприятия (например, задать вопросы всем подряд или конкретной группе) с целью определения общественного мнения. Как правило, в таких проектах принимает участие свыше 1000 человек.

Рекомендации по определению объема выборки

Как определить оптимальный объем выборки для исследования

В психологических и медицинских экспериментах и исследованиях количество испытуемых гораздо меньше, так как обработка данных здесь может занять более длительное время, а информация обладает таким свойством как актуальность, которая может быть утрачена из-за медлительности. Оптимальным числом для таких научных изысканий считается 10-30 человек, притом все испытуемые подлежат строгой классификации по конкретному признаку.

Оптимальный объем выборки – это то количество изучаемых объектов и явлений, которое позволяет получить достоверный и максимально точный (приближенный) результат с минимальными погрешностями, который можно «репрезентовать» на более широкий круг лиц. В случае нерепрезентативности выборки исследователь получит «частный эксперимент» с субъективной оценкой происходящего.

Читайте также:  Измерение мощности электрического тока ваттметром

Как определить оптимальный объем выборки для научного исследования?

Каждый исследователь самостоятельно определяет, какой объем выборки для него оптимальный. Данный параметр зависит от ряда условий:

  • Сколько авторов и компетентных ученых принимает участие в организации и проведении научного изыскания?
  • За сколькими испытуемыми автор сможет следить самостоятельно?
  • Какое количество объектов посильно для каждого «контролера»?
  • Возможность оперативной фиксации получаемых результатов?
  • Объем факторов, которые должны быть учтены в ходе испытания?
  • Шкала для оценки полученных итогов?
  • Наличие определенных знаний навыков, образования или опыта работы в конкретной области для проведения научного изыскания?
  • Методы исследования?
  • Требования к испытуемым?
  • Продолжительность исследования?
  • Точность результатов, допустимые погрешности и пр.?

Оптимальный объем выборки предполагает подбор стольких испытуемых, за которыми посильно проследить и оценить их результаты без лишних затрат времени, материальных и иных ресурсов с учетом располагаемых сил.

Как определить оптимальный объем выборки для исследовнаия

Как провести качественное научное исследование?

Если исследование предполагает оценку конкретной ситуации в определенной отрасли, то достаточно подобрать 10-30 участников, соответствующих конкретных условиям и требованиям.

Если же научное изыскание носит глобальный масштаб, то необходимо подобрать опытную и сильную команду, грамотно распределить обязанности, а затем, исходя из общих возможностей команды, определить объем выборки: до 100 участников, от 101 до 500, более 500 и пр.

В идеале на каждого «контролера» должно приходиться не более 10-20 испытуемых, чтобы качество получаемых данных было высоким, а жизнь контролера проходила не только в стенах «лаборатории». Поэтому объему выборки необходимо уделять особое внимание, так как именно этот критерий позволяет получить более качественные результаты научных и иных изысканий.

Трудности с учебой?

Помощь в написании студенческих и
аспирантских работ!

Источник



При увеличении объема выборки статистическая мощность исследования

Мощность статистических критериев

Мощность статистического критерия представляет собой вероятность отвержения нулевой гипотезы, когда она фактически неверна. Иными словами, мощность говорит нам о том, насколько вероятно в данном исследовании получить статистически значимый результат, если искомая закономерность действительно имеет место в генеральной совокупности. Из этого определения следует, что любой исследователь кровно заинтересован в высоком значении мощности используемого статистического критерия.

Мощность критерия является функцией трех вещей: 1) степени, в которой проявляет себя искомая закономерность («величина эффекта»), 2) избранного исследователем уровня статистической значимости (альфа, вероятность ошибочного отбрасывания нулевой гипотезы), 3) объема выборки из генеральной совокупности.

Каждую из этих четырех величин можно выразить через три оставшиеся. Джейкоб Коэн, энтузиаст анализа мощности в психологических исследованиях, в своей монографии [1] приводит огромное количество таблиц, с помощью которых можно определять мощность и необходимый объем выборки, не прибегая к трудоемким вычислениям. По мнению Коэна, трудности, которые возникают у исследователей при анализе мощности, частично объясняются тем, что в психологии в целом отсутствует четкое представление о степени выраженности исследуемых феноменов. Поэтому еще одним немаловажным достоинством его работы является разработка показателей величины эффекта и операционализация понятий «слабый», «средний» и «выраженный» эффект для наиболее распространенных статистических критериев.

К настоящему времени разработано большое количество статистических программ, предназначенных для анализа мощности. Данное сообщение посвящено пакету pwr, которым можно воспользоваться в рамках среды R.

Рассмотрим для примера работу с функцией pwr.r.test, предназначенной для анализа мощности коэффициента корреляции Пирсона, одного из наиболее распространенных в психологии показателей величины эффекта. Дж. Коэн предложил для коэффициента корреляции такие операциональные определения величины эффекта: 0.1 — слабая корреляция, 0.3 — средняя корреляция, 0.5 — значительная корреляция (замечу, что его классификация существенно отличается от того, что можно встретить в пособиях по анализу данных. Так, в [2] величина корреляции до 0.5 включительно рассматривается как слабая).

Аргументами этой функции являются:
n — объем выборки;
r — значение коэффициента корреляции;
sig.level — уровень статистической значимости;
power — мощность критерия;
alternative — строка, указывающая на тип альтернативной гипотезы: «two.sided» (ненаправленная), «greater», «less» (направленные).

Читайте также:  Усилитель мощности 500 ватт схема

При вызове функции только один из аргументов n, r, sig.level или power должен быть опущен, чтобы его можно было вычислить на основании оставшихся. Исключение составляет лишь аргумент sig.level, имеющий значение по умолчанию 0.05, поэтому ему передают значение NULL, если функция должна вычислить уровень значимости.

Рассмотрим такую задачу. Пускай предполагаемая исследователем сила связи в генеральной совокупности описывается как средняя, при этом он хочет обеспечить вероятность обнаружения этой зависимости на уровне 0.8, уровень статистической значимости установлен им в 0.05 и альтернативная гипотеза является ненаправленной:

Таким образом, чтобы с высокой вероятностью обнаруживать среднюю по величине связь, нужно иметь не менее 85 испытуемых. Если повысить уровень статистической значимости до 0.01, то объем выборки возрастет до 125 человек. Если связь между переменными предполагается слабой (самый распространенный в психологии вариант вследствие невысокой валидности измерения и комплексного характера взаимосвязей), то понадобится 1163 испытуемых. Используя рассмотренные вычисления на этапе планирования исследования, ученый может составить четкое представление о том, какой объем выборки ему может понадобиться, чтобы обнаруживать искомую закономерность с заданной величиной эффекта. Важно подчеркнуть, что необходимость представлять себе величину эффекта перед началом исследования существенно меняет акценты по сравнению с обычной практикой.

Рассматриваемая функция помогает отвечать и на другие вопросы. Например: если я располагаю выборкой в 30 человек и собираюсь обнаружить связь средней силы при установленном уровне значимости в 0.01, то какой будет мощность критерия? Оказывается, она в этом случае составит всего 0.156, т.е. существует крайне незначительная вероятность обнаружения данной закономерности.

Еще один пример. Какого рода эффекты я смогу обнаруживать с вероятностью 0.8, на уровне статистической значимости 0.01, если объем выборки составляет 100 человек? Ответ — 0.334, т.е. среднюю по величине зависимость.

Помимо функции pwr.r.test, в пакете pwr имеется богатый набор инструментов для работы с наиболее распространенными статистическими критериями:

pwr.p.test: критерий для одной доли
pwr.2p.test, pwr.2p2n.test: критерий значимости различия двух долей
pwr.t.test, pwr.t2n.test: критерий Стььюдента
pwr.anova.test: однофакторный дисперсионный анализ для сбалансированных планов
pwr.chisq.test: критерий хи-квадрат
pwr.f2.test: регрессионный анализ
Ряд функций предназначен для вычисления величины эффекта: ES.h (доли), ES.w1 (критерий согласия), ES.w2 (меры связи). Функция cohen.ES дает возможность вывести величину эффекта для заданного критерия и уровня.

1. Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum
2. Бююль А., Цефель П. SPSS: искусство обработки информации, изд-во DiaSoft, 2005 Метки: pwr, величина эффекта, мощность

Источник

9.Что такое статистическая мощность исследования и от чего она зависит?

Нужно ли исследователю учитывать её при планировании исследования, и

если да, то как это сделать?

Статистическая мощность анализа (1-β): вероятность того, что мы на выборке примем гипотезу H1, если на самом деле она верна (= шанс обнаружить эффект, если он на самом деле есть).

• Размер эффекта, пример: Корреляция между приёмом аспирина и снижением риска сердечного приступа: r = 0.034, r2 = 0.0012. Но это значит, что 34 человека из 1000 могут предотвратить приступ, принимая аспирин.

Статистическая мощность зависит от…

– объёма выборки: чем он больше, тем она выше;

– размера эффекта: чем он сильнее, тем она выше;

– от используемого статистического критерия: для разных статистических критериев, проверяющих одну и ту же гипотезу, она будет разной.

• Является критерием для определения объёма выборки с учётом размера ожидаемого эффекта.

• Важно! Только высокая мощность (0,95 и выше) даёт нам возможность делать достоверный вывод о том, что искомый эффект отсутствует (верна H0).

• При недостаточной статистической мощности подобный вывод является необоснованным (правильный вывод: мы не обнаружили эффект, но не можем сказать, есть он или нет).

Анализ статистической мощности и оценка объема выборки являются важным этапом планирования эксперимента, так как без этих вычислений объем данных может быть слишком большим, либо, напротив, слишком маленьким, чтобы получить надежные результаты. Если объем выборки слишком мал, то у вас имеется небольшая вероятность того, что проведенное вами экспериментальное исследование (массовый опрос и др.) даст надежный результат. Напротив, если объем выборки слишком большой, то время, потраченное на сбор данных и большие финансовые расходы, связанные с этим, не принесут ожидаемого эффекта.

Читайте также:  Коробка отбора мощности заднего моста

В спец.программах, например во вражеской Statistika есть специальный модуль — Анализ мощности. Тут доступны графические и аналитические процедуры, позволяющие оценить мощность и объем выборки различных процедур статистического анализа.

Назовем исходную гипотезу «нулевая гипотеза» — H0 . Соберем данные. Используя статистическую теорию, видим, что гипотеза H0, вероятно, неверна и должна быть отвергнута.

Отвергая H0, вы обосновываете то, во что действительно верите. Эта ситуация, типичная во многих областях приложения, называется критерий отвержения-принятия — «Reject-Support testing,» (RS testing); отвергая нулевую гипотезу, вы подтверждаете теорию.

Нулевая гипотеза либо справедлива, либо ошибочна, и статистическая процедура недвусмысленно указывает на это. Нулевая гипотеза либо отвергается, либо не отвергается. Следовательно, до проведения эксперимента вы постулируете, что имеют место только 4 возможности, показанные ниже:

HO H1
H0 Правильное принятие Ошибка II рода
H1 Ошибка I рода Правильное отвержение

Заметим, что имеются ошибки двух типов, показанные в этой таблице. Авторы многих учебников обычно придерживаются такой точки зрения, что Ошибка I рода должна принимать значение .05 или ниже, тогда как Ошибка II рода должна быть столь малой, насколько это возможно при фиксированном уровне ошибки 1 рода. «Статистическая мощность», которая равна 1 — , соответственно, должна быть максимально высокой. ( у Жени в презентации – 0,95)

Например, в двухгрупповом эксперименте, включающем сравнение средних в двух группах — экспериментальной и контрольной, исследователь верит, что лекарство приносит эффект и ищет подтверждение своим предположениям с помощью критерия, который значимо отвергает нулевую гипотезу, состоящую в том, что эффекта нет (средние равны).

В таком исследовании ошибка II рода является трагедией, потому что теория, которая действительно верна, ошибочно отвергается. Очевидно, мы должны действовать так, чтобы уменьшить эту ошибку, т.е. максимизировать мощность критерия. К сожалению, нельзя одновременно уменьшать обе ошибки, и на практике приходится находить компромисс между ними.

В некоторых случаях просто невозможно иметь дело с очень большими выборками — с такой ситуацией мы сталкиваемся, например, в социальных или психологических исследованиях. В таких задачах исследователи иногда тратят несколько дней на то, чтобы получить интервью одного человека. В результате в течение года можно обследовать 50 субъектов. Корреляционные критерии в таких случаях имеют очень низкую мощность (так как объем выборки слишком мал). В таких случаях лучше взять значение выше .05, тогда требуемая мощность может быть достигнута.

С другой стороны, возможно, мощность оказывается слишком большой. Например, можно проверять гипотезу о равенстве двух средних в популяции (Mu1 = Mu2), основываясь на миллионе наблюдений в каждой из сравниваемых групп. В такой ситуации даже при тривиальных (почти нулевых) различиях между группами нулевая гипотеза по существу всегда будет отвергнута.

Оценка мощности. При планировании эксперимента нужно помнить, что мощность должна быть разумно высокой, чтобы обнаружить разумные отклонения от нулевой гипотезы

Факторы, влияющие на мощность статистических тестов. (повторение мать учения): Важно какой именно статистический критерий применяется. Некоторые статистические тесты по своей природе имеют большую мощность, чем другие. Важен объем выборки (количество наблюдений, на основании которых делается вывод). Вообще говоря, чем больше объем данных, тем больше мощность. Однако увеличение числа наблюдений связано с финансовыми и временными затратами. Следовательно, важно сделать объем выборки «разумно большим». Величина экспериментальных эффектов. Уровень ошибки в экспериментальных измерениях. Ошибка измерения интерпретируется как «шум», который может скрыть «сигнал» в реальных экспериментах. Следовательно, все действия, улучшающие точность и надежность измерения, могут увеличить статистическую мощность.

Источник