Вып. 18, год 2003

На главную страницу Поиск Оставить комментарий к статье

МЕТОДОЛОГИЯ НАУЧНЫХ ИССЛЕДОВАНИЙ И ОБРАЗОВАНИЕ


Дополнительные замечания о роли статистических методов

D. R. Cox
Адрес для корреспонденции: Professor D. R. Cox, Nuffield College, Oxford OX1 1NF.
E-mail: david.cox@nuf.ox.ac.uk

Карикатуры в статье Sterne и Davey Smith содержат скрытое предупреждение о растущей двойной угрозе. Прежде всего, плохо обоснованные публикации воздействуют на явно нервозную и склонную к сплетням часть населения. Это приводит к дискредитации тщательно выполненных исследований, которые действительно могут способствовать повышению уровня здоровья. Корректно и честно используемые статистические методы отчасти защищают от ложных запугиваний и, что более важно, помогают (посредством использования научных принципов планирования и анализа исследований) проводить хорошо обоснованные научные работы и в конечном счете улучшать состояние здоровья населения.

Здесь было бы неуместно детально обсуждать конкретные статистические проблемы. Если принудительно проводимые в жизнь методические принципы представляют потенциальную опасность, рациональные рекомендации, отраженные во вставке 2, соответствуют общему направлению развития статистической науки. Это значит, что основным элементом является план исследования, направленный на минимизацию систематической ошибки; кроме того, важно также найти величину эффекта, относительного риска и т. д., что лучше всего обеспечивается установлением границ ошибки, доверительных интервалов или способов определения оценок и стандартных ошибок. Оценка статистической значимости играет ограниченную роль, обычно в качестве дополнения к выводам. Количественное представление субъективной вероятности возможно в особенности на стадии планирования исследования, но оно неуместно при общем представлении выводов.

Суровая критика авторами тех, кто пытается выявить эффекты в подгруппах испытуемых, в основном при нерезультативных исследованиях, вполне обоснованная. Все сообщения о значительном воздействии определенного фактора, оцениваемого только для болельщиков команды Астон Вилла, которые старше 75 лет и живут к югу от Бирмингема, ничего не стоят, как бы ни был велик интерес к этой конкретной группе; в крайнем случае, их можно поместить в раздел тем для будущих независимых исследований. Более рациональны небольшие по объему и хорошо спланированные исследования, в которых изучаются модифицирующие факторы основного эффекта, что на языке статистики часто ошибочно называют взаимодействием. Даже в наиболее тщательно спланированных и проведенных рандомизированных контролируемых испытаниях при полном сотрудничестве испытуемых оценивается только усредненный эффект для группы пациентов, которые дали осознанное согласие. Основанием для распространения выводов на различные популяции и на отдельных пациентов нередко является, прежде всего, научное толкование механизма действия изучаемого лечебного вмешательства, и это основание подкрепляется некоторыми оценками стабильности обнаруженных эффектов, даже если такие оценки статистически недостаточно чувствительные.

Все эти вопросы касаются просвещения населения в отношении сущности научных поисков и связанных с ними сомнений. Как отмечают авторы, современные статистические теории многим обязаны статистику и генетику R.A. Fisher, в частности за две его книги [1, 2]. Во второй из них в том же году, когда Karl Popper предложил гипотетико-дедуктивный метод, Fisher написал: “Можно сказать, что любой эксперимент существует только для того, чтобы дать фактам шанс отвергнуть нулевую гипотезу”. К 25-й годовщине со дня публикации первой книги Fisher, его друг F. Yates, написал работу, в которой наряду с оценкой его вклада критиковал Fisher, в частности, за то, что тот придавал особое значение критериям значимости [3]. В той или иной форме эти критические замечания с тех пор повторялись много раз. Чтобы дифференцировать различные типы гипотез, которые можно было бы проверять, полезно понять эти проблемы [4]. В научной лаборатории возможно провести эксперимент с предсказуемым результатом, если мы правильно понимаем лежащие в его основе процессы. Ключевым вопросом в таком случае является соответствие результата этому предсказанию. С другой стороны, во многих эпидемиологических исследованиях и рандомизированных клинических испытаниях, за редким исключением (например, мобильные телефоны и опухоли мозга), нет оснований ожидать нулевого эффекта. Чаще возникает вопрос о том, достаточно ли достоверно установлена направленность эффекта и придает ли ему распространенность какого-либо явления большое значение для клинической медицины или здравоохранения.

ЛИТЕРАТУРА

1. Fisher RA. Statistical methods for research workers. 1st ed. Edinburgh: Oliver and Boyd, 1925. Reprinted by Oxford University Press.

2. Fisher RA. Design of experiments. 1st ed. Edinburgh: Oliver and Boyd, 1935. Reprinted by Oxford University Press.

3. Yates F. The 25th anniversary of statistical methods for research workers. J Am Stat Assoc 1950; 46: 19–34.

4. Cox DR. Statistical significance test. Br J Clin Pharmacol 1982; 14: 325–31.


На главную страницу Поиск Оставить комментарий к статье

Copyright © 1998-2003. Обзор современной психиатрии. Все права сохранены.