Типы эпидемиологических исследований.

K.Rothman and S.Greenland. Types of Epidemiologic Studies. In: Rothman K., Greenland S. Modern Epidemiology. 2^nd ed., Lippincott Williams & Wilkins, Philadelphia, 1998 .- p. 67-78

Научный эксперимент – это эмблема научной активности. Что представляет собой эксперимент? Обычно под экспериментом понимают любое испытание или тестирование. Например, профессор в качестве эксперимента может использовать новый метод обучения. Для большинства ученых термин имеет более узкое значение: эксперимент это набор наблюдений, которые выполняются в контролируемых условиях, при которых ученый воздействует на условия для того, чтобы выяснить какой эффект подобное воздействие оказывают на наблюдения. Некоторые могут расширить это определение для того, чтобы включить контролируемые наблюдения без манипуляции внешними условиями. Таким образом, астрономические наблюдения во время солнечного затмения 1919 года, которые подтвердили общую теорию относительности Эйнштейна, часто назывались экспериментом. Для эпидемиологов, однако, слово эксперимент означает, что исследователь манипулирует теми условиями, которые он изучает.

Идеальный эксперимент должен был бы базироваться на целом наборе условий, из которых только один фактор, воздействующий на интересующий нас результат, варьирует. Для того чтобы решить эту задачу, мы должны контролировать условия, которые могут воздействовать не результат. К сожалению, в биологических науках условия, воздействующие на большинство результатов настолько сложные, и настолько непонятные, что их невозможно сделать аналогичными у разных объектов. В исследовании причин возникновения рака, например, невозможно создать условия, которые бы, безусловно, приводили к возникновению рака после фиксированного временного интервала, даже при условии, что популяция состоит из группы клонированных лабораторных мышей. В результате этого всегда будет то, что называется «биологическая вариабельность», которая обозначает вариабельность в наборе условий, приводящих к появлению эффекта.

В биологических экспериментах, соответственно, идеал создания абсолютно одинаковых наборов условий, в которых только один фактор варьирует, является не реалистичным, (хотя многие могут сказать, что эта задача является не реалистичной и для других отраслей науки). Вместо этого экспериментатор пытается создать условия, в которых объем вариабельности факторов, имеющих возможность воздействовать на результат, небольшой, по сравнению с вариабельностью изучаемого ключевого фактора. Таким образом, невозможно сделать так, чтобы все животные в экспериментальной группе ели абсолютно одинаковое количество пищи, вариабельность потребления пищи может вызвать проблему, если она воздействует на результаты исследования. Однако, если эта вариабельность небольшая, то тогда она может и не оказывать очень сильного воздействия на результаты эксперимента. Исследователь обычно удовлетворяется, если вариабельность внешних факторов (иными словами факторов, отличающихся от ключевых исследуемых переменных) слишком мала для того, чтобы серьезно воздействовать на изучаемые результаты.

Эпидемиологические типы исследований корнями своими уходят в концепцию научного эксперимента. Когда эпидемиологические эксперименты возможны, их дизайн находится под контролем тех принципов, которые уменьшают вариабельность внешних факторов, по сравнению с факторами исследования. Эпидемиологические эксперименты включают клинические испытания (когда объектами исследования являются пациенты), полевые исследования (когда испытания проводятся над индивидами в данной общине), и общинные интервенционные исследования (когда воздействие производится на общину в целом). Когда эксперименты не возможны, эпидемиологические эпидемиологи разрабатывают не экспериментальные исследования, которые симулируют состояния (что могло бы произойти, если бы эксперимент был произведен). Не экспериментальные исследования включают когортные исследования, в которых объекты классифицируются (и возможно отбираются) в соответствии со статусом их воздействия и наблюдаются на протяжении определенного времени для того, чтобы оценить заболеваемость. Исследования по типу случай-контроль, в которых пациенты отбираются в соответствии со своим состоянием – больны они или нет – и затем классифицируются в соответствии с их воздействием. Исследования пропорциональной смертности, которые могут рассматриваться как подтип исследования по типу случай-контроль. Одномоментные исследования, включающие изучение распространенности и экологические исследования, в которых единицей наблюдения являются группы людей.

Экспериментальные исследования.

В эксперименте те, кто подвергается воздействию агента или предположительной причины, подвергаются этому воздействию только постольку, поскольку исследователь решил, что необходимо, чтобы это воздействие было приложено к объекту исследования. Более того, причина для назначения специфического воздействия определенному субъекту должна быть только для того, чтобы выполнить протокол исследования – иными словами, единственной причиной для направления в ту или иную группу должно быть соответствие протоколу, а не потребностям объекта исследования. Например, предположим, что врач, изучающий головную боль, прописывает запатентованное лекарственное средство своим более богатым пациентам, а более дешевый вариант - своим бедным пациентам (поскольку предполагаемая большая надежность патентованной версии, с его точки зрения, не стоит значительно больших затрат для тех, кто беден). Если затем врач захочет сравнить эффекты двух лекарственных средств, он не сможет рассматривать себя как человека, проводящего эксперимент, несмотря на то, что сам исследователь отнес людей в ту или иную группу. Для того чтобы провести адекватный эксперимент, он должен был бы назначать лекарственное средство в соответствии с протоколом, который бы снизил вариабельность между группами воздействия по отношению к другим потенциальным причинам головной боли. Распределение воздействия в экспериментальных группах должно помочь исследованию, а не индивидууму. Если исследование проводится для того, чтобы помочь индивидууму, тогда возможно провести не экспериментальное исследование, но оно не должно называться экспериментом. Иногда по отношению к контролируемым исследованиям используется термин квази -эксперимент: в таких исследованиях воздействие было назначено исследователем, но не в соответствии с рандомизированным экспериментальным протоколом (Cook и Campbell1979).

Поскольку воздействия определяют цель исследования, а не потребности объекта исследования, этические правила ограничивают условия, в которых можно проводить эпидемиологический эксперимент. Эксперименты этически возможны только в том случае, когда следование научному протоколу не конфликтует с интересами объекта исследования. Если быть более точным, должна быть достаточно серьезная убежденность в том, что ни один человек, участвующий в исследовании, не мог бы лечиться лучше, чем два или три возможных воздействия, присутствующих в протоколе. Из этого требования следует очевидное ограничение, что любое воздействие, которое наносится объекту исследования, должно быть ограничено средствами, которые потенциально предотвращают либо заболевание, либо его последствия. Это ограничение само по себе приводит к тому, что большая часть эпидемиологических исследований является не экспериментальными. Вторым ограничением является то, что все альтернативы воздействия должны быть одинаково приемлемыми на современном уровне знаний. Третье ограничение заключается в том, что человек, принятый в исследование, не должен быть лишен предпочтительной формы лечения или профилактики, которые не включены в исследование. Например, неэтично включать плацебо-терапию в одну из групп клинического испытания, если существует общепризнанное лекарственное средство или метод профилактики. Для сравнения любого нового метода лечения основой должна быть возможная наилучшая терапия. Кроме того, все участники исследования должны быть полностью информированы как об их участии в эксперименте, так и о возможных последствиях.

Даже, несмотря на эти ограничениями, проводится большое количество эпидемиологических экспериментов. Большинство из них попадают в специализированную область клинических испытаний, под которыми мы понимаем эпидемиологические исследования различных методов лечения пациентов, у которых уже имеются некие заболевания (в данном случае испытание используется как синоним для слова эксперимент). Эпидемиологические эксперименты, которые направлены на оценку первичной профилактики (агентов, которые должны предотвратить появление заболевания), встречаются реже, чем клинические испытания. Эти исследования обычно называется полевыми испытаниями или общинными интервенционными исследованиями.

Клинические испытания.

Клиническое испытание – это эксперимент, при котором пациент используется в качестве объекта исследования. Целью клинического испытания является либо оценка возможного лечения данного заболевания, либо попытка поиска профилактических средств для предотвращения последствий заболеваний, таких как смерть или инвалидизация. Воздействие в клиническом испытании - это не первичные профилактические средства, (поскольку они не предотвращают появление самого заболевания), но они являются методами профилактики последствий исходного заболевания. Например, модификация диеты после того, как индивидуум перенес инфаркт миокарда, может предотвратить повторный инфаркт миокарда или смерть; или же применение химиотерапевтических препаратов у пациентов с онкологическими заболеваниями для предотвращения рецидива злокачественного новообразования.

Объекты в клинических исследованиях должны быть диагностированы как имеющие интересующее заболевание, и они должны быть включены в исследование вскоре после постановки диагноза для того, чтобы распределение на группы воздействия было сделано вовремя. Пациенты, чье заболевание слишком легкое или слишком тяжелое для того, чтобы применять данное лечение (или альтернативное лечение), должны быть исключены из исследования. Определение в группы должно быть произведено таким образом, чтобы минимизировать вариабельность внешних факторов, которые могут воздействовать на сравнение. Например, если некоторые врачи, принимающие участие в исследовании, предпочитают новую терапию, они могут влиять на распределение пациентов в группы, направляя в группу нового лечения своих собственных пациентов или, возможно, пациентов с более тяжелым течением заболевания. Понятно, что если пациенты с более тяжелым течением заболевания чаще будут получать новое лечение, достоверная оценка нового лечения станет невозможной.

Для того чтобы избежать этой, и похожих проблем, в группы воздействия в клинических испытаниях принято распределять пациентов таким образом, чтобы группы оказались сравнимыми по отношению к неизмеренным «исходным» характеристикам, что позволяет избежать манипуляций персонала, входящего в исследование, и проводить анализ причинно-следственных связей с минимальным количеством допущений. Практически все соглашаются с тем, что наилучшим способом добиться этой цели, является использование рандомизации (Bayer и соавторы 1976, Peto и соавторы 1976,Gelman и соавторы 1995). Достоверность исследования зависит от того, насколько случайный процесс добивается аналогичности в двух группах по отношению к исходному распределению неизмеренных факторов риска.

Клинические испытания по возможности должны попытаться применить маскирование по отношению к тому, к какой группе относится пациент. В идеале человек, который распределяет пациентов на группы, пациенты и исследователь, который оценивает результаты, не должны знать о том, кто, какое воздействие получил. Маскирование предотвращает целый ряд систематических ошибок, которые могут воздействовать на распределение, оценку или следование протоколу. Важнее всего держать в неведении человека, который проводит оценку, относительно того к какой группе относится пациент, особенно если оценка результата субъективна, такая как, например, клинический диагноз (некоторые результаты, такие как смерть, будут относительно нечувствительными к систематическим ошибкам в оценке). Знание пациента, в какую группу он относится, может воздействовать на его следовании протоколу, а также может оказать воздействие на описание им ощущения от симптомов, что в свою очередь может воздействовать на оценку результатов. Исследования, в которых как человек, производящий оценку, так и пациент, участвующий в исследовании, не знают какое воздействие получает пациент, известны как двойные слепые исследования. Исследования, в которых индивидуум, производящий оценку, не знает, какое лечение является каким, (это может происходить, когда в качестве воздействия используются закодированные таблетки – человек, производящий оценку не знает кода таблетки), могут описываться как тройные слепые исследования.

В зависимости от природы лечения может оказаться невозможным, или непрактичным, полностью исключить информацию о том, к какой группе относится тот или иной пациент для всех, или некоторых из этих трех участников. Например, препарат может иметь хорошо известные побочные эффекты, которые позволяют пациенту идентифицировать лечение. Исследователь должен понимать это и сообщать об этих возможностях.

Если для изучаемого состояния не существует общепринятого лечения, можно воспользоваться в качестве метода сравнения плацебо. Плацебо – это инертное воздействие, которое не имеет никакого эффекта (за исключением психологического эффекта от предложенного лечения, которое само по себе может быть достаточно мощным). Используя плацебо, исследователь может контролировать психологический компонент от самого лечения, и изучать не психологическую пользу от нового вмешательства. Кроме того, применение плацебо способствует маскированию, если сравнительного метода лечения нет. Однако в некоторых ситуациях использование плацебо может рассматриваться как не этичное, особенно, когда имеется эффективное лечение данного состояния. В этом случае в качестве сравнения необходимо использовать наилучший, из имеющихся методов лечения (Rothman и Michels1994). Плацебо также не является необходимым, когда задачей исследования является просто сравнение двух воздействий.

В ситуации, когда возможно, что пациенты не будут следовать протоколу, чрезвычайно важно измерить степень, с которой они отклоняются от протокола. Исследователи могут напрямую задавать вопросы пациентам о том, насколько они следуют протоколу и рекомендациям, иногда для этого можно применять биохимические показатели. Кроме того, в качестве оценки эффекта от воздействия используются показатели осложнений ( Angrist и соавторы 1996).

Полевые испытания.

Полевые испытания отличаются от клинических испытаний в том, что они работают с индивидами, которые еще не заболели и поэтому не являются пациентами. В то время как пациенты в клинических испытаниях могут страдать от осложнений заболевания, с высокой вероятностью за относительно короткий промежуток времени, риск же возникновения заболевания в первый раз обычно относитально низок. Соответственно, полевые испытания обычно требуют значительно большего количества участников, чем клинические испытания, и поэтому они значительно дороже. Более того, поскольку участники испытаний не являются пациентами, приходящими в некий общий центр для получения лечения, полевые испытания очень часто требуют, чтобы к испытуемым приходили туда, где они обычно находятся (на работу, домой или в школу); или возникает необходимость создания центов, в которых можно производить это исследование, и куда индивидуумы будут обращаться. Это добавляет дополнительную стоимость планам исследования.

Высокая стоимость полевых испытаний ограничивает их использование для изучения профилактических средств для крайне часто встречающихся, или для крайне тяжелых заболеваний. Было выполнено несколько полевых испытаний для того, чтобы определить эффективность больших доз витамина С в профилактике простуды (Karlowski и соавторы, 1975; Dykes и Meier 1975). Полиомиелит редкое, но серьезное заболевание, являлось достаточно серьезной проблемой для общественного здоровья и в связи с этим, возникла необходимость организации того, что на сегодняшний день считается наибольшим формальным экспериментом на людях, когда либо проводившемся - испытания вакцины Солка. В этом испытании вакцина или плацебо были применены на сотнях тысяч школьников (Francis и соавторы, 1955). Когда изучаемое заболевание возникает редко, более эффективным может оказаться изучение пациентов, которые имеют более высокий риск развития данного заболевания. Таким образом испытание вакцины против гепатита В, было выполнено в популяции гомосексуалистов Нью-Йорка, среди которых инфекция гепатита В возникала со значительно большей частотой, чем среди обычных жителей города (Szmuness 1980). Аналогичные идеи часто применяются и в клинических испытаниях, которые могут концентрироваться на пациентах с высоким риском побочных эффектов. Несколько клинических исследований по эффекту от снижения уровня холестерина, с целью снижения риска развития повторного инфаркта миокарда, были проведены на пациентах, уже перенесших инфаркт миокарда, поскольку такие пациенты имеют более высокий риск развития повторного инфаркта миокарда (Leren,1966; Detre и Shaw 1974). Значительно более дорогостоящим является выполнение испытания, которое бы изучило эффект снижения уровня холестерина на первичное возникновение инфаркта миокарда, поскольку для того, чтобы обеспечить адекватный результат, в исследование должно быть включено значительно большее количество людей. Исследование по воздействию на множественные факторы риска (MRFIT) являлось полевым испытанием нескольких первичных профилактических воздействий, направленных на борьбу с инфарктом миокарда, включая диету. Хотя оно включало только пациентов высокого риска, и пыталось снизить риск несколькими одновременными вмешательствами, это исследование включало 12866 испытуемых и стоило 115 миллионов долларов (практически полмиллиарда долларов в деньгах сегодняшнего дня) (Kolata1982). Точно также как и в клинических испытаниях, воздействие в полевых испытаниях должно быть распределено таким образом, чтобы группы оказались сравнимыми, и оно должно удалить любое сознательное вмешательство со стороны персонала в распределение на группы воздействия. Вновь случайное распределение является идеальным методом выбора, но сложности применения подобной схемы в крупномасштабных полевых испытаниях, может перевесить ее преимущества. Например, может оказаться удобным распределять вакцину по группам, которые обрабатываются абсолютно идентично, особенно если вакцину достаточно сложно транспортировать и хранить. Поскольку такие воздействия могут оказать серьезное влияние на интерпретацию экспериментальных исследований, необходимо внимательно взвесить их положительные и отрицательные стороны.

Популяционные вмешательства и кластерные рандомизированные испытания.

Популяционное профилактическое вмешательство – это расширение полевого испытания, которое включает в себя внедрение на популяционном уровне. Концептуально различие базируется на том, направлено ли вмешательство отдельно на каждого индивидуума, или нет. В то время как вакцина обычно применяется индивидуально каждому человеку, фторирование воды для профилактики кариеса, обычно применяется для всех (к водопроводу в целом). Соответственно, фторирование воды оценивалось при помощи популяционных профилактических исследований, в которых отбирались различные популяции (общины), и затем воздействие (обработка воды) применялось на уровне целой популяции (общины). Другие примеры профилактических средств, которые могут быть внедрены на популяционном уровне, включают группы быстрого реагирования, а также образовательные программы, включающие средства массовой информации, такие как программа профилактики ожогов в штате Массачусетс (MacKay и Rothman,1982). Некоторые вмешательства наиболее удобно проводить на группах индивидуумов, которые в целом меньше, чем община. Диетические вмешательства удобнее всего проводить на уровне семьи. Вмешательства со стороны окружающей среды могут воздействовать на целый офис, завод или здание. Защитное оборудование при занятиях спортом может быть использовано для всей команды или лиги. Группами для вмешательств могут оказаться военные подразделения, классы, пассажиры автомобилей или любые другие группы, члены которых одновременно подвергаются воздействию. Научное обоснование экспериментов с использованием таких вмешательств, аналогично тому, которое используется при популяционных профилактических исследованиях. От обычных полевых исследований эти исследования отличает то, что вмешательства легче применить на группе, чем на индивидууме.

Полевые исследования, в которых к группам воздействия случайным образом относятся не индивидуумы, а группы пациентов, называются кластерно-рандомизированными. Чем больше размеры группы, которая является рандомизационной единицей по отношению к общему размеру исследования, тем меньше эффект от рандомизации. Если в исследование вовлечены только две популяции, одна из которых получает вмешательство, а другая – нет (как в исследовании по фторированию воды (Ast и соавторы, 1956), не имеет значения, получила ли община, в которой стали фторировать воду, свое воздействие случайно или нет), различия в базовых характеристиках все равно будут теми же самыми, вне зависимости от метода назначения воздействия; под воздействием может оказаться только направление различий. Если количество рандомизированных групп в каждом воздействии достаточно велико, рандомизация приведет к аналогичному распределению исходных характеристик среди групп вмешательств.

Не экспериментальные исследования.

Ограничения, которые накладываются этикой и финансами, ограничивают эпидемиологические исследования не экспериментальными. Хотя для исследователя и считается не этичным подвергать людей воздействию потенциальной причины заболевания просто для того, чтобы выяснить этиологию этого заболевания, люди часто (сознательно или нет) сами подвергают себя воздействию потенциально вредных факторов. Размеры подобных воздействий были хорошо описаны (MacMahon1979): «Они выбирают большое количество дозировок различных потенциально токсических веществ – посмотрите на привычку курить сигареты, к которой приучили себя миллионы людей на уровнях практически от нуля (тех, кто подвергается воздействию за счет пассивного курения), до людей, выкуривающих в бодрствующем состоянии по 3-4 сигареты каждый час, и последовавшие за этим, в последние полстолетия, два миллиона (или более) смертей от рака легких. Примите во внимание, например тот факт, что, менее половины американских женщин проходят через менопаузу без того, чтобы их матка либо была хирургически удалена, либо без достаточно большой дозировки гормонов, а, как известно, оба этих фактора увеличивают риск развития рака у животных. Подумайте о последствиях того факта, что более чем 50 миллионов женщин во всем мире для целей контрацепции регулярно принимают комбинацию гормонов, которые на самом деле прерывают функционирование их собственных яичников».

Целью всех исследований является получение достоверных доказательств по отношению к изучаемой гипотезе. В идеале мы бы хотели, чтобы качество доказательств и экспериментальных исследований было бы также высоко, как и те, что мы получаем от хорошо спланированного эксперимента. В эксперименте, однако, исследователь имеет возможность изменять свое воздействие таким образом, чтобы улучшить достоверность исследования, в то время как в не экспериментальных исследованиях, исследователь не может контролировать воздействия. Если те, кто оказывается под воздействием, имеют больший или меньший риск для возникновения заболевания, по сравнению с теми, кто не оказывается под воздействием, то простое сравнение между подвергшимися воздействию, и не подвергшимися воздействию, не будет адекватно отражать эффект самого воздействия.

Поскольку исследователь не может сам влиять на воздействие в не экспериментальных исследованиях, он (или она) должны полагаться на единственный источник отбора, который у них остается – а именно на пациента. Если парадигмой научного наблюдения является эксперимент, тогда парадигмой не экспериментальных эпидемиологических исследований является «естественный эксперимент», в котором природа эмулирует эксперимент. Наверное, наиболее известным примером прототипа всех известных естественных экспериментов является элегантное исследование холеры в Лондоне, выполненное Джоном Сноу (John Snow). В Лондоне в середине девятнадцатого века имелось несколько водопроводных компаний, которые доставляли питьевую воду жителям города. Естественный эксперимент Сноу состоял в том, что он сравнил смертность от холеры среди людей, которые получали воду от двух основных водопроводных компаний Southwark и Vauxholl, компании, которая прокачивала из реки Темзы воду, загрязненную канализационными стоками, и компании Lambeth, которая в 1852 году изменила место сбора от Hungerford Market на Thames Ditton, получив, таким образом, источник воды без канализационных загрязненний. Вот как Сноу (Snow, 1860) описал это:

«…….перемешивающийся характер водоснабжения, предоставляемого компанией Southwark и Vauxholl с тем, что предоставляла компания Lambeth во многих частях Лондона, мог предоставить наиболее серьезные доказательства одной или другой стороне. В кварталах, снабжаемых обеими компаниями, перемешивание этого водоснабжения было очень тесным, водопроводные трубы всех компаний тянулись по всем улицам, заходя практически во все дворы и аллеи. Несколько домов снабжались одной компанией и несколько другой, в соответствии с решением владельца или жильца в том момент, когда водопроводные компании активно конкурировали друг с другом. Во многих случаях один и тот же дом на разных сторонах имел снабжение из различных источников. Каждая компания предоставляла воду, как богатым, так и бедным, как в большие дома, так и в маленькие, и не было никаких различий в условиях или профессии человека, который получал воду от различных компаний. Было очевидно, что ни один эксперимент не мог бы быть разработан более детально для того, чтобы проанализировать эффект водоснабжения на распространение холеры.

Эксперимент, кроме того, был еще и очень большим. Не менее чем 300000 человек, обоих полов, всех возрастов, всех рангов и сословий - от дворян, до очень бедных - были разделены на две группы вне их собственного выбора, и в большинстве случаев даже без их знания. Одна группа получала воду, содержащую канализационные стоки Лондона, и среди них могли находиться испражнения пациентов с холерой, а другая группа получала воду, абсолютно чистую от загрязнений.

Для того чтобы завершить этот эксперимент все, что было необходимо – это выяснить, кто предоставлял воду в каждый индивидуальный дом, где возникали случаи холеры».

Имеется два основных типа не экспериментальных исследований в эпидемиологии. Первый – это когортное исследование (так же называемое исследованием заболеваемости), является прямым аналогом экспериментов. Здесь сравниваются различные группы воздействия, но (как и в случае исследования Сноу) исследователь не назначает воздействия самостоятельно. Другое исследование – это исследование по типу случай-контроль, которое использует дополнительный шаг в формировании группы пациентов в зависимости от результата. Этот дополнительный выборочный шаг может привести к тому, что исследование по типу случай- контроль оказывается значительно более эффективным, чем когортное исследование популяции в целом, но оно приводит к тому, что появляются значительные возможности для систематических ошибок, отсутствующих в типичных когортных исследованиях.

Когортные исследования.

В классическом когортном исследовании исследователь определяет две или более группы людей, которые не имеют заболевания, отличающихся друг от друга воздействием на них потенциальной причины заболевания. Эти группы обозначаются как исследуемые когорты, (название происходит от латинского слова, обозначавшего одну из десяти единиц, составлявших римский легион). В подобных исследованиях имеется, по крайней мере, одна когорта, которую рассматривают как когорту, подвергавшуюся воздействию (индивидуумы, которые находились под воздействием возможной причины заболевания или условий) и другая когорта, которая рассматривается, как не подвергавшаяся воздействию (референтная когорта). Может быть более двух когорт, но каждая когорта будет представлять собой группу с различным уровнем воздействия. Например, профессиональное когортное исследование работников на химическом заводе может включать когорты пациентов на заводе, которые работают в различных подразделениях и в различных цехах этого завода, и каждая когорта подвергается воздействию различного набора химических веществ. Исследователь измеряет и сравнивает заболеваемость в каждой из этих когорт.

В естественном эксперименте Сноу, изучаемыми когортами были жители Лондона, которые потребляли воду либо от компании Lambeth либо от компании Southwark и Vauxholl и те, кто жил в районах, где водопроводные сети двух компаний были перемешены. Сноу смог оценить частоту смертей от холеры, используя домохозяйства в качестве знаменателя, отдельно для людей в каждой из этих двух когорт (Snow,1860).

«В соответствии с отчетом, который был предоставлен в парламент, компания Southwark и Vauxholl предоставляла воду 40046 домам с 1 января до 31 декабря 1853 года, а компания Lambeth за тот же самый период, предоставляла воду 26107 домам. Соответственно, в этот период за первые четыре недели произошло 286 смертельных случаев холеры в домах, обслуживаемых первой компанией, и только 14 в домах, обслуживаемых второй компанией. Соответственно пропорция смертельных случаев холеры на 10000 домов была следующая: Southwark и Vauxholl 71, Lambeth 5. В этот период смертность от холеры была в 14 раз выше среди тех людей, которые получали нечистую воду от компании Southwark и Vauxholl, чем среди тех, кто получал более чистую воду из Thames Ditton».

Многие когортные исследования начинаются с одной единой когорты, которая гетерогенна по отношению к воздействию. Сравнение заболеваемости делаются внутри подгрупп когорты, определяемой одним, или более воздействием. Примеры могут включать когортные исследования на лицах различных административных или социальных единиц таких, как когорты врачей, или медицинских сестер; или когорты, собранные из сотрудников определенных учреждений, рабочих заводов и т.д.

Исследование по типу случай-контроль.

Исследование по типу случай-контоль лучше всего понять, если мы определим популяцию, как источник, который представляет собой гипотетическую изучаемую популяцию, в которой могло бы быть проведено когортное исследование. Если проводится когортное исследование, то первичной задачей его, было бы идентифицировать числитель для тех, кто подвергся воздействие и для тех, кто воздействию не подвергся и измерить его в человеко-годах наблюдения (или как количество людей в каждой когорте), а затем идентифицировать количество случаев, возникающих в каждой категории или когорте. В исследованиях по типу случай-контоль случаи идентифицируются, и определяется статус их воздействия, точно также как и в когортном исследовании, но знаменатель, из которого могли бы быть рассчитаны показатели заболеваемости, не измеряется. Вместо этого контрольная группа берется из популяции, которая могла бы быть источником и для случаев.

Целью формирования контрольной группы является определение относительного (в противоположность абсолютного) размера знаменателей групп подвергавшихся и не подвергавшихся воздействию в исходной популяции. Из относительного размера знаменателей, мы можем оценить относительные размеры частоты. Таким образом, исследование по типу случай-контроль дает нам относительные показатели эффекта. Поскольку контрольная группа используется для оценки определения воздействия в исходной популяции, основным требованием при отборе контроля является то, что контроли должны выбираться независимо от статуса воздействия.

В целом исследования по типу случай-контоль отличаются от когортных исследований по тому, как отбираются пациенты. Когортное исследование идентифицирует пациентов и наблюдает за ними. Исследование по типу случай-контоль включает в себя дополнительный этап в отборе случаев и контроле из данной популяции. Более детальное обсуждение когортных исследований и исследований по типу случай-контоль будет представлено в главах 6 и 7.

Проспективные и ретроспективные исследования.

Исследования могут быть также классифицированы как проспективные, либо как ретроспективные. Мы определяем проспективное исследование, как исследование, в котором анализ воздействия и измерение других факторов был сделан до того, как возникло заболевание. В ретроспективных исследованиях эти показатели изучаются после того, как заболевание возникло.

Различия между классификациями исследований на когортные или по типу случай-контоль, проспективными и ретроспективными, должно быть сделано достаточно четко, поскольку эти две оси классификаций эпидемиологических исследований часто путаются. Ранние авторы называли когортные исследования проспективными, а исследования по типу случай-контоль ретроспективными, поскольку когортные исследования обычно начинаются с идентификации воздействия и затем измеряют развитие заболевания. В то время как исследование по типу случай-контоль обычно начинается с идентификации заболевших людей и контроля, а затем измерения статуса воздействия. Однако термины проспективное и ретроспективное исследование полезны для того, чтобы описать время начала заболевания по отношению к измерению воздействия. Например, исследование по типу случай-контоль может быть либо проспективным, либо ретроспективным. Проспективное исследование по типу случай-контоль использует показатели воздействия, которые были взяты до того, как человек заболел, в то время как ретроспективные исследования по типу случай-контоль используют показатели, взятые после того, как человек заболел. Как когортные, так и исследования по типу случай-контоль могут базироваться на смеси проспективных и ретроспективных измерений, используя данные, собранные как до, так и после начала заболевания. Различия между проспективными и ретроспективными исследованиями иногда используются для того, чтобы описать время идентификации субъектов, а не измерения воздействия и других факторов. Когда мы используем данный подход, ретроспективное или историческое когортное исследование включает идентификацию и наблюдение за пациентами, но пациенты идентифицируются только после того, как период наблюдения закончился. Идентификация пациентов, воздействие на них и результаты базируются на существующих записях или на воспоминаниях участников.

Эксперименты – это всегда проспективное когортное исследование, поскольку исследователь вначале распределяет людей между группами воздействия, а затем должен ждать до того момента, пока не произойдет заболевание. С другой стороны, многие профессиональные когортные исследования являются ретроспективными, иными словами пациенты отбираются после того, как возникло заболевание. Преимущества и недостатки проспективных и ретроспективных измерений, а также отбора обсуждаются в главах 8 и 9.

Одномоментные исследования.

Исследование, которое включает в качестве объектов всех людей в популяции в некий момент, или репрезентативную выборку всех подобных людей, включая тех, кто имеет заболевание, и имеет своей целью описать популяцию в данный момент, обычно обозначается как одномоментное (или кросс-секционное) исследование. Одномоментное исследование, которое выполняется для того, чтобы определить распространенность, называется исследованием распространенности. Обычно информация о воздействии анализируется вместе с информацией о заболевании, таким образом, чтобы субпопуляции с различным воздействием могли бы быть сравнены в соответствии с распространенностью у них заболеваний.

Одномоментные исследования могут и не иметь этиологических задач. Например, предоставление услуг системы здравоохранения очень часто требует знания того, сколько единиц чего-то потребуется (например, количества больничных коек) без учета причин заболеваний. Тем не менее, данные по распространенности заболеваний очень часто используются для этиологических выводов, поэтому понимание ограничения этих методов является чрезвычайно важным.

Одна из проблем, которая очень часто обсуждается в разделе выборки со смещенным временем начала, заключается в том, что случаи в одномоментных исследованиях будут всегда иметь большее количество заболевших с длительным течением заболевания, и в них обычно недостаточно представлены те, у кого заболевание имеет медленное течение. Для того чтобы понять, почему это происходит, предположим, что имеется две крайних ситуации, которые включают заболевания с крайне высокой вариабельностью продолжительности. Один человек, который заболевает этим заболеванием в возрасте 20 лет и живет до 70 лет, может быть включен в любое одномоментное исследование в течение 50 лет, пока он им страдает. Человек, который заболевает этим заболеванием в возрасте 40 лет и умирает в течение одного дня, практически не имеет никаких шансов на включение в исследование. Таким образом, если воздействие не меняет риск заболевания, но приводит к тому, что одно заболевание может быть крайне легким (таким образом, воздействие связано с продолжительностью заболевания), распространенность воздействия будет среди случаев. Таким образом, если воздействие не влияет на риск возникновения заболевания, но приводит к тому, что если человек заболел, оно у него будет крайне легким, иными словами, воздействие связано с продолжительностью жизни, то распространенность этого воздействия будет выше среди заболевших. В качестве результата будет обнаружена положительная взаимосвязь между воздействием и заболеванием, хотя само по себе воздействие и не оказывает никакого влияния на риск заболевания. Если воздействие не влияет на риск заболевания, но приводит к тому, что заболевание при возникновении очень быстро становится смертельным, (иными словами воздействие отрицательно связано с продолжительностью заболевания), распространенность воздействия среди случаев будет крайне низкой. В результате этого в одномоментном исследовании будет наблюдаться отрицательная связь между воздействием и заболеванием, несмотря на то, что само по себе воздействие не оказывает никакого влияния на риск заболевания.

Имеются аналитические методы, которые позволяют учитывать потенциальную связь между воздействием и продолжительностью заболевания (например, Simon, 1980b). Этот метод требует, чтобы мы получили даты постановки диагноза для всех случаев, или информацию о распределении продолжительности заболевания на различных уровнях воздействия. Даже при отсутствии связи между воздействием и продолжительностью заболевания, тем не менее, возникают проблемы, которые заключаются в том, что нынешнее воздействие может быть связано с теми воздействиями, которые были в то время, когда оно могло быть этиологически значимым для нынешнего заболевания. Подобное время отделено от настоящего двумя историческими периодами:

временем индукции между соответствующим воздействием и возникновением заболевания (которое остается гипотетическим до тех пор, пока не будут получены адекватные данные по времени индукции);
временем от возникновения заболевания до момента проведения исследования (которое мы можем измерить, желательно из медицинских записей).

Одномоментные исследования часто опираются на воздействия, которые не меняются, такие как группа крови и другие, мало меняющиеся характеристики человека. Для таких воздействий настоящая информация является полезной. Однако для изменяющихся воздействий, настоящая информация менее желательна, чем этиологически более полезная информация, которая была получена до того, как возникло заболевание. В исследовании этиологии рака дыхательных путей, сравнивающее информацию по курению между случаями и не случаями, оказалось, что курение в настоящий момент не является настолько же важным фактором, как информация о курении до того момента, как у них пациента был диагностирован рак. Кросс-секционный подход к таким вопросам может рассматриваться как исследование по типу случай-контроль, с чрезмерно большой контрольной группой, (поскольку сравнительно небольшое количество людей в популяции имеют рак легких), содержащий информацию о курении, полученную в неадекватный период времени, и со смещенной оценкой случаев (случаи с коротким течением заболевания с меньшей вероятности попадут в исследование, нежели случаи с длительной продолжительностью). Проблема временного периода, конечно, может быть решена, если мы зададим вопросы не только по поводу курения в настоящем, но и по поводу курения в прошлом.

Хотя нынешняя информация часто является чрезвычайно новой для того, чтобы быть важной с этиологической точки зрения, иногда имеется адекватное оправдание для ее использования. Если существуют причины поверить в то, что нынешнее воздействие достаточно точно соответствует тому, что было в прошлом, и если воспоминания о предыдущих воздействиях, по всей вероятности, будут ненадежными, можно использовать нынешний статус воздействия как суррогатный показатель для воздействия в прошлом. Исследование пищевых предпочтений, например, очень часто базируется на детальной информации на данный момент, поскольку только таким образом, мы можем получить точную информацию по потреблению пищевых продуктов, в то время как воспоминания о том, что человек ел в прошлом,могут быть достаточно расплывчатыми и ненадежными. Исследования, зависящие от нынешнего воздействия, когда важно прошлое воздействие, страдают от более низкой достоверности.

Одномоментные исследования могут включать формирование выборки в соответствии со статусом заболевания. Такие исследования иногда называются превалентными исследованиями по типу случай-контроль, поскольку их отношение к исследованию распространенности аналогично тому, как обычные исследования по типу случай-контоль относятся к когортным исследованиям (Morgenstern и Thomas, 1993).

Пропорциональные исследования смертности.

Пропорциональные исследования смертности включают только умерших. Пропорция умерших пациентов, подвергавшихся воздействию, и оказавшихся в одной из нескольких групп смерти, сравниваются с пропорцией умерших пациентов, не подвергавшихся воздействию. Соответствующее пропорциональное отношение смертности, очень часто сокращаемое как PMR (proportional mortality ratio) – это традиционный показатель эффекта воздействия на причину смерти. Поверхностно сравнение пропорции людей, умерших от определенной причины, для группы подвергавшихся воздействию, и не подвергавшихся воздействию, напоминает когортное исследование, которое измеряет заболеваемость. Однако эта аналогия обманчива, поскольку исследование пропорциональной смертности не включает в себя идентификацию наблюдения за когортами, все пациенты к тому моменту, когда они включаются в исследование, уже мертвы.

Идея, на которой базируется исследование пропорциональной смертности, заключается в том, что если воздействие вызывает (или предотвращает) определенное смертельное заболевание, должно быть пропорционально больше (или меньше) смертей от этого заболевания среди умерших, которые подвергались воздействию, чем среди умерших, которые не подвергались воздействию. Давно признано, что подобная идея страдает от двух значительных недостатков: во-первых, сравнение PMR не может позволить нам отличить насколько воздействие приводит к возникновению смертей в группе воздействия, или предотвращает их в контрольной группе, кроме того, воздействие может являться смесью этих эффектов (McDowall,1983). Например, исследование пропорциональной смертности может обнаруживать пропорциональное увеличение количества смертей от рака в группе, потребляющих большое количество аспирина, по сравнению с теми, кто не использует аспирин. Но эта находка может быть связана с превентивным эффектом аспирина по отношению к смерти от сердечно-сосудистых заболеваний, которая составляет большую часть не неопластических смертей. Подспудное допущение в исследовании пропорциональной смертности заключается в том, что общая смертность для категорий, которые мы не включили в исследование, не связана с воздействием.

Второй основной проблемой при сравнении смертности является то, что они не могут определить степень, с которой воздействие вызывает смерть или ухудшает прогноз заболевания по сравнению с контролем. Например, взаимосвязь использования аспирина со смертностью, может быть либо вследствие эффекта аспирина на возникновение новых случаев инсульта, тяжести инсульта или либо комбинации этих эффектов.

Двойственность при интерпретации PMR является смертельным недостатком этого метода, поскольку этот показатель может предоставить информацию, на основании которой мы можем продолжить изучение причинных взаимоотношений. Во многих случаях нас интересует одна или несколько достаточно узких причин смерти, и может оказаться мало вероятным, что воздействие серьезно влияет на прогноз или на частоту референтых смертей. Тем не менее, большое количество сложностей при интерпретации исследований пропорциональной смертности, может быть облегчено, если мы рассмотрим исследование пропорциональной смертности, как вариант исследования по типу случай-контроль. Для этого необходимо представить себе комбинированную популяцию, состоящую из подвергавшихся и не подвергавшихся воздействию людей, у который возникли данные случаи. Случаи – это те, кто умер в группах, как подвергавшихся воздействию, так и не подвергавшихся воздействию в определенных категориях, контролями являются другие умершие (Miettinen и Wang,1981).

Принцип отбора контрольных серий заключается в том, чтобы выбрать индивидуумов, представляющих исходную популяцию, из которой произошли эти самые случаи для того, чтобы выяснить распределение воздействия в этой самой популяции. Вместо того, чтобы брать выборку контролей напрямую из исходной популяции, мы можем сделать выборку референтных смертей, которые возникают в исходной популяции при условии, что распределение воздействий среди отобранных смертей, аналогичны распределению в исходной популяции, иными словами, что воздействие не связано с контрольной причиной смерти (McLaughlin и соавторы,1985). Если мы будем помнить о цели отбора контролей, становится понятным, что мы не должны отбирать как контроль, все иные случаи смерти, нежели изучаемые случаи смерти. Вместо этого мы можем отобрать в качестве контроля ограниченный набор референтных случаев смерти, которые подбираются не основании предполагаемого отсутствия связи с воздействием. Таким образом, другие причины смерти, для которых отношение с воздействием известно, предполагается (или возможно), будут исключены.

Принцип, который регулирует отбор контрольных причин смерти для включения в исследование, идентичен принципу отбора контролей для исследования по типу случай-контроль: контрольная серия должна быть отобрана вне зависимости от воздействия, с целью оценки пропорции исходной популяции, которая подвергалась воздействию. Смерти от причин, которые не включены как часть контрольных серий, могут быть исключены из исследования, или могут быть изучены как альтернативные случаи.

Отношение к исследованиям с пропорциональной смертностью, как к исследованиям по типу случай-контроль, может усилить их достоверность; оно также предоставляет основу для обычных эпидемиологических показателей эффекта, которые могут быть получены в подобных исследованиях (Wang и Miettinen,1982). Концептуальная ясность, которая является следствием рассмотрения исследований пропорциональной смертности, как исследований случай-контроль, заслуживает того, чтобы мы перестали в лексиконе эпидемиологов использовать термин « исследование пропорциональной смертности», и прекратить использование ошибочных PMR.

Экологические исследования.

Все описанные ранее типы исследований имели одну общую характеристику в том, что наблюдения делались на основании одного пациента. Возможно проводить исследования, в которых единицей наблюдения является группа людей, а не один индивидуум. Такие исследования называются экологическими или суммарными исследованиями. Группами могут являться классы школьников, заводы, города, страны, регионы или нации. Единственным требованием является то, чтобы в изучаемых популяциях имелась информация о воздействии и распределении заболеваний. Заболеваемость и смертность являются наиболее частыми показателями для того, чтобы оценить частоту возникновения заболеваний в группах. Воздействие также измеряется и другими общими индексами. Например, потребление алкоголя в данном регионе может быть оценено по данным об уплате акциза на продажу алкогольных напитков; информация о социально-экономическом статусе может быть доступна из данных переписи населения; данные об окружающей среде (температура, качество воздуха и т.д.) могут быть доступны либо локально, либо регионально.

Поскольку данные в экологических исследованиях – это показатели, которые были усреднены для всех испытуемых, степень связи между воздействием и заболеванием не обязательно отражает связь, имеющуюся на уровне индивидуумов (Morgenstern, 1982; Richardson и соавторы, 1987; Greenland и Robins, 1994). Кроме того, использование суррогатных показателей воздействия (данные по акцизу на алкоголь, а не данные по потреблению) и заболевания (смертность, а не частота новых случаев) еще больше размазывает существующие связи (Brenner и соавторы, 1992b). Кроме того, экологические исследования часто страдают от недоступности данных, которые необходимы для адекватного контроля влияния третьих переменных в анализе (Greenland и Robins,1994). Все эти проблемы вместе приводят к появлению результата, который может иметь сомнительную достоверность. Несмотря на эти проблемы, экологические исследования могут оказаться полезными для обнаружения взаимосвязи между некими воздействиями и частотой заболевания, даже если эта связь находится под воздействием неконтролируемых факторов. Подобная находка может указать на наличие эффектов, которые достойны последующего анализа. Детальное обсуждение экологических исследований представлено в главе 33.

Генерирование гипотез против скрининга гипотез.

Исследования, в которых достоверность меньше, иногда обозначаются как исследования, «генерирующие гипотезы», для того чтобы отличить эти исследования от, так называемых, «аналитических исследований», в которых достоверность оказывается выше. Экологические исследования часто рассматриваются как исследования, генерирующие гипотезы, в результате беспокойства по поводу различных систематических ошибок. Однако различия между генерирующими гипотезы и аналитическими исследованиями не являются концептуально достаточно точными. Это исследователь, а не исследование генерируют гипотезу, и любой тип данных может использоваться для тестирования гипотезы. Например, международные сравнения указывают, что женщины в Японии имеют значительно более низкую частоту рака молочной железы, чем женщины в Соединенных Штатах. Эти данные экологические и можно, как обычно, беспокоиться по поводу большого количества различий, которые существуют между культурами, однако, эти данные подтверждают целое количество гипотез, включая теорию о том, что ранние менархии, диета с высоким содержанием жиров и большие размеры молочных желез (значительно чаще встречающиеся среди американских женщин, чем среди японских женщин) могут оказаться важными факторами развития рака молочной железы (смотри Trichopoulos и Lipman,1992).

Международные различия в частоте рака молочной железы не являются не генерирующими гипотезами, ни аналитическими, поскольку гипотезы возникли независимо от данной информации. Иными словами, различия между генерирующими гипотезы и аналитическими исследованиями – это те различия, которые мы лучше бы заменили более точными определениями.

Предложение, которое мы рассматриваем как более удачное – это рассматривать предварительные исследования с ограниченной достоверностью или точностью, как исследования, скринирующие гипотезы, по аналогии со скринингом индивидуумов на выявление заболеваний. Подобные исследования представляют собой относительно простой и недорогой тест на наличие взаимосвязи между воздействием и заболеванием. Если подобная взаимосвязь обнаруживается, то мы можем использовать более серьезный, и более дорогой тест, с применением более достоверных дизайнов исследования. Хотя скрининговая аналогия и не должна быть принята в своем крайнем выражении, она лучше описывает характеристики исследования, чем различия между генерирующими гипотезы и аналитическими исследованиями.