Метаанализ исследований по йоду и его связи
с умственным развитием
Nico Bleichrodt, Marise Ph. Born
Свободный Университет Амстердама, Нидерланды
На русском языке статья впервые опубликована в 1999 году в сборнике "Преодоление последствий дефицита йода: зарубежный опыт" при поддержке детского фонда ООН (ЮНИСЕФ) под редакцией Г.А. Герасимова
Публикуется с разрешения издателя
Одним из проявлений эндемического кретинизма является тяжелая и необратимая умственная отсталость. Хотя процент пораженных кретинизмом лиц в йоддефицитных регионах колеблется, в некоторых областях он может достигать целых 10%. Важный вопрос заключается в следующем: страдает ли умственной отсталостью (выраженной, вероятно, в меньшей степени) и та часть населения йоддефицитных областей, которая лишена признаков кретинизма, т.е. так называемая здоровая группа? За последние 25 лет многие исследователи пытались найти ответ на этот вопрос. Выводы проведенных исследований оказались достаточно противоречивыми. Одни авторы не обнаруживали корреляции (или находили лишь слабую корреляцию) между наличием и отсутствием дефицита йода, с одной стороны, и показателями умственного развития, с другой, тогда как по другим данным между этими параметрами имеется сильная связь.
Поскольку объем таких работ, особенно в отношении числа обследованных лиц, часто оказывается небольшим, целесообразно объединить их результаты. Традиционный способ объединения результатов многих исследований сводится к чисто описательной их интеграции. Однако описательный вывод считается "субъективным", "научно необоснованным" и "не позволяющим извлечь надежную информацию" [1].
Самый простой способ каким-то образом количественно выразить объединенный результат нескольких исследований заключается в "подсчете голосов". Выводы разных работ делят на три группы: свидетельствующие о существенных положительных эффектах, свидетельствующие о существенных отрицательных эффектах и свидетельствующие об отсутствии существенных эффектов [2]. За "истину" принимается тот вывод, который содержится в большинстве проанализированных работ. Хотя простота такого подхода делает его довольно привлекательным, он вряд ли может служить надежным методом интеграции результатов разных исследований [1, 3, 4]. Один из его недостатков определяется тем, что статистическая значимость сильно зависит от размеров выборки. Данные, свидетельствующие о слабом эффекте, могут иметь высокую степень статистической достоверности, если получены при обследовании крупной выборки. Поэтому, если, например, в 20 работах наблюдались статистически значимые эффекты, мы все еще не можем быть уверены в том, что эти эффекты достаточно велики, чтобы иметь реальное значение.
Относительно недавно был предложен гораздо более надежный метод объединения результатов многих исследований - метаанализ. Метаанализ представляет собой "количественный синтез большого числа статистических результатов отдельных исследований по определенному вопросу" [5]. Этот метод исходит из того, что систематическая интеграция результатов уже выполненных исследований может дать для окончательного вывода гораздо больше, чем проведение еще одной, более или менее ограниченной по объему работы на ту же тему. Существующие методики метаанализа позволяют избежать недостатков, присущих описанным выше подходам к интеграции результатов разных исследований - традиционному описательному и способу "подсчета голосов".
Метаанализ состоит, как правило, из двух частей:
Объединение выводов различных исследований с целью получения общей оценки изучаемого эффекта. Проще говоря, такая общая оценка представляет собой среднюю взвешенную величину (размер) эффекта, наблюдавшегося в разных исследованиях, с учетом объема выборки в каждом из них. Например, если анализируется 10 работ, и во всех наблюдалась корреляция между потреблением соли и артериальным давлением, то именно метаанализ позволяет рассчитать среднюю взвешенную корреляцию между этими параметрами. Средняя корреляция является наилучшей оценкой степени (или силы) влияния потребления соли на артериальное давление в популяции и носит название "размера популяционного эффекта".
Сравнение степени "разброса" результатов отдельных исследований. Например, сила связи между потреблением соли и артериальным давлением, найденная в разных исследованиях, может существенно различаться. В таком случае мы могли бы сделать вывод о гетерогенности обследуемых популяций. Небольшие расхождения в результатах указывают на гомогенность данной группы исследований в отношении исследуемой популяции.
В метаанализе чаще всего используются два показателя: коэффициент корреляции Пирсона (product-moment correlation coefficient) и d-критерий Козна [6]. Последний, представляет собой стандартизованную разницу средних значений одной и той же переменной в двух группах. Оба показателя оценивают размер или силу эффекта.
Результаты отдельных работ часто представлены в разной форме. В одних, например, используется t-критерий, в других - критерий "хи-квадрат", в третьих - средняя величина и ее стандартное отклонение. Метаанализ с помощью трансформирующих формул превращает все эти разные показатели в коэффициент корреляции или d-критерий. Гетерогенность результатов оценивается с помощью нескольких статистических показателей, наиболее важным из которых является показатель, предложенный Stoffelmayr, DiSlavou и Hunter [7].
Метаанализ включает ряд этапов: формулирование проблемы исследования, сбор и отбор исследований, кодирование особенностей исследований, статистическую обработку результатов, интерпретацию данных и, наконец, выводы.
Существует ли связь между присутствием или отсутствием дефицита йода у детей и взрослых и их умственным развитием, и, если так, то насколько сильна эта связь?
Данный метаанализ включает исследования, посвященные влиянию йодной недостаточности на умственное развитие. Это означает, что для анализа отобраны работы, в которых население йоддефицитных регионов сравнивалось с населением обеспеченных йодом областей, а также те, в которых описывается влияние введения йода на умственное развитие (йодная профилактика против плацебо).
Поскольку литература, посвященная йоду и умственному развитию, весьма ограничена, подобрать соответствующие исследования не составляло труда. Всего оказалась 21 работа, подходящая для метаанализа. Пригодные для метаанализа данные были обнаружены в международных журналах, трудах симпозиумов, монографиях, информационных бюллетенях по ЙДЗ и тезисах.
Исследования, содержащие сведения об общей познавательной функции у детей и взрослых, проживающих в йоддефицитных районах, включались в метаанализ в том случае, если в них приводились необходимые для такого анализа статистические данные (например, средние величины со стандартными отклонениями или показатели значимости различий и размеры выборки). Иногда, например, одна и та же группа обследовалась с помощью разных тестов. В таких случаях в анализ включались только выводы одного исследования. Однако метаанализу подвергались все работы, которые были выполнены даже в одном и том же регионе, но с использованием разных тестов на интеллектуальность для разных возрастных групп, что удовлетворяло условию независимости данных.
Для интеграции результатов отдельных исследований прежде всего требовалось превратить разные статистические показатели (t, F, r и т.д.) в один общий. В качестве последнего, был выбран коэффициент корреляции.
Некоторые особенности работ, включенных в метаанализ, перечислены в таблице 1. Обследовались представители совершенно разных культур. Интеллектуальные способности часто оценивались с помощью "западных" тестов, хотя в ряде случаев они были адаптированы к условиям местной культуры. Интересно отметить, что в некоторых исследованиях применялись тесты со значительным вербальным компонентом, который очень чувствителен к влияниям окружающих условий и культурной среды.
Всего в 21 работе было обследовано 2676 человек, причем количество обследованных колебалось от 20 в работе № 2 до 499 в работе № 4. Для каждой работы указано общее число обследованных как в основной, так и в контрольной группе. Возраст обследованных колебался от 2 месяцев до 45 лет. Однако почти во всех работах обследовались дети не старше 15 лет.
Как видно из правого столбца таблицы 1, степень всех эффектов, выраженная в виде коэффициента корреляции, рассчитанного для каждой работы, была "положительной", т.е. средний показатель умственного развития в группах, не испытывающих дефицита йода, был выше, чем в "йоддефицитных" группах. Четырнадцать из этих корреляций были значимыми (р £ 0,01). В таблице 2 корреляции представлены в виде "stem and leaf" [8]. После трансформации размера каждого эффекта в z-критерий Фишера была произведена оценка общего размера эффекта по методу Шмидта-Хантера [9]. Этот метод придает разным исследованиям разный вес, исходя из объема исследованной выборки. Работам, проведенным на большем числе испытуемых, придается больший вес, поскольку выводы из этих более обширных исследований значительно надежнее, чем выводы из работ с меньшим числом обследованных. Взвешенный размер по популяционного эффекта, рассчитанный как коэффициент корреляции, оказался равным 0,34 (при р = 0,00001). 95%-ный доверительный интервал этого размера популяционного эффекта составляет 0,31 -0,38. Наглядное изображение размеров эффекта и доверительных интервалов приведено на рисунке. 1.
Таблица 1. Характеристика исследований, включенных в метаанализ (* - возраст в месяцах)
Страна
n
Возраст (годы)
Тест на ннтеллектуальность
r
Индонезия
102
13-20
Test Intelligensy Kollektip Indonesia
0.57
Новая Гвинея
20
10-12
Pacific Design Construction Test
0.56
Испания
97
2,5-5
McCarthy Scales of Children's Abilities
0.53
Китай
499
7-14
Combined Raven's Test for Rural China
0.51
Эквадор
32
3-5
Stanford-Binet Intelligence Scale
0.50
Эквадор
46
6-10
Goodenough Draw-A-Man Test
0.48
Эквадор
67
3,5-5,5
Stanford-Binet Intelligence Scale
0,48
Испания
184
6-12
Cattell Culture Fair Intelligence
0.45
Эквадор
124
3,5-5,5
Stanford-Binet Intelligence Scale
0.37
Индонезия
143
6-12
Test Intelligent Anak
0.36
Испания
74
2-30*
Bayley Scale of Infant Development
0.36
Китай
192
7-14
0.28
Китай
99
25-45
0.28
Индонезия
163
5-20
Raven Coloured Progressive Matrices
0,28
Заир
138
4-23*
Brunet-Lezine Scale
0,26
Эквадор
50
6-10
Goodenough Draw-A-Man Test
0,24
Чили
90
6-12
Wechler Intelligence Scale for Children. Revised
0.20
Китай
94
0-7
0,18
Эквадор
108
12-15
Wechler Intelligence Scale for Children
0,12
Эквадор
154
8-12
Stanford-Binet Intelligence Scale
0,08
Боливия
200
5,5-12
Stanford-Binet Intelligence Scale
0.04
Таблица 2.
Размеры эффектов, наблюдаемых в 21 исследовании, в форме "Stem-and-leaf"
0
0
+0,1
4
8
+0,2
2
8
+0,3
0
4
6
8
8
8
+0,4
6
6
7
+0,5
5
8
8
+0,6
0
1
3
6
7
+0,7
Рис. 1.
Наглядное изображение размеров и доверительных интервалов эффекта, зарегистрированного в 21 исследовании общего умственного развития, а также (взвешенного) размера популяционного эффекта - rho (за исключением работ 19, 20 и 21).
При интерпретации размера популяционного эффекта важно учитывать степень гомогенности отдельных данных. Для определения гомогенности исследований мы применили показатель Stoffelmayr и др. [7]. Этот показатель рассчитывается следующим образом: разброс, обусловленный ошибками выборки, вычитается из общего разброса группы коэффициентов корреляции. Если остаток (остаточное стандартное отклонение) не превышает четверти размера популяционного эффекта, то данную группу исследований можно считать гомогенной. В нашем случае остаточное стандартное отклонение составляло 0,14. Это больше четверти размера популяционного эффекта (0,25 х 0,344 = 0,086). Таким образом, анализируемая группа исследований оказалась гетерогенной. Иными словами, все эти исследования были проведены не на однородной популяции.
Более тщательный анализ отдельных работ позволил установить, что структура трех из них, в которых размеры эффекта были наименьшими, отличалась от структуры остальных одним важным обстоятельством. Данные в этих трех работах были получены при обследовании отобранной группы, состоящей исключительно из школьников, но ничего не сообщалось о тех, кого не включили в обследуемую группу. Это явилось достаточной причиной для переоценки гомогенности работ с исключением из анализа указанных трех исследований.
Оставшиеся 18 работ оказались гомогенными, что позволяет считать обследованные в них группы населения однородными (остаточное SD = 0,097, т.е. меньше четверти размера популяционного эффекта, равной 0,25 х 0,40). Взвешенный размер популяционного эффекта, вычисленный по данным оставшихся 18 работ, составил 0,40 (р = 0,00001) при доверительном интервале 0,36 - 0,43.
Хотя выводы многих работ свидетельствуют об отрицательном влиянии йодной недостаточности на умственное развитие детей и взрослых, проживающих в регионах с тяжелым дефицитом йода, в других исследованиях этот эффект проявлялся менее отчетливо. Самым важным недостатком такого рода работ часто является малое число лиц, на результатах обследования которых основываются выводы. Эти мелкие исследования редко "дают достаточно определенные ответы, которые могли бы лечь в основу практических мероприятий" [10]. Однако метаанализ позволяет надежно интегрировать выводы нескольких мелких исследований и тем самым дать взвешенную общую оценку в единицах размера популяционного эффекта.
Нам удалось найти всего 21 работу, содержащую необходимые для метаанализа статистические данные. Три из этих работ были исключены из дальнейшего рассмотрения в связи с тем, что состав обследованных в них групп существенно отличался от остальных (обследовались только школьники). Остальные 18 работ сформировали гомогенную группу. Размеры эффекта, наблюдавшегося в отдельных исследованиях, колебались от 0,12 до 0,57. Размер популяционного эффекта, выраженный в виде взвешенного среднего г, оказался равным 0,40 при 95%-ном доверительном интервале 0,36-0,43. Данные всех, а также выбранной группы исследований суммированы в таблице 3.
Таблица З. Статистические показатели, использованные при метаанализе эффектов йодной недостаточности
Показатели
Общая группа
Выбранная группа
Количество работ
21
18
Число обследованных
2676
2214
Размер популяционного эффекта (взвешенный средний r)
0,34
0,40
Значимость (р)
0,00001
0,00001
Средняя стандартная разница (g)
0.78
0,90
95%-ный доверительный интервал
0,31-0,38
0,36 - 0,43
Проверка гомогенности
гетерогенна
Гомогенна
Значение вывода из метаанализа можно яснее себе представить, оценив d-критерий, который представляет собой разницу между двумя группами средних величин, разделенную на стандартное отклонение. Согласно Cohen [9], d-критерии, равные 0,2, 0,5 и 0,8, отражают соответственно малый, средний и большой размер эффекта. При метаанализе влияния йодной недостаточности на умственное развитие d-критерий для большого размера эффекта составил 0,90. Конкретно это означает, что различия между средними показателями для двух обследованных групп - испытывающей и не испытывающей дефицита йода - равны 0,9 SD, или 13,5 пунктов IQ. Иными словами, показатель IQ у типичного ребенка из группы без йодного дефицита оказывается выше, чем у 82% детей из группы с йодным дефицитом. Если показатели тестов в обеих группах подчиняются нормальному распределению, то выводы метаанализа можно представить и графически - в виде перекрывающихся распределений (см. рис.2).
Рис. 2.
Средний размер эффекта в единицах стандартного отклонения (50 и 82 - перцентили распределения показателя в группе без йодного дефицита). 1) основная группа; 2) контроль.
Неясно, однако, подчиняются ли показатели в йоддефицитной группе нормальному распределению. Этот вопрос уже поднимался DeLong [11], который писал: "... либо низкие средние показатели в йоддефицитной группе определяются небольшим числом детей с "субкретинизмом", либо йодная недостаточность сдвигает все распределение умственных способностей в популяции в сторону меньших значений". Ответ на этот вопрос требует дальнейших исследований.
К сожалению, неизвестно, сколько работ выпало из метаанализа. Во-первых, мы могли найти не все работы, так как в Нидерландах нет некоторых журналов и книг. Во-вторых, в ряде публикаций отсутствуют необходимые для метаанализа статистические данные. В-третьих, могут существовать и неопубликованные исследования или сообщения во внутренних изданиях или местных журналах. В последующем метаанализ следует проводить с использованием данных возможно большего количества работ. Кроме того, помимо исследования общего интеллектуального уровня, нужно было бы проанализировать разницу в более специфических аспектах умственного развития, таких как память, ориентация в пространстве, понимание и т.д. Следовало бы также изучить возможные половые различия.
Многие работы посвящены влиянию йодной недостаточности на двигательные и психомоторные навыки. Метаанализ результатов таких исследований должен дать более надежные сведения, касающиеся в основном возможных последствий для отдельных сторон двигательной деятельности.
Остро необходимы исследования, посвященные влиянию йодной недостаточности на познавательную, двигательную и психомоторную функции, из которых можно было бы извлечь данные для проведения более полного метаанализа. Такими данными являются:
число обследованных лиц в каждой половой и возрастной подгруппе, средний возраст обследованных и его колебания, использованный тест (или тесты), взаимозависимость или независимость полученных результатов;
средние показатели и их стандартные отклонения для разных полов и всей группы в целом или точные значения статистических показателей (Т, F, с2 и т.п.) с указанием направления эффекта, а также одно- или двузначности теста. При использовании нескольких тестов важны результаты каждого из них;
по возможности: рост, масса тела, распространенность или частота зоба, его размеры, содержание Т4 и ТТГ в сыворотке и расчетный уровень потребления йода.
Метаанализ позволяет объединять выводы нескольких (небольших) исследований, посвященных нейромоторной и познавательной функциям.
В данном метаанализе удалось использовать результаты всего 18 уже проведенных исследований по влиянию йодной недостаточности.
d-Критерий при большом размере эффекта был найден равным 0,90. Это означает, что средние показатели для йоддефицитной и контрольной групп разнились на 0,9 SD или 13,5 пунктов IQ.
Light, RJ.; Pillemer, D.B. Summing up. The science of reviewing research. Harvard University Press, Cambridge; 1984.
Ma, Т.; Wang, D,; Cheng, Z.P.; Wang, Y.Y. Neuro intellectual impairment in Non-cretin individuals in IDD. Unpublished report; 1986.
Hyde, J.S. Introduction: meta-analysis and the psychology of gender. In: Hyde, J.S.; Linn, M.C., Eds. The psychology of gender: Advances through metaanalysis. Johns Hopkins, Baltimore, MD; 1986.
Bautista, A.; Barker, P.A.; Dunn, J.T.; Sanchez, M.; Kaiser, D.L. The effects of oral iodized oil on intelligence, thyroid status, and somatic growth in school-age children from an area of endemic goiter. Am. J. Clin. Nutr. 35:127;1982.
Bleichrodt, N. Iodine deficiency disorders in Indonesia and Spain. In Keats, D.M.; Munro, D.; Mann, L. Eds. Heterogeneity in cross-cultural psychology. Swets & Zeitlinger B-V., Amsterdam; 1990.
Bleichrodt, N.; Drenth, PJ.D.; Querido, A. (1980). Effects of iodine deficiency on mental and psychomotor abilities. Am. J. Phys. Anthrop. 53:55; 1980.
Bleichrodt, N.; Escobar del Rey, P.; Morreale de Escobar, G.; Garcia, I.; Rubio, C. Iodine deficiency, implications for mental and psychomotor development in children. In DeLong, G.R.; Robbins, J.; Condliffe, P.G. Eds. Iodine and the brain. Plenum Press, New York; 1989.
Bleichrodt, N,; Garcia, I.; Rubio, C.; Morreale de Escobar, G.; Escobar del Rey, F. Developmental disorders associated with severe iodine deficienсу. In Hetzel, B.S.; Dunn, J.T.; Stanbury, J.B. Eds. The prevention and control of iodine deficiency disorders. Elsevier Science Publishers, New York; 1987:65.
Collins, J.K.; Boyages, S-C.; Maberly, G.F.; Eastman.'C.J.; Derun, Liu; Qidong, Qian; Peiying, Zhang; Chequi, Qu. The effects of iodized oil and iodized salt prophylaxis on cognitive functioning in iodine deficient endemi-as in China. International Conference on Iodine and the Brain, Bethesda. MD; 1988.
Djokomoeljanto, R.R.J. The effect of severe iodine deficiency: A study on a population in Central Java, Indonesia. Thesis. Indonesia, Semarang; 1974. Dodge, P.R.; Palkes, H.; Fierro-Benitez, R.; Ramirez, I. Effect on intelligence of iodine in oil administered to young Andean children. A preliminary report. In Stanbury, J.B.; Kroc, R.L. Eds. Endemic goiter. РАНО Scientific Publication 193:378; 1969.
Fierro-Benitez, R. Iodized oil and mental development. In Medeiros-Neto, G.; Maciel. R.M.B.; Halpern, A. Eds- Iodine deficiency disorders and congenital hypothyroidism. Ache, Sao Paulo; 1986:120-126.
Fierro-Benitez, R.; Ramirez, I.; Suarez, J. Effect of iodine correction early in fetal life on intelligence quotient. A preliminary report. In Stanbury, J.B.; R.L. Kroc, R.L. Eds. Human development and the thyroid gland. Relation to endemic cretinism. Plenum Press, New York; 1972:239.
Fierro-Benitez, R.; Cazar, R.; Stanbury, J.B.; et al. Effects on schoolchildren of prophylaxis of mothers with iodized oil in an area of iodine deficiency. J. Endocrinol. Invest. 11:327; 1988.
Greene, L.S. (1973). Physical growth and development, neurological maturation and behavioral functioning in two Ecuadorian Andean communities in which goiter is endemic. Am. J. Phys. Anthrop. 38: 119-134; 1973.
Hetzel, B.S. The prevention and control of iodine deficiency disorders. United Nations: Nutrition policy discussion paper no. 3; 1988.
Fa-Fu, Lin; Aihaiti; Hong-Xin, Zhao; Jin, Lin; Ji-Youg, Jiang; Maimaiti; Aiken. The relationship of a low-iodine and high-fluoride environment to subclinical critinism in Xinjiang. IDD-Newsletter; 7:3; 1991.
Muzzo, S.; Leiva, L.; Carrasco, D. Influence of a moderate iodine deficiency upon intellectual coefficients ofschoolage children. In Medeiros-Neto, G.; Maciel, R.N.B.; A. Halpern, A. Eds. Iodine deficiency disorders and congenital hypothyroidism. Ache, Sao Paulo; 1986:40-45.
Pharoah, P.O.D.; Connolly, K.J.; Ekins, R.P; Harding, A.G. Maternal thyroid hormone levels in pregnancy and the subsequent cognitive and motor performance of the children. Clin. Endocrinol., 21: 265; 1984.
Querido, A. Endemic cretinism-a continuous personal educational experience during 10 years. Postgrad. Med. J. 51:591-599; 1975.
Thilly, C.H. Psychomotor development in regions with endemic goiter. In Hetzel, B.S.; Smith, R.M. Eds. Fetal brain disorders-recent approaches to the problem of mental deficiency. Elsevier/North-HoUand Biomedical Press, Amsterdam; 1981:265.
Trowbridge, F.L. (1972). Intellectual assessment in primitive societies, with a preliminary report of a study of the effects of early iodine supplementation on intelligence. In Stanbury, J.B.; Kroc, R.L. Eds. Human development and the thyroid gland. Relation to endemic cretinism. Plenum, New York; 1972: 137-149.