Нелинейная модель смешанных эффектов - Nonlinear mixed-effects model

Нелинейные модели смешанных эффектов составляют класс статистические модели обобщающий линейные модели смешанных эффектов. Подобно линейным моделям со смешанными эффектами, они особенно полезны в условиях, когда в одном статистические единицы или когда есть зависимости между измерениями связанных статистических единиц. Нелинейные модели смешанных эффектов применяются во многих областях, включая лекарство, здравоохранение, фармакология, и экология.[1][2]

Определение

Хотя любой статистическая модель содержащий оба фиксированные эффекты и случайные эффекты является примером нелинейной модели со смешанными эффектами, наиболее часто используемые модели являются членами класса нелинейных моделей со смешанными эффектами для повторяющихся измерений.[1]

куда

  • количество групп / предметов,
  • это количество наблюдений для -я группа / предмет,
  • является действительной дифференцируемой функцией вектора параметров группы и ковариантный вектор ,
  • моделируется как линейная модель смешанных эффектов куда - вектор фиксированных эффектов и - вектор случайных эффектов, связанных с группой , и
  • - случайная величина, описывающая аддитивный шум.

Оценка

Когда модель нелинейна только при фиксированных эффектах, а случайные эффекты являются гауссовыми, оценка максимального правдоподобия можно сделать, используя нелинейный метод наименьших квадратов методы, хотя асимптотические свойства оценщиков и статистика тестов может отличаться от обычного общая линейная модель. В более общих условиях существует несколько методов выполнения оценка максимального правдоподобия или же максимальная апостериорная оценка в определенных классах нелинейных моделей со смешанными эффектами - обычно в предположении нормально распределенных случайных величин. Популярным подходом является алгоритм Линдстрома-Бейтса.[3] который основан на итеративной оптимизации нелинейной задачи, локальной линеаризации модели вокруг этого оптимума и последующем использовании традиционных методов из линейных моделей со смешанными эффектами для выполнения оценки максимального правдоподобия. Стохастическая аппроксимация алгоритм максимизации ожидания дает альтернативный подход для выполнения оценки максимального правдоподобия.[4]

Приложения

Пример: моделирование прогрессирования заболевания

Для моделирования прогрессирования заболевания использовались нелинейные модели со смешанными эффектами.[5] В прогрессирующая болезнь, временные паттерны прогрессирования исходных переменных могут иметь нелинейную временную форму, аналогичную у разных пациентов. Однако стадия заболевания человека может быть неизвестна или известна лишь частично из того, что можно измерить. Следовательно, скрытый В модель можно включить временную переменную, описывающую индивидуальную стадию заболевания (то есть, когда пациент находится вдоль нелинейной кривой среднего).

Пример: моделирование снижения когнитивных функций при болезни Альцгеймера.

Пример моделирования прогрессирования заболевания по продольным баллам ADAS-Cog с использованием программы progmod р упаковка.[5]

Болезнь Альцгеймера характеризуется прогрессирующим когнитивным ухудшением. Однако пациенты могут сильно различаться по когнитивным способностям и бронировать, так когнитивное тестирование в один момент времени часто может использоваться только для грубой группировки людей в разные стадии болезни. Теперь предположим, что у нас есть набор продольных когнитивных данных. из индивидуумы, каждый из которых классифицируется как обладающий нормальным познанием (CN), легкие когнитивные нарушения (MCI) или слабоумие (DEM) во время базового визита (время соответствующий измерению ). Эти продольные траектории можно смоделировать с помощью нелинейной модели смешанных эффектов, которая учитывает различия в состоянии болезни на основе исходной категоризации:

куда

  • - это функция, которая моделирует средний временной профиль когнитивного снижения, форма которого определяется параметрами ,
  • представляет время наблюдения (например, время с момента начала исследования),
  • и фиктивные переменные, которые равны 1, если индивидуальные имеет MCI или деменцию на исходном уровне и 0 в противном случае,
  • и - это параметры, моделирующие разницу в прогрессировании заболевания в группах MCI и деменции по сравнению с когнитивно нормальными,
  • разница в стадии заболевания у отдельных относительно его / ее базовой категории, и
  • - случайная величина, описывающая аддитивный шум.

Пример такой модели с экспоненциальный Функция среднего подходит для продольных измерений Шкала оценки болезни Альцгеймера - когнитивная подшкала (ADAS-Cog) показано в коробке. Как показано, включение фиксированных эффектов исходной категоризации (MCI или деменция по отношению к нормальному познанию) и случайное влияние отдельных непрерывных стадий заболевания выравнивает траектории когнитивного ухудшения, чтобы выявить общую картину когнитивного ухудшения.

Пример: анализ роста

Оценка кривой среднего роста мальчиков из исследования роста в Беркли с деформацией и без нее. Модель деформации подобрана как нелинейная модель со смешанными эффектами с использованием pavpop р упаковка.[6]

Явления роста часто следуют нелинейным схемам (например, логистический рост, экспоненциальный рост, и гиперболический рост ). Такие факторы, как дефицит питательных веществ[необходимо разрешение неоднозначности ] могут не только напрямую влиять на измеряемый результат (например, организмы с недостатком питательных веществ в конечном итоге становятся меньше), но, возможно, также и на время (например, организмы с недостатком питательных веществ растут медленнее). Если модель не учитывает различия во времени, расчетные кривые на уровне популяции могут сгладить более мелкие детали из-за отсутствия синхронизация между организмами. Нелинейные модели со смешанными эффектами позволяют одновременно моделировать индивидуальные различия в результатах и ​​сроках роста.

Пример: моделирование роста человека

Модели для оценки средних кривых роста и веса человека как функции возраста и естественного отклонения от среднего значения используются для создания графики роста. Однако рост детей может быть рассинхронизирован как из-за генетических факторов, так и из-за факторов окружающей среды. Например, возраст начала полового созревания и связанные с ним скачок высоты может варьироваться несколько лет между подростками. Следовательно, поперечные исследования может недооценивать величину скачка пубертатного роста, потому что возраст не синхронизируется с биологическим развитием. Различия в биологическом развитии можно моделировать с помощью случайных эффектов. которые описывают сопоставление наблюдаемого возраста с скрытый биологический возраст с использованием так называемого функция деформации . Простая нелинейная модель смешанных эффектов с такой структурой дается формулой

куда

  • представляет собой функцию, которая представляет рост обычного ребенка в зависимости от возраста. Его форма определяется параметрами ,
  • это возраст ребенка соответствует измерению высоты ,
  • - это функция деформации, которая сопоставляет возраст с биологическим развитием для синхронизации. Его форма определяется случайными эффектами boldsymbol {w} _i,
  • - случайная величина, описывающая аддитивную вариацию (например, постоянные различия в росте детей и шум измерения).

Существует несколько методов и программных пакетов для подгонки таких моделей. Так называемой SITAR модель[7] могут соответствовать таким моделям, используя функции деформации, которые аффинные преобразования времени (то есть аддитивные сдвиги в биологическом возрасте и различия в скорости созревания), в то время как так называемые pavpop модель[6] может соответствовать моделям с плавно меняющийся функции деформации. Пример последнего показан в рамке.

Пример: популяционное фармакокинетическое / фармакодинамическое моделирование

Основные фармакокинетические процессы, влияющие на судьбу употребляемых веществ. Нелинейное моделирование смешанных эффектов можно использовать для оценки воздействия этих процессов на популяционном уровне, а также для моделирования индивидуальных вариаций между субъектами.

Модели ПК / ПД для описания отношения "воздействие-реакция" такой как Модель Emax могут быть сформулированы как нелинейные модели смешанных эффектов.[8] Подход смешанной модели позволяет моделировать как популяционный уровень, так и индивидуальные различия в эффектах, которые имеют нелинейное влияние на наблюдаемые результаты, например скорость, с которой соединение метаболизируется или распределяется в организме.

Пример: эпидемиологическое моделирование COVID-19

Экстраполированные траектории распространения инфекции в 40 странах, серьезно пострадавших от COVID-19, и средний (численный) средний показатель до 14 мая

Платформа нелинейных моделей со смешанным эффектом может использоваться для описания траекторий заражения субъектов и понимания некоторых общих черт, общих для субъектов. В эпидемиологических проблемах субъектами могут быть страны, штаты или округа и т. Д. Это может быть особенно полезно для оценки будущей тенденции эпидемии на ранней стадии пендемии, когда о болезни известно почти мало информации.

Байесовская иерархическая модель Ричардса [9] представляет собой байесовскую версию нелинейной модели смешанных эффектов. Первый этап модели описывает COVID-19 траектории заражения из отдельных стран через обобщенная логистическая функция (Кривая роста Ричардса), а второй этап модели включает ковариативный анализ для поиска возможных факторов риска вспышки COVID-19.

Смотрите также


Рекомендации

  1. ^ а б Пинейро, Дж; Бейтс, Д.М. (2006). Модели со смешанными эффектами в S и S-PLUS. Статистика и вычисления. Нью-Йорк: Springer Science & Business Media. Дои:10.1007 / b98882. ISBN  0-387-98957-9.
  2. ^ Болкер, БМ (2008). Экологические модели и данные в R. Университет Макмастера: математика и статистика. Издательство Принстонского университета.
  3. ^ Линдстрем, MJ; Бейтс, Д.М. (1990). «Нелинейные модели смешанных эффектов для данных повторных измерений». Биометрия. 46 (3): 673–687. Дои:10.2307/2532087. JSTOR  2532087. PMID  2242409.
  4. ^ Kuhn, E; Лавьель, М. (2005). «Оценка максимального правдоподобия в нелинейных моделях смешанных эффектов». Вычислительная статистика и анализ данных. 49 (4): 1020–1038. Дои:10.1016 / j.csda.2004.07.002.
  5. ^ а б Ракет, LL (2020). «Статистическое моделирование прогрессирования болезни Альцгеймера». Границы больших данных. 3. Дои:10.3389 / fdata.2020.00024. S2CID  221105601.
  6. ^ а б Ракет Л.Л., Соммер С., Маркуссен Б. (2014). «Нелинейная модель смешанных эффектов для одновременного сглаживания и регистрации функциональных данных». Письма с распознаванием образов. 38: 1–7. Дои:10.1016 / j.patrec.2013.10.018.
  7. ^ Коул TJ, Дональдсон MD, Бен-Шломо Y (2010). «SITAR - полезный инструмент для анализа кривой роста». Международный журнал эпидемиологии. 39 (6): 1558–66. Дои:10.1093 / ije / dyq115. ЧВК  2992626. PMID  20647267. S2CID  17816715.
  8. ^ Йонссон, EN; Карлссон, Миссури; Уэйд, младший (2000). «Обнаружение нелинейности: преимущества нелинейного моделирования смешанных эффектов». AAPS PharmSci. 2 (3): E32. Дои:10.1208 / пс020332. ЧВК  2761142. PMID  11741248.
  9. ^ Ли, Се Юн; Лей, Боуэн; Маллик, Бани (2020). «Оценка кривых распространения COVID-19 с учетом глобальных данных и информации о заимствованиях». PLOS ONE. Дои:10.1371 / journal.pone.0236860.