Новости

28 апреля 2026 Новости

Событийная модель в RWE: почему реальная клиническая практика требует другой архитектуры данных

В большинстве проектов, которые проводятся на платформе MainEDC™, всё устроено предсказуемо: есть готовый протокол, и от команды ожидают аккуратной реализации без лишней философии, а то и вообще умение не задавать вопросы, а только реализация. Это нормальная и важная роль. В индустрии с высокой ценой ошибки надёжный исполнитель нужен не меньше, чем сильная идея.

Но настоящий прогресс начинается в другом сценарии - когда спонсор или коллеги из КИО приходят не только с вопросом "как это настроить", а с вопросом "а точно ли это лучше собирать именно так?". В этот момент включается уже не просто реализация, а наша внутренняя экспертиза: инженерная, клиническая, дата-менеджерская и методологическая. Мы начинаем смотреть глубже - где структура искусственна, где формы перегружают процесс, где события теряются, а где будущие сложности уже зашиты в дизайн.

Именно здесь рождаются более зрелые решения. Не потому что кто-то хочет усложнить проект, а наоборот - потому что опыт позволяет заранее увидеть, как сделать его проще, чище и устойчивее. Меньше лишних форм, меньше ручной работы, меньше формального шума. Больше логики, больше управляемости, больше данных, которые действительно отражают реальную практику. Именно в таких проектах наша команда перестаёт быть просто исполнителем и становится полноценным партнёром, с которым рождаются лучшие практики.

Наше преимущество здесь не в том, что мы "знаем как правильно". В такой сложной области, как RWE, никто не имеет монополии на истину. Наше преимущество - в насмотренности. В том, что мы видели сотни сценариев: как запускают простые регистры и потом вынужденно их усложняют, как перегруженные CRF ломают мотивацию врачей, как мониторинг тонет в формальных проверках, как хорошие идеи в протоколе теряются из-за плохой архитектуры данных.

От протокольного мира к миру реальных событий

В классических клинических исследованиях сама структура данных заранее подчинена протоколу. Есть визит 1, визит 2, визит 3. Есть форма демографии, форма нежелательных явлений, форма сопутствующей терапии. Есть логика, в которой исследование как будто заранее знает, когда и в каком виде жизнь пациента "случится". Такой подход исторически оправдан: интервенционное исследование должно быть максимально стандартизированным, а значит, и архитектура данных строится вокруг предусмотренных точек сбора информации. Современный GCP-подход по-прежнему требует, чтобы исследование генерировало надежные результаты, а системы и процессы были fit for purpose, то есть пригодны для своей конкретной задачи. При этом сам ICH E6(R3) уже прямо делает акцент на quality by design, risk-based thinking, operational feasibility и использовании технологий, встроенных в существующую инфаструктуру здравоохранения. Иначе говоря, регуляторная логика сама подталкивает отрасль к более гибким моделям, если они лучше соответствуют природе данных и цели исследования.

RWE живет по другой физике. Здесь пациент не приходит "на визит 4 по протоколу", а обращается тогда, когда у него обострение, когда изменилась терапия, когда пришел лабораторный результат, когда врач скорректировал лечение, когда случилась госпитализация, когда пациент сам заполнил электронный дневник (ePRO), когда данные пришли из регистра, лабораторной системы или электронной медицинской карты. FDA определяет real-world data как данные о состоянии здоровья пациента и/или оказании медицинской помощи, которые рутинно собираются из различных источников, а EMA прямо указывает на электронные медицинские записи, регистры и иные реальные источники медицинской информации как основу real-world evidence. В этом мире искусственная упаковка всего в заранее заданные визиты начинает не помогать, а мешать. (U.S. Food and Drug Administration)

И вот здесь возникает главный разворот мышления. В RWE первичной единицей учета должен становиться не визит и не форма, а событие. Не бумажная клетка, а факт клинической жизни. Не вопрос "в какой CRF-странице это хранить", а вопрос "что произошло, когда произошло, с кем произошло, из какого источника это пришло и как это связано с другими событиями". Это не косметическое изменение терминов. Это смена философии работы с данными.

Почему классическая CRF-логика начинает тормозить RWE

Когда в RWE используется архитектура, унаследованная от классического “ИРК-осознания реальности”, организация данных почти всегда идет против течения самой реальности. Система пытается дисциплинировать живой, асинхронный, фрагментарный поток медицинской информации, загоняя его в фиксированные окна и формы. В результате появляется то, что знакомо любому дата-менеджеру: лишние страницы, искусственные repeat-формы, многочисленные conditional-ветки, пути, циклы, дублирование полей, логика "если этого визита нет, давайте создадим псевдовизит", а затем - бесконечные правила реконциляции и ручная борьба с тем, что сама модель была неестественной с самого начала.

Проблема не в том, что классический CRF плох. Проблема в том, что у него была другая историческая задача. Он создавался для мира, где протокол определяет маршрут пациента в исследовании. А в RWE маршрут пациента определяет архитектуру исследования, а не наоборот. И если платформа этого не понимает, то она начинает облагать всех участников "налогом на искусственность": врач тратит время на ввод в неестественные формы, монитор / DM / Data Science-специалист тратит время на проверку конструкций, которые не отражают реальную клиническую последовательность, дата-менеджер дополнительно тратит время на очистку следствий плохой структуры, а спонсор платит за операционный шум, ошибочно принимая его за контроль качества. И обратная ситуация возникает, когда данные есть, и они полезные, а мы не знаем куда их добавить.

Здесь особенно важен современный регуляторный сдвиг к понятию fit for purpose. И ICH E6(R3), и FDA, и EMA все более последовательно говорят о том, что качество данных не сводится к формальной "правильности" ввода в систему. Качество - это пригодность данных и процессов для ответа на научный и регуляторный вопрос, а EMA в свежем RWD Data Quality Framework прямо определяет fit for purpose как наличие у данных необходимых качественных характеристик для достижения конкретной цели принятия решений. Это крайне важный момент: если архитектура системы системно искажает клиническую реальность, то даже очень аккуратно заполненная форма не делает модель качественной.

Событийная модель - взрослая форма уважения к данным

Событийная модель начинается с простой, но очень сильной идеи: медицина разворачивается во времени как цепочка событий, а не как набор страниц в eCRF. Назначение терапии, изменение дозы, нежелательное явление, лабораторное измерение, процедура, госпитализация, отмена препарата, новый диагноз, исход - все это события разной природы, но они равноправны в архитектуре данных как элементы единой временной траектории пациента.

Это мышление уже хорошо знакомо зрелым экосистемам данных наблюдательных исследований. Например, OMOP CDM от OHDSI (участником которого является ДМ365) прямо описывает себя как ориентированную на человека модель: все клинические таблицы событий связаны с сущностью PERSON, а дата или дата начала события позволяет получить продольное представление клинически значимых событий по каждому человеку. Более того, общая логика модели строится вокруг доменов событий, где для каждой записи минимально фиксируются сам человек и момент во времени, при этом исходные коды сохраняются, чтобы не терялась информация. То есть одно из самых влиятельных направлений стандартизации данных наблюдательных исследований уже давно исходит из событийно-продольного взгляда на пациента, а не из формы-визита как основной сущности. (ohdsi.github.io)

Это важно не только для аналитиков и архитекторов. Это важно философски. Событийная модель признает, что данные не принадлежат форме. Данные принадлежат клинической реальности, а задача платформы - не заставить реальность выглядеть аккуратно в интерфейсе, а точно и управляемо ее отразить. В некотором смысле это и есть технологическая зрелость: когда система перестает командовать данными и начинает им служить.

Почему это удобнее врачу и исследователю

У врача нет внутренней категории "повторяемая форма НЯ вне запланированного визита". У врача есть пациент, у которого случилось ухудшение состояния, был назначен новый препарат, изменился лабораторный профиль, появилась жалоба, возникла необходимость в консультации или госпитализации. Когда цифровая система отражает именно эту естественную логику, врач работает быстрее, увереннее и с меньшим ощущением, что его заставляют заниматься канцелярией вместо медицины.

Если платформа построена вокруг событий, интерфейс может спрашивать не "откройте нужную форму", а "какое событие произошло?". Далее система уже сама знает, какие атрибуты должны быть собраны, какие связи с другими событиями возможны, какие проверки нужны, и где следует запросить подтверждение. Это не только снижает когнитивную нагрузку. Это делает работу врача ближе к тому, как он реально мыслит клинически. А любая система, которая заставляет специалиста думать против своей профессиональной логики, всегда будет проигрывать той, что встроена в эту логику.

Есть и еще один тонкий момент. В RWE часто важно не столько "заполнить все", сколько не потерять важное. Классическая форма-центричная модель легко создает иллюзию полноты: страницы есть, поля есть, значит и данные как будто собраны. Событийная модель честнее. Она фиксирует, что произошло, когда произошло, и из какого источника это известно. Она не маскирует отсутствие клинического события "пустой формой". Для исследователя это означает более прозрачную картину реального течения наблюдения, а для врача - меньше бессмысленных действий ради формального ощущения порядка.

Почему это удобнее дата-менеджеру

Дата-менеджер страдает не от данных как таковых, а от архитектурной неестественности. Большая часть операционной боли появляется там, где система заранее выбрала неудачную модель представления реальности, а потом пытается компенсировать это edit checks, ручной работой (которую мы терпеть не можем в ДМ365) и всякими процессными костылями. Когда данные хранятся как события с атрибутами, источником, временем и контекстом, очень многие конфликты перестают быть загадкой.

Во-первых, становится естественнее lineage (происхождение и прослеживаемость данных). EMA в своем RWD quality framework отдельно подчеркивает важность provenance, documentation of data provenance, metadata, data quality metrics и role clarity между держателями данных, пользователями и регуляторами. Для RWE это не бюрократическая надстройка, а фундамент доверия. Когда событие несет информацию о происхождении, способе трансформации и своем месте в общей цепочке, дата-менеджмент превращается из "ловли несостыковок по формам" в осмысленное управление жизненным циклом данных. (European Medicines Agency (EMA))

Во-вторых, событийная модель лучше переносит гетерогенность источников. Один и тот же пациент может дать данные из EHR, регистра, лабораторной системы, ePRO, OCR-разбора документа и ручного ввода исследователя. Если система все это сводит только в форму-визитную структуру, она рано или поздно начинает терять смысл источника и временную природу записи. Если же ядро событийное, то разнородные источники не ломают модель, а просто присоединяются к ней как разные каналы поступления событий.

В-третьих, снижается стоимость изменений. В RWE почти всегда что-то доуточняется. Появляются новые исследовательские вопросы, дополнительная категоризация, новый атрибут, новый класс событий, новая схема связи между событиями. В классическом EDC это часто означает переработку страниц, миграции, перепроверку логики и иногда довольно болезненное влияние на уже собранные данные. В событийной модели расширение часто делается значительно органичнее: меняется словарь, атрибутный слой, правила обработки и представления, но не ломается сам способ смотреть на реальность.

И тут возникает важный коммерческий вывод. Чем естественнее архитектура, тем дешевле каждая следующая аналитическая и операционная задача. А значит, спонсор получает не просто "другую базу", а более экономную, устойчивую и масштабируемую модель всей программы RWE.

Почему это удобнее мониторам и качеству в целом

Мониторинг в классическом понимании наследует ту же форму-центричную логику, что и EDC. Проверяется полнота форм, соответствие полей, наличие подписи, закрытие query, последовательность статусов. Все это важно, но в RWE этого недостаточно. Если исследование строится на реальных, асинхронных данных, монитор должен видеть не только заполненность, но и траекторию, аномалии, пропуски событий, неестественные интервалы, конфликты источников, неожиданные изменения лечения, резкие отклонения в последовательности измерений.

Именно поэтому современный регуляторный контур так настойчиво смещается к risk-based и proportionate подходу. ICH E6(R3) подчеркивает, что oversight measures должны быть fit for purpose, а quality by design должна заранее выделять critical-to-quality факторы. Это очень сильная мысль: зрелый контроль не пытается одинаково смотреть на все. Он смотрит туда, где риск для прав участников, надежности результатов и интерпретируемости данных действительно высок. Событийная модель естественным образом поддерживает такой контроль, потому что позволяет следить не только за заполненностью, но и за смысловой структурой клинического пути.

Практически это означает переход от вопроса "все ли страницы заполнены?" к вопросу "правдоподобна ли клиническая история, какова полнота критических событий, какова консистентность между источниками, не потеряны ли моменты, которые влияют на интерпретацию эффективности и безопасности?". Для мониторинга это более интеллектуальная и более ценная работа. Для спонсора - меньше шума и больше реального контроля. Для качества - переход от ритуала к содержанию.

Почему событийная модель сильнее аналитически

RWE редко существует ради архивирования наблюдений. Оно существует ради вывода. Ради понимания безопасности, эффективности, маркетинговых выводов, паттернов применения терапии, маршрутов пациента, факторов риска, приверженности терапии, смены лечения, использования ресурсов здравоохранения, времени до наступления исхода, динамики лечения и множества других вопросов, которые по своей природе являются временными и событийными. 

С научной точки зрения продольные данные и временная структура наблюдений - не дополнение к RWE, а его основа. Именно поэтому и эмуляция целевого исследования, и современные подходы к проектированию наблюдательных исследований требуют аккуратного описания временных окон, начала наблюдения, индекса, исходов, цензурирования, последовательности воздействий и других временных сущностей. 

FDA прямо рассматривает использование EHR и данных страховых требований для оценки эффективности и безопасности, а European Medicines Agency через DARWIN EU строит инфраструктуру для своевременного и надёжного получения доказательств по использованию, безопасности и эффективности лекарств на основе реальных медицинских баз данных. Это возможно только там, где данные можно уверенно развернуть во времени и связать между собой.

Событийная модель здесь выигрывает по определению. Она изначально поддерживает анализ времени до события, последовательности лечения, динамику воздействий, начало и завершение событий, построение траектории пациента, анализ интервалов, зависящие от времени ковариаты и целые классы дизайнов, где важно не просто наличие признака, а его место в общей траектории. Когда же данные насильно укладываются в визитную матрицу, аналитикам и статистикам затем приходится заново восстанавливать время и причинно-следственные связи, которые система сама же и скрыла.

Грубо говоря, классическая модель сначала ломает клиническую историю, а затем предлагает статистикам героически её восстановить. Событийная модель старается эту историю изначально не искажать.

Почему это важнее в эпоху AI, OCR и мультиканальных данных

Пока RWE строилось в основном на регистрах и EHR, можно было считать, что это просто немного более сложный EDC. Но сегодня в контур данных активно входят OCR ( наше решение https://dm365.ru/blog/news/ocr-ai-v-rwe/ocr-ai-v-rwe.html) , ePRO, носимые устройства, данные, генерируемые пациентами (в нашей практике их уже более 30%) , автоматические интеграции, машинное кодирование терминов и т.п. Абсолютное большинство RWE проектов стало перспективными, а не ретроспективными как было принято в ранних попытках. И в этот момент становится очевидно: архитектура, построенная вокруг строгих визитов и форм, уже не просто неудобна - она стратегически слаба.

ICH E6(R3) прямо признаёт роль цифровых медицинских технологий, носимых устройств, сенсоров и их интеграции в существующую инфраструктуру здравоохранения. European Medicines Agency в рамках DARWIN EU говорит о данных от врачей, больниц и регистров на всём жизненном цикле лекарственных препаратов. Это означает, что будущее не движется к унификации источников - наоборот, оно становится всё более разнообразным. И система, которая не умеет естественно принимать и связывать разнородные события, будет воспринимать каждый новый источник как проблему интеграции.

В этом контексте событийная модель становится оптимальным фундаментом для AI-ready RWE. Документ, разобранный через OCR, превращается не в форму с текстом, а в набор клинических событий с указанием источника и уровня достоверности. Ответ пациента в ePRO становится полноценным событием траектории наравне с записью врача, но с другим типом происхождения. Изменение терапии из EHR связывается с лабораторными результатами и симптомами пациента не вручную через формы, а на уровне единой модели. И именно здесь становится понятно: событийная архитектура - это не только про удобство сегодня, это про способность системы жить и развиваться завтра.

Что это означает для регуляторной надежности, а не только для удобства

Иногда кажется, что разговор о событийной модели - это про интерфейсы или внутреннюю архитектуру. На самом деле это разговор про доверие к данным. European Medicines Agency в своём Data Quality Framework для RWD подчёркивает необходимость документирования происхождения данных, публикации метаданных, наличия метрик качества, чёткого распределения ролей и оценки пригодности данных для конкретной регуляторной задачи. Сообщество OMOP, в свою очередь, строит ориентированную на человека и продольную модель именно для того, чтобы данные наблюдательных исследований могли давать надёжные доказательства через стандартизированную структуру, словари и аналитические инструменты. FDA развивает отдельную программу RWE для регуляторного использования данных реальной практики. Всё это даёт чёткий сигнал рынку: недостаточно просто собрать много реальных данных - нужно уметь доказать, что их структура, происхождение и обработка делают их надёжными для принятия решений.

Именно поэтому событийная модель важна не только как более аккуратная архитектура. Она лучше поддерживает проверяемость, объяснимость и трассируемость - те свойства, без которых RWE быстро превращается в красивую, но слабо воспроизводимую картину. Когда мы говорим, что система работает событийно, мы фактически говорим, что она уважает происхождение данных, их временную природу и необходимость прозрачной обработки. А это уже не язык маркетинга, а язык зрелой системы качества.

Как это выглядит на платформенном уровне MainEDC™

Хорошая событийная платформа - это не хаос свободного ввода, а более высокий уровень инженерии по сравнению с классическим CRF-подходом. Просто эта инженерия переносится с уровня жёстко заданных страниц на уровень событийного ядра, словарей, атрибутных схем, правил валидации, связей между сущностями, управления происхождением данных и механизмов представления для разных ролей.

В основе предлагаемой нами архитектуры лежит несколько принципов.

Первый - событие (и группа данных) как базовая сущность с обязательной фиксацией времени, субъекта, источника и статуса обработки. Одинаковые события имеют одинаковую типизацию, любое изменение в структуре материнского события ( данных, триггерах, настройках полей, проверках и т.п.) наследуются. 

Второй - доменная типизация по CDISC. Не одна универсальная таблица, а управляемая структура клинических доменов, где события терапии, лабораторные данные и нежелательные явления сопоставимы, но не смешиваются без смысла.

Третий - сохранение происхождения данных. Не только нормализованное представление, но и возможность проследить источник, преобразования и участки, где требовалась ручная верификация.

Четвёртый - представления под роли. Врач видит клиническую логику, дата-менеджер - качество и аномалии, монитор - риски и согласованность, спонсор - агрегированную картину, аналитик - устойчивый слой данных.

Пятый - расширяемость. Новый источник или новая гипотеза не ломают систему, а естественно в неё встраиваются.

Именно здесь происходит ключевой переход: система перестаёт быть инструментом ввода и становится операционной средой, которая отражает и поддерживает реальную клиническую практику.

Почему хорошая EDC умеет работать как RWE-платформа

Рынок давно научился красиво говорить "RWE-ready", "registry support", "observational workflows", "real-world module". Но если под капотом по-прежнему живет логика визитов, форм и ручного обхода асинхронности, то это не событийная RWE-платформа. Это классический EDC, который надел пиджак потемнее и решил, что так сойдет.

Проблема в том, что с каждым годом это будет сходить все хуже. Регуляторный интерес к RWE растет. DARWIN EU расширяется и использует данные из врачей, больниц и регистров для регуляторных задач по всему жизненному циклу препаратов. FDA системно развивает guidance и программы по использованию RWD/RWE в принятии решений. Общие data standards для observational data становятся зрелее. Это означает, что ожидание от платформ больше не будет ограничиваться способностью "куда-то сложить данные". От них будут ждать управляемой, прозрачной, масштабируемой и научно пригодной работы с продольными клиническими событиями. (European Medicines Agency (EMA))

Именно поэтому сейчас очень важен не вопрос "можем ли мы использовать RWE?", а вопрос "достаточно ли взрослая у нас модель данных, чтобы RWE не превратилось в ручную борьбу с последствиями неудачной архитектуры?". Это уже не академический спор. Это вопрос скорости запуска, стоимости сопровождения, доверия к выводам и способности масштабировать программы наблюдательных исследований.

Почему это выгодно всем участникам, а не только платформе

Когда событийная модель реализована правильно, выигрывают не только архитекторы и дата-менеджеры, которые любят красивые системы.

Врач выигрывает потому, что интерфейс начинает отражать реальную клинику, а не бюрократическую фантазию о ней.

Дата-менеджер выигрывает потому, что меньше времени уходит на искусственные конфликты модели и больше - на реальные вопросы качества.

Монитор выигрывает потому, что может видеть риски и аномалии там, где они действительно возникают.

Спонсор выигрывает потому, что получает более быструю операционную работу, более прозрачную аналитику и более устойчивую платформенную основу для расширения программы.

А платформа выигрывает потому, что перестает быть узким инструментом ввода и становится системой, в которой реально можно строить современный RWE-контур - от первичного события до управляемого evidence generation.

Это и есть момент, когда технология начинает становиться частью научной инфраструктуры.

Финальный вывод

Событийная модель в RWE - это не альтернатива классическому подходу. Это следующая стадия зрелости работы с клиническими данными. Там, где реальная медицинская практика течет как последовательность разнотипных событий, модель, построенная вокруг фиксированных визитов и форм, неизбежно начинает создавать трение, потерю смысла и лишние издержки. Там же, где ядро строится вокруг события, времени, контекста, происхождения и связи между фактами, появляется то, чего рынку хронически не хватает: архитектура, которая одновременно удобна, научно состоятельна, технологически расширяема и регуляторно взрослая.

Поэтому вопрос уже не в том, можно ли в исследованиях реальной клинической практики продолжать жить на старой логике электронных систем сбора данных. Формально - можно. Так же, как можно вести сложный многоцентровый проект на бумаге (мы этого, мягко говоря, не рекомендуем). Вопрос в другом: зачем сознательно использовать модель, созданную для другого мира, если сама индустрия, регуляторы и стандарты данных уже движутся в сторону подхода, ориентированного на пациента, продольного анализа, оценки пригодности данных под задачу и учёта происхождения данных?

Именно здесь начинается разговор не просто о технологии, а о компетенции. Построить событийную среду для исследований реальной практики - это не добавить пару форм и назвать это реестром. Это значит глубоко понимать природу данных реальной клинической практики, их операционную жизнь, научные сценарии использования и требования к качеству. И в этот момент система перестаёт быть просто хранилищем. Она становится средой, в которой реальная клиническая практика превращается в управляемое, проверяемое и убедительное доказательство.

Обсудим, как это может работать у вас?

Если вы дочитали до этого места, значит вопрос уже не в теории, а в практике. Как именно событийная модель может лечь на ваши исследования? Где она упростит процессы, а где потребует переосмысления текущего дизайна? Какие источники данных можно подключить уже сейчас, а какие - позже, без риска сломать архитектуру?

Хорошая новость в том, что переход к событийной модели не означает начинать с нуля. Все накопленные наработки в экосистеме MainEDC™ сохраняют ценность: формы, визиты, библиотеки, справочники, правила валидации - всё это может быть унаследовано и аккуратно встроено в событийную логику. Мы не ломаем существующее, а переиспользуем его, переводя в гибкую архитектуру.

Мы предлагаем не абстрактную демонстрацию, а предметный разговор на вашем кейсе. Разберём текущий подход, покажем, где возникают ограничения, и вместе посмотрим, как это может работать в событийной модели - на уровне реальных данных, ролей и процессов.

Свяжитесь с нами, и давайте обсудим, как превратить ваши данные реальной клинической практики в управляемое и убедительное доказательство.

contact@dm365.ru