Рустам Гильфанов: клинические исследования и IT. Как цифровые технологии творят революцию в науке

От успеха клинических исследований (КИ) зависит очень многое в глобальном здравоохранении. Особенно остро мир почувствовал это в последние два года, столкнувшись с пандемией коронавируса — и необходимостью искать лекарства и разрабатывать вакцины настолько быстро, насколько это возможно. С момента, когда в Китае был выявлен первый заразившийся новой болезнью, и до регистрации первой вакцины прошло меньше года — срок рекордный для мировой фарминдустрии.

Однако это, судя по всему, лишь вершина айсберга: современные информационные технологии уже производят революцию в клинических исследованиях, и в ближайшее десятилетие сама научная система переживет фундаментальные изменения.

Собственно, революция уже началась: до недавнего времени процент успеха (PoS) клинических исследований составлял всего 13,8% [1], но примерно с 2015 года этот показатель стремительно пошел вверх. Ожидаемый успех клинических исследований к июлю 2021 года вырос до 40,6% — а в случае с отдельно взятой третьей фазой испытаний он и вовсе достиг рекордных 98,6% [2]. По сути, медицина впервые за всю свою истории пришла к тому моменту, когда выход исследования в третью фазу де-факто означает его успех.

Как отмечал два года назад журнал Nature [3], ключевой причиной такого роста стало все более активное применение в клинических исследованиях технологий искусственного интеллекта (AI). Рост эффективности КИ шел параллельно с ростом объема финансов на рынке AI в медицине: по данным IQVIA, в 2014 году объем этого рынка составлял $600 млн, а в 2022-м прогнозируется цифра в $8 млрд — и это далеко не предел [4].

Можно приводить тысячи цифр, доказывающих, что это направление развивается и будет востребовано все активнее и активнее. Но мне кажется более интересным попытаться понять, какие качественные изменения происходят сейчас и будут происходить в дальнейшем в медицинской науке благодаря искусственному интеллекту и IT в целом. Я вижу десять основных тенденций, которые постараюсь коротко описать.

1. Еще больше проб и ошибок

Медицинская наука в целом и клинические исследования в частности — это бесконечная история проб и ошибок. Ученые и фармакологи тестируют все больше и больше различных веществ на эффективность против самых разных патологий — и в последние годы, как отмечают мои коллеги в колонке для Clinical Reader, число изучаемых лекарств увеличилось "драматически" [5]. Между производителями возникает конкуренция за людей, готовых проходить испытания, а также за то, какое и, главное, чье вещество первым продемонстрирует способность нивелировать определенную патологию.

Дело в том, что прогресс в нанотехнологиях в первые десятилетия XXI века кардинально изменил систему таргетинга лекарств, только-только сложившуюся на излете прошлого столетия, а вместе с ней и принцип поиска новых средств.

Сегодня никто не ищет "лекарство от рака" — с научной точки зрения, такая формулировка наивна, а то и вовсе глупа. Сегодня ученые ищут такие препараты, которые могут воздействовать на клетки определенного типа, на конкретные участки генома, на мельчайшие точки в организме человека — никоим образом не задевая при этом здоровые клетки и органы.

Таргетные препараты уже сейчас позволяют успешно лечить многие виды онкозаболеваний и продлевать жизнь пациентам, а будущее науки — за таргетными препаратами индивидуализированного типа. Идеал, к которому стремятся ученые в борьбе против рака, — препарат, который поможет конкретному пациенту N победить опухоль именно того типа, какая у него развилась, и не повредит при этом ни одну здоровую клетку. Но если пациент N страдает редким видом онкопатологии, встречающимся, например, в одном случае на 10 миллионов, как можно разработать и проверить лекарство против такого заболевания? Классические КИ, с обязательной выборкой размером в тысячи испытуемых, не оставляют пациенту N шанса.

Искусственный интеллект позволяет протестировать многие потенциально эффективные препараты методом in silico — то есть, с помощью компьютерного моделирования [6]. На современном этапе развития науки метод in silico не может заменить классические КИ с тестированием на животных и человеке, но зато он позволяет, например, предварительно проверить, сработает ли узкотаргетированный препарат — не тратя времени на поиск кандидатов для КИ.

2. Эффективный поиск кандидатов

А поиск кандидатов — это как раз огромная головная боль многих исследователей. С чем приходилось сталкиваться ученым ранее? Маркус Ву описывал в Nature [3] историю о том, как руководителю исследовательской группы Кевину Хьюзу потребовалась в 1994 году выборка женщин старше 70 лет с определенными опухолями молочных желез. На все США потенциальных кандидаток было около 40 тыс., а включить в исследование удалось в итоге всего 636 человек — причем на их поиск, переговоры и согласование всех формальностей ушло пять лет!

Это колоссальная потеря времени. Средняя пятилетняя выживаемость при раке молочной железы, выявленном на ранних стадиях, в странах с высоким уровнем дохода составляет 90%, а в Индии и Южной Африке — всего 66% и 40% соответственно [7]. Значит, за пять лет, пока исследование попросту стоит на месте из-за инфраструктурных сложностей, в одних только США умирает каждая десятая пациентка с подобным диагнозом, а ЮАР — три из пяти женщин!

Прежде у руководителей исследовательских групп, по сути, не было надежных средств ускорить процесс поиска кандидатов, и многие важные испытания подолгу не начинались лишь из-за этого.

Сегодня такая возможность появляется: искусственный интеллект способен подобрать кандидатов по целому ряду параметров за считанные секунды, да еще и направить стандартные письма-приглашения присоединиться к исследованию по их адресам. Это, опять-таки, лишь самая очевидная часть той работы, которая переложена на плечи машин.

3. Открытость для желающих

Современные системы сбора и аналитики данных работают в обе стороны: не только исследователям легче искать потенциальных участников, но и потенциальным участникам — находить те КИ, для которых они сами могут быть полезны. На одном только портале ClinicalTrials. gov содержится информация о 300 тыс. клинических исследованиях, проводимых прямо сейчас, но человеку не от науки или медицины крайне сложно понять, для каких этих КИ он подходящая кандидатура, а для каких — нет.

Мои коллеги из DQueST разработали интеллектуальный опросник, который позволяет претенденту на участие в исследовании отфильтровать те КИ, которые ему заведомо не подходят. За 50 простых вопросов удается отмести порядка 60-80% исследований, что существенно облегчает порог входа для заинтересованного человека [8].

Это, кстати, обнажает важную проблему нашего времени, характерную и для науки: на смену нехватке информации приходит ее переизбыток. Интеллектуальные средства, способные избавить нас от информационного шума, становятся все ценнее — и они, я не сомневаюсь, здорово послужат науке в 2020–2030-е годы.

4. Дизайн протоколов становится совершеннее

Каждое клиническое исследование ведется строго по заранее продуманному протоколу, и случайные отклонения от плана и внешние факторы, которые не удалось предусмотреть заранее, могут остановить работу на долгие месяцы. А это, опять-таки, не только потерянные деньги, но и потенциально не спасенные жизни — особенно в случае с поисками новых таргетных препаратов.

Чем строже дизайн протокола КИ, тем выше эффективность всей работы. При этом, разрабатывая дизайн протокола, ученым приходится учитывать колоссальное количество разнородных факторов: от особенностей той болезни, лекарство от которой ищется, до обнародованных данных других КИ.

Вы же помните, что на одном только ClinicalTrials. gov содержится информация о 300 тыс. исследований, которые ведутся прямо сейчас более чем в 200 странах? Очевидно, что ни одному самому гениальному руководителю исследовательской группы не по силам оценить значимый процент этих работ. Получается, что вплоть до недавнего времени многие КИ частично дублировали друг друга; не учитывали результаты других КИ и теряли время; сталкивались с препятствиями, которые не удавалось предсказать из-за невозможности обработать всю информацию.

Проблемы эти не ушли совсем, но постепенно нивелируются благодаря системам искусственного интеллекта. Сервисы вроде Trials. ai уже умеют собирать всю доступную по открытым источникам информацию о прошедших и только идущих исследованиях, чтобы учитывать ее при дизайне протоколов. ИИ способен вычислить, какие параметры и, главное, в каком диапазоне важны для максимально эффективного исследования: к примеру, для терапии сахарного диабета могут быть нужны люди с конкретными показателями гемоглобина, не слишком высокими и не слишком низкими, но высчитать эти границы без опоры на сведения из уже проведенных КИ — очень непросто.

5. Контроль прохождения на каждом этапе

В 1950-е годы исследователям с огромным трудом удалось получить разрешение на проведение исследований противозачаточных таблеток. Они преодолели множество препятствий:

сопротивление консервативной части ученого сообщества;
непонимание целесообразности таких таблеток со стороны правительства;
доминирующие патриархальные настроения во многих и многих семьях.

Однако на решающем этапе возникла неожиданная трудность: женщины, согласившиеся принять участие в КИ, зачастую забывали принимать таблетки вовремя. Проконтролировать их прием было очень непросто, и данные на первых стадиях серьезно искажались.

Аналогичная проблема обнаружилась в экстремальных условиях при разработке вакцин против коронавируса: "золотой стандарт" — двойное слепое рандомизированное плацебо-контролируемое исследование — разбивался о страхи самих участников КИ перед COVID-19, и участники исследований "расслеплялись" (то есть нарушали правило о том, что участники не в курсе, досталась им настоящая вакцина или плацебо), сдавая тесты на антитела к S-белку вскоре после вакцинации. У разработчиков вакцин фактически не было инструментов эти моменты проконтролировать, что обострило этическую проблему современной науки: имеет ли право "ослепленная" плацебо-группа на настоящее лекарство? И когда, если вокруг бушует пандемия опасной болезни?

Современные технологии помогают находить решения и здесь. К примеру, пациенты, тестирующие лекарства против психоневрологических заболеваний, склонны забывать о приеме таблеток или отказываться от них. Уже разработаны платформы, которые не только напоминают пациентом о необходимости выпить лекарство, но и анализируют процесс принятия таблетки с помощью камеры в смартфоне и компьютерного зрения. Исследование одного из таких сервисов показало: 90% пациентов с шизофренией, использовавших такую систему, принимали таблетки в соответствии с необходимым графиком, тогда как в контрольной группе их число составляло лишь 72% [9].

По мере развития искусственного интеллекта, включая системы распознавания лиц, речи и эмоций, а также распространения "умных" гаджетов, способных измерять все больше разнообразных параметров, эффективность контроля испытуемых будет расти — а значит, и результаты КИ будут корректнее. Как только данные будут собраны, плацебо-группу можно моментально "расслепить" и дать ей настоящее лекарство.

6. NLP: облегчение систематизации

Natural language processing (NLP) — еще одно перспективное направление. Такие системы позволяют компьютеру анализировать речь, как написанную, так и устную. В случае с медициной и клиническими исследованиями их главная миссия — находить релевантные выписки из медкарт, заметки докторов и самих пациентов, даже слова, произнесенные на приеме.

Главная трудность, которая встает перед внедрением NLP во все КИ, заключается в необходимости предварительно обучать нейросеть базовым терминам и лексемам, связанным с контекстом исследования. То есть, пока что перед тем, как начнет работать искусственный интеллект, приходится немало поработать интеллекту естественному — в лице группы датасайентистов, медиков, лингвистов. У этого направления есть огромный потенциал для развития, и постепенно сервисы становятся все эффективнее — правильно обнаруживая сущности и находя между ними связи в 79,5% и 80,5% соответственно [10]. Революция, на мой взгляд, состоится при достижении отметки в 97-98%.

7. Быстрый анализ собранных данных

Образ ученого, разбирающего кипы бумаг и разрозненных файлов, все еще остается доминирующим в массовом сознании. Однако, конечно, именно в этой сфере — анализа того, что уже собрано в ходе КИ, — искусственный интеллект начал появляться едва ли не в первую очередь. Систематизация больших данных в течение долгих десятилетий была ключевой проблемой науки, и зачастую многие ошибки совершались на основе неверных выводов из подобных систематизаций. Сегодня любое крупное исследование моментально превращается в стройные таблицы, графики, математические модели, а за распространением коронавируса по миру благодаря таким технологиям всё человечество впервые в истории получило возможность наблюдать буквально онлайн [11].

8. Перспектива создания единой базы по всем КИ

Следующий этап развития big data — появление единой базы данных по всем системам здравоохранения на планете, по всем пациентам, докторам и исследованиям. Минуя языковые барьеры и государственные границы, такая база данных должна стать основой для прогресса в медицине: ученые рубежа XIX-XX века, когда современный подход к КИ только зарождался, и помыслить не могли о доступе к информации о сотнях миллионах пациентов с сахарным диабетом или раком. И не только потому, что эти данные не могли быть оцифрованы: на планете в принципе жило в несколько раз меньше людей. И если перенаселение Земли несомненно угрожает климату, то для медицинской науки прирост населения — скорее, благо: открываются перспективы найти и опробовать лекарства даже от редких заболеваний. Один случай на миллион при миллиарде человек в мире против одного случая на миллион при восьми миллиардах — существенная разница.

Здесь, ясное дело, встает вопрос, с одной стороны, открытости данных, а с другой — утечек конфиденциальной информации, связанной со здоровьем людей. Это два вызова, которые стоят перед Всемирной организацией здравоохранения и специалистами из IT-сообщества, и мне хочется верить, что пандемия COVID-19 в 2020–2021 гг. обратила внимание ответственных лиц на эти вопросы.

9. Двойное слепое рандомизированное плацебо-контролируемое исследование станет прошлым веком?

В автоспорте, авиастроении, космической отрасли уже давно получили распространение технологии CFD (computational fluid dynamics). Они используются для изучения механики сплошных сред: как повысить обтекаемость корпуса болида или ракеты, как снизить лобовое сопротивление самолета или торпеды. Все знают о тестах в аэродинамической трубе, и для своей отрасли такие тесты остаются "золотым стандартом", однако за последние десятилетия CFD продвинулись настолько, что львиная доля вычислений производятся в виртуальном пространстве — и погрешность полученных данных все ниже. Перспектива отказа от аэродинамических труб для проверки расчетов, произведенных на компьютере, уже не кажется такой отдаленной.

Медицина также может прийти к, условно говоря, "виртуальном пациенту". Пока такие технологии, как правило, применяются для обучения докторов [12], однако для клинических исследований тех или иных лекарств на предмет эффективности уже можно создать "модель человека" в компьютере.

Методика виртуальных КИ станет наиболее полезной в нескольких ситуациях:

во-первых, при поиске лекарств от очень опасных и неизвестных заболеваний вроде Эболы или бешенства (когда создание контрольной группы этически невозможно);
во-вторых, при апробации терапии для редких нозологий (когда контрольную группу чрезвычайно трудно набрать из-за низкой распространенности болезни в популяции);
в-третьих, при необходимости оценить эффект на исключительно больших популяциях.

По сравнению с вычислительной гидро- и аэродинамикой, технологии "виртуальных пациентов" пребывают в зачаточном состоянии, но в ближайшие десятилетия сюда наверняка польются и деньги, и человеческие ресурсы, и внимание ученых.

10. Снижение стоимости КИ — рост прибыли фармкомпаний

И последнее, но, пожалуй, самое важное: деньги, человеческие ресурсы, внимание. Каждое исследование — это тысячи и миллионы долларов, сотни и тысячи вовлеченных людей, десятки и сотни организаций и стран. Одни только транзакционные издержки на проведение качество КИ сегодня — это гигантские затраты. А притом, что, как я отметил в самом начале статьи, лишь 40% исследований в медицине дают результат (а каких-то шесть лет назад было и вовсе втрое меньше!), можно говорить о миллиардах долларов и человеко-часов, потраченных впустую.

Искусственный интеллект, само собой, не сможет заменить живого человека у руля клинического исследования, как и заменить настоящих пациентов, в него вовлеченных, однако сэкономить эти миллиарды он точно сумеет. И уже экономит, постепенно проникая в медицину и науку. Я искренне надеюсь, что те средства, которые IT сохранят для фармкомпаний, будут направлены на поиск новых лекарств, вакцин, методов терапии. Для нас, инвесторов и специалистов из IT-отрасли, это очень важно и вдохновляюще.

Об Авторе

Рустам Гильфанов — IT предприниматель, венчурный партнер фонда LongeVC.

Источники:

1. Wong CH, Siah KW, Lo AW. Estimation of clinical trial success rates and related parameters. Biostatistics. 2019 Apr 1;20(2):273-286. doi: 10.1093/biostatistics/kxx069. Erratum in: Biostatistics. 2019 Apr 1;20(2):366. PMID: 29394327; PMCID: PMC6409418.

2. Estimates of Clinical Trial Probabilities of Success (PoS) / projectalpha.mit.edu/pos/

3. Woo M. An AI boost for clinical trials. Nature. 2019 Sep;573(7775):S100-S102. doi: 10.1038/d41586-019-02871-3. PMID: 31554996.

4. Accenture, Artificial Intelligence: Healthcare's New Nervous System, www.accenture.com/au-en/insight-artificial-intelligence-healthcare

5. Lev Gerlovin, Brooke Bonet, Inderpreet Kambo, and Giuliano Ricciardi. The Expanding Role Of Artificial Intelligence In Clinical Research. June 9, 2020. www.clinicalleader.com/doc/the-expanding-role-of-artificial-intelligence-in-clinical-research-0001

6. Debmalya Barh, Vijender Chaitankar, Eugenia Ch Yiannakopoulou, Emmanuel O. Salawu, Sudhir Chowbina, Preetam Ghosh, Vasco Azevedo. Chapter 21 — In Silico Models: From Simple Networks to Complex Diseases, Animal Biotechnology, Academic Press, 2014, Pages 385-404, doi.org/10.1016/B978-0-12-416002-6.00021-3.

7. www.who.int/news-room/fact-sheets/detail/breast-cancer

8. Cong Liu, Chi Yuan, Alex M Butler, Richard D Carvajal, Ziran Ryan Li, Casey N Ta, Chunhua Weng, DQueST: dynamic questionnaire for search of clinical trials, Journal of the American Medical Informatics Association, Volume 26, Issue 11, November 2019, Pages 1333-1343, doi.org/10.1093/jamia/ocz121

9. Bain EE, Shafner L, Walling DP, Othman AA, Chuang-Stein C, Hinkle J, Hanina A. Use of a Novel Artificial Intelligence Platform on Mobile Devices to Assess Dosing Compliance in a Phase 2 Clinical Trial in Subjects With Schizophrenia. JMIR Mhealth Uhealth. 2017 Feb 21;5(2):e18. doi: 10.2196/mhealth.7030. PMID: 28223265; PMCID: PMC5340925.

10. Yuan C, Ryan PB, Ta C, Guo Y, Li Z, Hardin J, Makadia R, Jin P, Shang N, Kang T, Weng C. Criteria2Query: a natural language interface to clinical databases for cohort definition. J Am Med Inform Assoc. 2019 Apr 1;26(4):294-305. doi: 10.1093/jamia/ocy178. PMID: 30753493; PMCID: PMC6402359.

11. www.worldometers.info/coronavirus/#countries

12. Kononowicz A, Woodham L, Edelbring S, Stathakarou N, Davies D, Saxena N, Tudor Car L, Carlstedt-Duke J, Car J, Zary N. Virtual Patient Simulations in Health Professions Education: Systematic Review and Meta-Analysis by the Digital Health Education Collaboration. J Med Internet Res 2019;21(7):e14676. doi: 10.2196/14676