2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/part...

28
2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ

Upload: others

Post on 22-May-2020

16 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ

Page 2: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ

ЧЕТВЕРТАЯ ПАРАДИГМА 55

Вступление

САЙМОН МЕРСЕР (SIMON MERCER) | Microsoft Research

Во второй части этой книги исследуются результаты раз-вития и задачи самой персональной, интимной и непо-средственно влияющей на всех живущих на планете области знаний: здравоохранении и медицине.

В первой статье описывается ситуация. Гиллам (Gillam) и его соавторы рассказывают о прогрессе медицины на протя-жении всей истории человечества и о том, как будут выглядеть комплексные технологии, которые изменят лицо здравоохра-нения при нашей жизни. Остальные статьи сосредоточены на конкретных задачах медицинской науки и технологиях, кото-рые разрабатываются для их решения.

В любое утверждение о том, что грядущая революция в медицине будет универсальной, можно поверить только в том случае, если мы сможем убедительно продемонстрировать, как она сможет пересечь экономические и социальные сфе-ры современного мира. Робертсон (Robertson) и его соавторы показывают, что комбинация всемирно распространенной технологии мобильных телефонов и вычислительных техник Байесовских сетей может обеспечить сбор компьютеризиро-ванных медицинских карт в районах, где здравоохранение мало распространено, а также автоматическую выдачу точ-ных диагнозов.

Понимание человеческого мозга является одной из вели-чайших задач медицины, и Лихтман (Lichtman) и его соав-торы описывают свои методы создания огромных наборов данных, необходимых для понимания этих наиболее сложных структур. Даже визуализация мозга человека на субклеточ-ном уровне, с его расчетными 160 триллионами синаптиче-

Page 3: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ

ЧЕТВЕРТАЯ ПАРАДИГМА 57ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ56

Сингулярность здравоохранения и эра

семантической медицины

Когда в 1499 г. португальский мореплаватель Васко да Гама вернулся домой после первого морского путе-шествия из Европы в Индию, у него осталось меньше половины команды — цинга забрала жизни 100 из 160

человек. В эпоху великих географических открытий1 цинга была основной причиной смерти моряков. Капитаны кора-блей во время своих походов обычно планировали смертность на уровне половины команды. Подозревали, что проблема с цингой вызвана питанием, но никто не мог этого доказать. Бо-лее чем столетием позже, в ходе путешествия из Англии в Ин-дию в 1601 г., капитан Джеймс Ланкастер на одном из своих четырех кораблей стал давать членам команды по три ложки лимонного сока каждый день. К середине плавания почти 40% команды (110 из 278) на трех кораблях умерли, а на корабле, где давали лимонный сок, выжили все [1]. Британский воен-но-морской флот отреагировал на это открытие повторением эксперимента спустя 146 лет.

В 1747 г. британский корабельный врач Джеймс Линд ле-чил моряков, страдающих цингой, при помощи шести произ-вольных методов, и продемонстрировал, что цитрусовые уби-рают все симптомы. Через 48 лет британский военно-морской флот принял новые указания по питанию с применением ци-трусовых, которые практически мгновенно истребили цингу

МИХАЭЛЬ ГИЛЛАМ (MICHAEL GILLAM), КРЕЙГ ФАЙЕД (CRAIG FEIED), ДЖОНАТАН ХАНДЛЕР (JONATHAN HANDLER), ЭЛАЙЗА МУДИ (ELIZA MOODY)Microsoft

БЕН ШНАЙДЕРМАН (BEN SHNEIDERMAN), КАТРИН ПЛЕЗАН (CATHERINE PLAISANT) Мэрилендский университет (University of Maryland)

МАРК СМИТ (MARK SMITH) Институт инноваций компании MedStar Health (MedStar Health Institutes for Innovation)

ДЖОН ДИКАСОН (JOHN DICKASON) Частная практика

ских связей, является задачей, которая проверит пределы хранилищ данных и станет только первым шагом в определении функций из формы.

Методы понимания процессов нашего мышления на следующем этапе раз-вития науки представлены Горвицем (Horvitz) и Кристианом (Kristan), которые описывают техники записи последовательностей активности нейронов и их кор-реляции с поведением простейших организмов. Эта работа приведет к появле-нию новых программных инструментов, привлекающих технологии машинного обучения и искусственного интеллекта к получению новых медицинских зна-ний.

Хотя наборы данных, составляющие медицинскую карту отдельного паци-ента, на порядки меньше описывающих архитектуру мозга, текущие тенденции в направлении универсальных электронных медицинских карт означают, что большая часть населения планеты вскоре будет иметь свои медицинские карты в цифровой форме. Они образуют набор данных, который по размеру и слож-ности будет конкурировать с наборами данных неврологии. Здесь мы находим параллельные проблемы и возможности. Бучан (Buchan), Винн (Winn) и Бишоп (Bishop) к этим большим объемам медицинских данных применяют новые тех-ники машинного обучения для автоматизации выбора терапии, которая даст наиболее желательный результат. Технологии, подобные этим, потребуются нам в случае реализации мира «Сингулярности здравоохранения», где коллектив-ный медицинский опыт используется для моментального информирования о наилучших клинических практиках.

Поскольку грядущая эра компьютеризированных медицинских карт обеща-ет дать более доступные и подробные медицинские данные, для возможности использования этой информации потребуется применение стандартных форм шифрования, которые позволят делать заключения на основании различных наборов данных. Карделли (Cardelli) и Приами (Priami) смотрят в будущее, в ко-тором медицинские данные можно будет накладывать на исполняемые модели, в которых закодирована базовая логика биологических систем — не только для демонстрации поведения организма, но и для прогнозирования его будущего состояния или реакций на стимул. В случае с неврологией такие модели могут помочь в понимании процессов нашего мышления, а в случае с медицинскими картами они могут помочь понять механизмы появления заболеваний и их лече-ния. Хотя компьютерное моделирование биологических феноменов находится только на стадии зарождения, оно может дать, возможно, самые интригующие знания о возникающих комплементарных и синергических взаимосвязях между вычислительными и живыми системами.

16 15—17 век.

Page 4: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 5958

науки [7]. Клинические врачи постоянно отстают при столкновении с этим пото-ком медицинской информации, несмотря на свою специализацию [8].

Чувство перегруженности информацией присутствовало на удивление дав-но. Об этом говорит речь доктора Генри Нойеса (Dr. Henry Noyes) 1865 г. для Американского офтальмологического сообщества (American Ophthalmologic Society). Он говорил, что «врачи мужественно сражаются, чтобы сохранять уро-вень своих знаний при развитии мира медицины, но слишком часто они пер-выми осуждают себя за невозможность выполнения ежедневных задач...» И продолжал: «Подготовительные работы к медицинскому исследованию, при правильном его проведении, настолько огромны, что лишь немногие могут тра-тить время на их тщательное выполнение...» [9].

МОЖЕТ ЛИ ВНЕДРЕНИЕ ЗНАНИЙ В ЗДРАВООХРАНЕНИИ СТАТЬ ПРАКТИЧЕСКИ МГНОВЕННЫМ?

Скорость перехода значительных медицинских открытий в широкую практику за последние два тысячелетия постоянно увеличивалась, как показано на рисун-ке 2.

Если рассматривать последние 150 лет, когда влияние индустриализации и информационного взрыва стало особенно ощутимым, траектория немного сгла-живается, но остается преимущественно линейной, как видно по рисунку. (Под-бор асимптоты составляет r2 от 0,73, а подбор прямой — 0,83.)

Учитывая то, что даже скорость света имеет свои пределы, эта тенденция неизбежно станет асимптотической к горизонтальной оси. Если линейность в достаточной степени сохранится и далее, в следующие 20 лет возможно начало особого этапа здравоохранения, характеризующегося практически мгновенным переходом от медицинских открытий к широкой медицинской практике.

Приближение этой траектории к оси произойдет примерно в 2025 г. В ответ на огромный вычислительный прогресс, который наблюдается по закону Мура, и развитие параллельных и распределенных вычислительных архитектур, Рей Курцвайл (Ray Kurzweil) в книге «Сингулярность уже близка» предсказывает, что 2045 г. станет годом сингулярности, когда компьютеры достигнут или пре-высят вычислительные способности человека, и когда их способность к само-стоятельному улучшению может привести к «взрыву интеллекта», который в конечном счете затронет все аспекты человеческой культуры и технологии [10]. Математика определяет сингулярность как точку, где объект меняет свою при-роду и приобретает характеристики, не свойственные объекту такого класса. Се-годня пути распространения медицинской информации сложны и многогран-ны, они включают в себя рекламу, лекции, брошюры, коллег и журналы. В мире с практически мгновенным переходом знаний в практику пути распростране-ния станут практически полностью цифровыми и прямыми.

на британском флоте. Британская торговая палата утвердила подобные правила питания для торгового флота еще через 70 лет — в 1865 г.

Общее время с момента демонстрации Ланкастером метода профилактики цинги до его утверждения по всей Британской империи составило 264 года [2].

Впоследствии темпы перехода медицинских открытий на практику заметно ускорились. Но в отчете Института медицины (Institute of Medicine) за 2003 г. обнаружено, что период между значимыми открытиями и началом их использо-вания в стандартной лечебной практике до сих пор составляет 17 лет [3, 4]. Такой долгий переход от знаний к клинической практике плохо влияет на стоимость и качество лечения пациентов. Общенациональная оценка 439 показателей каче-ства выявила, что только половина взрослых получает лечение, рекомендован-ное национальными стандартами США [5].

ВЛИЯНИЕ ИНФОРМАЦИОННОГО ВЗРЫВА В МЕДИЦИНЕ

Мы сталкиваемся с новой задачей вследствие стремительного роста открытий медицинских знаний, несмотря на существенные улучшения степени их внедре-ния. Более 18 миллионов статей уже внесены в каталоги биомедицинской ли-тературы, 800 тыс. из них появились в 2008 г. Скорость пополнения удва-ивается каждые 20 лет, и в 2012 г. коли-чество статей в год должно превысить 1 млн, как показано на рисунке 1.

Ввод всех этих новых медицин-ских знаний в практику является сложной задачей. Пятьсот лет назад Леонардо да Винчи мог быть худож-ником, инженером, музыкантом и ученым. Сто лет назад говорили, что терапевт должен знать практически все о медицине2. Сегодня обычный врач первой помощи должен знать примерно 10 тыс. заболеваний и син-дромов, 3 тыс. видов лечения и 1,1 тыс. лабораторных анализов [6]. По оценкам исследователей из библио-тек, терапевт только по одной специ-альности — эпидемиологии — дол-жен учиться 21 час в день только для того, чтобы не отставать от развития

17 www.medinfo.cam.ac.uk/miu/papers/Hanka/THIM/default.htm

Медицинские статьи, которые вносятся в каталог каждый год

Всег

о ст

атей

Год

РИСУНОК 1.

Количество биомедицинских статей, которые ежегодно вносятся в каталог, резко растет, и в 2012 г. должно превысить 1 млн.

Page 5: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 6160

Несмотря на то, что идеи о технологической сингулярности остаются проти-воречивыми3, авторы называют переломный момент, когда медицинские знания станут «текучими», и их поток из исследований в практику («от лабораторного стола до кровати») станет ровным и мгновенным, «сингулярностью здравоохра-нения».

ЧТО БУДЕТ ПОСЛЕ ДОСТИЖЕНИЯ СИНГУЛЯРНОСТИ ЗДРАВООХРАНЕНИЯ

20 мая 1999 г. Администрация США по пищевым продуктам и лекарственным веществам (U.S. Food and Drug Administration, FDA) признала лекарственный препарат Rofecoxib (Vioxx) безопасным и эффективным. 30 сентября 2004 г. ком-пания Merck отозвала его с рынка из-за подозрений о возможных побочных эф-фектах для сердечно-сосудистой системы. По оценкам FDA, за 5 лет нахождения этого препарата на рынке, rofecoxib стал причиной более 27 тыс. инфарктов или внезапных сердечных смертей и 140 тыс. случаев сердечной недостаточности [11]. Rofecoxib был одним из самых популярных лекарств, которые когда-либо отзывались; его принимали более 80 млн человек, образуя продажи на уровне 2,5 млрд долл. США в год4.

Сегодня следует ожидать, что после заявления FDA об отзыве этого препара-та с рынка пациенты будут извещены, а врачи немедленно пропишут альтерна-тивы. Но существующие каналы распространения информации задерживают такую реакцию. В мире сингулярного здравоохранения ситуация изменится. Для поддержки мгновенного перехода статьи журналов будут состоять не толь-ко из слов, но и из битов. Текст будет соединен с кодом, и статьи будут считаться полными только в том случае, если будут содержать алгоритмы.

С такой автоматизацией знаний каждый новый препарат будет проходить через каскад пострыночных исследований, которые будут независимо созда-ваться и изучаться ведущими учеными разных континентов (эффективная про-верка качества методом краудсорсинга). Подозрительные наблюдения будут отмечаться в реальном времени, небезопасные методы лечения будут общей волной удаляться из систем медицинских предписаний различных организаций и клиник. Взрыв биомедицинской информации станет, наконец, управляемым.

Другие сценарии распространения знаний также будут беспрепятственны-ми: врачи-резиденты смогут отказаться от справочников с перечнем медикамен-тов, которые они традиционно носили, и вместо них использовать клинические системы, которые персонализируют лечение с учетом региона на основании чувствительности к лекарствам, необходимая информация будет поступать в реальном времени из локальной микробиологической лаборатории и корректи-роваться в соответствии с профилем генома пациента.

Переход медицинских открытий в клиническуюпрактику: последние 2500 лет

Ангина

Артемизинин

Аутопсии

Карантин

Перевязки Анестезия

Цинга ПрививкаПослеродовой сепсис

Послеродовой сепсис

Хеликобактер

Лет д

о пе

рехо

да в

меди

цинс

кую

пра

ктик

уЛе

т до

пере

хода

в мед

ицин

скую

пра

ктик

у Последние 150 летЛет

Лет

ПастерРахит — солнечный свет

Антисептическаяповязка

Переливание крови

Рахит — питание Пенициллин Дородовые стероиды

Хеликобактер пилориНациональный институтмедицинской отчетности

Подробности указанного диапазона

2025год

РИСУНОК 2.

С момента появления первого отчета об ангине до его общего применения в медицине прошло 2300 лет, но современные открытия распространяются все быстрее и быстрее. Если рассма-тривать последние 150 лет, эта тенденция сохраняет свою линейность, приближаясь к оси при-мерно в 2025 г.

18 http://en.wikipedia.org/wiki/Technological_singularity19 http://en.wikipedia.org/wiki/Rofecoxib

Page 6: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 6362

и безопасностью, которое предлагает индивидуальные указания и рекомен-дации по здоровью, основанные на клинической экспертизе клиники Мейо, с использованием конфиденциальных данных о здоровье пациента из Microsoft HealthVault7. Что важно, новые медицинские знания и рекомендации могут при помощи компьютера вводиться в это приложение и практически мгновенно применяться к пациентам во всем мире.

Новая технология соединяет исследовательские лаборатории с клинической практикой. 28 апреля 2009 г. компания Microsoft объявила о выпуске Amalga Life Sciences, расширения линейки продуктов сбора данных для ученых и исследова-телей. С этим выпуском Microsoft предлагает масштабируемые решения «сбора и текучести данных», которые соединяют три аудитории: пациентов, поставщи-ков и исследователей. Такие компании, как Microsoft, работают над тем, чтобы данные и знания проходили по семантически взаимодействующей сети пациен-тов, поставщиков и исследователей. Эти усилия по обеспечению связи помогут добиться эффективного и мгновенного распространения медицинских знаний во всей системе здравоохранения. Сингулярность здравоохранения может стать дверью в новую Эру семантической медицины.

Мгновенный переход знаний в медицину не просто желателен, но и крайне важен. Он может быть — и, возможно будет — достигнут во время нашей жизни.

ССЫЛКИ

[1] F. Mosteller, «Innovation and evaluation», Science, vol. 211, pp. 881—886, 1981, doi: 10.1126/science.6781066.

[2] J. Lind, A Treatise of the Scurvy (1753). Edinburgh: University Press, reprinted 1953.[3] E. A. Balas, «Information Systems Can Prevent Errors and Improve Quality», J. Am.

Med. Inform. Assoc., vol. 8, no. 4, pp. 398—399, 2001, PMID: 11418547.[4] A. C. Greiner and Elisa Knebel, Eds., Health Professions Education: A Bridge to

Quality. Washington, D.C.: National Academies Press, 2003.[5] E. A. McGlynn, S. M. Asch, J. Adams, J. Keesey, J. Hicks, A. DeCristofaro, et al., «The

quality of health care delivered to adults in the United States», N. Engl. J. Med., vol. 348, pp. 2635—2645, 2003, PMID: 12826639.

[6] T. H. Davenport and J. Glaser, «Just-in-time delivery comes to knowledge management», Harv. Bus. Rev., vol. 80, no. 7, pp. 107—111, 126, July 2002, doi: 10.1225/R0207H.

[7] B. S. Alper, J. A. Hand, S. G. Elliott, S. Kinkade, M. J. Hauan, D. K. Onion, and B. M. Sklar, «How much effort is needed to keep up with the literature relevant for primary care?» J. Med. Libr. Assoc., vol. 92, no. 4, pp. 429—437, Oct. 2004.

[8] C. Lenfant, «Clinical Research to Clinical Practice — Lost in Translation?» N. Engl. J. Med., vol. 349, pp. 868—874, 2003, PMID: 12944573.

[9] H. D. Noyes, Specialties in Medicine, June 1865.

Поиск знаний также будет улучшен. Практикующие врачи получат доступ к высокопроизводительным и очень точным базам данных медицинских карт пациентов, чтобы предлагать профилактическое лечение, выявлять успешные шаблоны лечения [12, 13] и снижать число медицинских ошибок. Клинические врачи смогут создавать причинно-следственные гипотезы, выполнять виртуаль-ные клинические исследования для создания персональных планов лечения и моделировать сценарии, которые смогут исключить возникновение пандемий.

Заглядывая еще дальше — мгновенный поток знаний от исследовательских центров на передовую клинического лечения ускорит лечение и профилактику новых заболеваний. В тот момент, когда исследовательские лаборатории выявят эпитопы для вспышки новых заболеваний, синтезаторы протеина, ДНК, РНК и липидов, установленные в каждом крупном госпитале мира, получат инструк-ции по локальному синтезу вакцин или даже указания по терапии антителами для быстрого применения на пациентах, дистанционно переданные из цен-трального органа.

ДВИЖЕНИЕ К СИНГУЛЯРНОСТИ ЗДРАВООХРАНЕНИЯ

Такие компании, как Microsoft и Google, сейчас создают технологии, которые обеспечат текучесть данных и знаний. Microsoft HealthVault и Google Health — это расположенные в Интернете безопасные и частные «пользовательские обла-ка данных», где данные каждого клинического пациента могут быть получены от устройств и других информационных систем. Что важно — после того, как данные поступают в такие «облака пациента», они принадлежат пациенту. Па-циенты самостоятельно определяют, какие данные могут быть доступными, и кто может иметь к ним доступ.

В исследовании KLAS за февраль 2009 г. рассматривается новый класс ре-шений, предназначенных для сбора данных для здравоохранения. Такие реше-ния для организаций («облака данных компании») унифицируют данные сотен или тысяч различных систем (таких как MEDSEEK, Carefx, dbMotion, Medicity и Microsoft Amalga)5. Эти платформы начинают использоваться как каналы дан-ных для заполнения облаков данных пациентов. Свежий пример — канал связи между больничной системой сбора данных Amalga Пресвитерианского госпи-таля (Presbyterian’s hospital) Нью-Йорка и службой HealthVault его пациентов6. Данные практически мгновенно могут поступать из госпиталя к пациентам по-средством этих каналов связи.

Возникновение пользовательских облаков данных создает новые пути, кото-рыми медицинские знания могут непосредственно поступать к пациентам.

21 апреля 2009 г. клиника Мейо (Mayo Clinic) заявила о запуске собственного сервиса Health Advisory — онлайн-приложения с повышенной приватностью

22 www.microsoft.com/presspass/press/2009/apr09/04-21MSMayoConsumerSolutionPR.mspx

20 www.klasresearch.com/Klas/Site/News/PressReleases/2009/Aggregation.aspx21 http://chilmarkresearch.com/2009/04/06/healthvault-ny-presbyterian-closing-the-loop-on-care

Page 7: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ

ЧЕТВЕРТАЯ ПАРАДИГМА 65

ДЖОЭЛ РОБЕРТСОН, ДЕЛ ДЕХАРТ (JOEL ROBERTSON, DEL DEHART) Робертсоновский исследовательский институт (Robertson Research Institute)

КРИСТИН ТОЛЛЕ (KRISTIN TOLLE) ДЭВИД ХЕКЕРМАН (DAVID HECKERMAN) Microsoft Research

Предоставление медицинских услуг

в развивающихся странах: задачи и потенциальные

решения

Даже для стран с достаточно высокоразвитой техно-логической инфраструктурой актуально развитие интеллектуальной информатики здравоохранения для решения проблемы сокращения затратности и

повышения качества здравоохранения. Большая часть медицинских знаний и информации остается в бумаж-ной форме, и даже будучи оцифрованной, эта информация зачастую попадает в различные наборы данных и хранилища в произвольных форматах. Обмен данными не распространен и часто нарушается из-за невозможности безопасной деиден-тификации для сохранения конфиденциальности пациента. Все эти проблемы мешают собирать и анализировать данные, которые могли бы улучшить прогностическую и профилак-тическую медицину.

Развивающиеся страны сталкиваются с такими же про-блемами, а кроме них — с воздействием экономических и геополитических ограничений, транспортными и географи-ческими барьерами, недостатком кадров и инфраструктуры. Простые и очень действенные меры, такие как универсальные прививки для детей и материнский уход за детьми, затрудня-ются слабыми системами мониторинга и отчетности. В недав-ней статье журнала Lancet, написанной группой Кристофера Мюррея (Christopher Murray), говорится о том, что «охват

[10] R. Kurzweil, The Singularity Is Near: When Humans Transcend Biology. New York: Penguin Group, 2005, p. 136.

[11] D. J. Graham, D. Campen, R. Hui, M. Spence, C. Cheetham, G. Levy, S. Shoor, and W. A. Ray, «Risk of acute myocardial infarction and sudden cardiac death in patients treated with cyclo-oxygenase 2 selective and non-selective non-steroidal anti-inflammatory drugs: nested case- control study», Lancet, vol. 365, no. 9458, pp. 475—481, Feb. 5—11, 2005.

[12] C. Plaisant, S. Lam, B. Shneiderman, M. S. Smith, D. Roseman, G. Marchand, M. Gillam, C. Feied, J. Handler, and H. Rappaport, «Searching Electronic Health Records for temporal patterns in patient histories: A case study with Microsoft Amalga», Proc. Am. Med. Inform. Assoc., Washington, D.C., Nov. 2008.

[13] T. Wang, C. Plaisant, A. Quinn, R. Stanchak, B. Shneiderman, and S. Murphy, «Aligning temporal data by sentinel events: Discovering patterns in electronic health records», Proc. ACM CHI2008 Human Factors in Computing Systems Conference, ACM, New York, Apr. 2008, pp. 457—466, doi: 10.1145/1357054.1357129.

Page 8: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 6766

ваний. Многие системы работают только с одним заболеванием и не очень легко подстраиваются под регион — например, местный язык, положения и процессы. «Приближение» относится к возможности системы собирать информацию и со-поставлять ее для одного конкретного человека.

В большинстве систем рассматривается обобщенный пациент, они не улав-ливают уникальных характеристик, которые могут быть эффективными для индивидуального лечения.

На предмет увеличения масштаба система NxKM тестировалась в Индии, Конго, Доминиканской республике, Гане и Ираке. Она также тестировалась в бедных районах с низким уровнем медицинского обслуживания в США. При консультации с экспертами по масштабированию баз данных архитектура была рассчитана на объединение множества индивидуальных баз данных с деиденти-фицированной центральной базой данных, что в принципе дает неограничен-ные варианты масштабирования.

Для уменьшения масштаба для работы с различными типами заболеваний и его увеличения для предоставления точных индивидуальных диагнозов требу-ется огромное количество знаний. Например, INTERNIST-1, экспертная система диагноза во внутренней медицине, содержит около 250 тыс. связей с примерно 600 заболеваниями и 4 тыс. результатов [3]. Мы собрали вместе медицинскую ли-тературу, информацию справочников и рекомендации экспертов для создания растущей базы данных для NxKM, которая на сегодня насчитывает более 1 тыс. заболеваний и более 6 тыс. результатов, основываясь на ранних работах одного из нас (Хекермана), который разработал эффективные методы оценки и пред-ставления экспертных медицинских знаний посредством Байесовской сети [4]. Система также может «приближаться», обеспечивая очень подробный сбор дан-ных. Каждый результат в отдельной медицинской карте или в отдельном случае диагностики может отслеживаться. Такой уровень подробности обеспечивает уникальную гибкость в определении факторов, относящихся к результатам и точности диагностики.

С точки зрения масштабирования на регион, существующие в развивающих-ся странах задачи крайне разнообразны и зависят от специфических для региона условий медицины. Например, заболевание, которое часто встречается в одном регионе, может практически не встречаться в другом. В то время как основан-ные на правилах экспертные системы требуют полного перепроектирования для каждого региона, основанная на сетях вероятностного подобия [4] модуль-ная природа базы знаний NxKM дает возможность быстрой настройки под каж-дый регион. В текущей версии NxKM используются региональные приоритеты, основанные на оценках экспертов. Она также может обновлять приоритеты для каждого региона по мере практического использования. NxKM также содержит модульную систему, которая упрощает настройку к терминам, видам лечения и языкам, привычным для каждого региона. Если информация для конкретного региона неизвестна или недоступна, до момента сбора или определения таких данных используется стандартный модуль.

вакцинации прогрессирует медленно и не до того уровня, который ожидался по официальным оценкам ВОЗ и ЮНИСЕФ. Существует острая необходимость в неза-висимом и контролируемом мониторин-ге показателей здоровья в эру глобальных инициатив, с целевой направленностью и финансированием в соответствии с про-изводительностью» [1].

Кроме того, в последнем отчете ООН по Целям развития тысячелетия (Millennium Development Goals) отме-чается, что «пневмония убивает больше детей, чем любое другое заболевание, и при этом в развивающихся странах доля детей в возрасте до 5 лет с подозрением на пневмонию, которые поступают на лечение, сохраняется очень низкой» [2]. Предоставление в необходимых местах

надежной поддержки сбора данных и принятия решений по диагностике от са-мых квалифицированных из доступных специалистов — это цель общественных усилий в здравоохранении, но инструменты для ее реализации были дорогосто-ящими, недоступными и не имели поддержки.

Ниже мы сосредоточимся на задачах предоставления медицинских услуг в развивающихся странах и опишем созданную нами для их решения технологию, которая опирается на компьютеры и мобильные телефоны. В центре этой техно-логии находится NxOpinion Knowledge Manager1 (NxKM), которая разрабатыва-лась Робертсоновским исследовательским институтом с 2002 г. Эта медицинская платформа включает в себя медицинские знания, собранные большой командой экспертов в США и развивающихся странах, диагностический механизм на ос-нове Байесовских сетей и мобильные телефоны для взаимодействия с конечным пользователем.

ИЗМЕНЕНИЕ МАСШТАБА И ПРИБЛИЖЕНИЕ

Ограничения масштабирования являются одним из крупнейших барьеров для развертывания систем поддержки принятия решений и электронных медицин-ских карт. Термин «увеличение масштаба» относится к возможности системы поддерживать крупные базы данных — охватывающие сотни тысяч или мил-лионы людей. «Уменьшение масштаба» относится к возможности системы рабо-тать в нескольких странах и регионах, а также с ограниченным набором заболе-

Индийские врачи используют медицин-скую платформу NxOpinion.

1 www.nxopinion.com/product/knowledgemng

Page 9: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 6968

рование этой системы с врачами в сельских районах Индии. Кроме предоставле-ния рекомендаций по лечению для врачей решение с телефоном и центральным ПК может использоваться для создания портативных личных медицинских карт.

Одна из наших партнерских организаций, Программа ежегодного отчета о здоровье школьников (School Health Annual Report Programme, SHARP), бу-дет использовать эту систему для наблюдения за более чем 10 млн индийских школьников в 2009 г., создавая уникальную виртуальную медицинскую карту для каждого ребенка.

Другим преимуществом этого метода является то, что данные, собранные этой системой, могут использоваться для улучшения базы знаний NxKM. На-пример, как говорилось выше, информация о преобладании специфических заболеваний региона важна для точной медицинской диагностики. Особенно важна своевременная информация о вспышках заболеваний в конкретном ре-гионе. При использовании клинического приложения подтвержденные случаи заболевания, включая относящиеся к новой вспышке, немедленно поступают в NxKM. Кроме того, можно централизованно контролировать индивидуальные диагнозы. Если загруженные результаты отдельного пациента будут признаны неточными, пациент может быть идентифицирован для дальнейшего контроля.

ИНТЕРФЕЙС ПОЛЬЗОВАТЕЛЯ

Проблема мобильной технологии — очень ограниченный интерфейс пользова-теля и сложность ввода данных при помощи относительно маленького экрана и клавиатуры. Наша система упрощает этот процесс несколькими способами. Во-первых, в системе предварительно заполняются общие результаты для от-дельного местоположения (например, факты о конкретной деревне). Также, как говорилось выше, система может выдавать вопросы — с несколькими вари-антами ответа — после ввода только базовой информации, такой как основная жалоба больного. Кроме того, вопросы могут подстраиваться под организацию, местоположение или уровень знаний врача.

Так как пользователи часто меняют телефоны, важно, чтобы интерфейс пользователя был независимым от оборудования. Наше приложение интерфей-са установлено на платформе среднего уровня, которую мы внедрили для мно-жества устройств.

Кроме простого ввода, интерфейс обеспечивает простой доступ к важной информации. Например, он предоставляет ежедневную сводку по пациентам, требующим внимания, включая их диагноз, адрес в деревне и предыдущих вра-чей, к которым они обращались.

РЕШЕНИЯ ДЛЯ ОБМЕНА ДАННЫМИ

Даже вне унаследованных хранилищ данных (таких как EPIC и CERNER [5]) все еще сохраняются препятствия для обмена важными медицинскими данными — включая вопросы конфиденциальности и независимости. Доступность данных

ТОЧНОСТЬ И ЭФФЕКТИВНОСТЬ ДИАГНОСТИКИ

Исследования показывают, что даже высококвалифицированные терапевты переоценивают точность своей диагностики. По недавним оценкам Института медицины, от 44 тыс. до 98 тыс. смертей, которых можно было избежать, про-изошли по вине врачебных ошибок, большая часть которых заключалась в не-правильно поставленном диагнозе [5]. В развивающихся странах совокупность проблем неправильных диагнозов и недостатка данных не только снижают каче-ство медицинского обслуживания, но и приводят к недостаточному выявлению заболеваний и неправильным оценкам и планированию здоровья населения.

И опять, основываясь на диагностической методологии сетей вероятност-ного подобия [4], для выдачи точных диагнозов NxKM использует Байесовский механизм оценки. Важным компонентом этой системы, дающим повышенную точность, является возможность задавать пользователю дополнительные вопро-сы для сужения круга возможных диагнозов. NxKM может запрашивать у поль-зователя дополнительные данные на основании расчета ценности информации (например, функции затрат) [4]. Также для клинического использования важна возможность определения степени уверенности в диагнозе (то есть вероятности наиболее подходящего диагноза). Такое определение особенно полезно для ме-нее опытных пользователей системы, что важно для лечения больных в развива-ющихся регионах, где глубокие медицинские знания встречаются редко.

ПОСЛЕДНЯЯ МИЛЯ

Другой ключевой задачей является выполнение диагностики там, где она боль-ше всего необходима. Мобильные телефоны — это естественный выбор ввиду их распространенности в развивающихся странах. На самом деле, во множестве таких регионов доступ к мобильной связи намного выше, чем к чистой воде. На-пример, согласно рыночной базе данных Wireless Intelligence2, 80% населения земли в 2008 г. находились в зоне покрытия сети мобильной связи. И показате-ли Международного союза телекоммуникаций (International Telecommunication Union)3 говорят о том, что к концу 2006 г. 68% мировых подписок на услуги мо-бильной связи были в развивающихся странах. Более свежие данные Между-народного союза телекоммуникаций показывают, что в период с 2002 по 2007 г. подписки на услуги мобильной связи были самой быстрорастущей сферой телекоммуникаций в мире, и рост на душу населения был самым быстрым в развивающемся мире4. Поэтому мы разработали систему, в которой мобильные телефоны используются для доступа к центральной базе знаний NxKM и диа-гностическому механизму, установленному на ПК. Сейчас мы проводим тести-

2 www.wirelessintelligence.com3 www.itu.int4 www.itu.int/ITU-D/ict/papers/2009/7.1%20teltscher_IDI%20India%202009.pdf

Page 10: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 7170

может ограничиваться регионально (например, в Индии и ЮАР), организаци-ями (например, Всемирной организацией здравоохранения, World Vision или фармацевтическими компаниями) или поставщиками (например, страховыми компаниями и группами поставщиков медицинских услуг).

Каждый из этих наборов данных содержит огромную ценность для обще-ственного здоровья, и следует предпринять усилия для преодоления барьеров сбора данных в общие и деидентифицированные глобальные наборы. Такие пу-бличные наборы данных, являясь ценными самими по себе, также добавляют ощутимую ценность для собственных наборов данных, предоставляя ценный общий контекст.

NxKM импортирует, управляет и экспортирует данные через публичные наборы. Эти процессы позволяют различным заинтересованным группам (пра-вительствам, организациям здравоохранения, поставщикам услуг первичной медицинской помощи, небольшим больницам, лабораториям, поставщикам специальных услуг и страховщикам) использовать общую интерактивную де-идентифицированную (сохраняющую конфиденциальность) базу данных, при этом сохраняя контроль над собственными и защищенными данными.

ВЗГЛЯД В БУДУЩЕЕ

Но некоторые задачи еще не решены. Хотя врачи с полным медицинским об-разованием сразу могут использовать такие инструменты наборов данных и поддержки диагностики, другие врачи, такие как Аккредитованные активисты общественного здоровья (Accredited Social Health Activists, ASHA) и другие сель-ские работники зачастую неграмотны или общаются только на местном диалек-те. Мы исследуем два потенциальных решения — первое использует технологию распознавания речи, а второе позволяет отвечать пользователям на вопросы с вариантами ответов при помощи цифровой клавиатуры телефона. Распознава-ние речи дает дополнительную гибкость ввода, но — по крайней мере, сейчас — для него требуется обучение под каждого конкретного пользователя.

Другой задачей является уникальная и повторяемая идентификация пациен-та — проверка того, что личность человека, получающего лечение, определена правильно — притом, что в большинстве регионов с недостатками медицинско-го обслуживания стандартной системы идентификации не существует. Распоз-навание речи в комбинации с распознаванием лица и новыми методами био-метрики, вместе с подтверждением местоположения при помощи GPS, может помочь подтвердить, что лечение получает именно тот пациент, которому оно требуется.

Другое препятствие — целостность данных. Например, большинство сель-ских жителей заявляют о диагнозах, не подтвержденных квалифицированным медицинским персоналом, которые могут быть ошибочными. Мы старались устранить эту проблему за счет использования механизма логического вывода, который позволяет понижать размерность неподтвержденных сведений.

Инновационный метод NxOpinion при помощи искусственного интеллекта показывает данные, когда вы хотите их видеть, в удобной для вас форме и на нужном устройстве.

Page 11: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 7372

рать и быстро распространять подтвержденные данные, сможет спасти миллио-ны жизней. Ответы на запросы могут стать практически мгновенными, и, таким образом, привести к определению устойчивости к лекарствам, возникновения заболеваний и эффективного лечения всего лишь за доли того времени, которое эти процессы занимают сейчас. Потенциал усиления медицинских работников в развивающихся странах при помощи глобальной системы диагностики и баз данных — просто грандиозный.

ССЫЛКИ

[1] S. S. Lim, D. B. Stein, A. Charrow, and C. J. L. Murray, «Tracking progress towards universal childhood immunisation and the impact of global initiatives: a systematic analysis of three-dose diphtheria, tetanus, and pertussis immunisation coverage», Lancet, vol. 372, pp. 2031—2046, 2008, doi: 10.1016/S0140-6736(08)61869-3.

[2] The Millennium Development Goals Report. United Nations, 2008.[3] R. A. Miller, M. A. McNeil, S. M. Challinor, F. E. Masarie, Jr., and J. D. Myers, «The

Internist-1/ Quick Medical Reference Project—Status Report», West. J. Med. vol. 145, pp. 816—822, 1986.

[4] D. Heckerman. Probabilistic Similarity Networks. Cambridge, MA: MIT Press, 1991.[5] L. Kohn, J. Corrigan, and M. Donaldson, Eds. To Err Is Human: Building a Safer

Health System. Washington, D.C.: National Academies Press, 2000.[6] C. Dwork and K. Nissim, «Privacy-Preserving Datamining on Vertically Partitioned

Databases», Proc. CRYPTO, 2004, doi: 10.1.1.86.8559.

Развертывание систем, способных работать в любой точке мира, может при-вести к созданию большого количества информации о пациентах. Хранение, со-вмещение и затем доступ к этой информации на местах, при сохранении ее кон-фиденциальности и безопасности, является исключительно трудной задачей, когда количество пациентов исчисляется миллионами (а не десятками тысяч, как в большинстве существующих систем медицинской информации). Кроме того, остается сложной задачей ввод проверенных данных такого масштаба об-ратно в систему для улучшения возможности прогноза с сохранением возмож-ности анализа получением отдельных сегментов (поиск информации).

И последним, возможно, самым большим препятствием является отсут-ствие взаимодействия. Если организации, правительства и компании захотят использовать общую деидентифицированную глобальную базу данных, при этом защищая и сохраняя права на собственную базу данных, медицина и здра-воохранение останутся в выигрыше. Унифицированная база данных, дающая возможность интеграции среди различных систем мониторинга и оценки и баз данных, должна помочь в быстром и эффективном определении устойчивости к лекарствам, в предупреждении вспышек заболеваний, а также в мониторинге эффективности лечения и медицинского вмешательства. Глобальная база дан-ных должна поддерживать запросы, которые защищают от идентификации лю-дей и при этом предоставляют достаточно информации для анализа и проверки. Такие технологии уже появляются (например, [6]), но сохраняется сложность за-дачи поиска системы поощрения для такого сотрудничества.

РЕЗЮМЕ

Мы разработали и начинаем внедрять систему сбора, анализа и передачи меди-цинских знаний и данных в развивающихся странах. Эта система имеет сервер, на котором содержатся медицинские знания и данные, с возможностью диа-гностики в реальном времени, и клиентскую часть на мобильном телефоне для медицинских работников на местах. Мы уверены, что такая система улучшит медицинские услуги в развивающихся странах за счет более качественных диа-гнозов, наборов более точных и своевременных данных по множеству людей, и улучшенного распространения точных и своевременных медицинских знаний и информации.

Если мы задумаемся о том, как мир объединенных медицинских карт может быть использован для улучшения медицины, мы увидим, что потенциальное влияние очень велико. Зная практически каждого человека, его заболевания и местоположение, при улучшении целостности данных и сбора данных в цен-тральное хранилище мы сможем совершить революцию в медицине, а может быть, и истребить большую часть болезней. Такая глобальная система может от-слеживать влияние различных гуманитарных усилий и тем самым приспосабли-вать их, курсы лечения и ресурсы для конкретных регионов. Мы надеемся, что система, которая сможет ставить высококачественные диагнозы, а также соби-

Page 12: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ

ЧЕТВЕРТАЯ ПАРАДИГМА 75

ДЖЕФФ В. ЛИХТМАН (JEFF W. LICHTMAN) Р. КЛЕЙ РЕЙД (R. CLAY REID) ГАНС ПЕТЕР ФИСТЕР (HANS PETER PFISTER) Гарвардский университет (Harvard University)

МАЙКЛ Ф. КОЭН (MICHAEL F. COHEN) Microsoft Research

Изучение принципиальной схемы мозга

Центр наших когнитивных способностей — мозг — возможно, самая сложная загадка всей биологии. Каждую секунду в человеческом мозгу миллиарды корковых нервных клеток передают миллиарды

сообщений и выполняют сверхсложные расчеты. Как работает мозг — как его функции следуют за его структу-рой — остается тайной.

Огромное количество нервных клеток мозга соединены синапсами в цепи неимоверной сложности. В общем пред-полагается, что специфика этих соединений является осно-вой нашей возможности воспринимать и классифицировать объекты, нашего поведения, как приобретенного (например, игра на пианино), так и врожденного (например, ходьба), и памяти — не считая управления низкоуровневыми функци-ями, такими как сохранение позы и даже дыхание. На самом высоком уровне наши эмоции, наше самоощущение, само наше сознание полностью являются результатом действия на-шей нервной системы.

На макроуровне человеческий мозг состоит из участков, которые приблизительно можно связать с определенными видами деятельности. Но на самом деле в выполнении одной задачи часто используется несколько частей мозга. Эта слож-ность возникает в первую очередь из-за того, что большинство действий начинается с сигнала органов чувств, после которо-го происходит анализ, принятие решения и, в конце концов, само действие или моторика.

На микроскопическом уровне мозг состоит из миллиар-дов нейронов, каждый из которых соединен с другими ней-ронами несколькими тысячами синаптических связей. У нас нет подробной принципиальной схемы мозга человека или

Page 13: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 7776

для выявления мельчайших деталей соединений нервных клеток. Но для со-ставления карты цепей необходимо преодолеть технический барьер: ЭМ обыч-но отображает очень тонкие участки (толщиной в десятые нанометра), поэтому для реконструкции объема требуется «последовательная реконструкция», где информация изображения из смежных сечений одного объема реконструиру-ется в объемный набор данных. Существует несколько методов получения таких объемных данных (см., например, [3-5]), но все они имеют потенциал создания очень объемных библиотек данных цифровых изображений, как описано далее.

НЕКОТОРЫЕ ЦИФРЫ

Для того, чтобы реконструировать при помощи ЭМ все синаптические цепи в 1 кубическом миллиметре мозга (объем, который мог бы поместиться на острие иглы), потребуется набор последовательных изображений на миллиметр в глу-бину. Для получения всех ветвлений аксонов и дендритов потребуется секцио-нирование на уровне, возможно, не более 30 нм. Таким образом, для глубины в 1 мм потребуется 33 тыс. изображений. Чтобы рассмотреть все типы везикул (источник нейротрансмиттеров) и синапсов, каждое изображение должно иметь поперечное разрешение не менее 10 нм. Изображение одного миллиметра ква-дратного с разрешением 5 нм — это изображение с ~4 x1010 пикселями или 10 - 20 гигапикселями. Таким образом, данные изображения в 1 кубическом миллиме-тре будут находиться в пределах 1 петабайта 1 (250 ~ 1 000 000 000 000 000 байт). Человеческий мозг содержит около 1 млн. мм3 нервной ткани.

СЕГОДНЯШНИЕ УСПЕХИ

При такой пугающей задаче хочется опустить руки и найти более простую про-блему. Однако новые технологии и техники дают проблеск надежды. Мы ис-пользуем их с конечной целью создания полной принципиальной схемы мозга. Для этой цели потребуется интенсивное и масштабное сотрудничество биоло-гов, инженеров и компьютерных ученых.

Три года назад лаборатории Рейда (Reid) и Лихтмана (Lichtman) начали работать над методами автоматизации и ускорения крупномасштабных после-довательных сечений ЭМ. Фокусируясь конкретно на крупных объемах коры головного мозга в высоком разрешении, группа Рейда сконцентрировалась на высокой производительности и процессах с высокой степенью автоматизации. Пока их работа была опубликована только в абстрактной форме [3], но они уве-рены, что в ближайшем времени получат первые 10 терабайт объемных данных по анатомии мозга в большом разрешении. Физиологические эксперименты те-перь могут показать функцию практически каждого нейрона в кубе размером 300 мкм. Новые данные ЭМ обладают разрешением, способным показать прак-тически каждый аксон, дендрит и синапс — физические связи, обеспечивающие функцию нейронов.

любого другого млекопитающего, хотя о существовании таких синаптических цепей знали более века назад. На самом деле составить карту нервных контуров пытались всего лишь раз, и это было двадцать лет назад с маленьким червем, ко-торый имеет всего 300 нервных клеток. Основным камнем преткновения являет-ся огромная техническая сложность, связанная с составлением подобной карты. Но недавние технологические прорывы в визуализации, компьютерных науках и молекулярной биологии позволяют снова заняться этой проблемой. Однако даже при наличии принципиальной схемы нам нужно знать, какие сообщения проходят по нейронам этой цепи — подобно тому, как прослушиваются сигналы в компьютерном чипе. Это является вторым барьером для понимания: традици-онные методы физиологии позволяют нам прослушивать только очень малую часть нервов этой цепи.

Чтобы понять масштабы проблемы, представьте себе кору головного мозга человека, которая содержит более 160 триллионов синаптических связей. Эти соединения проходят от миллиардов нейронов. Каждый нейрон имеет синапти-ческие связи с сотнями или даже тысячами различных нейронов, и каждый от-правляет информацию по синапсам к аналогичному числу целевых нейронов. Такой огромный коэффициент объединения по входу и выходу может возникать потому, что каждый нейрон имеет сложное геометрическое строение со множе-ством процессов приема (дендриты) и одним очень разветвленным исходящим процессом (аксон), который может простираться на достаточно большие рассто-яния.

Можно надеяться на возможность обратного проектирования цепей голов-ного мозга. Другими словами, если мы научимся прикасаться только к отдель-ным нейронам и видеть их связи и прочность таких связей, мы сможем как мини-мум начать получать инструменты для расшифровки функций отдельной цепи. Огромное количество и сложные формы клеток являются не единственным аспектом этой проблемы. Цепи, соединяющие нервные клетки, имеют наномас-штаб. Плотность синапсов в коре головного мозга составляет около 300 млн на кубический миллиметр.

Функциональная магнитно-резонансная томография (фМРТ) предоставля-ет возможность краткого обзора работы мозга в макроскопическом объемном виде. Но самое высокое разрешение фМРТ составляет около 1 мм3 на воксел — в этом кубическом миллиметре может содержаться 300 млн синапсов. Таким об-разом, даже в самых подробных функциональных изображениях человеческо-го мозга содержится огромное количество цепей. Кроме того, размер этих си-напсов слишком мал для ограниченных дифракцией разрешения стандартных технологий оптического получения изображений.

Составление карты цепей потенциально может подвергаться анализу при помощи цветовой кодировки нейронных процессов [1] и использования техник, не ограниченных дифракцией [2]. В настоящее время золотым стандартом для анализа синаптических связей является использование электронной микроско-пии (ЭМ), нанометрического (нм) разрешения которой более чем достаточно

Page 14: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 7978

Разделение и отслеживание отдельных нейронов в общем объеме остается ак-туальной проблемой. Однако определенные успехи достигнуты при помощи эк-зотических средств. Лаборатория Лихтмана нашла метод выражения различных комбинаций красного, зеленого и синего флуоресцентного протеина в создан-ной генной инженерией мыши. Эти случайные комбинации сейчас предоставля-ют около 90 цветов или их комбинаций [1]. При помощи этого метода можно от-слеживать отдельные нейроны с их разветвлением к возможным синаптическим связям с другими нейронами или конечным органам в мускулах. Маркирован-ные различными цветами нервы (процесс «мозговой дуги» (brainbow)), показан-ные на рисунке 1, похожи на разноцветные провода в компьютере и служат для той же цели: маркировка проводов, идущих на большие расстояния.

Так как эти цветные метки присутствуют в живой мыши, можно отслеживать изменения синаптических связей, наблюдая одни и те же участки несколько раз в течение минут, дней или даже месяцев.

Лаборатория Рейда смогла разметить нейроны зрительной коры крысы и кошки таким образом, что они «загораются» при активации. Стимулируя кошку линиями различной ориентации, они буквально могут видеть, какие нейроны включаются, в зависимости от конкретных визуальных стимулов. Сравнивая ор-ганизацию зрительной коры у крысы и у кошки, они обнаружили, что в то время как нейроны крысы кажутся случайно организованными на основании визуаль-ных стимулов, нейроны кошки имеют различимую структуру (см. рис. 2).

Для достижения максимального разрешения при помощи ЭМ требуется со-здание изображений очень тонких срезов нервной ткани.

Один метод начинается с блока ткани; после каждого прохода создания изображения из блока удаляется тонкий срез, после чего процесс повторяется. Исследователи группы Лихтмана в Гарварде разработали новое устройство —

подобие высокотехнологичного токарного станка, который они называют Авто-матическим лентосборочным токарным станком-ультрамикротомом (Automatic Tape-Collecting Lathe Ultramicrotome, ATLUM), способного обеспечивать эффек-тивное создание изображений в наномасштабе на больших объемах ткани. (См. рис. 3 на следующей странице).

ATLUM [3] автоматически разделяет установленный блок мозговой ткани на тысячи сверхтонких сечений и собирает их на длинной покрытой углеродом ленте для последующей маркировки и построения изображений в сканирую-щем электронном микроскопе (СЭМ). Так как процесс полностью автомати-зирован, объемы размером в десятки кубических миллиметров — достаточно большие для охвата целых нейронных цепей нескольких участков — могут быть быстро и точно сокращены до ленты со сверхтонкими сечениями. Изображения СЭМ таких полученных на ATLUM сечений могут иметь поперечные разреше-ния в 5 нм и выше — что достаточно для построения изображений отдельных синаптических везикул, а также определения и отслеживания всех связей в цепи.

РИСУНОК 1.

Изображения «мозговой дуги» с различными нейронами, флуоресцирующими разными цветами. Наблюдая за нейронами в группах срезов, мы можем отслеживать сложную структуру ветвле-ния каждого нейрона для создания древовидных структур на рисунке справа.

РИСУНОК 2.

Нейроны зрительной коры отмечены на живом организме при помощи чувствительного к кальцию красителя. Слева: Трехмерная реконструкция тысяч нейронов зрительной коры кры-сы, полученная из группы изображений (300 мкм сбоку). Нейроны имеют цветовую кодировку в соответствии с ориентацией зрительного стимула, который их возбудил в большей степени. Посередине: Двухмерное изображение плоскости сечения изображения слева. Нейроны, отреаги-ровавшие на различную ориентацию стимула (разные цвета) кажутся произвольно расположен-ными в коре. Вставка: Цветовая кодировка ориентации стимула. Справа: Для сравнения — зри-тельная кора кошки крайне упорядочена. Нейроны, отреагировавшие на различные ориентации стимула, разделены с удивительной точностью. Это изображение представляет собой полную трехмерную функциональную карту более чем 1000 нейронов в объеме зрительной коры разме-ром 300x300x200 мкм [6, 7].

Page 15: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 8180

Тонкие срезы — это изображения одного небольшого участка за один раз. После получения серии отдельных изображений, они должны быть сшиты в очень крупные изображения, и по возможности собраны в объеме.

В Microsoft Research продолжаются работы по сшиванию и последующему интерактивному просмотру изображений с миллиардами пикселей1.

После организации таких гигапиксельных изображений в иерархическую пирамиду приложение HD View может передавать запрошенные изображения через Интернет для просмотра2. Это дает возможность исследования деталей в большом и малом масштабах. На рис. 4 показан анализ результата.

После получения и сшивания изображений множественные срезы образца необходимо собрать для получения согласованного объема. Возможно, самой сложной задачей на этом этапе является извлечение отдельных ветвей нейронов. В Гарварде ведутся работы по предоставлению интерактивных инструментов для выделения отдельных «процессов» с последующим их отслеживанием меж-ду срезами для выявления каждого дендрического или аксонового волокна [8, 9] (см. рис. 5). Синаптические связи находить автоматически еще сложнее; однако

Нож движется вперед

Эта лента ткани собирается погру-женным ленточным конвейером

Образец вращается

Эти синхронизированные движения дают спиральный рез в блоке ткани, обеспечивая постоянную ленту ткани в водяной емкости ножа

Уровень воды ножа регулируется этой впускной трубкой

РИСУНОК 3.

Автоматический лентосборочный токарный станок-ультрамикротом (ATLUM), обеспечива-ющий эффективное создание изображений в наномасштабе для крупных объемов ткани.

РИСУНОК 5.

NeuroTrace позволяет неврологам интерактивно исследовать и разделять нервные процессы в данных ЭМ с высоким разрешением.

1 http://research.microsoft.com/en-us/um/redmond/groups/ivm/ICE2 http://research.microsoft.com/en-us/um/redmond/groups/ivm/HDView

РИСУНОК 4.

HD View позволяет интерактивно исследовать это 2,5-гигапик-сельное изображение. Слева: Срез нервной ткани. Большое серое образование по центру — это ядро нейрона. Посередине: При-ближенный капиллярный и миелинизированный аксон Справа: Приближенные миелиновые слои, окружающие поперечное сечение аксона. Снизу: Увеличенное изображение тонких везикул, окружа-ющих синаптическую связь между очень мелкими структурами.

Page 16: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ

ЧЕТВЕРТАЯ ПАРАДИГМА 83ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ82

развитие интерфейсов пользователя и компьютерного зрения дают надежду на то, что весь процесс может стать управляемым.

Расшифровка полной принципиальной схемы человеческого мозга представ-ляет собой одну из величайших задач 21 века. Продвижения на биологическом и техническом уровне определенно приведут к новым успехам и открытиям и скорее всего они помогут ответить на фундаментальные вопросы о том, как наш мозг мечтает или думает.

ССЫЛКИ

[1] J. Livet, T. A. Weissman, H. Kang, R. W. Draft, J. Lu, R. A. Bennis, J. R. Sanes, and J. W. Lichtman, «Transgenic strategies for combinatorial expression of fluorescent proteins in the nervous system» Nature, vol. 450, pp. 56–62, 2007, doi: 10.1038/nature06293.

[2] S. Hell, «Microscopy and its focal switch» Nature Methods, vol. 6, pp. 24–32, 2009, doi: 10.1038/ NMeth.1291.

[3] D. Bock, W. C. Lee, A. Kerlin, M. L. Andermann, E. Soucy, S. Yurgenson, and R. C. Reid, «High- throughput serial section electron microscopy in mouse primary visual cortex following in vivo two-photon calcium imaging» Soc. Neurosci. Abstr., vol. 769, no. 12, 2008.

[4] W. Denk and H. Horstmann, «Serial block-face scanning electron microscopy to reconstruct three-dimensional tissue nanostructure» PLoS Biol., vol. 2, p. e329, 2004, doi: 10.1017/ S1431927606066268.

[5] K. J. Hayworth, N. Kasthuri, R. Schalek, and J. W. Lichtman, «Automating the Collection of Ultrathin Serial Sections for Large Volume TEM Reconstructions» Microsc. Microanal., vol. 12, pp. 86–87, 2006.

[6] K. Ohki, S. Chung, Y. H. Ch’ng, P. Kara, and R. C. Reid, «Functional imaging with cellular resolution reveals precise microarchitecture in visual cortex» Nature, vol. 433, pp. 597–603, 2005, doi:10.1038/nature03274.

[7] K. Ohki, S. Chung, P. Kara, M. Hübener, T. Bonhoeffer, and R. C. Reid, «Highly ordered arrangement of single neurons in orientation pinwheels» Nature, vol. 442, pp. 925–928, 2006, doi:10.1038/nature05019.

[8] W. Jeong, J. Beyer, M. Hadwiger, A. Vazquez, H. Pfister, and R. Whitaker, «Scalable and Interactive Segmentation and Visualization of Neural Processes in EM Datasets» IEEE Trans. Visual. Comput. Graphics, Oct. 2009.

[9] A. Vazquez, E. Miller, and H. Pfister, «Multiphase Geometric Couplings for the Segmentation of Neural Processes» Proceedings of the IEEE Conference on Computer Vision Pattern Recognition (CVPR), June 2009.

На пути к компьютерному микроскопу

для нейробиологии

Хотя нейробиология развивается большими шагами, мы до сих пор не понимаем, как симфония связей между нейронами приводит к богатому и осознан-ному поведению животных. Как местные взаимо-

действия между нейронами сливаются в поведенческую ди-намику нервных систем, давая животным их впечатляющие возможности чувствовать, учиться, принимать решения и действовать в окружающем мире? Множество подробностей остается под покровом тайны. Новые знания появятся благо-даря применению вычислительных методов, в особенности машинного обучения и процедур логического вывода, для создания объяснительных моделей из данных о действиях по-пуляций нейронов.

НОВЫЕ ИНСТРУМЕНТЫ ДЛЯ НЕЙРОБИОЛОГОВ

Большую часть истории электрофизиологии, нейробиоло-ги отслеживали свойства мембран нейронов позвоночных и беспозвоночных животных при помощи стеклянных микро-пипеток, заполненных проводящим раствором. Овладевая техниками, которые могли бы впечатлить даже лучших ча-совщиков, нейробиологи изготовили стеклянные электроды с наконечниками диаметром зачастую меньше микрона, и использовали специальные машины для проведения наконеч-ников в тело клетки отдельных нейронов — надеясь, что ней-роны будут работать так же как и в более крупных группах. Этот метод предоставил данные о напряжениях мембраны и потенциале действий отдельной или нескольких клеток.

ЭРИК ГОРВИЦ (ERIC HORVITZ) Microsoft Research

УИЛЬЯМ КРИСТЕН (WILLIAM KRISTAN) Калифорнийский университет, Сан-Диего (University of California, San Diego)

Page 17: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 8584

Однако взаимосвязь между нейробиологами и данными о нервных системах изменяется. Новые регистраторы предоставляют данные по действию больших популяций нейронов. Такие данные делают процедуры вычислений все более важными, вместе с экспериментальными инструментами для нового понимания взаимосвязей, архитектуры и общего комплекса нервных систем.

Новые возможности для экспериментов и моделирования в более крупном масштабе стали доступными с приходом быстрых методов оптического постро-ения изображений. В этом методе для отслеживания уровней кальция и потен-циалов мембраны нейронов используются красители и фотоувеличители с вы-соким пространственным и временным разрешением. Такие оптические записи с высокой степенью достоверности позволяют нейробиологам исследовать одно-временную деятельность популяций от десятков до тысяч нейронов. В относи-тельно короткое время доступные данные об активности нейронов выросли из тонкой струйки информации, собранной путем отбора небольшого количества нейронов, в крупномасштабные наблюдения нейронной активности.

Пространственно-временные наборы данных по поведению популяций ней-ронов создают привлекательные дедуктивные задачи и возможности. Следую-щая волна открытий о нейрофизиологической основе когнитивных способно-стей, возможно, придет через применение новых типов вычислительных линз, направляющих информационно-теоретическую «оптику» в потоки данных о пространственно-временных популяциях.

Мы полагаем, что нейробиологи, изучающие популяции нейронов, со вре-менем начнут пользоваться инструментами, которые служат в качестве вычис-лительных микроскопов — систем, объединяющих машинное обучение, оценку и визуализацию для помощи ученым в формулировании и проверке гипотез на основании данных. Выводы, полученные из потоков пространственно-вре-менных данных подготовки, могут даже накладываться на традиционные оп-тические изображения во время проведения экспериментов, дополняя такие изображения аннотациями, которые могут помочь в выборе направления для проведения исследования.

Интенсивный компьютерный анализ станет основой для моделирования и визуализации данных по высокоразмерным популяциям, где множество нейро-нов взаимодействует и принимает участие в действиях других нейронов и групп, и где взаимодействия потенциально чувствительны к контексту — цепи и потоки могут существовать динамически, кратковременно и даже одновременно на об-щем нейронном субстрате.

ВЫЧИСЛЕНИЯ И СЛОЖНОСТЬ

Мы видим многочисленные возможности для объединения движущихся бы-стрым темпом вычислений, чтобы помочь нейробиологам с вопросом понима-ния данных о популяциях нейронов. В исследованиях популяций нейронов уже используется статистический анализ. Например, статистические методы исполь-зовались для идентификации и определения характеристик нейронной актив-

ности в виде траекторий в крупных пространствах динамических состояний [1]. Мы восхищены возможностью применения более мощного машинного обуче-ния и механизмов оценки для создания объяснительных моделей из библиотек случаев данных о популяциях нейронов. Вычислительные процедуры помогут ученым в получении знаний из необработанных данных нейронной активности путем поиска по более крупным наборам альтернатив и оценки достоверности различных объяснительных моделей. Вычислительные методы могут работать с различной степенью детализации, от исследования локальных связей и функ-ций нейронов одной цепи до потенциально ценных обобщений более высокого уровня популяций нейронов — которые могут дать упрощенное представление о работе нервных систем.

Кроме создания пояснений из наблюдений, дедуктивные модели можно ис-пользовать для вычисления ожидаемой ценности информации, что поможет нейробиологам определять, какие тесты лучше провести или какую инфор-мацию лучше собрать в свете текущих целей и неопределенности. Вычисление ценности информации может помочь в направлении интервенционных иссле-дований, например, руководства по стимуляции отдельных единиц, соедине-ния напряжения отдельных клеток или выборочной модификации клеточной активности при помощи агонистических и антагонистических фармакологиче-ских средств.

Мы уверены в потенциале автоматических и интерактивных систем, вклю-чая такие, которые используются в качестве настольных инструментов для про-цессов в реальном времени. Однажды компьютерные инструменты даже смогут предоставить указания для датчиков и интервенций посредством визуализации и рекомендаций, которые динамически создаются при исследовании изображе-ний.

Выходя за пределы исследований отдельных систем животных, компьютер-ные инструменты для анализа данных популяций нейронов скорей всего будут ценными в изучении строения нервных систем во время эмбриогенеза, а также при сравнении нервных систем различных видов животных. Такие исследова-ния смогут выявить изменения в цепях и функциях в процессе развития, а также под давлением эволюционной адаптации.

СПЕКТР СЛОЖНОСТИ

Нейробиологи исследуют нервные системы позвоночных и беспозвоночных животных по всему спектру сложности. Мозг человека состоит примерно из 100 млрд нейронов, которые взаимодействуют друг с другом при помощи при-мерно 100 трлн синапсов. А мозг нематоды Caenorhabditis elegans (C. elegans) имеет всего 302 нейрона. Такие нервные системы беспозвоночных дают воз-можность изучить принципы неврональных систем, которые можно обобщить до более сложных систем, включая нашу. Например, C. elegans была эталонной системой для исследования структуры нейронных цепей, и в составлении карты точных связей между ее нейронами достигнуты большие успехи.

Page 18: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 8786

Многие нейробиологи останавливаются на изучении более простых нервных систем, даже если ими движут вопросы о нейробиологической природе челове-ческого интеллекта. Нервные системы получаются в процессе улучшений и мо-дификаций, поэтому очень вероятно, что ключевые аспекты обработки нейрон-ной информации заключены в головном мозге разной сложности. Хотя новые обобщения, слои и взаимодействия могли появляться в более сложных нервных системах, виды мозга разной степени сложности скорее всего основываются на схожих нервных тканях — о которых мы многого еще не знаем.

В работе с нашими коллегами Эшишем Капуром (Ashish Kapoor), Эриком Честейном (Erick Chastain), Джонсоном Апасиблем (Johnson Apacible), Дэниэ-лом Вагенааром (Daniel Wagenaar) и Пэкстоном Фреди (Paxon Frady) мы исполь-зуем машинное обучение, механизмы оценки и визуализацию для понимания базовых механизмов принятия решений у Hirudo — европейской медицинской пиявки. Мы применяем компьютерный анализ для получения информации из оптических данных об активности популяций нейронов в сегментальной ган-глии Hirudo. Ганглия состоит примерно из 400 нейронов, и оптическая система создания изображения обнаруживает активность около 200 нейронов одновре-менно — то есть всех нейронов с одной стороны нервного узла. Несколько ка-дров оптических изображений Hirudo показаны на рисунке 1. Яркость каждого из показанных нейронов представляет уровень деполяризации клеток, который является основой для потенциалов действия.

Мы разрабатываем инструменты анализа и сбора в стремлении к разработке компьютерных микроскопов для понимания активности популяций нейронов и ее связи с поведением. В одном методе мы создаем графические вероятностные временные модели, которые могут прогнозировать будущее поведение Hirudo

РИСУНОК 2.

Возможные соединения и ско-пления, полученные из данных популяции при построении изображения Hirudo.

РИСУНОК 1.

Изображение последовательности нейронов Hirudo перед принятием решения ползти или плыть.

РИСУНОК 3.

Предполагаемые информацион-ные взаимосвязи между нейро-нами в сегментальном нервном узле Hirudo. Схожая динамика в активности нейронов по време-ни выделена дугами и скоплени-ями.

Page 19: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 8988

на основании анализа данных популяции. Модели создаются методом поиска в большом пространстве допустимых моделей, где нейроны и абстракции ней-ронов служат случайными переменными, среди которых возможны временные и вневременные зависимости. Эти методы могут определить модули нейронов, которые действуют вместе и могут динамически проявляться в ходе активности, которая приводит к принятию животным решения. В дополнительной работе мы рассматриваем роль состояний нейронов при определении траекторий че-рез пространство состояний динамической системы.

ПОЯВЛЕНИЕ КОМПЬЮТЕРНОГО МИКРОСКОПА

Мы начали создавать интерактивные средства просмотра и инструменты, кото-рые позволяют ученым управлять дедуктивными предположениями и параме-трами, а также визуально проверять последствия. Например, ползунки позво-ляют плавно изменять пороги допустимых связей между нейронами, а также испытывать прочность взаимосвязей и членства в модулях. Мы очень хотим увидеть мир, где подобные инструменты будут широко использоваться нейро-биологами и дополняться компонентами обучения, логического вывода и визуа-лизации, разработанными сообществом этих ученых.

На рисунке 2 показан снимок экрана прототипа инструмента, который мы называем MSR Computational Microscope, разработанного Эшишем Капуром, Эриком Честейном и Эриком Горвицем в Microsoft Research в процессе более широкого сотрудничества с Вильямом Кристеном из Калифорнийского универ-ситета в Сан-Диего, и Дэниэлом Вагенааром из Калифорнийского технологиче-ского института (California Institute of Technology). Этот инструмент позволяет пользователям визуализировать активность нейронов за отдельный период времени, и затем интерактивно исследовать взаимосвязи между ними. Пользо-ватели могут выбирать различные механизмы логического вывода и указывать предположения для создания моделей. Они также могут выделять отдельные нейроны и их поднаборы в качестве фокусных точек анализа. На рисунке 2 по-казан анализ активности нейронов в сегментальной ганглии Hirudo. Предпола-гаемые информационные взаимосвязи между клетками отображаются в виде выделенных нейронов и дуг между нейронами. Такие предположения могут по-мочь в направлении исследований и подтверждении физических связей между нейронами.

На рисунке 3 показан другой информационный анализ, который простран-ственно объединяет клетки, ведущие себя схожим образом в ганглии Hirudo при проведении группы тестов. Анализ дает предварительное видение того, как ин-формационно-теоретический анализ когда-нибудь сможет помогать нейробио-логам в обнаружении и проверке взаимосвязей внутри и между неврональными подсистемами.

Мы пока находимся в самом начале этого многообещающего направления исследований, но ожидаем увидеть расцвет анализа, инструментов и более широкой субдисциплины, которая фокусируется на нейроинформатике попу-

ляций нейронов. Мы уверены, что компьютерные методы приведут нас к эф-фективным представлениям и языкам для понимания нейронных систем, и что они станут основными инструментами нейробиологов для получения знаний о тысячах загадок, связанных с чувствованием, обучением и принятием решений нервной системой.

ССЫЛКИ

[1] K. L. Briggman, H. D. I. Abarbanel, and W. B. Kristan, Jr., «Optical imaging of neuronal populations during decision-making,» Science, vol. 307, pp. 896–901, 2005, doi: 10.1126/science.110.

Page 20: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ

ЧЕТВЕРТАЯ ПАРАДИГМА 91

АЙЕН БУЧАН (IAIN BUCHAN) Манчестерский университет (University of Manchester)

ДЖОН УИНН (JOHN WINN), КРИС БИШОП (CHRIS BISHOP) Microsoft Research

Унифицированный метод моделирования

для здравоохранения с использованием большого

количества данных

Количество доступных данных здравоохранения стре-мительно растет и намного превышает возможность получения персональных или общественных преиму-ществ из анализа этих данных [1]. Тремя ключевыми

элементами такого роста являются электронные медицинские карты (electronic health records, EHR), биотехнологии и науч-ные достижения. Мы обсудим это ниже, и придем к нашему предложению унифицированного метода моделирования, который поможет получить все преимущества среды с боль-шим количеством данных.

ЭЛЕКТРОННЫЕ МЕДИЦИНСКИЕ КАРТЫ

Организации здравоохранения во всем мире, с большим и ма-лым количеством ресурсов, внедряют EHR. На уровне обще-ства EHR могут использоваться для управления медицински-ми услугами, отслеживания здоровья населения и поддержки исследований. Социальные выгоды использования EHR могут быть более ощутимыми на уровне всего населения, чем на уровне лечения отдельных пациентов.

Использование стандартных терминов и онтологии в EHR повышает структуру данных здравоохранения, но клиниче-ское кодирование вносит новые потенциальные искажения.

Page 21: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 9392

Например, применение стимулов для профессионалов первичной медицинской помощи по работе с отдельными состояниями может привести к колебаниям ко-личества кодирования новых случаев таких состояний [2]. С другой стороны, снижение стоимости устройств дистанционного мониторинга и тестирования «у кровати пациента» приводит к накоплению информации в EHR, которая более точна, но может создать иллюзию увеличения случаев заболеваний просто вви-ду доступности большего количества информации.

Некоторые пациенты начинают дополнять свои собственные медицинские карты или редактировать параллельные карты в Интернете [3]. Управление будущими медицинскими картами может быть в большей степени связано с частными лицами (пациентами, гражданами, потребителями) и сообществами (семьями, местным населением и пр.), чем с организациями здравоохранения. В итоге EHR создают более насыщенную информацией среду здравоохранения, где намного больше данных собираются и передаются в цифровом виде. Но ком-пьютерный интеллект и модели здравоохранения для применения к этой куче данных почти не разрабатываются.

БИОТЕХНОЛОГИИ

Биотехнологии вызвали бум в исследованиях молекулярной медицины. Неко-торые техники, такие как полногеномный анализ, создают огромные объемы данных без тех погрешностей, которые присущи целевому выбору факторов исследования. Поэтому такие наборы данных имеют более широкий диапазон и отсутствие отбора в сравнении с традиционными экспериментальными из-мерениями. Важные неточности все еще могут возникать из артефактов био-технической обработки проб и данных, но они должны снижаться с развити-ем технологий. Систематическая погрешность, которая находится вне данных, представляет собой более сложную проблему — например, метаболомический анализ, достоверность которого нарушена без учета времени дня или време-ни, которое прошло с момента последнего приема пищи перед взятием пробы. Большой задачей для здравоохранения с использованием большого количества данных является интеграция различных масштабов данных, от переменных мо-лекулярного уровня до уровня популяций, а также различные уровни прямоты измерений факторов. Когда будут доступны реалистичные, комплексные моде-ли, охватывающие различные масштабы, следующей задачей будет обеспечение их доступности для клинических врачей и пациентов, которые совместно смогут оценить риски различных вариантов при выборе персональных методов лече-ния.

НАУЧНЫЕ РЕЗУЛЬТАТЫ

Результаты здравоохранения развивались в геометрической прогрессии [4]. В 2009 г. в библиографической системе здравоохранения PubMed, новый доку-мент регистрировался каждые 2 минуты. Поэтому метод проверки литературы

для управления медицинскими знаниями потенциально перегружен. Более того, перевод новых знаний на практику является медленным и несогласованным [5]. Это отрицательно влияет не только на врачей и пациентов, принимающих ме-дицинские решения, но и на исследователей, которые оценивают шаблоны и механизмы.

Необходимо объединить процесс поиска доказательной базы с компьютер-ными моделями для исследования растущего количества данных здравоохране-ния и исследований.

Управляемые гипотезами исследования и подходы редукционизма к при-чинным связям хорошо послужили медицине в определении основных незави-симых детерминант здоровья и результатов лечения отдельных пациентов (см. рисунок 1). Но они не отражают всей комплексности здоровья. К примеру, кли-нические исследования исключают до 80% ситуаций, в которых могло бы пропи-сываться лекарство — например, когда у пациента есть несколько заболеваний, и он принимает различные лекарства [7]. Давайте рассмотрим недавно получив-шее лицензию лекарство общего предписания. Врач X может прописать его, а

Экспертнаяоценка

Экспертнаяоценка

Экспертнаяоценка

Данные

Данные

Данные

Статистическое тестирование

Уточнение гипотезы

Хроническое обструктивное заболевание легких

Сердечно-сосудистое заболевание

Рак легких

Гипотеза

Гипотеза

Гипотеза

Независимоезаключение

Статистическое тестирование

Уточнение гипотезы

Независимоезаключение

Статистическое тестирование

Уточнение гипотезы

Независимоезаключение

РИСУНОК 1.

Традиционные методы, основанные на проверке статистических гипотез, искусственно разде-ляют здравоохранение на множество подпроблем. Таким образом они упускают замечательную возможность для статистической «аренды мощности». Хроническое обструктивное заболева-ние легких, сердечно-сосудистые заболевания и рак легких могут рассматриваться как «большая троица» [6].

Page 22: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 9594

пространства проблемы, с консультациями с литературой и коллегами для соз-дания графика на основании организующего принципа — например «обструк-ция периферических дыхательных путей». Такая модель более качественно от-ражает реальную сложность астмы с множеством классов одышки и другими признаками и симптомами, и относит их к известным механизмам. Затем для изучения того, как генетические, экологические и другие факторы в исследова-нии влияют на образование различных групп аллергической сенсибилизации в отношении результатов анализов кожи и крови и отчетов по одышке, использу-ются неконтролируемые методы группировки. Эпидемиолог может соотносить эти шаблоны с биологическими каскадами реакций, тем самым определяя гипо-тезы для дальнейшего изучения.

В сценарии №2 клиническая команда выполняет аудит результатов лечения по пациентам с хронической ангиной. Немного отличающиеся планы лечения, например, различная глубина изучения и лечения в первичной медицинской помощи перед обращением к специалисту, достаточно распространены. При

врач Y — нет, что может привести к естественным экспериментам. В полностью разработанной системе здравоохранения с большим количеством данных, где информация от таких экспериментов поступает в EHR, клинические исследова-тели могут изучать результаты пациентов при использовании нового лекарства в сравнении с естественными методами контроля и потенциально могут вносить корректировки на смешанные и изменяющие факторы. Однако такие коррек-тировки могут быть крайне сложными и выходить за возможности традицион-ных моделей.

УНИФИЦИРОВАННЫЙ МЕТОД

Мы предлагаем унифицированный метод моделирования, который позволит использовать все преимущества среды с большим количеством данных без по-тери реальной комплексности здоровья (см. рисунок 2). Наш метод основан на разработках в области машинного обучения за последние 10 лет, которые дают новые мощные инструменты, хорошо подходящие для решения этой задачи. Знание результатов лечения, смешанных или изменяющихся факторов, может быть собрано и представлено в системе вероятностных графических моделей, где подходящие переменные, включая наблюдаемые данные, представляются в виде графика [8]. Затем разработка предположений на этих графиках может вы-полняться автоматически при помощи различных алгоритмов, основанных на прохождении локальных сообщений, например [9]. В сравнении с классически-ми методами машинного обучения эта новая система предлагает более глубокую интеграцию знаний предметной области, получаемых непосредственно от экс-пертов или из литературы, с использованием статистического обучения. Кроме того, такие автоматические алгоритмы логического вывода могут масштабиро-ваться до наборов данных размером в сотни миллионов записей, а новые ин-струменты, такие как Infer.NET, позволяют мгновенно разрабатывать решения в рамках этой системы [10]. Мы проиллюстрируем применение этого метода в двух сценариях.

В сценарии №1 эпидемиолог исследует генетические и экологические фак-торы, которые вызывают предрасположенность к астме у некоторых детей. Он проводит групповое исследование 1 тыс. детей, которые наблюдаются в течение 10 лет, с подробными экологическими и физиологическими параметрами, а так-же данными по более чем полумиллиону из 3 млн генетических факторов, кото-рые могут отличаться у разных людей. В традиционном методе эпидемиологии предопределенные гипотезы могут проверяться с использованием отобранных групп генетических и других факторов. Также для поиска связей между отдель-ными генетическими факторами и простыми определениями состояния здоро-вья (например, одышка или ее отсутствие в возрасте 5 лет) можно использовать метод полногеномного сканирования. В обоих этих методах используются отно-сительно простые статистические модели. Альтернативный метод машинного обучения может начинаться с создания эпидемиологом графической модели для

Электронныемедицинскиекарты (EHR)

Экспертнаяоценка

Экспертнаяоценка

Экспертнаяоценка

Данные

Данные

Данные

Унифицированнаяграфическая модель

Крупномас-штабныевыводы

Здравоохранениев разных масштабах

и системах:

Исследование

Политика

Уход

Уточнение модели

РИСУНОК 2.

Мы предлагаем использовать унифицированный метод создания медицинских моделей, с расту-щими статистическими ресурсами электронных медицинских карт в дополнение к данным, полученным в результате специализированных исследований.

Page 23: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 9796

Аватар — это не только статистический инструмент для поддержки диа-гностики и лечения, но также и средство связи, которое соединяет пациента с выбранной им же сетью врачей и других доверенных специалистов по уходу — например, для обсуждения возможных методов лечения. Изначально являясь очень простой многосистемной моделью, аватар здоровья может вырасти по глубине и сложности для сокращения расстояния между аватаром и реально-стью. Такой аватар не будет включать в себя моделирование человека на моле-кулярном уровне (которое мы считаем невозможным), а вместо этого будет ис-пользовать унифицированную статистическую модель, охватывающую текущее клиническое понимание в применении к конкретному пациенту.

Эта парадигма может быть расширена до сообществ, в которых множество индивидуальных аватаров взаимодействуют с аватаром общества для предо-ставления унифицированной модели здоровья населения. Такой аватар обще-ства может предоставлять подходящую и своевременную информацию для использования в целях охраны и улучшения состояния здоровья членов такого сообщества. Для сокращения серьезности и длительности заболеваний и луч-шего обслуживания сообщества в целом дефицитные ресурсы сообщества мо-гут более точно подгоняться под потребности здравоохранения, в особенности в профилактике и раннем вмешательстве. Услуги клинического, потребительско-го и общественного здравоохранения смогут взаимодействовать более эффек-тивно, предоставляя социальные выгоды и новые возможности для инноваций и инициатив в медицине.

ВЫВОД

Сама по себе информация не может привести к появлению здравоохранения с использованием большого количества данных. Для охвата всего комплекса здо-ровья, что в конечном счете приведет к значительному повышению глобальных стандартов здоровья населения, требуется основательный пересмотр методоло-гии. Мы уверены, что машинное обучение в комбинации с общим увеличением вычислений в отношении медицины может принести большую пользу. Возмож-но, само общество должно разработать вычислительные системы для поиска сигналов в наборах медицинских данных, если потенциал выигрыша для чело-вечества намного превосходит риски. Мы уверены, что это так.

ССЫЛКИ

[1] J. Powell and I. Buchan, «Electronic health records should support clinical research», J. Med. Internet Res., vol. 7, no. 1, p. e4, Mar. 14, 2005, doi: 10.2196/jmir.7.1.e4.

[2] S. de Lusignan, N. Hague, J. van Vlymen, and P. Kumarapeli, «Routinely-collected general practice data are complex, but with systematic processing can be used for quality improvement and research», Prim. Care. Inform., vol. 14, no. 1, pp. 59—66, 2006.

проведении стандартного клинического аудита возможны обсуждения плана лечения, сверка с литературой, изучение простейшей сводной статистики, вы-работка отдельных гипотез, а возможно, и проверка гипотез при помощи про-стых регрессионных моделей. В альтернативном методе машинного обучения возможно создание графической модели предполагаемого плана лечения путем обсуждения и предоставления ссылок на литературу и ее сравнение с обнару-женной сетевой топологией в наборах данных с результатами пациентов. Затем приемлемые сети могут использоваться для моделирования потенциального воздействия изменений на клиническую практику путем запуска сценариев, ко-торые изменяют вес дуги базовых графиков. Таким образом, группы связей в локально релевантных данных могут комбинироваться с доказательствами из литературы в процессе планирования сценария, который включает в себя кли-ническую оценку и машинное обучение.

ЧЕТВЕРТАЯ ПАРАДИГМА: АВАТАРЫ ЗДОРОВЬЯ

Унифицированные модели, без сомнения, имеют потенциал влияния на личное, общественное здоровье и клиническую практику. Станут ли они парадигмой для будущего?

Первой парадигмой информации здравоохранения может быть история случаев заболеваний плюс терапевт, которая была сформулирована Гиппокра-том более 2 тыс. лет назад и до сих пор остается важной частью клинической практики. Во второй парадигме медицинская карта передается группе допол-нительных врачей, каждый из которых фокусируется на своей специализации в состоянии пациента. Третья парадигма — это здравоохранение, основанное на доказательствах, где сеть профессиональных медиков своевременно соединяет-ся со знаниями и медицинской картой пациента. Эта третья парадигма до сих пор находится в процессе реализации, в особенности в отношении охвата всех комплексов клинической практики в цифровых записях и возможности вычис-ления отдельных аспектов здравоохранения.

Мы предвидим четвертую парадигму медицинской информации, по анало-гии с другими дисциплинами, где данные о здоровье человека собираются из различных источников и вводятся в унифицированную модель здоровья этого человека. Эти источники могут начинаться сетевыми датчиками участков тела и заканчиваться проверкой и интерпретацией клиническими экспертами, с на-много большим участием самого пациента в создании информации о своем здо-ровье, чем есть сейчас. При наличии всех этих данных унифицированная модель будет играть роль «аватара здоровья» — электронного представления здоровья человека, непосредственно измеренного или предполагаемого статистическими моделями или врачами. Врачи, взаимодействуя с аватаром пациента, могут по-лучить более комплексный обзор различных специализированных планов лече-ния, чем при использовании только медицинских карт.

Page 24: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ

ЧЕТВЕРТАЯ ПАРАДИГМА 99ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ98

ЛУКА КАРДЕЛЛИ (LUCA CARDELLI) Microsoft Research

КОРРАДО ПРИАМИ (CORRADO PRIAMI) Microsoft Research — Университет Тренто, Центр компьютерной и системной биологии и Университет Тренто (University of Trento Centre for Computational and Systems Biology and University of Trento

Визуализация в моделях алгебры процессов

биологических систем

В последнем исследовании нобелевский лауреат Пол Нурс призывает к лучшему пониманию живых орга-низмов за счет «разработки подходящих языков для описания обработки информации биологических си-

стем и создания более эффективных методов для перевода биохимических описаний в функции логических цепей, опре-деляющих биологические феномены» [1].

Язык, который хочет видеть Нурс — это формальный язык, который может автоматически преобразовываться в исполняемый машинный код, и который поддерживает моде-лирование и техники анализа для проверки свойств биологи-ческих систем. Хотя существует множество методов формаль-ного моделирования живых систем, только некоторые из них предоставляют исполняемые описания, которые выделяют механистические шаги, вызывающие переход системы из од-ного состояния в другое [2]. Практически все техники, связан-ные с математическим моделированием, абстрагируются от таких отдельных шагов для создания глобального поведения, обычно усредненного по времени.

Компьютерная наука дает ключевые элементы для опи-сания механистических шагов: алгоритмы и языки програм-мирования [3]. Согласно метафоре с молекулами в качестве процессов, приведенной в [4], вычисления процессов опре-деляются как многообещающий инструмент для моделиро-вания биологических систем — сложных, параллельных и управляемых взаимодействиями своих подсистем.

Причинно-следственная связь — основное отличие мето-дов моделирования на основе языка от других техник. Фак-

[3] L. Bos and B. Blobel, Eds., Medical and Care Compunetics 4, vol. 127 in Studies in Health Technology and Informatics series. Amsterdam: IOS Press, pp. 311—315, 2007.

[4] B. G. Druss and S. C. Marcus, «Growth and decentralization of the medical literature: implications for evidence-based medicine», J. Med. Libr. Assoc., vol. 93, no. 4, pp. 499—501, Oct. 2005, PMID: PMC1250328.

[5] A. Mina, R. Ramlogan, G. Tampubolon, and J. Metcalfe, «Mapping evolutionary trajectories: Applications to the growth and transformation of medical knowledge», Res. Policy, vol. 36, no. 5, pp. 789—806, 2007, doi: 10.1016/j.respol.2006.12.007.

[6] M. Gerhardsson de Verdier, «The Big Three Concept — A Way to Tackle the Health Care Crisis?» Proc. Am. Thorac. Soc., vol. 5, pp. 800—805, 2008.

[7] M. Fortin, J. Dionne, G. Pinho, J. Gignac, J. Almirall, and L. Lapointe, «Randomized controlled trials: do they have external validity for patients with multiple comorbidities?» Ann. Fam. Med., vol. 4, no. 2, pp. 104—108, Mar.—Apr. 2006, doi: 10.1370/afm.516.

[8] C. Bishop, Pattern Recognition and Machine Learning. Springer, 2006.[9] J. Winn and C. Bishop, «Variational Message Passing», J. Mach. Learn. Res., vol. 6,

pp. 661—694, 2005.[10] T. Minka, J. Winn, J. Guiver, and A. Kannan, Infer.NET, Microsoft Research

Cambridge, http://research.microsoft.com/infernet.

Page 25: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 101100

для биологов, чтобы они могли использовать его в собственных неформальных моделях и экспериментах.

Одна из попыток биологов по соединению формальных языков и нефор-мальных описаний систем включает в себя использование ограниченного есте-ственного языка, организованного в виде таблиц, которые собирают всю ин-формацию, относящуюся к структуре и динамике системы. Такое описательное представление достаточно информативно и структурировано для компиляции в формальное описание, подходящее для моделирования и анализа [6, 7]. Хотя стиль описательных моделей еще не является визуальным, он определенно более понятен для биологов, нежели формальный язык (программирования).

Наилучшим способом сделать язык понятным для ученых и помочь в управ-лении всем его комплексом является визуализация языка. Это сложнее, чем ви-зуализация данных или результатов моделей, так как язык описывает полную кинетику системы, включая динамические взаимосвязи между событиями. Та-ким образом, визуализация языка должна быть динамичной и по возможности реактивной [8], чтобы ученые могли определять и вставлять события в работаю-щую модель при непосредственном вмешательстве. Для этого требуется точное соответствие между внутренним исполнением формального языка и его визуа-лизацией, чтобы кинетика языка полностью отражалась в кинетике визуализа-ции и наоборот.

Такая возможность полного соответствия кинетики общего (полного по Тью-рингу) языка моделирования визуальным представлениям была продемонстри-рована, например, для пи-исчисления [9], но для адаптации таких общих мето-дов к специфическим требованиям визуализации сохраняется еще множество практических вопросов (см. рисунок 1). Одним из таких требований, например, является визуализация и отслеживание молекулярных комплексов. В этих целях язык BlenX [10] и его средства поддержки дают возможность точного представ-ления комплексов биологических элементов и изучения их развития во времени [11] (см. рисунок 2). Графическое представление комплексов также полезно в изучении процессов морфогенеза для выявления механистических шагов фор-мирования шаблона (см. рисунок 3).

АНАЛИЗ

Создание модели является одним из шагов в научном цикле, и подходящие язы-ки моделирования (вместе с возможностями их исполнения и визуализации) особенно важны для моделирования сложных систем. Однако в конце концов возникнет желание проанализировать модель с использованием большого ко-личества техник. Некоторые из этих техник могут быть связаны с базовой мате-матической системой, такой как анализ дифференциальных уравнений, цепей Маркова или сетей Петри, полученных из модели. Другая техника может быть связана с описанием модели (языка, на котором написана модель). Например, нам может потребоваться узнать, представляют ли два различных описания мо-

тически причинно-следственная связь в языках параллельного программирова-ния четко соотносится с идеей параллельности или независимости событий, что сильно отличает причинность от структурирования по времени. Действие A вы-зывает действие B, если A является необходимым условием для происхождения B, и A влияет на действие B — то есть существует поток информации от А к В. Вторая часть состояния, определяющего причинность, четко разделяет предше-ствование (которое относится только к положению во времени) и причинность (поднабор временного упорядочения, где также учтен поток информации) [5]. Как следствие, перечень реакций системы не предоставляет информации о при-чинах, а дает информацию только о времени. Поэтому необходимо разработать новые инструменты моделирования и анализа для охвата причинности.

Причинно-следственная связь является ключевой проблемой в анализе слож-ных взаимодействующих систем, так как она помогает разделять независимые компоненты и упрощать модели, при этом позволяя четко определять обмен ин-формацией между различными сигнальными каскадами. Когда эксперимента-тор наблюдает интересующее его событие в модели, можно сжать предыдущую историю системы и оставить только предшествующие события, которые вызва-ли интересующее. Это может дать точные подсказки о причинах заболеваний, взаимодействии лекарства с живой системой (с определением его эффективно-сти и побочных эффектов) и механизмах регулирования изменений поведения.

Причинность — это взаимосвязь между событиями, и поэтому наиболее естественно изучать ее в дискретных моделях, которые, в свою очередь, описаны алгоритмическими языками моделирования. Хотя в компьютерной науке для создания моделей параллельных систем уже определено множество языков мо-делирования, еще остается множество задач по созданию алгоритмических мо-делей для понимания биологических процессов на уровне систем. Среди таких задач — взаимосвязь между местными взаимодействиями низкого уровня и про-изводным глобальным поведением высокого уровня; дальнейшее исследование систем; представление в разных уровнях и масштабах по времени, пространству и размеру; а также причинные отношения между взаимодействиями и осведом-ленность о контексте внутренних компонентов. Таким образом формальные системы моделирования, которые могут быть кандидатами для продвижения алгоритмической системной биологии, должны быть дополнительными и иметь возможность взаимодействия с математическим моделированием. Они должны решать вопросы параллельности и комплексности, быть алгоритмическими и количественными, выражать причинно-следственную связь, управляться взаи-модействием, а также быть компонуемыми, масштабируемыми и модульными.

ВИЗУАЛИЗАЦИЯ ЯЗЫКА

Практичность представляет собой фундаментальную проблему использования формальных языков в биологии. Язык моделирования должен быть понятным

Page 26: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 103102

Сходство поведения фактически является первым инструментом в компью-терной науке для проверки вычислительных систем. Например, мы можем ис-пользовать схожести для обеспечения согласованности внедрения и специфи-кации, как можно больше абстрагируясь от синтаксических описаний, вместо этого сосредотачиваясь на семантике (динамике) спецификаций и внедрений. Пока что биология фокусируется на синтаксических связях между генами, ге-номами и белками. Совершенно новым направлением исследований является изучение семантического сходства биологических организмов, представляющих сложные сети взаимодействий. Такой метод может привести к новому видению систем и усилить необходимость в компьютерной науке для улучшения систем-ной биологии.

Биология является наукой, использующей большое количество данных. Био-логические системы представляют собой огромные коллекции взаимодейству-

дели одинаковое поведение — в соответствии с некоторыми параметрами сход-ства поведения. Такой тип соответствия модели может возникнуть, например, из кажущихся различными биологических систем, которые работают по общим фундаментальным принципам. Подобный вопрос — сможем ли мы упростить (абстрагировать) описание модели, при этом сохранив ее поведение, опять же с какой-то степенью схожести поведения, которая может скрывать отдельные некритические подробности.

РИСУНОК 2.

Зеленые блоки с «S» на диаграмме представляют организмы, заполняющие рассматриваемую биологическую систему. Голубые прямоугольники возле зеленых блоков представляют активные поверхности раздела или области, доступные для комплексации и декомплексации. На диаграм-ме показано, как моделирование спецификации BlenX образует кольцевой комплекс и предостав-ляет положение и связи между блоками для изучения.

M TM

TMPMP

MeP

M M

-tpn v

+tpn

Выход

-tpn

-pep q+pep a-pep+pep

Продуцирование Деградирование

Деградирование

РИСУНОК 1.

Эту диаграмму можно привести в однозначное соответствие с формальными стохастически-ми моделями пи-исчисления [9, 12, 13], чтобы можно было редактировать или диаграммы, или модели. Узлы представляют собой молекулярные состояния (значки узлов показаны просто для наглядности), а маркированные дуги — взаимодействие с другими молекулами среды. В моделях используется биохимический вариант пи-исчисления, с массовой долей в виде верхнего индекса и знаками сложения и вычитания для добавления и удаления связующего.

Page 27: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЧЕТВЕРТАЯ ПАРАДИГМАЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ 105104

ВИЗУАЛИЗАЦИЯ АНАЛИЗА

Чтобы исполнение моделей было интерактивным (для динамического измене-ния фокуса на различные характеристики) и реактивным (для изменения их ис-полнения в реальном времени), им нужна визуализация. Исполнение является одной из форм анализа; для других методов анализа также требуется визуали-зация. Для сложных систем нормальный метод «группового» анализа, состоя-щий из выполнения сложного анализа на модели с последующим получением результатов для решения задачи, должен быть заменен более интерактивным и исследовательским методом.

Абстрагирование модели является важным инструментом для управления сложностью, и мы можем представить себе выполнение этой задачи в интерак-тивной форме — например, за счет объединения или скрывания компонен-тов. Для объединения затем потребуются подходящая визуализация и методы отношения поведения исходных компонентов к поведению сгруппированных компонентов. Это означает визуализацию не языка моделирования, а скорее визуализацию функции абстракции между моделями. Поэтому мы предлагаем визуализировать исполнение программ и моделей таким образом, чтобы резуль-таты были связаны со спецификацией исходного кода и модели, а графическое абстрагирование, выполняемое конечным пользователем, преобразовывалось в трансформацию формальной программы и модели. Затем средство поддержки будет проверять, какие свойства сохраняются при трансформации, а какие нет, и извещать об этом пользователя.

Все сказанное выше усиливает необходимость в формальном и исполняе-мом языке для моделирования биологии как основной функции компьютерной лаборатории для биологов, которая может стать высокопроизводительным ин-струментом биологии следующего поколения.

БЛАГОДАРНОСТЬ

Авторы благодарят Эндрю Филлипса (Andrew Phillips) и Лоренцо Дематте (Lorenzo Dematté) за подготовку информации.

ССЫЛКИ

[1] P. Nurse, «Life, Logic and Information», Nature, vol. 454, pp. 424—426, 2008, doi: 10.1038/454424a.

[2] J. Fisher and T. Henzinger, «Executable Cell Biology», Nature Biotechnology, vol. 25, pp. 1239—1249, 2007, doi: 10.1038/nbt1356.

[3] C. Priami, «Algorithmic Systems Biology: An opportunity for computer science», Commun. ACM, June 2009, doi: 10.1145/1506409.1506427.

[4] A. Regev and E. Shapiro, «Cells as computation», Nature, vol. 419, p. 343, 2002, doi: 10.1038/419343a.

[5] P. Degano and C. Priami, «Non-interleaving semantics of mobile processes», Theor. Comp. Sci. vol. 216, no. 1—2, pp. 237—270, 1999.

ющих компонентов. Исследования последнего десятилетия были посвящены определению и классификации таких компонентов, особенно на молекулярном уровне (гены, метаболиты, протеины). Для практического использования тако-го количества доступных данных нам нужно полностью представить их в виде компактных исполняемых моделей, чтобы такие процессы исполнения могли при необходимости восстанавливать доступные данные. Такой метод объединит синтаксис и семантику в унифицированные представления и создаст необходи-мость в различных методах хранения, получения и сравнения данных. Таким образом, хранилище модели, представляющее динамику биологических процес-сов в компактной и механистической форме, будет крайне ценным и сможет улучшить понимание биологических данных и базовых биологических прин-ципов, которые управляют жизнью. Оно будет способствовать разработке про-гнозов и оптимальных схем дальнейших экспериментов для перехода от сбора данных к созданию знаний.

РИСУНОК 3.

Зеленые, красные и синие блоки с «S» на диаграмме представляют различные виды, заполняющие рассматриваемую биологическую систему. Голубые прямоугольники возле блоков представляют активные поверхности раздела или области, доступные для комплексации и декомплексации. Диаграмма поясняет, как шаблоны образуются в процессе морфогенеза при моделировании спец-ификацией BlenX.

Page 28: 2. ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕdownload.microsoft.com/documents/rus/devcenter/Part 2_Health an… · 60 ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ ЧЕТВЕРТАЯ

ЗДОРОВЬЕ И БЛАГОПОЛУЧИЕ106

[6] M. L. Guerriero, J. Heath, and C. Priami, «An automated translation from a narrative language for biological modelling into process algebra», Proc. of CMSB 2007, LNBI 4695, 2007, pp. 136—151, doi: 10.1007/978-3-540-75140-3_10.

[7] M. L. Guerriero, A. Dudka, N. Underhill-Day, J. Heath, and C. Priami, «Narrative-based computational modelling of the Gp130/JAK/STAT signalling pathway», BMC Syst. Biol., vol. 3, no. 1, p. 40, 2009, doi: 10.1186/1752-0509-3-40.

[8] S. Efroni, D. Harel, and I. R. Cohen, «Reactive Animation: Realistic Modeling of Complex Dynamic Systems», Computer, vol. 38, no. 1, pp. 38—47, Jan. 2005, doi: 10.1109/MC.2005.31. [9] A. Phillips, L. Cardelli, and G. Castagna, «A Graphical Representation for Biological Processes in the Stochastic Pi-calculus», Trans. Comput. Syst. Biol., VII—LNCS 4230, 2006, pp. 123—152, doi: 10.1007/11905455_7.

[10] L. Dematté, C. Priami, and A. Romanel, «The BlenX Language: a tutorial», Formal Meth. Comput. Syst. Biol., LNCS 5016, 2008, pp. 313—365, doi: 10.1145/1506409.1506427.

[11] L. Dematté, C. Priami, and A. Romanel, «The Beta Workbench: a computational tool to study the dynamics of biological systems», Brief Bioinform, vol. 9, no. 5, pp. 437—449, 2008, doi: 10.1093/ bib/bbn023.

[12] C. Priami, «Stochastic pi-calculus», Comp. J., vol. 38, no. 6, pp. 578—589, 1995, doi: 10.1093/comjnl/38.7.578.

[13] A. Phillips and L. Cardelli, «Efficient, Correct Simulation of Biological Processes in Stochastic Pi-calculus», Proc. Comput. Meth. Syst. Biol., Edinburgh, 2007, pp. 184—199, doi: 10.1007/978-3-540-75140-3_13.