Многовековое использование в медицинской практике результатов лабораторных исследований сформировало подход к их обобщению и анализу, в основе которого лежит термин «референтный интервал».

Суть последнего базируется на четырех постулатах:

  1. Разброс данных анализов при их многократном повторении с достаточной степенью точности описывается функцией Гаусса (нормальное распределение).
  2. Интерес для диагностики представляют результаты только тех лабораторных образцов, значения которых выходят за рамки референтных интервалов, определяемых по кривой плотности распределения данных. Из теории ошибок следует, что если получено среднее значение (математическое ожидание «М») серии одинаковых испытаний, то 95% результатов попадают в интервал, равный (М ± 2Ϭ), где Ϭ – стандартное отклонение. Принципиально, что это условие выполняется при разбросе данных, подчиняющихся нормальному закону распределения.
  3. Обычно среднее значение лабораторных анализов и величина стандартного отклонения определяется путем проведения исследований в выбранной целевой группе пациентов, определяемых как здоровые (практически здоровые). В такую группу могут, например, входить мужчины в возрасте от 18 до 45 лет. При этом математическое ожидание полученных данных фиксируется в качестве «нормы», а допустимое значение должно попадать в референтный интервал.
  4. Логично предположить, что «заболевание» должно, видимо, смещать позицию наиболее вероятного значения анализа при сохранении общего вида кривой плотности распределения данных.

С точки зрения статистики, основанной на технологиях бумажного документооборота, подход является корректным и, видимо, оптимальным. Сложно представить, что для получения значения «нормы» единовременно проводилось обследование нескольких тысяч пациентов с последующим сведением результатов в столбики бумажных бланков.

Вместе с тем, после начала активного использования в лечебных процессах медицинских информационных систем и методов компьютерной обработки данных ситуация коренным образом изменилась. Мы получили возможность не только анализировать значительно большие объемы данных, но и «натыкаться» на факторы, влияние которых на результаты проявляется только статистически.

В процессе сопоставления лабораторных исследований, годами накапливающихся в хранилищах данных МИС, мы натолкнулись на эффект, позволяющий выдвинуть гипотезу, способную несколько трансформировать современное понимание сути референтных интервалов. Ее можно сформулировать следующим образом: «Условию нормального распределения в целевых группах здоровых пациентов подчиняются не значения анализов, а количественные соотношения кластеров, объединяющих в себе близкие по характеристикам биологических образцов группы пациентов». При этом с высокой степенью вероятности можно предположить, что в таких группах (кластерах) разброс значения анализов должен подчиняться нормальному закону.

К каким изменениям в наших представлениях это может привести? Если рассматривать локальные «нормы» для каждой из групп, общая картина ничем не отличается от привычного подхода. Разве что изменится выражение, описывающее распределение плотности и значение стандартного отклонения. Вместо классической «Гауссианы» оно будет определяться, как обобщение нескольких самостоятельных нормальных распределений. Но так как вид исходного распределения данных анализа мы определяем сугубо экспериментально, сравнить его с «отсутствующим пока теоретическим» невозможно.

Схематически случаи переходов от «здорового» состояния к «заболеванию» для двух подходов могут быть представлены рисунками 1 – 2 и 3 – 4. На рисунках 1 и 2 («классическое» представление) изменение вида огибающей для плотности значений анализов определяется «смещением» значения анализа для каждого из пациентов. Отличие между кривыми связано, таким образом, с индивидуальной реакцией организма каждого пациента на заболевание.

референтные интервалы
Рисунок 1
референтные интервалы 2
Рисунок 2

На рисунках 3 и 4 штрихами представлена линия, определяемая совокупностью нормальных распределений данных (вероятностями значений анализов) в «кластерах№. При заболевании в разных группах (кластерах) от диагноза к диагнозу можно, конечно, ожидать изменения значений анализа (изменение наиболее вероятного значения, или стандартной ошибки). Но отлична от нуля и вероятность того, что представители разных кластеров реагируют на болезнь по-разному. То есть можно ожидать изменения количественных соотношений в группах при сохранении (малом изменении) результатов исследований биологического материала. Проводя аналогию с геномом человека, почему бы не предположить, что совокупность анализов здорового пациента в определенных рамках погрешностей столь же индивидуальна, как отпечаток пальца.

Что произойдет, если на различные возбудители заболеваний организмы пациентов из разных групп будут реагировать не совсем одинаково? Иммунитет одних может полностью блокировать внешнее негативное воздействие. Другим внутренних ресурсов может не хватить, даже для частичной компенсации. При этом нарушение в работе одного из органов длительное время может не отражаться на работе остальных.

референтные интервалы 3
Рисунок 3
Рисунок 4

 

Вполне возможно, что соотношения наполнений кластеров, зафиксированных для здоровых пациентов, при заболевании могут существенно измениться. Условный вид трансформации «суммарной огибающей» нормальных распределений при таком варианте приведен на рисунке 4. Здесь реализовано предположение, что значения анализов, характерных для кластеров, при заболевании изменяются мало. При этом итоговая вероятностная кривая трансформируется, в основном, за счёт изменения наполнений кластеров. Локальные распределения данных в группах обозначены символами («А», «Б», «В»…), такими же, как на рисунке 3.

Исходя из этого можно сделать логичное предположение: если выдвигаемая гипотеза ложна, то при заболеваниях наиболее вероятное значение соответствующего анализа должно смещаться в ту, или иную сторону при сохранении общего вида распределения (рисунок 2). Если же гипотеза «кластеризации пациентов» состоятельна, вид распределения должен трансформироваться от вида кривой Гаусса к варианту огибающей для некоторой совокупности нормальных распределений, разнесенных по шкале значений. То есть должны обнаруживаться локальные экстремумы и «перегибы» на вероятностных кривых. Принимая во внимание сказанное выше, рассмотрим результаты реальных исследований.

В качестве примера выбираем три диагноза из одной группы заболеваний («I11.9», «I 20.0» и «I48») и три анализа, активно используемые в этих случаях (Г0002, Г0018 и Г0020). Так как нас интересуют не конкретные анализы, а изменения вероятностных распределений их значений, приведенные кодировки будут применяться и в дальнейшем. Пользователи же МИС qMS могут при желании выяснить их реальное наименование и используемые размерности, просто заглянув в соответствующий справочник услуг.

Примененная нами методика базируется на построении гистограмм по значениям анализов, проведенных в первые два дня после госпитализации пациента. В качестве диагноза, к которому привязываются анализ, рассматривается основной диагноз выписки. Определенную сложность при обработке данных представлял выбор величины бина гистограммы. Оптимальный и всеми признанный подход решения этой задачи нам, к сожалению, не известен. Поэтому мы остановились на часто используемом варианте, предложенном Стерджессом. В его основе лежит уравнение, связывающее число бинов гистограммы (Nб) с общим числом проведенных наблюдений (n): Nб=1+log2(n).

Для обеспечения корректности подхода мы выбрали анализы, количество которых превышает 2000, что соответствует значению Nб≈12. Кривые плотности результатов мы строили с помощью сплайнов, привязывая их начальные и конечные точки к средним значениям соответствующих бинов. Ширина бина гистограммы конкретного анализа определялась по разнице между минимальным и максимальным значениями выборки, путем деления полученного интервала на Nб. При этом мы отбрасывали результаты измерений, встречающиеся в общей массе данных менее 2-х раз. Для возможности сопоставления распределений по различным диагнозам площади под огибающими мы нормировали к 100 единицам.

На каждом из приведенных ниже рисунков (рисунки 5, 6 и 7) кроме соответствующих «кривых распределения» приведены данные по «норме» показателя (справочные материалы) и его референтному интервалу.

Начнем с анализа Г0002. В первом случае («I48») кривая вполне соответствует «классическому» представлению. Даже наиболее вероятное значение несмотря на заболевание вполне соответствует «норме». При «классическом» подходе вывод об отклонениях состояния пациента от нормы можно, видимо, делать, ориентируясь на «крылья» огибающих. К этому диапазону относится, в частности, и незначительный локальный максимум в районе значения «15». Его, конечно, можно отнести к погрешности наблюдений, но мы пока торопиться не будем. Сомнение в целесообразности его игнорирования связаны с тем, что аналогичный «всплеск» еще более выраженно присутствует и на огибающей для диагноза «I20.0».

Рисунок 5

 

Рисунок 6

 

Второй график, кроме дополнительного «перегиба» в районе значения «12», отличается от первого и смещением наиболее вероятного значения в большую сторону. Еще более любопытным оказывается график для диагноза «I11.9». Интерес вызывает не столько то, что «пик» вероятности приходится на значение «6» (вместо «6.5» по норме), сколько возможное существование дополнительного максимума, весьма близкого к случаю «I20.0». Было бы логичным предположить, что «огибающая» формируется, как минимум, двумя вероятностными кривыми. Несмотря на то, что «завышенных» значений анализа в рассматриваемом случае встречается существенно меньше, локальный максимум в точке «12.5» встречается и здесь.

Рисунок 7

 

С точки зрения классического подхода эти «незначительные отклонения» можно объяснить неаккуратностью измерений, или использование «просроченных» маркеров для анализаторов, или… Все это так, но наблюдаемые отличия могут быть объяснены и различием в поведении представителей разных «кластеров» при этих заболеваниях. Так, например, «Гипертонии» в большей степени могут быть подвержены представители кластера, который условно можно обозначить как «6», а кластер «15» от этого недуга практически избавлен.

Сделаем следующий шаг и рассмотрим кривые плотностей вероятности для анализа «Г0020». Предположим, что выдвинутая гипотеза имеет право на существование. Попробуем представить полученные в эксперименте (на самом деле в реальных лечебных процессах) кривые в виде огибающей «спектра нормальных распределений». Каждая «линия» такого спектра описывается формулой Гаусса:

Применительно к нашему рассмотрению «X» — математическое ожидание для значений анализа, характерного для выбранного «кластера» пациентов. «А» — параметр, определяющий количественную долю представителей кластера «X» в генеральной выборке пациентов. P(X) – число представителей кластера в бине, заключенном между значениями «хi» и «хi+1». Наконец «?» — значение стандартного отклонения значений анализа, применительно к кластеру «X». Существенным явилось бы выяснение правомерности утверждения о единственности представления кривой распределения плотности вероятности в виде «спектра гауссиан». Но пока ограничимся тем, что такое разложение принципиально возможно.

Рассмотрим варианты «нормальных» спектров применительно к сплайнам огибающих для вероятных значений анализа «Г0020». Они представлены на рисунках 8, 9 и 10. В данном случае сплошная «жирная» линия соответствует реальным данным, а пунктирная — определяет огибающую для совокупности «спектральных линий», обозначенных тонкими контурами. Видно, что реальный эксперимент и полученная огибающая спектра практически совпадают.

Рисунок 8

 

Рисунок 9
Рисунок 10

 

Характерно, что референтный интервал в данном случае перекрывает практически весь диапазон изменения показателя (от 5 до 13!). То есть с учетом «классического» подхода для указанных диагнозов проведение анализа «Г0020» смысла не имеет.

В то же время картина меняется, если рассматривать пациента, как устойчивую и сбалансированную химико-биологическую систему, в здоровом состоянии адекватно реагирующую на внешние раздражители: нагрузки, лекарственные препараты, пищу и т.д. Очевидно, что задача любой устойчивой замкнутой системы, к числу которых несомненно относится и человек, связана с максимальным снижением негативных последствий внешних воздействий, или нарушений в работе одного из своих элементов (внутренних органов).

В последнем случае, например, при заболевании поджелудочной железы, на начальном этапе радикально может меняться значение прямого индикатора (содержание инсулина), или опосредованного (количество глюкозы в крови), при сохранении значений всех остальных анализов. Предположим, что в нашем распоряжении имеются описания «кластеров», значения «Х» которых не связанны с нарушением работы рассматриваемого органа. В этом случае интересно было бы сравнить между собой их количественные характеристики («А», «Х» и «?») для случаев «здоровые пациенты» и «заболевание с диагнозом Y».

Допустим, что кластеры, определяемые близостью значений устойчивых анализов, действительно существуют (своеобразный аналог теории «квантования»). Тогда, отталкиваясь от сопоставления вида вероятностных распределений данных для различных групп, можно было бы делать обоснованные предположения о склонности их представителей к тем, или иным заболеваниям. В определенном смысле это могло бы стать более доступной альтернативой расшифровке генетического кода. То есть, при состоятельности выдвигаемой гипотезы мы могли бы разработать дополнительные инструменты ранней диагностики и профилактики. Наконец, проводя параллель с геномом, можно предположить, что совокупность значений анализов, характерных для каждого конкретного человека, может быть достаточно устойчива.

Вернемся, однако, к рисункам. Нетрудно заметить, что все три «экспериментальные кривые», смоделированы практически одним и тем же набором функций Гаусса, немного отличающихся положением мод3 и значениями стандартных ошибок (?) для разных диагнозов. Основное же отличие заключается в параметрах «А», оказывающих определяющее влияние, как на положение «наиболее вероятного» значения огибающей, так и на ее общий.

Отталкиваясь от реального вида кривой плотности значений можно сделать предположение, что основную «группу риска» для диагнозов «I48» и «I11.9» составляют пациенты, относящиеся к кластеру «10.5», в то время как представители кластер «8» должны более пристальное внимание обращать на признаки проявления стенокардии. Представители же кластера «6.5» могут практически ничего из этого набора заболеваний не опасаться.

В завершение рассмотрим вид распределения плотности значений для анализа «Г0018» (рисунки 11, 12 и 13). При определении «нормы» и референтных интервалов (14 и 10÷18 соответственно) исследователи, вполне возможно, и пользовались результатами, соответствующими некоему «нормальному распределению», но распределения в рамках рассматриваемых диагнозов этому условию заведомо не соответствуют. Прежде всего, имеются четыре характерных экстремума (на рисунке 11 это значения: «11.6», «14.4», «16.4» и «20»). При более аккуратном разложении огибающих в «спектр», таких экстремумов окажется наверняка больше, но мы ограничимся указанными.

график 3
Рисунок 11
график 2
Рисунок 12

 

график 1
Рисунок 13

Рассматривая полученный результат с точки зрения «классических представлений», мы вынуждены будем констатировать, что анализ «Г0018» является маркером для приведенных диагнозов. И действительно, значительная часть данных обследованных пациентов существенно выходит за рамки референтного интервала. Возникает, правда, вопрос: «почему при таком значительном изменении количественного соотношения групп «здоровых» (анализы в рамках референтного интервала) и «заболевших» пациентов положение моды (наиболее вероятного значения анализа) остается неизменным?».

Если же принять теорию «кластеров», все становится на свои места. Вполне можно себе представить, что группа пациентов, анализы которой тяготеют к значению «20», в рассматриваемых диагнозах представлена гораздо шире и при этом вполне укладывается в свой локальный (относящийся к «кластеру») референтный интервал. Дополнительным аргументом в пользу теории является и факт наличия указанного «кластера» и в анализах диагноза «I11.9». Там он, правда, выражен менее ярко и, при желании, может быть интерпретирован, как «погрешность».

Следует отметить, что выводы из рассмотрения значения анализа «Г0018» для диагнозов «I48» и «I20.0», сделанные на основе альтернативных логик, во многом совпадают, если речь идет о диапазоне «20». Но обоснования результата заметно отличаются. Если в первом случае речь идет о выходе за референтный интервал, то во втором, об отношении пациента к «группе риска». В то же время, при «классическом» подходе значение анализа, равное 16-ти, настороженности у специалиста вызывать не должно, в то время как при втором, подозрение на «I20.0» должно просто «бить в набат».

Аналогичное высказывание справедливо и для значений анализа в диапазоне «12». Врачу в этом случае имеет прямой смысл провести дополнительные исследования, связанные с уточнением признаков таких заболеваний, как «I48» и «I11.9» (Рисунки 11 и 13).

Вместо заключения

С исторической точки зрения только «вчера» началось активное внедрение информационных систем в работу медицинских организаций. Но уже сегодня мы оказались погружены в принципиально новую информационную реальность. И дело здесь не только в доступности сотен терабайт данных и наличии инструментов и методов их обработки. Появилась основа для проверки корректности существующих представлений об интересующих нас объектах и связанных с ними процессах. Остановка за оптимальными подходами к выбору наиболее перспективных направлений исследований.

Если позиции «искусственного интеллекта», благодаря кинематографу, фантастической литературе и политике Государства уже закрепились под бюджетным солнцем, то вопросы поиска новых зависимостей, закономерностей и представлений пока еще ожидают своей востребованности.

Озвученная выше идея кластеризации представляет из себя не более чем гипотезу, требующую подтверждения, или опровержения. Но подобных задач, отталкивающихся от недоступных ранее наблюдений, множество. И их количество будет, как нам кажется, стремительно нарастать. Необходимо научиться выбирать из них те, которые в обозримой перспективе способны реально повлиять на повышение эффективности и качества лечебных процессов.

Так, в частности, если рассматриваемая гипотеза окажется состоятельной, основанные на ней выводы могут привести к существенному пересмотру представлений о сути как референтных интервалов, так и «нормы». Пока в этом направлении сделан только первый шаг. Очень не хватает данных по анализам, связанным с состоянием «здоров». То есть, как и во многих подобных случаях, требуют подготовки и согласования программы действий, в последние годы все чаще обозначаемые словосочетанием «дорожная карта». В контексте изложенного выше необходимо предусмотреть, как минимум, следующие шаги:

  • Формирование «Паспортов обследований» населения в рамках диспансеризации с включением в нее существенно более широкого набора лабораторных исследований.
  • Целенаправленное рассмотрение (изучение) плотностей распределения результатов анализов для различных заболеваний с целью определения наличия на них характерных локальных экстремумов и «перегибов».
  • Анализ пригодности (возможности использования) существующих методов и алгоритмов математического моделирования с целью представления вероятностных кривых в виде «спектра» нормальных распределений с проверкой их стабильности и воспроизводимости.
  • Продумывание методики диагностирования с учетом возможной состоятельности гипотезы кластеризации.
  • На основе проводимых обследований проведение сопоставления выводов, опирающихся на «классические» и «альтернативные» представления.

Понятно, что для реализации подобных программ необходима, как минимум, законодательная основа доступа к деперсонифицированной информации, накапливаемой в МИС, и согласованные (скоординированные) действия владельцев первичных данных, разработчиков программного обеспечения и профессиональных аналитиков. Ну и, конечно, желание что-то в этой жизни поменять к лучшему.

Читайте еще: «Практика разработки и внедрения системы менеджмента качества в медицинской организации»

13 января / 2020
Автор: Валерий Пулит
Фотографии:
Наши контакты
Санкт-Петербург, Гаккелевская улица 21А,
"Балтийский деловой центр"

    Отправляя данную форму, Вы соглашаетесь с политикой конфиденциальности и правилами нашего сайта

    Нажимая на кнопку, вы даете согласие на обработку персональных данных и соглашаетесь c политикой конфиденциальности.