|
NEU-2002
ПРОГНОЗИРОВАНИЕ РАЗВИТИЯ СЕРДЕЧНО-СОСУДИСТЫХ ПАТОЛОГИЙ
НА ОСНОВЕ РАСЧЕТА ГЛОБАЛЬНОГО РИСКА
Н.С. Гарколь, А.Н. Тушев, Е.Н. Воробьева, Т.В. Иванова
Алтайский технический университет,
E-mail: tus@agtu.secna.ru
 
В настоящее время разработано достаточно много медицинских нейросетевых экспертных систем, позволяющих сократить время диагностики различных заболеваний. Известно, что в диагностике сердечно-сосудистых заболеваний ведущим фактором риска являются дислипопротеинемии (ДЛП) [1]. Однако в диагностике дислипопротеинемий четко определить роль различных форм липопротеинов достаточно затруднительно, поэтому применение математического метода нечетких множеств дает возможность интерпретировать неопределенность, обусловленную частичной принадлежностью объектов (фенотипов) множеству по отношению к их свойствам.
Целью настоящего исследования явилась разработка программно-диагностического комплекса автоматизированного определения степени глобального кардиоваскулярного риска и прогнозирования развития сердечно-сосудистой патологии с учетом фенотипирования дислипопротеинемий на основе обучения искусственных нейронных сетей и на последующей кластеризации с использованием нечетких множеств.
Материалом для исследования послужили данные Городского липидологического центра г. Барнаула 5121 пациентов с различными степенями кардиоваскулярного риска, на основании которых была создана информационная база. Информационная база данных содержала четыре класса "кардиоваскулярного" риска: легкий, умеренный, высокий, очень высокий, а также 12 признаков, включающих сведения об клинико-лабораторном исследовании параметров сыворотки крови, антропометрические показатели.
В работе была использована собственная разработка программного комплекса имитатора искусственной нейронной сети слоистой архитектуры. Таблица данных для обучения состояла из 364 примеров, для тестирования было выделено 24 примера, по 6 примеров на каждую группу "кардиоваскулярного" риска. В результате тестирования нейронная сеть распознала 13 из 24 примеров правильно, что составило 54,1%. К неправильно распознанным примерам были отнесены и те, у которых на выходном слое нейронной сети фиксировались несколько (два и более) нейронов с достаточно высоким уровнем активности, в результате чего достаточно сложно однозначно определить степень риска развития сердечно-сосудистых патологий.
Таким образом, на практике оказалось, что достаточно сложно выделить четкие границы между смежными "кардиоваскулярными" классами. Для ранжировки признаков и оценки эффективности разделения классов был применен метод дивергенции, где ранг важности каждого входного признака устанавливается исходя из значения соответствующей ему дивергенции. Данный подход к выделению признаков заключается в порождении множества признаков, свойства которых позволяют максимизировать меру различия между классами. Дивергенция использовалась в качестве критерия при порождении оптимального множества признаков и определялась как расстояние Махаланобиса между классами. Применимость этих преобразований основывается на допущении идентичных математических ожиданиях всех классов [1, 2].
Кроме того, данные преобразования дают хороший эффект кластеризации, минимизирующий энтропию, а также эти преобразования не приводят к перекрытию любых двух образов, принадлежащим разным классам.
Для тестирования было взято уже 120 примеров, по 30 примеров на каждую группу "кардиоваскулярного" риска, результат тестирования показал, что 119 из 120 примеров распознано правильно, что составило 99,1%. Неверно распознанный пример, видимо, можно отнести на счет требуемой вероятности ошибки, при повышении которой встал бы вопрос о преобучивании сети или проведения дополнительной процедуры упорядочивания признаков и определении количества измерений, приводящих к требуемой вероятности ошибки.
Анализ приведенных данных показывает, что качество распознавания достаточно высоко и не требует проведения дополнительных вышеуказанных процедур.
Проведенные исследования показали эффективность использования нейронных сетей в прогнозировании развития сердечно-сосудистых патологий на основе расчета глобального риска, что обеспечивает проведение своевременного мониторинга по их коррекции.
Литература:
1. Варшавский Б.Я., Воробьева Е.Н, Тушев А.Н., Гарколь Н.C. и др. Взаимосвязь различных факторов риска ишемической болезни сердца у жителей Алтайского края // Вестник Российской академии медицинских наук. 2001. № 2. С. 31–34.
2. Ту Д., Гонсалес Р. К. Принципы распознавания образов. - М., Мир, 1978.
3. Прикладная статистика. Классификация и снижение размерности: Спр. изд. /Айвазян
и др., М., Финансы и статистика, 1989.
|