Нейросетевая обработка данных пациентов больных раком молочной железы
Капошилова А.А., Жуков Л.А.
Сибирский Государственный Технологический Университет
Данные
для первоначальной нейросетевой обработки
получены из архива Краевого
онкологического диспансера. Для обработки
использовались параметры: личные сведения
о больном (возраст, район проживания и
другие), сведения о сроке наблюдения у
онколога и проводившихся ранее видах
лечения, планируемом или проводящемся
лечении и о результатах анализов. Была
разработана структура файла базы данных.
Файл базы данных содержит 74 параметров и 91
запись.
Для
нейросетевой обработки данные были
оцифрованы. Для каждого поля файла был
разработан свой кодификатор. Примеры:
1) Поле место жительства кодировалось как
Красноярск – 1;
город Красноярского края – 2;
село, поселок, деревня – 3.
2) Возраст – количество лет
3) Вес – в килограммах
4) Рост – в сантиметрах
5) Вид работы: умственная - 1
физическая - 2
не работает - 3
6) Профессиональная вредность
1. Производство
связано с химическими веществами (химическое производство)
2. Производство связано с повышенной температурой
3. Угольное производство
4. Металлургия
5. Сидячая работа
6. Служащие (врачи, учителя)
7. Домработница
7) Стадия: 1–1, 2A–2, 2Б – 3, 3A–4, 3Б–5, 3В–6.
Из-за отсутствия значительной части необходимых
параметров в карточках больных, не все из
них используются на данном этапе работ.
Предполагается, что данные будут
уточняться, и дополняться в ходе дальнейшей
работы. Основными особенностями данных
были: зашумленность и наличие
множественных пропусков (пробелов) в данных,
поэтому для нейросетевой обработки из 74
полей было использовано только 54.
Цель
данного этапа исследований было изучить
возможность использования нейронных сетей
для решения трудно формализуемых экспертно-диагностических
задач и обучить набор специализированных
нейронных сетей для систематизации больных
с онкопатологией, классификации таких
больных и выделения основных типов, а также
выявление факторов, имеющих наибольшее
влияние на течение болезни.
Для обработки
данных выполнено обучение нескольких серий
нейронных сетей. Каждая сеть обучалась для
классификации на два класса без учителя.
Было обучено 123 набора нейронных сетей для
классификации на два класса и выделением
значимых параметров.
Таблица 1 – Значимые параметры, выделенные при обучении по всей ОВ
| Поле
| Наименование поля
| Значимость
|
|---|
| J_OP
| j-терапия+операция
| 0.62
| | YZ_PODM
| Наличие узлов в подмышечной области со стороны поражения
| 0.59
| | OP_G_X
| Операция+гамма терапия+химио терапия
| 0.59
| | G_OP_X
| Гамма терапия + операция + химио терапия
| 0.51
| | ST_
| Стадия
| 0.46
| | OP_HOLST
| Операция Холстеда
| 0.26
| | T_R
| Размер опухоли
| 0.21
| | OP_PD
| Операция Педжета
| 0.19
| | V_N
| Локализация верхня-наружная
| 0.18
|
Описание классов.
Возраст,
рост и вес пациенток обоих классов
приблизительно одинаков (возраст 51,9 лет для
первого класса и 51,5 лет для второго, вес 75,4
кг и 76,2 кг, рост 156,9 см и 158,3 см, площадь тела
женщин, относящихся ко второму классу
больше). Живут пациентки в основном в
городах края, но не в Красноярске. Работают
на физической работе, но оба класса
служащие. Пациентки 1-ого класса имеют 2Б,
второго 3А стадию. Место расположения
опухоли чаще левая в обоих классах.
Длительность наблюдения у пациентов
первого класс больше: для первого 4,5 месяца,
для второго - 2,7 месяцев. Опухоль выявлена
самостоятельно как у пациенток первого так
и второго класса. У пациенток, относящихся к
первому классу время от постановки
диагноза до начала лечения заболевания
меньше в среднем: 9,6 и 14,8 дней. Менопауза, у
пациенток второго класса 10,2 и 4,9 лет.
Пациентки обоих классов в среднем по 4
аборта. Выкидышей нет в обоих классах. Роды
по одному ребенку для обоих классов.
Частота обращений к врачу пациенток
второго класса выше. Размер опухоли у
пациенток первого класса 3,1 см, у второго 4,7
см. У второго класса наличие узлов в
подмышечной области 20% и 80%. У пациенток
второго класса чаще проводилась операция
Холстеда. Операция Пейти-Дейсона
проводилась у пациенток обоих классов.
Лечения проводились для пациенток первого
класса Крупные Фракции, операция+гамма
терапия+химио терапия. Лечения проводились:
для пациенток первого класса j-терапия+операция, гамма терапия+операция+химио
терпия.
Аналогично
была обучена еще одна серия нейронных сетей
на обучающей выборке, в которой был удален
параметр, характеризующий стадию (ST). В результате
была получена менее устойчивая
классификация из 115 наборов 11 пришли к
разбиению, которое было получено при
предыдущем обучении.
Таблица 2 – Значимые параметры, выделенные при обучении по ОВ без параметра стадия (ST)
| Поле
| Наименование поля
| Значимости
|
|---|
| OP_G_X
| Операция+гамма терапия+химио терапия
| 0.65
| | J_OP
| j-терапия+операция
| 0.63
| | G_OP_X
| Гамма терапи+ операция+химо терапия
| 0.58
| | YZ_PODM
| Наличие узлов в подмышечной области со стороны поражения
| 0.56
| | OP_HOLST
| Операция Холстеда
| 0.23
| | AFF_Gamma
| Эффект гамма терапии
| 0.16
| | YZ_METTA
| Наличие узлов с постлучевым метаморфозом
| 0.16
| | GAMMA
| Осложнения после гамма терапии
| 0.14
| | T_R
| Размер опухоли
| 0.13
|
В
результате нейросетевой обработки
получена устойчивая классификация
пациентов на два класса с отчетливым
разделением пациентов на группу с более
тяжелой патологией и группу с более легкой
стадией заболевания.
Вернуться к основному списку
|