Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

A CANCER DISEASE STAGES ESTIMATION METHOD BASED ON THE GROUP CLASSIFICATION OF THE DISTRIBUTIONS

Butov A.A. 1 Korchagina I.A. 1
1 Ulyanovsk State University
The article presents the developed method of statistical estimation of stages of the disease in people with cancer based on group classification of distributions. The definition of stages is one of the factors of cancer treatment. This method treats the set of the patient’s health indicators. Each of the health parameters is an independent random variable with the same type of distribution.On its basis the functions of likelihood ratio were built. By considering these functions separately, the intervals for stages for each health indicator were evaluated. But given the functions of the likelihood ratio in the aggregate, the situations were identified and described when the stage of the disease is clearly defined, and when it is not possible to determine the stage. This result simplifies the definitions of the stages in the treatment of patient.
statistical estimation
health indicators
likelihood ratio.

Введение

По статистическим данным в 2011 г. в России раковые болезни были обнаружены у 522410 людей, число умерших составило 285535. В структуре смертности населения России раковые болезни занимают второе место (15%), [1].

Рак – любая злокачественная опухоль. Характерной чертой рака является неконтролируемые рост и деление клеток. Успешность и способ лечения рака зависят от типа, расположения опухоли и стадии развития рака, [2]. Статистические исследования, показали, что доля больных с впервые установленным диагнозом ракового заболевания по стадиям опухолевого процесса составила: I стадия – 23,9%, II – 25,9%, III – 21,8%, IV – 21,3%, [1]. Поэтому при лечении возникает задача правильно определить стадию ракового заболевания по комплексу анализов.

Метод оценки стадий раковых заболеваний

В работе приведен метод оценки раковых заболеваний, позволяющий на основе группы показателей здоровья, дифференцировать стадию заболевания. Показатели здоровья в данном случае рассматриваются как случайные величины, которые могут влиять на определение стадии ракового заболевания.

Пусть 110856.jpg – вероятностное пространство, где 110863.jpg – пространство элементарных событий, 110871.jpg110879.jpg-алгебра подмножеств 110891.jpg, 110898.jpg – вероятностная мера, [3]. Тогда показатели здоровья 110905.jpg – случайные величины, определенные на вероятностном пространстве 110915.jpg, где 110923.jpg – общее число показателей здоровья в группе. Для каждого показателя здоровья 110932.jpg, 110939.jpg, 110947.jpg на вероятностном пространстве 110954.jpg были определены функции

110962.jpg (1)

и

110970.jpg, (2)

где каждая из функций описывает плотности вероятностей каждой стадии заболевания из двух исследуемых. На основании этих функции для каждого показателя 110982.jpg, 110989.jpg, 110996.jpg было построено отношение правдоподобия, [4]

111006.jpg. (3)

Функция отношения правдоподобия 111014.jpg, 111024.jpg, 111031.jpg может принимать значения в интервале 111039.jpg. На рисунке 1 представлен график зависимости отношения правдоподобия от показателя здоровья.

Отношение правдоподобия показывает изменение стадии ракового заболевания при каком-то определенном значении показателя здоровья у пациента. Для того чтобы разграничить стадии заболевания введем 111046.jpg 111054.jpg, где 111062.jpg – пороговое значение.

Таким образом, для каждого показателя 111078.jpg, 111085.jpg, 111092.jpg были определены интервалы 111102.jpg и 111110.jpg, 111119.jpg,

где 111126.jpgи 111134.jpg, соответственно.

111659.jpg 

Рис. 1. Отношение правдоподобия

Объединим интервалы 111141.jpg,111149.jpg во множество

111158.jpg (4)

и 111170.jpg, 111177.jpg во множество

111184.jpg, (5)

соответственно. Формулы (4) и (5) определяют области, где стадии ракового заболевания могут быть дифференцируемы для каждого показателя здоровья 111196.jpg, 111205.jpg, 111214.jpg. Исходя из этих формул, определим область для каждого показателя здоровья 111221.jpg, 111229.jpg, 111236.jpg, где стадии ракового заболевания не могут быть дифференцируемы

111244.jpg. (6)

Пусть 111252.jpg, 111266.jpg – значения показателей здоровья, тогда рассмотрим следующие ситуации:

1) если существует номер 111338.jpg такой, что 111345.jpg, 111355.jpg, то требуется проверить, чтобы 111363.jpg, 111372.jpg. Если нет противоречия, то тогда можно диагностировать стадию заболевания.

2) если существует номер 111385.jpg такой, что 111393.jpg, 111400.jpg, то требуется проверить, чтобы 111408.jpg, 111416.jpg. Если есть противоречие, то увеличиваем D на 3%-10%.

3) нет ни одного 111435.jpg такого, что 111442.jpg, то рассчитываем значение

111449.jpg. (7)

Для того чтобы разграничить стадии в совокупности введем 111459.jpg111467.jpg, где 111476.jpg– пороговое значение.

Если 111483.jpg или 111491.jpg, то можно однозначно диагностировать стадию.

Если 111498.jpg,

то невозможно однозначно судить о том, какая стадия заболевания.

Настоящий метод был апробирован как в имитационных моделях, так и при анализе лабораторных числовых рядов, полученных при исследовании статистического материала заболеваемости в Ульяновской области.

Работа выполнена при поддержке Министерства образования и науки РФ (НИР, проводимых в рамках государственного задания Министерства образования и науки РФ на 2013 г., Программы развития деятельности студенческих объединений УлГУ на 2012-2013 гг.)