Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

QSAR REGRESSION MODEL OF ACUTE SUBLETHAL NEUROTOXICITY OF ORGANIC SOLVENTS WITH RESPECT TO RATS

Grigorev V.Y. 1 Raevskaya O.E. 1 Raevsky O.A. 1
1 Institute of Physiologically Active Compounds
It is developed QSAR regression model of acute sublethal neurotoxicity of 44 organic solvents with respect to rats. It is established that modelled biological activity depends on such descriptors, as polarizability, sum of partial atom charges, H-acceptor ability and dipole moment of molecules. Designed QSAR model has higher statistical characteristics in comparison with the models published in the literature.
neurotoxicity
QSAR
HYBOT

Важным свойством химических соединений является их токсичность. Среди различных видов токсичности особое место занимает нейротоксичность, которая в той или иной степени присуща всем веществам [1]. Для исследования биологической активности химических соединений, в том числе и токсичности, с успехом используются методы QSAR. В настоящее время известно ограниченное количество данных по нейротоксичности, которые могли бы быть применены в QSAR исследованиях. Одним из таких массивов являются данные работы [7], которые были неоднократно использованы для создания регрессионных моделей на основе топологических и физико-химических дескрипторов [5, 6].

Цель настоящего исследования состояла в создании новых количественных моделей «структура – нейротоксичность» с высокими статистическими характеристиками на основе небольшого количества интерпретируемых физико-химических дескрипторов.

Материалы и методы исследования

Данные по острой сублетальной токсичности (EC30, мкМ/л, ингаляционно, 4 часа) 47 органических растворителей были взяты из работы [5]. Физико-химические молекулярные дескрипторы рассчитывали с использованием компьютерной программы HYBOT [3]. Ряд дескрипторов включал в себя: поляризуемость (α, Å3), максимальный положительный атомный заряд (max(Q+)), сумму положительных атомных зарядов (S(Q+)), сумму положительных атомных зарядов/α (S(Q+)/α), максимальный свободноэнергетический Н-акцепторный дескриптор (max(Ca)), сумму свободноэнергетических Н-акцепторных дескрипторов (S(Ca)) В работе также были использованы экспериментальные значения дипольных моментов (m, Д) [2]. Регрессионный анализ проводили на основе алгоритма SVD [4]. В качестве статистических характеристик полученных моделей использовали: n – число точек, m – число дескрипторов, r2 – коэффициент детерминации, rmsec – среднеквадратичное отклонение, q2 и rmsecv – коэффициент детерминации и среднеквадратичное отклонение в условиях кросс-валидации с выбором по одному, соответственно. В качестве оценок погрешности коэффициентов моделей использовали стандартные ошибки. Расчет регрессионных моделей выполняли путем перебора всех возможных комбинаций дескрипторов. Лучшие модели определяли по минимальной величине rmsec.

Результаты исследования и их обсуждение

В структурном плане анализируемые органические растворители представляют собой довольно разнородный ряд (табл. 1). В их состав входят: алканы, алкены и их хлорпроизводные, спирты, простые и сложные эфиры, кетоны, бензол и его производные, производные пиридина. Представленные данные по нейротоксичности свидетельствуют о достаточно широком диапазоне изменения моделируемой активности, который составляет 2.37 логарифмических единиц. В настоящей работе были использованы физико-химические параметры (поляризуемость, атомные заряды, дипольный момент, дескрипторы водородной связи), которые непосредственно связаны с теоретическим описанием межмолекулярных взаимодействий. Эти дескрипторы имели следующие диапазоны изменения: α: 6.43÷15.94 Å3, max(Q+): 0.01÷0.24, S(Q+): 0.01÷0.87, S(Q+)/α: 0.002÷0.081, max(Ca): 0.00÷2.47, S(Ca): 0÷3.19, m: 0.00÷2.76 Д.

Таблица 1

Названия, острая сублетальная нейротоксичность EC30 (мкМ/л) и молекулярные физико-химические дескрипторы: α (Å3), max(Q+), S(Q+), S(Q+)/α, max(Ca), S(Ca), m (Д) исследованных соединений

Соединение

log(1/EC30)

α

max(Q+)

S(Q+)

S(Q+)/α

max(Ca)

S(Ca)

m

1

н-Пентан

-2.94

9.95

0.03

0.36

0.037

0.00

0.00

0.00

2

Метилацетат

-2.77

6.71

0.24

0.54

0.081

1.50

1.65

1.67

3

1-Пропанол

-2.71

6.92

0.10

0.39

0.056

1.61

1.61

1.65

4

Этилацетат

-2.58

8.54

0.24

0.61

0.072

1.54

1.69

1.74

5

н-Гексан

-2.50

11.78

0.03

0.44

0.037

0.00

0.00

0.00

6

Пропилацетат

-2.44

10.38

0.24

0.68

0.066

1.50

1.65

1.80

7

Бутилацетат

-2.32

12.21

0.24

0.75

0.062

1.47

1.62

1.84

8

2-Метил-1-пропанол

-2.19

8.75

0.11

0.46

0.053

1.57

1.57

1.66

9

Циклогексан

-2.17

11.01

0.03

0.41

0.037

0.00

0.00

0.00

10

Ацетон

-2.16

6.43

0.10

0.31

0.048

1.79

1.79

2.70

11

1-Бутанол

-2.15

8.75

0.10

0.46

0.053

1.60

1.60

1.62

12

Циклогексилацетат

-2.08

15.11

0.24

0.87

0.058

1.52

1.68

1.90

13

н-Гептан

-2.05

13.62

0.03

0.51

0.037

0.00

0.00

0.00

14

Диэтиловый эфир

-1.98

8.75

0.05

0.45

0.051

1.54

1.54

1.24

15

Дихлорметан

-1.91

6.47

0.04

0.08

0.012

0.15

0.30

1.61

16

Диоксан

-1.88

8.61

0.06

0.65

0.075

1.48

2.96

0.40

17

1,2-Дихлорэтен

-1.87

8.11

0.04

0.08

0.009

0.15

0.42

1.28

18

3-Метил-1-бутанол

-1.85

10.59

0.11

0.53

0.050

1.62

1.62

1.72

19

1-Пентанол

-1.83

10.59

0.11

0.53

0.050

1.61

1.61

1.66

20

2-Пропанол

-1.82

6.92

0.11

0.39

0.057

1.69

1.69

1.75

21

Дисульфид углерода

-1.75

8.83

0.01

0.01

0.002

1.59

3.19

0.00

22

2-Бутанон

-1.71

8.27

0.10

0.38

0.046

1.91

1.91

2.76

23

Тетрагидрофуран

-1.70

7.98

0.05

0.41

0.052

1.66

1.66

1.71

24

2-Бутанол

-1.65

8.75

0.11

0.46

0.053

1.62

1.62

1.65

25

Бензол

-1.58

10.43

0.03

0.21

0.020

0.11

0.64

0.00

26

1,1,1-Трихлорэтан

-1.48

10.23

0.04

0.15

0.015

0.07

0.21

1.57

27

4-Ксилол

-1.45

14.10

0.04

0.33

0.023

0.10

0.60

0.00

28

1,2,4-Триметилбензол

-1.42

15.94

0.04

0.39

0.024

0.11

0.54

0.30

29

Тетрахлорметан

-1.40

10.32

0.08

0.08

0.008

0.16

0.63

0.00

30

Хлорбензол

-1.40

12.36

0.04

0.20

0.016

0.25

0.63

1.58

31

1,2-Дихлорэтан

-1.36

8.30

0.04

0.15

0.019

0.38

0.76

1.75

32

3-Ксилол

-1.36

14.10

0.04

0.33

0.023

0.11

0.56

0.35

33

Трихлорэтен

-1.32

10.04

0.04

0.08

0.008

0.15

0.52

0.80

34

1,2,3-Триметилбензол

-1.30

15.94

0.04

0.39

0.024

0.12

0.63

0.56

35

Стирол

-1.30

13.91

0.04

0.27

0.019

0.22

0.85

0.37

36

Тетрахлорэтен

-1.30

11.96

0.02

0.04

0.003

0.15

0.71

0.00

37

1,3,5-Триметилбензол

-1.26

15.94

0.04

0.39

0.024

0.14

0.70

0.00

38

Циклогексанон

-1.26

11.16

0.10

0.49

0.044

2.06

2.06

2.75

39

Трихлорметан

-1.26

8.39

0.05

0.09

0.011

0.08

0.24

1.18

40

Толуол

-1.26

12.27

0.04

0.27

0.022

0.10

0.51

0.40

41

1,1,2-Трихлорэтан

-1.23

10.23

0.05

0.15

0.014

0.38

0.69

1.36

42

Пиридин

-1.20

9.73

0.04

0.28

0.029

2.47

2.92

2.21

43

2-Ксилол

-1.18

14.10

0.04

0.33

0.023

0.10

0.62

0.52

44

Пропилбензол

-1.15

15.94

0.04

0.41

0.025

0.12

0.71

0.40

45

Этилбензол

-1.00

14.10

0.04

0.33

0.024

0.11

0.65

0.40

46

3-Метилпиридин

-0.83

11.56

0.05

0.34

0.030

1.87

2.33

2.30

47

1,1,2,2-Тетрахлорэтан

-0.57

12.16

0.05

0.15

0.012

0.15

0.60

1.70

В табл. 2 представлены регрессионные модели нейротоксичности, включающие в себя от 1 до 6 дескрипторов. Для того чтобы выявить среди них наиболее адекватную модель, был проведен анализ зависимости величины rmsec от числа дескрипторов m. После модели 4 величина rmsec практически не меняется, поэтому она была выбрана в качестве основной для дальнейшей работы. Соответствующее уравнение (1) имеет достаточно хорошие статистические характеристики, которые, однако, могут быть улучшены путем дальнейшей обработки.

Таблица 2

Статистические характеристики и физико-химические дескрипторы регрессионных моделей «структура – нейротоксичность»

n

m

r2

rmsec

q2

rmsecv

Дескрипторы

1

47

1

0.442

0.40

0.396

0.42

S(Q+)/α

2

47

2

0.534

0.37

0.488

0.39

α, S(Q+)

3

47

3

0.688

0.31

0.599

0.35

α, S(Q+), µ

4

47

4

0.740

0.28

0.556

0.37

α, S(Q+), S(Ca), µ

5

47

5

0.760

0.28

0.584

0.36

α, max(Q+), S(Q+), S(Ca), µ

6

47

6

0.776

0.27

0.495

0.41

α, max(Q+), S(Q+), max(Ca), S(Ca), µ

log(1/EC30) = –3.21(±0.24) + 0.170(±0.019)α – 2.29(±0.25)S(Q+) +

+0.190(±0.065)S(Ca) +0.246(±0.063)µ (1)

(n=47; r2=0.740; rmsec=0.28; q2=0.556; rmsecv=0.37).

Одной из стандартных процедур при исследовании регрессионных QSAR моделей является анализ Y-выбросов. При использовании этого подхода для анализа модели (1) было установлено, что в случае н-пентана, диоксана и дисульфида углерода отклонение рассчитанных величин нейротоксичности от экспериментальных значений превышает двукратную величину rmsec. Следует отметить, что в регрессионных моделях других авторов также фиксируется наличие Y-выбросов. Так, в работе [5] в качестве таких статистических выбросов фигурируют 4 молекулы: н-пентан, н-гексан, н-гептан и циклогексан, а в работе [6] – циклогексилацетат и диоксан. Несмотря на то, что регрессионные модели созданы на основе различных по своей природе дескрипторах, частичное совпадение результатов может свидетельствовать о наличии каких-то систематических погрешностей, связанных, например, с выходом указанных соединений из структурной области применения моделей.

В результате исключения Y-выбросов из анализируемой серии была получена модель (2), которая характеризуется высокими статистическими характеристиками и соответствует современным требованиям, предъявляемым к QSAR моделям [8].

log(1/EC30) = -3.08(±0.21) + 0.169(±0.016)α -2.61(±0.23)S(Q+) +0.238(±0.085)S(Ca) +0.204(±0.072) (2)

(n=44; r2=0.823; rmsec=0.23; q2=0.776; rmsecv=0.26).

Так, в частности, r2>0.6, q2>0.5, r2-q2<0.2. Следует подчеркнуть, что модель (2) имеет очевидные преимущества по сравнению с предшествующими регрессионными уравнениями. По сравнению с моделью, представленной в работе [5] (r2=0.503, s=0.388), уравнение (2) имеет более высокий коэффициент корреляции и более низкую величину среднеквадратичного отклонения. По отношению к модели, разработанной авторами публикации [6], кроме вышеперечисленных достоинств, следует причислить наличие меньшего числа коэффициентов в уравнении (5 против 7).

Также необходимо отметить отсутствие в разработанной модели трудно интерпретируемых топологических дескрипторов. Использованные нами переменные имеют ясный физико-химический смысл. Так, из полученной модели (2) следует, что к увеличению нейротоксичности ведет увеличение поляризуемости, Н-акцепторной способности и дипольного момента молекул. Уменьшению активности способствует увеличение суммарного атомного заряда молекул. При этом основной вклад в моделируемое свойство вносят поляризуемость и суммарный атомный заряд молекул. Полученные данные открывают дополнительные возможности при решении как прямой (предсказание нейротоксичности для новых соединений), так и обратной задачи QSAR (конструирование молекул с заданным уровнем нейротоксичности).

Выводы

1. Установлено, что разработанная QSAR модель острой сублетальной нейротоксичности ряда органических растворителей по отношению к крысам имеет более высокие статистические характеристики по сравнению с известными в литературе моделями.

2. Выявлено, что нейротоксичность исследованных соединений зависит от таких молекулярных дескрипторов, как поляризуемость, сумма атомных зарядов, Н-акцепторная способность, дипольный момент.