Важным свойством химических соединений является их токсичность. Среди различных видов токсичности особое место занимает нейротоксичность, которая в той или иной степени присуща всем веществам [1]. Для исследования биологической активности химических соединений, в том числе и токсичности, с успехом используются методы QSAR. В настоящее время известно ограниченное количество данных по нейротоксичности, которые могли бы быть применены в QSAR исследованиях. Одним из таких массивов являются данные работы [7], которые были неоднократно использованы для создания регрессионных моделей на основе топологических и физико-химических дескрипторов [5, 6].
Цель настоящего исследования состояла в создании новых количественных моделей «структура – нейротоксичность» с высокими статистическими характеристиками на основе небольшого количества интерпретируемых физико-химических дескрипторов.
Материалы и методы исследования
Данные по острой сублетальной токсичности (EC30, мкМ/л, ингаляционно, 4 часа) 47 органических растворителей были взяты из работы [5]. Физико-химические молекулярные дескрипторы рассчитывали с использованием компьютерной программы HYBOT [3]. Ряд дескрипторов включал в себя: поляризуемость (α, Å3), максимальный положительный атомный заряд (max(Q+)), сумму положительных атомных зарядов (S(Q+)), сумму положительных атомных зарядов/α (S(Q+)/α), максимальный свободноэнергетический Н-акцепторный дескриптор (max(Ca)), сумму свободноэнергетических Н-акцепторных дескрипторов (S(Ca)) В работе также были использованы экспериментальные значения дипольных моментов (m, Д) [2]. Регрессионный анализ проводили на основе алгоритма SVD [4]. В качестве статистических характеристик полученных моделей использовали: n – число точек, m – число дескрипторов, r2 – коэффициент детерминации, rmsec – среднеквадратичное отклонение, q2 и rmsecv – коэффициент детерминации и среднеквадратичное отклонение в условиях кросс-валидации с выбором по одному, соответственно. В качестве оценок погрешности коэффициентов моделей использовали стандартные ошибки. Расчет регрессионных моделей выполняли путем перебора всех возможных комбинаций дескрипторов. Лучшие модели определяли по минимальной величине rmsec.
Результаты исследования и их обсуждение
В структурном плане анализируемые органические растворители представляют собой довольно разнородный ряд (табл. 1). В их состав входят: алканы, алкены и их хлорпроизводные, спирты, простые и сложные эфиры, кетоны, бензол и его производные, производные пиридина. Представленные данные по нейротоксичности свидетельствуют о достаточно широком диапазоне изменения моделируемой активности, который составляет 2.37 логарифмических единиц. В настоящей работе были использованы физико-химические параметры (поляризуемость, атомные заряды, дипольный момент, дескрипторы водородной связи), которые непосредственно связаны с теоретическим описанием межмолекулярных взаимодействий. Эти дескрипторы имели следующие диапазоны изменения: α: 6.43÷15.94 Å3, max(Q+): 0.01÷0.24, S(Q+): 0.01÷0.87, S(Q+)/α: 0.002÷0.081, max(Ca): 0.00÷2.47, S(Ca): 0÷3.19, m: 0.00÷2.76 Д.
Таблица 1
Названия, острая сублетальная нейротоксичность EC30 (мкМ/л) и молекулярные физико-химические дескрипторы: α (Å3), max(Q+), S(Q+), S(Q+)/α, max(Ca), S(Ca), m (Д) исследованных соединений
№ |
Соединение |
log(1/EC30) |
α |
max(Q+) |
S(Q+) |
S(Q+)/α |
max(Ca) |
S(Ca) |
m |
1 |
н-Пентан |
-2.94 |
9.95 |
0.03 |
0.36 |
0.037 |
0.00 |
0.00 |
0.00 |
2 |
Метилацетат |
-2.77 |
6.71 |
0.24 |
0.54 |
0.081 |
1.50 |
1.65 |
1.67 |
3 |
1-Пропанол |
-2.71 |
6.92 |
0.10 |
0.39 |
0.056 |
1.61 |
1.61 |
1.65 |
4 |
Этилацетат |
-2.58 |
8.54 |
0.24 |
0.61 |
0.072 |
1.54 |
1.69 |
1.74 |
5 |
н-Гексан |
-2.50 |
11.78 |
0.03 |
0.44 |
0.037 |
0.00 |
0.00 |
0.00 |
6 |
Пропилацетат |
-2.44 |
10.38 |
0.24 |
0.68 |
0.066 |
1.50 |
1.65 |
1.80 |
7 |
Бутилацетат |
-2.32 |
12.21 |
0.24 |
0.75 |
0.062 |
1.47 |
1.62 |
1.84 |
8 |
2-Метил-1-пропанол |
-2.19 |
8.75 |
0.11 |
0.46 |
0.053 |
1.57 |
1.57 |
1.66 |
9 |
Циклогексан |
-2.17 |
11.01 |
0.03 |
0.41 |
0.037 |
0.00 |
0.00 |
0.00 |
10 |
Ацетон |
-2.16 |
6.43 |
0.10 |
0.31 |
0.048 |
1.79 |
1.79 |
2.70 |
11 |
1-Бутанол |
-2.15 |
8.75 |
0.10 |
0.46 |
0.053 |
1.60 |
1.60 |
1.62 |
12 |
Циклогексилацетат |
-2.08 |
15.11 |
0.24 |
0.87 |
0.058 |
1.52 |
1.68 |
1.90 |
13 |
н-Гептан |
-2.05 |
13.62 |
0.03 |
0.51 |
0.037 |
0.00 |
0.00 |
0.00 |
14 |
Диэтиловый эфир |
-1.98 |
8.75 |
0.05 |
0.45 |
0.051 |
1.54 |
1.54 |
1.24 |
15 |
Дихлорметан |
-1.91 |
6.47 |
0.04 |
0.08 |
0.012 |
0.15 |
0.30 |
1.61 |
16 |
Диоксан |
-1.88 |
8.61 |
0.06 |
0.65 |
0.075 |
1.48 |
2.96 |
0.40 |
17 |
1,2-Дихлорэтен |
-1.87 |
8.11 |
0.04 |
0.08 |
0.009 |
0.15 |
0.42 |
1.28 |
18 |
3-Метил-1-бутанол |
-1.85 |
10.59 |
0.11 |
0.53 |
0.050 |
1.62 |
1.62 |
1.72 |
19 |
1-Пентанол |
-1.83 |
10.59 |
0.11 |
0.53 |
0.050 |
1.61 |
1.61 |
1.66 |
20 |
2-Пропанол |
-1.82 |
6.92 |
0.11 |
0.39 |
0.057 |
1.69 |
1.69 |
1.75 |
21 |
Дисульфид углерода |
-1.75 |
8.83 |
0.01 |
0.01 |
0.002 |
1.59 |
3.19 |
0.00 |
22 |
2-Бутанон |
-1.71 |
8.27 |
0.10 |
0.38 |
0.046 |
1.91 |
1.91 |
2.76 |
23 |
Тетрагидрофуран |
-1.70 |
7.98 |
0.05 |
0.41 |
0.052 |
1.66 |
1.66 |
1.71 |
24 |
2-Бутанол |
-1.65 |
8.75 |
0.11 |
0.46 |
0.053 |
1.62 |
1.62 |
1.65 |
25 |
Бензол |
-1.58 |
10.43 |
0.03 |
0.21 |
0.020 |
0.11 |
0.64 |
0.00 |
26 |
1,1,1-Трихлорэтан |
-1.48 |
10.23 |
0.04 |
0.15 |
0.015 |
0.07 |
0.21 |
1.57 |
27 |
4-Ксилол |
-1.45 |
14.10 |
0.04 |
0.33 |
0.023 |
0.10 |
0.60 |
0.00 |
28 |
1,2,4-Триметилбензол |
-1.42 |
15.94 |
0.04 |
0.39 |
0.024 |
0.11 |
0.54 |
0.30 |
29 |
Тетрахлорметан |
-1.40 |
10.32 |
0.08 |
0.08 |
0.008 |
0.16 |
0.63 |
0.00 |
30 |
Хлорбензол |
-1.40 |
12.36 |
0.04 |
0.20 |
0.016 |
0.25 |
0.63 |
1.58 |
31 |
1,2-Дихлорэтан |
-1.36 |
8.30 |
0.04 |
0.15 |
0.019 |
0.38 |
0.76 |
1.75 |
32 |
3-Ксилол |
-1.36 |
14.10 |
0.04 |
0.33 |
0.023 |
0.11 |
0.56 |
0.35 |
33 |
Трихлорэтен |
-1.32 |
10.04 |
0.04 |
0.08 |
0.008 |
0.15 |
0.52 |
0.80 |
34 |
1,2,3-Триметилбензол |
-1.30 |
15.94 |
0.04 |
0.39 |
0.024 |
0.12 |
0.63 |
0.56 |
35 |
Стирол |
-1.30 |
13.91 |
0.04 |
0.27 |
0.019 |
0.22 |
0.85 |
0.37 |
36 |
Тетрахлорэтен |
-1.30 |
11.96 |
0.02 |
0.04 |
0.003 |
0.15 |
0.71 |
0.00 |
37 |
1,3,5-Триметилбензол |
-1.26 |
15.94 |
0.04 |
0.39 |
0.024 |
0.14 |
0.70 |
0.00 |
38 |
Циклогексанон |
-1.26 |
11.16 |
0.10 |
0.49 |
0.044 |
2.06 |
2.06 |
2.75 |
39 |
Трихлорметан |
-1.26 |
8.39 |
0.05 |
0.09 |
0.011 |
0.08 |
0.24 |
1.18 |
40 |
Толуол |
-1.26 |
12.27 |
0.04 |
0.27 |
0.022 |
0.10 |
0.51 |
0.40 |
41 |
1,1,2-Трихлорэтан |
-1.23 |
10.23 |
0.05 |
0.15 |
0.014 |
0.38 |
0.69 |
1.36 |
42 |
Пиридин |
-1.20 |
9.73 |
0.04 |
0.28 |
0.029 |
2.47 |
2.92 |
2.21 |
43 |
2-Ксилол |
-1.18 |
14.10 |
0.04 |
0.33 |
0.023 |
0.10 |
0.62 |
0.52 |
44 |
Пропилбензол |
-1.15 |
15.94 |
0.04 |
0.41 |
0.025 |
0.12 |
0.71 |
0.40 |
45 |
Этилбензол |
-1.00 |
14.10 |
0.04 |
0.33 |
0.024 |
0.11 |
0.65 |
0.40 |
46 |
3-Метилпиридин |
-0.83 |
11.56 |
0.05 |
0.34 |
0.030 |
1.87 |
2.33 |
2.30 |
47 |
1,1,2,2-Тетрахлорэтан |
-0.57 |
12.16 |
0.05 |
0.15 |
0.012 |
0.15 |
0.60 |
1.70 |
В табл. 2 представлены регрессионные модели нейротоксичности, включающие в себя от 1 до 6 дескрипторов. Для того чтобы выявить среди них наиболее адекватную модель, был проведен анализ зависимости величины rmsec от числа дескрипторов m. После модели 4 величина rmsec практически не меняется, поэтому она была выбрана в качестве основной для дальнейшей работы. Соответствующее уравнение (1) имеет достаточно хорошие статистические характеристики, которые, однако, могут быть улучшены путем дальнейшей обработки.
Таблица 2
Статистические характеристики и физико-химические дескрипторы регрессионных моделей «структура – нейротоксичность»
№ |
n |
m |
r2 |
rmsec |
q2 |
rmsecv |
Дескрипторы |
1 |
47 |
1 |
0.442 |
0.40 |
0.396 |
0.42 |
S(Q+)/α |
2 |
47 |
2 |
0.534 |
0.37 |
0.488 |
0.39 |
α, S(Q+) |
3 |
47 |
3 |
0.688 |
0.31 |
0.599 |
0.35 |
α, S(Q+), µ |
4 |
47 |
4 |
0.740 |
0.28 |
0.556 |
0.37 |
α, S(Q+), S(Ca), µ |
5 |
47 |
5 |
0.760 |
0.28 |
0.584 |
0.36 |
α, max(Q+), S(Q+), S(Ca), µ |
6 |
47 |
6 |
0.776 |
0.27 |
0.495 |
0.41 |
α, max(Q+), S(Q+), max(Ca), S(Ca), µ |
log(1/EC30) = –3.21(±0.24) + 0.170(±0.019)α – 2.29(±0.25)S(Q+) +
+0.190(±0.065)S(Ca) +0.246(±0.063)µ (1)
(n=47; r2=0.740; rmsec=0.28; q2=0.556; rmsecv=0.37).
Одной из стандартных процедур при исследовании регрессионных QSAR моделей является анализ Y-выбросов. При использовании этого подхода для анализа модели (1) было установлено, что в случае н-пентана, диоксана и дисульфида углерода отклонение рассчитанных величин нейротоксичности от экспериментальных значений превышает двукратную величину rmsec. Следует отметить, что в регрессионных моделях других авторов также фиксируется наличие Y-выбросов. Так, в работе [5] в качестве таких статистических выбросов фигурируют 4 молекулы: н-пентан, н-гексан, н-гептан и циклогексан, а в работе [6] – циклогексилацетат и диоксан. Несмотря на то, что регрессионные модели созданы на основе различных по своей природе дескрипторах, частичное совпадение результатов может свидетельствовать о наличии каких-то систематических погрешностей, связанных, например, с выходом указанных соединений из структурной области применения моделей.
В результате исключения Y-выбросов из анализируемой серии была получена модель (2), которая характеризуется высокими статистическими характеристиками и соответствует современным требованиям, предъявляемым к QSAR моделям [8].
log(1/EC30) = -3.08(±0.21) + 0.169(±0.016)α -2.61(±0.23)S(Q+) +0.238(±0.085)S(Ca) +0.204(±0.072) (2)
(n=44; r2=0.823; rmsec=0.23; q2=0.776; rmsecv=0.26).
Так, в частности, r2>0.6, q2>0.5, r2-q2<0.2. Следует подчеркнуть, что модель (2) имеет очевидные преимущества по сравнению с предшествующими регрессионными уравнениями. По сравнению с моделью, представленной в работе [5] (r2=0.503, s=0.388), уравнение (2) имеет более высокий коэффициент корреляции и более низкую величину среднеквадратичного отклонения. По отношению к модели, разработанной авторами публикации [6], кроме вышеперечисленных достоинств, следует причислить наличие меньшего числа коэффициентов в уравнении (5 против 7).
Также необходимо отметить отсутствие в разработанной модели трудно интерпретируемых топологических дескрипторов. Использованные нами переменные имеют ясный физико-химический смысл. Так, из полученной модели (2) следует, что к увеличению нейротоксичности ведет увеличение поляризуемости, Н-акцепторной способности и дипольного момента молекул. Уменьшению активности способствует увеличение суммарного атомного заряда молекул. При этом основной вклад в моделируемое свойство вносят поляризуемость и суммарный атомный заряд молекул. Полученные данные открывают дополнительные возможности при решении как прямой (предсказание нейротоксичности для новых соединений), так и обратной задачи QSAR (конструирование молекул с заданным уровнем нейротоксичности).
Выводы
1. Установлено, что разработанная QSAR модель острой сублетальной нейротоксичности ряда органических растворителей по отношению к крысам имеет более высокие статистические характеристики по сравнению с известными в литературе моделями.
2. Выявлено, что нейротоксичность исследованных соединений зависит от таких молекулярных дескрипторов, как поляризуемость, сумма атомных зарядов, Н-акцепторная способность, дипольный момент.