Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 1,021

1 1
1

Формирование рубрикатора – один из самых важных шагов при подготовке системы к работе, поскольку именно он определяет тематику, по которой будет разбираться входящая информация.

Цели и методы исследований. Система поддерживает работу с иерархическим рубрикатором неограниченной глубины.

1. Выбираем источник информации для интернет-сайта, в котором будет создан рубрикатор. Выбор информации в данном случае связан с медициной и здоровьем в городе Пензе (наличие медицинских центров, адреса, телефоны и т.д.)

2. Проводим обучение рубрикатора: процесс обучения рубрикатора заключается в построении некоторого множества терминов, характеризующих принадлежность каждой его рубрике. Задаём список тем или рубрик, наиболее точно характеризующих исследуемую область знаний – «медицина и здоровье». Формируем необходимые условия при анализе текста, а именно: поддержка работы с иерархическим рубрикатором с неограниченным количеством уровней вложенности; все слова должны быть строго с соблюдением их морфологической нормы; укорочения должны быть понятны неподготовленным пользователям (например травматические пункты – травмпункты). Перечисляем темы, которые наиболее интересуют посетителей сайта по тематике «медицина и здоровье» 3. Создаём тематические узлы – группы близких по смыслу понятий. Этот метод позволяет исключить появления множества рубрик, схожих по своей тематике, и сделать каждую рубрику «уникальной» для поиска необходимой информации (рисунок).

.shel1.tif

 

Заключение. Таким образом, из перечисленных выше тематик определяем: медицинские товары – оборудование – БАДы; – клиники – медицинские центры – травмпункты – аптеки.