Формирование рубрикатора – один из самых важных шагов при подготовке системы к работе, поскольку именно он определяет тематику, по которой будет разбираться входящая информация.
Цели и методы исследований. Система поддерживает работу с иерархическим рубрикатором неограниченной глубины.
1. Выбираем источник информации для интернет-сайта, в котором будет создан рубрикатор. Выбор информации в данном случае связан с медициной и здоровьем в городе Пензе (наличие медицинских центров, адреса, телефоны и т.д.)
2. Проводим обучение рубрикатора: процесс обучения рубрикатора заключается в построении некоторого множества терминов, характеризующих принадлежность каждой его рубрике. Задаём список тем или рубрик, наиболее точно характеризующих исследуемую область знаний – «медицина и здоровье». Формируем необходимые условия при анализе текста, а именно: поддержка работы с иерархическим рубрикатором с неограниченным количеством уровней вложенности; все слова должны быть строго с соблюдением их морфологической нормы; укорочения должны быть понятны неподготовленным пользователям (например травматические пункты – травмпункты). Перечисляем темы, которые наиболее интересуют посетителей сайта по тематике «медицина и здоровье» 3. Создаём тематические узлы – группы близких по смыслу понятий. Этот метод позволяет исключить появления множества рубрик, схожих по своей тематике, и сделать каждую рубрику «уникальной» для поиска необходимой информации (рисунок).
.
Заключение. Таким образом, из перечисленных выше тематик определяем: медицинские товары – оборудование – БАДы; – клиники – медицинские центры – травмпункты – аптеки.
Библиографическая ссылка
Щелбанина И.В., Горюнова Т.И. Разработка алгоритма рубрицирования медико-социальных данных // Современные наукоемкие технологии. – 2013. – № 8-1. – С. 69-69;URL: https://top-technologies.ru/ru/article/view?id=32444 (дата обращения: 21.11.2024).