Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

THE COMMON MATHEMATICAL MODEL OF ROBOT’S MAKING DECISION THAT DEPENDS ON HIS EMOTIONAL PSEUDOEDUCATION AND LOGICAL EXPERIENCE

Sharapov Yu.A. 1
1 Perm State National Research University
The paper has a review of directions for the development a contemporary social robotics and proves necessity of modelling emotional and logical sphere for social robots. The theory of emotional robots describes two different models of robot’s making decision based on pseudoemotions and logical sphere. The paper’s goal is a combination of these two mathematical models. It uses hypotheses of psychological theory of human mindsets by georgian psychologist D.N. Uznadze. This paper adapts the psychological hypotheses for mathematical modelling. It uses the theory of numerical series and mathematical analysis. The paper describes mathematical models of accumulation of robot’s emotional pseudoeducation and robot’s logical experience. There are a chart and description of an emotional-logical robot. The paper introduces a concept of emotional-logical stupor. The result of the paper is a common mathematical model of robot’s making decision that depends on both his emotional pseudoeducation and logical experience. The common model is useful to design social robots and develop computer games with heroes that have humanlike behavior.
robot
mindset
Uznadze
emotion
experience
making decision
emotional-logical stupor

Под роботом будем понимать некий автомат, способный принимать самостоятельные решения.

В настоящее время одним из направлений исследований в робототехнике является создание робота, который в течение длительного времени сможет взаимодействовать с человеком и запоминать события, которые происходят в окружающем мире, в том числе с участием хозяина [9]. Таких роботов будем называть «социальными».

Создание социальных роботов идет по пути моделирования различных психических и физиологических процессов человека, основными из которых на данный момент являются память и эмоции.

Для того чтобы взаимодействовать с человеком, роботу необходимо накапливать информацию из окружающего мира. Ученые [8] отмечают, что память является необходимым условием для любой формы обучения.

Тем не менее, если робот будет запоминать каждую деталь происходящих событий, со временем произойдет переполнение его памяти. Одно из решений, которое предлагают ученые для решения этой проблемы, – математическое моделирование механизмов забывания и обобщения информации. Процесс забывания реализуется на основе представления информации в памяти робота в виде иерархии и распределения приоритетов важности информации [10].

Еще одним направлением развития современной робототехники является создание эмоциональных роботов. Одним из примеров является разработка японскими и французскими инженерами робота-гуманоида Pepper [1]. Робот впервые был представлен 5 июня 2014 года на конференции по робототехнике в Японии. Он использует анализ мимики и тон голоса собеседника, распознает его эмоции. Pepper запрограммирован обучаться и адаптироваться к окружающей обстановке, на общение с людьми, быть благожелательным, добрым, при необходимости подбадривать собеседника. Он может не только распознавать эмоции, но, как заявляют его создатели, способен сам искусственно их генерировать. Например, он способен демонстрировать радость или испуг.

Американский нейробиолог А. Дамасио [3], говоря о механике принятия решений человека, приходит к выводу, что без эмоций рациональное поведение человека было бы невозможно. Эмоции являются внутренним механизмом, который превращает внешние раздражители в мотивы, создают оптимальные условия для приспособления организма к окружающей среде. Эмоции выступают в роли регуляторов, влияя на выбор того или иного действия, определяя способы и средства достижения цели.

Несмотря на то, что современная наука далеко продвинулась в создании «забывающих роботов», а также механических прототипов эмоциональных роботов, на сегодняшний день не существует роботов, поведение которых является результатом выбора между накопленным логическим опытом и сгенерированными «эмоциями» в условиях процесса забывания части опыта и ранее сгенерированных «эмоций».

Теория эмоциональных роботов О.Г. Пенского и К.В. Черникова [2, 5] для математического моделирования роботов использует теории грузинского психолога и академика Д.Н. Узнадзе [4], описывающие работу эмоциональной памяти человека и природу его эмоций.

Так, Д.Н. Узнадзе пишет о существовании у человека установок. Установка по Д.Н. Узнадзе, – это комплексная реакция всех психологических и физиологических подсистем человека на внешнее воздействие. В течение жизни человека установки могут изменяться. Кроме того, установка может не просто изменяться, а меняться на противоположную. Тем не менее существуют периоды жизни человека, на протяжении которых установка является неизменной и определяет модель поведения и реакцию человека.

Особенностью теории [2] является моделирование роботов, которые в процессе накопления информации способны забывать часть полученной ранее информации. Такие роботы называются роботами с неабсолютной памятью.

В теории эмоциональных роботов внешним воздействием, «раздражителем» являются порции информации, которые робот получает на рецепторы из окружающей среды. Такие порции информации называются информационными псевдоустановками. «Накопление» информационных псевдоустановок в условиях забывания части ранее накопленной информации описывается процессом накопления логического опыта робота [6].

Комплексная реакция на раздражитель выражается в возникновении внутри робота порции информации в тот момент, когда он получает извне информационную псевдоустановку. Таким образом, моделируется внутренний «ответ» робота на внешнюю информацию-раздражитель. Такой «ответ» является порцией информации и называется эмоциональной псевдоустановкой. «Накопление» эмоциональных псевдоустановок, в условиях забывания части ранее накопленной информации, описывается процессом эмоционального псевдовоспитания робота [2, 5, 7].

Величины информационной и эмоциональной псевдоустановок измеряются в битах. В отличие от эмоциональной псевдоустановки информационная может принимать только неотрицательные значения.

В работах [2, 5] рассматриваются вопросы эмоционального псевдовоспитания робота только для одного уровня псевдовоспитания. Однако процесс накопления логического опыта в них не затронут.

В статье [6] выведена формула, описывающая процесс накопления роботом опыта на нескольких уровнях накопления опыта с учетом смены знака информационной псевдоустановки:

sharapov001.wmf (1)

где i – текущий такт процесса накопления логического опыта роботом; j – текущий такт на уровне накопления логического опыта l; j[m] – такт перехода процесса накопления логического опыта роботом с уровня m на уровень m + 1; sharapov002.wmf – логический опыт робота, накопленный за i тактов от начала процесса накопления логического опыта; sharapov003.wmf – локальный логический опыт робота, накопленный за j тактов текущего уровня накопления логического опыта l; ΛJ[q] – коэффициент долговременной информационной памяти на уровне накопления логического опыта q; J[q] – индикатор смены знака информационной псевдоустановки между уровнями накопления логического опыта q и q + 1; sharapov004.wmf – локальный логический опыт робота, накопленный к такту j[m] уровня накопления логического опыта m.

Актуальным является обобщение существующей теории эмоциональных роботов и создание общей математической теории, в которой поведение робота является следствием параллельно протекающих процессов логического накопления опыта и эмоционального псевдовоспитания в условиях забывания полученной ранее информации.

В данной статье не рассматривается качественная сторона процесса эмоционального псевдовоспитания робота и процесса накопления логического опыта роботом. Поэтому в рамках данных моделей нельзя сказать, какую именно информацию и какой именно логический опыт запоминает робот лучше, какие псевдоэмоции остаются дольше в «памяти» робота, и соответственно, как влияет та или иная логическая или эмоциональная информация на скорость ее забывания.

Попытка выделить два процесса «развития» робота: эмоциональный и логический  позволяет на самом простом качественном уровне сделать разделение информации, на основе которой идут процессы накопления логического опыта и эмоционального псевдовоспитания.

Математическая модель накопления роботом эмоционального псевдовоспитания на нескольких уровнях псевдовоспитания

Сделаем предположение, что процесс эмоционального псевдовоспитания робота будет проходить аналогично процессу накопления опыта роботом, который описывает формула (1).

Определение 1. Уровнем накопления эмоционального псевдовоспитания роботом k назовем количество смен значений модуля псевдоустановки робота sharapov005.wmf к текущему такту процесса накопления опыта. Обозначим sharapov006.wmf.

Адаптируем алгоритм накопления роботом опыта на нескольких уровнях с учетом смены знака информационной псевдоустановки, приведенный в работе [6], для процесса эмоционального псевдовоспитания робота.

Рассмотрим следующие варианты смены знака эмоциональной псевдоустановки:

1. В конце тактов j внутри уровня накопления псевдовоспитания робота k (с помощью индикатора sharapov007.wmf).

2. Между уровнями накопления псевдовоспитания k и k + 1, т.е. в конце последнего такта уровня k (с помощью индикатора J[k]).

Определение 2. Локальным эмоциональным псевдовоспитанием робота, назовем величину

sharapov008.wmf,

где k – уровень псевдовоспитания робота; j – номер такта на уровне k; sharapov009.wmf – коэффициент кратковременной эмоциональной памяти робота на такте с номером j в рамках уровня k; sharapov010.wmf – локальное эмоциональное псевдовоспитание робота, полученное за j – 1 такт на уровне k; sharapov011.wmf – индикатор смены знака эмоциональной псевдоустановки на такте с номером j в рамках уровня k.

Определение 3. Эмоциональным псевдовоспитанием робота на нескольких уровнях (эмоциональным псевдовоспитанием робота) назовем величину

sharapov012.wmf,

где k – уровень псевдовоспитания робота; sharapov013.wmf – локальное эмоциональное псевдовоспитание робота, полученное на такте с номером j в рамках уровня k; Θ[k] – коэффициент долговременной эмоциональной памяти робота на уровне k; J[k] – индикатор смены знака между уровнями k и k + 1; R[k–1] – эмоциональное псевдовоспитание робота, полученное за все предыдущие k – 1 уровни.

В качестве критерия перехода с одного уровня накопления роботом эмоционального псевдовоспитания на другой будем применять следующее неравенство:

sharapov014.wmf

где sharapov015.wmf и sharapov016.wmf – эмоциональное псевдовоспитание робота на уровне k тактах i и i – 1 соответственно; δ – бесконечно малая величина, которая так же, как и эмоциональное псевдовоспитание робота, измеряется в битах.

Использование такого критерия означает, что переход с уровня псевдовоспитания k на уровень k + 1 происходит тогда, когда на уровне псевдовоспитания робота k изменение эмоционального псевдовоспитания робота становится меньше некоторой малой величины δ, т.е. достаточно сильно «замедляется».

Таким образом, процесс накопления эмоционального псевдовоспитания роботом на нескольких уровнях накопления эмоционального псевдовоспитания будет описываться следующей формулой:

sharapov017.wmf (2)

где i – текущий такт процесса эмоционального псевдовоспитания робота; j – текущий такт на уровне k; j[g] – такт перехода процесса эмоционального псевдовоспитания робота с уровня g на уровень g + 1; sharapov018.wmf – величина эмоционального псевдовоспитания за i тактов процесса псевдовоспитания от начала этого процесса; sharapov019.wmf – локальное эмоциональное псевдовоспитание робота, полученное за j тактов текущего уровня k; Θ[h] – коэффициент долговременной эмоциональной памяти на уровне псевдовоспитания h; J[h] – индикатор смены знака эмоциональной псевдоустановки между уровнями псевдовоспитания h и h + 1; sharapov020.wmf – локальное эмоциональное псевдовоспитание робота, полученное к такту j[g] уровня псевдовоспитания g.

Эмоционально-логический робот

Рассмотрим ситуацию, когда робот получает некоторый информационный поток (ИП). Рисунок демонстрирует схему такого робота.

pic_48.wmf

Схема эмоционально-логического робота

Информационный поток от рецепторов робота попадает в фильтр Ф. Фильтр Ф производит дискретизацию ИП и по некоторой заданной функции f определяет величину порции информации для каждого такта. Будем считать, что функция f фильтра Ф имеет такие свойства, что значения этой функции являются значениями информационных псевдоустановок.

Пусть робот имеет накопители, которые сохраняют логическую (ЛН) и эмоциональную (ЭН) информацию соответственно.

Информационная псевдоустановка на каждом такте попадает из Ф в ЛН. Пусть в ЛН задана функция Ii, которая по некоторому закону для каждого такта выдает значения +1 или –1 и является индикатором, который используется для получения элементарного логического опыта на основе информационной псевдоустановки и индикатора. Пусть также в ЛН задана функция-индикатор J, которая необходима для управления сменой знака между уровнями накопления информации в многоуровневом процессе.

Будем считать, что в фильтре Ф также задана функция g, определяющая величину информации, которая поступает в ЭН, на каждом такте, в тот момент, когда ЛН робота получает информационную псевдоустановку. Будем считать, что функция g фильтра Ф имеет такие свойства, что значения этой функции являются значениями эмоциональных псевдоустановок. Таком образом, будем моделировать эмоциональную псевдоустановку как псевдоэмоциональный «ответ» робота на информационную псевдоустановку. Пусть также задана функция-индикатор W, которая необходима для управления сменой знака между уровнями эмоционального псевдовоспитания в многоуровневом процессе.

Пусть робот уже имеет априори заданные для него действия: A – в случае, если его «поведение» определяет логический опыт и B – в случае, если его «поведение» определяют псевдоэмоции.

Общая математическая модель эмоционально-логического робота

Будем предполагать, что в основу работы ЭН положена математическая модель эмоционального псевдовоспитания робота на нескольких уровнях с учетом смены знака эмоциональной псевдоустановки, а в основу работы ЛН положена математическая модель накопления логического опыта роботом на нескольких уровнях с учетом смены знака информационной псевдоустановки.

Построим общую математическую модель принятия решений роботом между действием A, которое определяет логическая составляющая, и действием B, которое определяет эмоциональная составляющая.

Сделаем предположение, что информационный такт равен эмоциональному такту. Это позволит на каждом такте i получать на выходе накопителя ЭН величину эмоционального псевдовоспитания, на выходе ЛН величину накопленного логического опыта робота. Таким образом, происходит синхронизация этих процессов. Эмоциональное псевдовоспитание робота и накопление логического опыта будут начинаться в один и тот же момент времени и протекать параллельно.

Будем полагать, что на выходе накопителя ЛН на каждом такте i будет вычисляться величина логического опыта робота по формуле (1), на выходе накопителя ЭН на каждом такте i будет вычисляться величина эмоционального псевдовоспитания робота по формуле (2).

Условием выполнения действия на основе логики, т.е. выполнение действия A, на такте i будем считать следующее неравенство:

sharapov021.wmf

Условием выполнения действия на основе псевдоэмоций, т.е. выполнение действия B, на такте i будем считать следующее неравенство:

sharapov022.wmf

Определение 4. Эмоционально-логическим ступором робота назовем состояние робота, при котором выполняется условие конфликта между эмоциональным псевдовоспитанием и логическим опытом:

sharapov023.wmf

где i – текущий номер такта относительно начала процесса эмоционального псевдовоспитания и процесса накопления логического опыта роботом; k – уровень эмоционального псведовоспитания; l – уровень накопления логического опыта робота.

В случае эмоционально-логического ступора робот не может выбрать, какое действие выполнить, A или B.

Заключение

Таким образом, в настоящей статье приводится обоснование необходимости моделирования эмоциональной и логической составляющей для создания «социального» робота, описаны математические модели накопления эмоционального псевдовоспитания и накопления логического опыта роботом. Также статья содержит описание и схему эмоционально-логического робота. Итогом и результатом данной работы является общая математическая модель принятия решений роботом в зависимости от его эмоционального псевдовоспитания и логического опыта.