Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

RESEARCH OF THE MATHEMATICAL MODEL OF ROBOT’S EMOTIONAL EDUCATION

Popov N.V. 1
1 National Research Perm State University
2800 KB
Artificial intelligence is one of the key components of robotics. A robot must simulate mental functions of people, particularly emotions and memory. Mental functions that a robot imitates must be similar to human ones: for example, as time goes by a robot must forget old events because the robot’s memory is imperfect. There is a need to formalize these concepts just like some others, such as emotional education. In the article mathematical model of emotional education of evenly forgetful robot is studied. The statement of finiteness of evenly forgetful robot‘s complete education is proven. The conditions of convergence of robot‘s complete education, i.e. its asymptotic stability, are found. The series of characteristics describing robot‘s education as it approaches its limit are introduced. The example of the educational process that is asymptotic stable is given. The ideas on how the article‘s results can be used in modeling robot‘s emotional behavior are proposed.
robots
robotics
emotional robots
emotional education
research

В математической теории эмоциональных роботов [2–4, 8] суммарное воспитание, полученное некоторым роботом в ходе воспитательного процесса, описывается формулой

pop01.wmf

pop02.wmf

где под тактом понимаем время, в течение которого робот испытывает эмоции вследствие воспитательного воздействия [3]; ri –элементарное воспитание, полученное на i-м такте [3];

?i – коэффициент памяти для i-го такта (0 ? ?i < 1, память робота неабсолютна [8]); Ri – общее воспитание, приобрётенное роботом в течение i первых тактов [3].

Рассмотрим случай равномерно забывчивого робота pop03.wmf [3, 4]. Суммарное воспитание такого робота описывается рекуррентным соотношением

pop04.wmf

pop05.wmf (1)

Последовательность, задаваемую этой формулой, назовём неклассическим рядом. Отметим, что классический ряд pop06.wmf [6], характеризуемый рекуррентным соотношением pop07.wmf, где pop08.wmf, является частным случаем неклассического при ? = 1. Свойства классического ряда исчерпывающе описаны в фундаментальном труде по математическому анализу [5–7].

Целью предлагаемой статьи является изучение свойств неклассических рядов и нахождение критерия их сходимости.

Критерий сходимости неклассических рядов

Рассмотрим случай, когда последовательность pop09.wmf – ограничена. Тогда выполняется следующая лемма.

Лемма. Если 0 ? ? < 1 и последовательность pop10.wmf – ограничена, то неклассический ряд pop11.wmf – тоже ограничен.

Доказательство.

По условию леммы, найдется такое число m > 0, что pop12.wmf для любого i. Докажем, что при сделанных предположениях pop13.wmf ограничивает ряд pop14.wmf, то есть, какой бы i ни взять, pop15.wmf.

Для i = 1 справедлива цепочка неравенств:

pop16.wmf

Пусть наше утверждение доказано для всех pop17.wmf, то есть pop18.wmf для данных значений индекса. Истинность утверждения для pop19.wmf следует из следующих соотношений:

pop20a.wmf

pop20b.wmf

Таким образом, лемма доказана по методу математической индукции.

Следствие. Если pop21.wmf при любом i, то pop22.wmf для всех j (i и j – натуральные числа).

В рамках теории доказанная лемма говорит о том, что при ограниченных воздействиях на равномерно забывчивого робота его суммарное воспитание будет ограничено.

Предположим, что последовательность элементарных воспитаний робота pop23.wmf при неограниченном возрастании n сходится к определённому пределу. При данном условии справедлива следующая теорема.

Теорема. Неклассический ряд pop24.wmf при 0 ? ? < 1 сходится тогда и только тогда, когда последовательность pop25.wmf имеет конечный предел при pop26.wmf.

Доказательство.

Необходимость.

Пусть pop27.wmf. Запишем определение неклассического ряда и выразим оттуда pop28.wmf: pop29.wmf Отсюда получаем

pop30a.wmf

pop30b.wmf

Следовательно, последовательность pop31.wmf сходится к числу pop32.wmf

Достаточность.

Пусть pop33.wmf и 0 ? ? < 1. Введём вспомогательные последовательности: pop34.wmf, pop35.wmf Для введённых последовательностей задача переформулируется следующим образом: доказать, что для больших значений i величины pop36.wmf оказываются меньшими любого наперёд заданного ? > 0. Заметим, что по свойствам пределов [5] qi – бесконечно малая величина.

По определению, pop37.wmf, pop38.wmf. С учётом введённых обозначений преобразуем рекуррентную формулу (1):

pop39a.wmf

pop39b.wmf

pop40.wmf,

pop41.wmf.

Таким образом, мы получили следующее рекуррентное задание для ряда pop42.wmf.

pop43.wmf

pop44.wmf

Поскольку, по свойствам пределов [5], сходящаяся последовательность pop45.wmf – ограничена, мы можем применить лемму и сделать вывод о том, что ряд pop46.wmf, а вместе с ним и pop47.wmf ограничены. То есть найдется такое число M, не зависящее от i, что pop48.wmf.

Зададимся произвольным ? > 0 и введём в рассмотрение ?? – пока неизвестное для нас положительное действительное число. Подберём ?? по числу ? так, чтобы выполнялось pop49.wmf, начиная с некоторого номера N. Тем самым мы установим сходимость ряда. Пусть Nq – натуральное число, такое, что для всех pop50.wmf pop51.wmf.

Для частичных сумм неклассического ряда pop52.wmf, начиная с pop53.wmf справедливы следующие оценки сверху:

pop55.wmf, pop56.wmf,

где Mi – оценка сверху для величины, pop54.wmf pop57.wmf

Таким образом, мы получили рекуррентно заданную последовательность:

pop58.wmf

Решением полученной рекуррентной последовательности [1], удовлетворяющим начальному условию, является выражение

pop59.wmf

По условию, 0 ? ? < 1. А значит, pop60.wmf. То есть по числу pop61.wmf (взято для удобства дальнейших выкладок) найдется такой номер N?, что для любого i ? N? справедливо неравенство pop62.wmf. Отсюда, при условии pop63.wmf следует истинность цепочки соотношений

pop64a.wmf

pop64b.wmf (2)

Ниже будет показано, что искомый ?? обращает коэффициент при ?i в неотрицательное число, а значит, неравенство (2) верно. Используем соотношение (2) для определения значения ?? по известным и не зависящим от i величинам M, ?, ?. Таким образом, справедливо равенство

pop65.wmf. (3)

Ясно, что из наших рассуждений и равенства (3) при искомом значении ?? следует, что pop66.wmf, начиная с некоторого номера N (при этом легко видеть, что pop67.wmf).

Разрешив квадратное уравнение относительно ??, получаем равенство

pop68.wmf. (4)

Потребуем для ?? выполнения следующих условий:

1) ?? – действительное число. А значит, pop70.wmf

2) pop71.wmf Данное условие необходимо для справедливости оценки сверху, приведенной выше. После подстановки в это неравенство значения ??, определяемого формулой (4), и несложных преобразований получаем, что в соотношении (4) нужно выбрать знак «–» и pop72.wmf.

Если M ? ?, то приведённые выше условия выполняются автоматически:

pop73.wmf,

pop74.wmf,

так как pop75.wmf.

Поскольку, задавшись произвольным ?, в наших рассуждениях фактически не играла никакой роли величина M (существенным оставалось лишь то, что M ограничивает сверху ряд pop76.wmf), то систему условий можно заменить на одно, более простое, требование – M ? ? – и при необходимости можно увеличить M, чтобы данное требование выполнялось.

Подводя итог доказательству достаточности условий теоремы, сформулируем последовательность шагов для определения сходимости ряда pop77.wmf:

1. Возьмём некоторое положительное число ?.

2. Возьмём любое число M, удовлетворяющее следующим условиям:

? pop78.wmf, независимо от i.

? M ? ?.

3. Вычислим

pop79.wmf.

4. Вычислим Nq: такой номер, что, каким бы ни был pop80.wmf, pop81.wmf

5. Вычислим N?: такой номер, что, каким бы ни был pop82.wmf, pop83.wmf.

6. Тогда pop84.wmf, и, при любых pop85.wmf, pop86.wmf

То есть pop87.wmf – предел для ряда pop88.wmf по определению.

Следствие. Если pop89.wmf то pop90.wmf – сумма неклассического ряда pop91.wmf.

Характеристики предельного воспитания робота

Согласно доказанному критерию, сходимость суммарного воспитания некоторого робота эквивалентна сходимости соответствующей последовательности элементарных воспитательных воздействий, оказанных на робота. В дальнейшем сходящуюся последовательность элементарных воспитаний будем называть планом воспитания, предельное значение суммарного воспитания – целью воспитания. Используя следствие из критерия сходимости, получаем соотношение между целью и планом воспитания:

pop92.wmf,

где R – цель воспитания, pop93.wmf, pop94.wmf – план воспитания, ? – коэффициент памяти робота [3].

На практике время, в течение которого воспитывался робот, всегда конечно. Поэтому существует потребность в вычислении времени (числа тактов), по прошествии которого цель воспитания будет достигнута с заданной точностью, при выбранном плане воспитания. Число тактов, достаточное для того, чтобы суммарное воспитание робота отклонялось от цели воспитания не более чем на заданную величину ?, назовём эффективным временем воспитания и обозначим ET(?). Вычислить ET(?), используя только план воспитания pop95.wmf и коэффициент памяти робота ?, можно, например, с помощью последовательности шагов, описанной выше. Из соображений удобства заменим второй пункт эквивалентной ему совокупностью действий:

2.1. Возьмём любое число m, такое, что pop96.wmf для любых натуральных i.

2.2. pop97.wmf.

Число M, вычисленное предложенным способом, будет удовлетворять обоим условиям второго пункта:

pop98a.wmf

pop98b.wmf

pop98c.wmf,

pop99.wmf.

Для первой цепочки неравенств использованы следствие из леммы для критерия сходимости неклассических рядов и соотношения для модулей действительных чисел.

Ясно, что при задании точности ? ~ 1 %, определяющей отклонение итогового воспитания от цели воспитания, воспитательные воздействия, начиная с ET(?) + 1-го, практически не возымеют на робота никакого эффекта.

Пример численной реализации критерия сходимости

Рассмотрим робота, коэффициент памяти [3] которого pop100.wmf. Пусть план воспитания подчиняется экспоненциальному закону pop101.wmf, pop102.wmf

Поскольку pop103.wmf, суммарное воспитание, полученное роботом, будет иметь конечный предел. Целью воспитания является pop104.wmf.

Вычислим эффективное время воспитания, соответствующее точности ? = 10–2.

pop105.wmf,

pop106a.wmf

pop106b.wmf,

pop107a.wmf

pop107b.wmf,

(?? допустимо округлять вниз, так как из условия ? ? ?? следует справедливость цепочки неравенств pop108.wmfи pop109.wmf),

pop110.wmf,

pop111.wmf,

pop112.wmf.

Суммарное воспитание робота после двадцати семи тактов воспитательного процесса, вычисленное при помощи компьютера, составляет R ? 2,99993. Для этого числа порядок точности существенно больше, чем заданный. Объясняется это тем, что M значительно превосходит точную верхнюю грань [5] множества всех возможных значений величины pop113.wmf.

Заключение

Таким образом, в предложенной статье была исследована математическая модель суммарного воспитания равномерно забывчивого робота [3, 4, 8]. Результатом исследования стали критерий сходимости воспитательного процесса и ряд характеристик предельного воспитания робота.

Полученный критерий можно использовать в робототехнике для подбора параметров искусственного интеллекта робота, связанных с воспитанием, в частности, для того, чтобы гарантировать устойчивое воспитание робота, а значит, стабильную, предсказуемую реакцию робота на внешние воздействия. Свою ценность имеет и лемма, использованная для доказательства критерия: она фактически постулирует тот факт, что в модели роботов с неабсолютной памятью [8] воспитание, приобретённое роботом, всегда будет конечно, так как воздействия на робота ограничены. Численная характеристика эффективного времени воспитания может быть полезна при первичной «воспитательной» настройке робота при производстве, чтобы гарантировать поведение, близкое к тому, которое в идеале должно быть у робота, определяемое целью воспитания.