Научный журнал
Современные наукоемкие технологии
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,916

ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКОЙ МОДЕЛИ ЭМОЦИОНАЛЬНОГО ВОСПИТАНИЯ РОБОТА

Попов Н.В. 1
1 ФГБОУ ВПО «Пермский государственный национальный исследовательский университет»
Одним из ключевых компонентов робототехники является искусственный интеллект. Робот должен имитировать психические функции людей, в частности, эмоции и память. Имитируемые роботом функции психики по своим характеристикам должны быть подобны человеческим: к примеру, робот c течением времени должен забывать прошлые события, поскольку память робота неабсолютна. Возникает потребность в формализации с помощью математики данных понятий и ряда других, вспомогательных, понятий, таких как эмоциональное воспитание. В статье изучена математическая модель эмоционального воспитания равномерно забывчивого робота. Доказано, что суммарное воспитание равномерно забывчивого робота всегда конечно. Найдены условия, при которых суммарное воспитание робота будет сходиться к определённому числу, то есть будет асимптотически устойчиво. Введён ряд характеристик предельного воспитания робота. Приведен пример реализации асимптотической устойчивости воспитания. Предложены идеи использования результатов статьи в моделировании эмоционального поведения роботов.
роботы
робототехника
эмоциональные роботы
эмоциональное воспитание
исследование
1. Андерсон Дж. Дискретная математика и комбинаторика. – М.: Вильямс, 2004. – 960 с.
2. Гипотезы и алгоритмы математической теории исчисления эмоций: монография / Перм. гос. ун-т; [под. ред. О.Г. Пенского]. – Пермь, 2009. – 152 с.
3. Пенский О.Г., Черников К.В. Основы математической теории эмоциональных роботов: монография / Перм. гос. ун-т. – Пермь, 2010. – 256 с.
4. Пенский О.Г. Математические модели эмоциональных роботов: монография / О.Г. Пенский. – Пермь: Перм. гос. ун-т, 2010. – 193 с.
5. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления: учеб. для вузов. – 8-е изд. – М.: ФИЗМАТЛИТ, 2001. – Т. 1. – 680 с.
6. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления: учеб. для вузов. – 8-е изд. – М.: ФИЗМАТЛИТ, 2001. – Т. 2. – 864 с.
7. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления: учеб. для вузов. – 8-е изд. – М.: ФИЗМАТЛИТ, 2002. – Т. 3. – 728 с.
8. Черников К.В. Математические модели роботов с неабсолютной памятью: дис. канд. физ.-мат. наук. – Пермь, 2013.

В математической теории эмоциональных роботов [2–4, 8] суммарное воспитание, полученное некоторым роботом в ходе воспитательного процесса, описывается формулой

pop01.wmf

pop02.wmf

где под тактом понимаем время, в течение которого робот испытывает эмоции вследствие воспитательного воздействия [3]; ri –элементарное воспитание, полученное на i-м такте [3];

?i – коэффициент памяти для i-го такта (0 ? ?i < 1, память робота неабсолютна [8]); Ri – общее воспитание, приобрётенное роботом в течение i первых тактов [3].

Рассмотрим случай равномерно забывчивого робота pop03.wmf [3, 4]. Суммарное воспитание такого робота описывается рекуррентным соотношением

pop04.wmf

pop05.wmf (1)

Последовательность, задаваемую этой формулой, назовём неклассическим рядом. Отметим, что классический ряд pop06.wmf [6], характеризуемый рекуррентным соотношением pop07.wmf, где pop08.wmf, является частным случаем неклассического при ? = 1. Свойства классического ряда исчерпывающе описаны в фундаментальном труде по математическому анализу [5–7].

Целью предлагаемой статьи является изучение свойств неклассических рядов и нахождение критерия их сходимости.

Критерий сходимости неклассических рядов

Рассмотрим случай, когда последовательность pop09.wmf – ограничена. Тогда выполняется следующая лемма.

Лемма. Если 0 ? ? < 1 и последовательность pop10.wmf – ограничена, то неклассический ряд pop11.wmf – тоже ограничен.

Доказательство.

По условию леммы, найдется такое число m > 0, что pop12.wmf для любого i. Докажем, что при сделанных предположениях pop13.wmf ограничивает ряд pop14.wmf, то есть, какой бы i ни взять, pop15.wmf.

Для i = 1 справедлива цепочка неравенств:

pop16.wmf

Пусть наше утверждение доказано для всех pop17.wmf, то есть pop18.wmf для данных значений индекса. Истинность утверждения для pop19.wmf следует из следующих соотношений:

pop20a.wmf

pop20b.wmf

Таким образом, лемма доказана по методу математической индукции.

Следствие. Если pop21.wmf при любом i, то pop22.wmf для всех j (i и j – натуральные числа).

В рамках теории доказанная лемма говорит о том, что при ограниченных воздействиях на равномерно забывчивого робота его суммарное воспитание будет ограничено.

Предположим, что последовательность элементарных воспитаний робота pop23.wmf при неограниченном возрастании n сходится к определённому пределу. При данном условии справедлива следующая теорема.

Теорема. Неклассический ряд pop24.wmf при 0 ? ? < 1 сходится тогда и только тогда, когда последовательность pop25.wmf имеет конечный предел при pop26.wmf.

Доказательство.

Необходимость.

Пусть pop27.wmf. Запишем определение неклассического ряда и выразим оттуда pop28.wmf: pop29.wmf Отсюда получаем

pop30a.wmf

pop30b.wmf

Следовательно, последовательность pop31.wmf сходится к числу pop32.wmf

Достаточность.

Пусть pop33.wmf и 0 ? ? < 1. Введём вспомогательные последовательности: pop34.wmf, pop35.wmf Для введённых последовательностей задача переформулируется следующим образом: доказать, что для больших значений i величины pop36.wmf оказываются меньшими любого наперёд заданного ? > 0. Заметим, что по свойствам пределов [5] qi – бесконечно малая величина.

По определению, pop37.wmf, pop38.wmf. С учётом введённых обозначений преобразуем рекуррентную формулу (1):

pop39a.wmf

pop39b.wmf

pop40.wmf,

pop41.wmf.

Таким образом, мы получили следующее рекуррентное задание для ряда pop42.wmf.

pop43.wmf

pop44.wmf

Поскольку, по свойствам пределов [5], сходящаяся последовательность pop45.wmf – ограничена, мы можем применить лемму и сделать вывод о том, что ряд pop46.wmf, а вместе с ним и pop47.wmf ограничены. То есть найдется такое число M, не зависящее от i, что pop48.wmf.

Зададимся произвольным ? > 0 и введём в рассмотрение ?? – пока неизвестное для нас положительное действительное число. Подберём ?? по числу ? так, чтобы выполнялось pop49.wmf, начиная с некоторого номера N. Тем самым мы установим сходимость ряда. Пусть Nq – натуральное число, такое, что для всех pop50.wmf pop51.wmf.

Для частичных сумм неклассического ряда pop52.wmf, начиная с pop53.wmf справедливы следующие оценки сверху:

pop55.wmf, pop56.wmf,

где Mi – оценка сверху для величины, pop54.wmf pop57.wmf

Таким образом, мы получили рекуррентно заданную последовательность:

pop58.wmf

Решением полученной рекуррентной последовательности [1], удовлетворяющим начальному условию, является выражение

pop59.wmf

По условию, 0 ? ? < 1. А значит, pop60.wmf. То есть по числу pop61.wmf (взято для удобства дальнейших выкладок) найдется такой номер N?, что для любого i ? N? справедливо неравенство pop62.wmf. Отсюда, при условии pop63.wmf следует истинность цепочки соотношений

pop64a.wmf

pop64b.wmf (2)

Ниже будет показано, что искомый ?? обращает коэффициент при ?i в неотрицательное число, а значит, неравенство (2) верно. Используем соотношение (2) для определения значения ?? по известным и не зависящим от i величинам M, ?, ?. Таким образом, справедливо равенство

pop65.wmf. (3)

Ясно, что из наших рассуждений и равенства (3) при искомом значении ?? следует, что pop66.wmf, начиная с некоторого номера N (при этом легко видеть, что pop67.wmf).

Разрешив квадратное уравнение относительно ??, получаем равенство

pop68.wmf. (4)

Потребуем для ?? выполнения следующих условий:

1) ?? – действительное число. А значит, pop70.wmf

2) pop71.wmf Данное условие необходимо для справедливости оценки сверху, приведенной выше. После подстановки в это неравенство значения ??, определяемого формулой (4), и несложных преобразований получаем, что в соотношении (4) нужно выбрать знак «–» и pop72.wmf.

Если M ? ?, то приведённые выше условия выполняются автоматически:

pop73.wmf,

pop74.wmf,

так как pop75.wmf.

Поскольку, задавшись произвольным ?, в наших рассуждениях фактически не играла никакой роли величина M (существенным оставалось лишь то, что M ограничивает сверху ряд pop76.wmf), то систему условий можно заменить на одно, более простое, требование – M ? ? – и при необходимости можно увеличить M, чтобы данное требование выполнялось.

Подводя итог доказательству достаточности условий теоремы, сформулируем последовательность шагов для определения сходимости ряда pop77.wmf:

1. Возьмём некоторое положительное число ?.

2. Возьмём любое число M, удовлетворяющее следующим условиям:

? pop78.wmf, независимо от i.

? M ? ?.

3. Вычислим

pop79.wmf.

4. Вычислим Nq: такой номер, что, каким бы ни был pop80.wmf, pop81.wmf

5. Вычислим N?: такой номер, что, каким бы ни был pop82.wmf, pop83.wmf.

6. Тогда pop84.wmf, и, при любых pop85.wmf, pop86.wmf

То есть pop87.wmf – предел для ряда pop88.wmf по определению.

Следствие. Если pop89.wmf то pop90.wmf – сумма неклассического ряда pop91.wmf.

Характеристики предельного воспитания робота

Согласно доказанному критерию, сходимость суммарного воспитания некоторого робота эквивалентна сходимости соответствующей последовательности элементарных воспитательных воздействий, оказанных на робота. В дальнейшем сходящуюся последовательность элементарных воспитаний будем называть планом воспитания, предельное значение суммарного воспитания – целью воспитания. Используя следствие из критерия сходимости, получаем соотношение между целью и планом воспитания:

pop92.wmf,

где R – цель воспитания, pop93.wmf, pop94.wmf – план воспитания, ? – коэффициент памяти робота [3].

На практике время, в течение которого воспитывался робот, всегда конечно. Поэтому существует потребность в вычислении времени (числа тактов), по прошествии которого цель воспитания будет достигнута с заданной точностью, при выбранном плане воспитания. Число тактов, достаточное для того, чтобы суммарное воспитание робота отклонялось от цели воспитания не более чем на заданную величину ?, назовём эффективным временем воспитания и обозначим ET(?). Вычислить ET(?), используя только план воспитания pop95.wmf и коэффициент памяти робота ?, можно, например, с помощью последовательности шагов, описанной выше. Из соображений удобства заменим второй пункт эквивалентной ему совокупностью действий:

2.1. Возьмём любое число m, такое, что pop96.wmf для любых натуральных i.

2.2. pop97.wmf.

Число M, вычисленное предложенным способом, будет удовлетворять обоим условиям второго пункта:

pop98a.wmf

pop98b.wmf

pop98c.wmf,

pop99.wmf.

Для первой цепочки неравенств использованы следствие из леммы для критерия сходимости неклассических рядов и соотношения для модулей действительных чисел.

Ясно, что при задании точности ? ~ 1 %, определяющей отклонение итогового воспитания от цели воспитания, воспитательные воздействия, начиная с ET(?) + 1-го, практически не возымеют на робота никакого эффекта.

Пример численной реализации критерия сходимости

Рассмотрим робота, коэффициент памяти [3] которого pop100.wmf. Пусть план воспитания подчиняется экспоненциальному закону pop101.wmf, pop102.wmf

Поскольку pop103.wmf, суммарное воспитание, полученное роботом, будет иметь конечный предел. Целью воспитания является pop104.wmf.

Вычислим эффективное время воспитания, соответствующее точности ? = 10–2.

pop105.wmf,

pop106a.wmf

pop106b.wmf,

pop107a.wmf

pop107b.wmf,

(?? допустимо округлять вниз, так как из условия ? ? ?? следует справедливость цепочки неравенств pop108.wmfи pop109.wmf),

pop110.wmf,

pop111.wmf,

pop112.wmf.

Суммарное воспитание робота после двадцати семи тактов воспитательного процесса, вычисленное при помощи компьютера, составляет R ? 2,99993. Для этого числа порядок точности существенно больше, чем заданный. Объясняется это тем, что M значительно превосходит точную верхнюю грань [5] множества всех возможных значений величины pop113.wmf.

Заключение

Таким образом, в предложенной статье была исследована математическая модель суммарного воспитания равномерно забывчивого робота [3, 4, 8]. Результатом исследования стали критерий сходимости воспитательного процесса и ряд характеристик предельного воспитания робота.

Полученный критерий можно использовать в робототехнике для подбора параметров искусственного интеллекта робота, связанных с воспитанием, в частности, для того, чтобы гарантировать устойчивое воспитание робота, а значит, стабильную, предсказуемую реакцию робота на внешние воздействия. Свою ценность имеет и лемма, использованная для доказательства критерия: она фактически постулирует тот факт, что в модели роботов с неабсолютной памятью [8] воспитание, приобретённое роботом, всегда будет конечно, так как воздействия на робота ограничены. Численная характеристика эффективного времени воспитания может быть полезна при первичной «воспитательной» настройке робота при производстве, чтобы гарантировать поведение, близкое к тому, которое в идеале должно быть у робота, определяемое целью воспитания.


Библиографическая ссылка

Попов Н.В. ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКОЙ МОДЕЛИ ЭМОЦИОНАЛЬНОГО ВОСПИТАНИЯ РОБОТА // Современные наукоемкие технологии. – 2015. – № 12-3. – С. 439-443;
URL: http://top-technologies.ru/ru/article/view?id=35287 (дата обращения: 08.04.2020).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074