При проектировании систем автоматического управления необходимо учитывать многочисленные и порой противоречивые требования. Обычно стремятся обеспечить один из показателей качества системы, при учете требований к остальным показателям в виде ограничений. В технических системах часто достаточно изменять одно воздействие для обеспечения минимального времени переходного процесса, прогнозируя поведение систем на математических моделях при известных управляющих воздействиях. Применение микропроцессорной техники требует разработки простых алгоритмов. Задача осложняется необходимостью определения в реальном масштабе времени оптимального управления с учетом информации о реальных изменениях координат системы, заданиях, возмущающих воздействиях и ограничениях. Использование для этих целей традиционных методов не всегда оправдано.
Для эффективного управления подвижными объектами в большинстве случаев оказывается достаточным получение оптимальных законов на математических моделях. Эти результаты могут использоваться при программном управлении. Требования к алгоритму управления оказываются не высокие. Возможен синтез оптимальных управлений и в реальном масштабе времени средствами микропроцессорной техники.
Рассмотрим управление подвижным объектом, модель которого представляется системой обыкновенных дифференциальных уравнений
(1)
где X1, X2, X3, X4, X5, X6 - координаты; F - возмущающее воздействие; t - время.
Управление выходной координатой X1, соответствующей перемещению объекта, осуществляется дискретным входным воздействием U, модуль которого не может превышать значения Uм. Необходимо синтезировать микропроцессорными средствами закон изменения управляющего воздействия, обеспечивающего оптимальный по быстродействию переход без перерегулирования по положению подвижного объекта из любого начального состояния в заданное состояние.
Метод последовательного многошагового синтеза оптимальных управлений
Разработан метод последовательного многошагового синтеза оптимальных управлений линейными и нелинейными системами [1]. Оптимальный закон составляется из управлений, найденных во время переходного процесса для малых интервалов времени. На начальном этапе рассчитывается прогнозируемое оптимальное управление для очередного шага. Это управление в дальнейшем может быть скорректировано. Затем определяются координаты системы в результате выполнения пробного шага с найденным прогнозируемым управлением. На следующем этапе методом имитационного моделирования выполняется перевод системы по оптимальному закону с учетом принятых ограничений из состояния, полученного в результате выполнения пробного шага, в равновесное.
Сравниваются значения координат системы при переводе ее в равновесное состояние с допустимыми значениями координат. Если нет нарушений ограничений, то использованное на пробном шаге управление считается оптимальным и его следует применить для расчета реальных координат. Если наблюдаются нарушения ограничений после перевода системы в равновесное состояние, то использованное на пробном шаге управление не является оптимальным, его следует скорректировать и повторить расчеты. Управления на отдельных шагах составляют оптимальный закон управления подвижным объектом.
Алгоритм управления подвижным объектом
Рассмотрим алгоритм синтеза оптимального по быстродействию управления подводным подвижным объектом при перемещении без перерегулирования по глубине, с дискретным изменением управляющего воздействия. Для поиска управления воспользуемся расчетом пробных шагов, выполняемых с предельными динамическими возможностями в сторону увеличения скорости объекта с целью скорейшего достижения заданной глубины и последующими переводами его в равновесное состояние. Для определения управления на каждом шаге используем методы имитационного моделирования и динамического программирования.
Определим оптимальное управление U(t), обеспечивающее минимальное время перевода объекта из исходного состояния X1i(0) = X1нач, X2i(0) = 0, X3i(0) = 0, X4i(0) = 0, X5i(0) = 0, X6i(0) = 0 F(0) = 0 в заданное состояние состояния X1(T) = X1z, X2(T) = 0, X3(T) = 0, X4(T) = 0, X5(T) = 0 X6(T) = -F. Решение задачи предполагает, что речь идет о системе с квантованием координат по уровню и по времени.
Объект описывается системой разностных уравнений
(2)
где ΔX1, ΔX2, ΔX3, ΔX4, ΔX5 и ΔX6 приращения координат объекта за шаг Δt.
Определение оптимального по быстродействию управления на очередном реальном шаге начинается с расчета методом динамического программирования без учета главного ограничения управления Up1, обеспечивающего максимальное приращение координаты X1 на первом пробном шаге.
(3)
Рассчитываются координаты объекта X1p1, X2p1, X3p1, X4p1, X5p1 и X6p1 после выполнения первого пробного шага с управлением Up1
(4)
Осуществляется проверка возможности выполнения аналогичного шага в реальной системе. Задаются начальные условия координатам X1p2, X2p2, X3p2м1, X4p2м1, X5p2м1 и X6p2м1 для второго пробного шага, которые принимают полученные после выполнения первого пробного шага значения.
(5)
Определяется оптимальное управление Up2 на втором пробном шаге.
(6)
Рассчитываются координаты объекта X1p2, X2p2, X3p2, X4p2, X5p2 и X6p2 после выполнения второго пробного шага с управ- лением Up2
(7)
Задаются начальные условия координатам X1p3, X2p3, X3p3, X4p3м1, X5p3м1 и X6p3м1 для выполнения третьего пробного шага, которые принимают значения, полученные после выполнения второго пробного шага.
(8)
Определяется оптимальное управление Up3 на третьем пробном шаге.
(9)
Рассчитываются координаты объекта X1p3, X2p3, X3p3, X4p3, X5p3 и X6p3 после выполнения третьего пробного шага с управ- лением Up3
(10)
Задаются начальные условия для выполнения четвертого пробного шага
(11)
Определяется оптимальное управление Up4 на четвертом пробном шаге.
(12)
Рассчитываются координаты объекта X1p4, X2p4, X3p4, X4p4, X5p4 и X6p4 после выполнения четвертого пробного шага с управлением Up4
(13)
Задаются начальные условия для выполнения пятого пробного шага
(14)
Определяется оптимальное управление Up5 на пятом пробном шаге.
(15)
Рассчитываются координаты объекта после выполнения пятого пробного шага с управлением Up5
(16)
Задаются начальные условия для выполнения шестого пробного шага
(17)
Определяется оптимальное управление Up5 на шестом пробном шаге.
(18)
Рассчитываются координаты объекта после выполнения шестого пробного шага.
(19)
В равновесном состоянии значение координаты X6p6 должно быть равно значению возмущающего воздействия с обратным знаком -F. Если это условие не выполняется, то рассчитывается по выражениям (18) и (19) следующий шестой пробный шаг с ранее полученными новыми начальными условиями.
После выполнения условия X6p6 = -F оценивается значение координаты X5p6. В равновесном состоянии значение координаты X5p6 должно быть равно нулю. Если это условие не выполняется, то рассчитывается по выражениям (15) и (16) следующий пятый пробный шаг с ранее полученными новыми начальными условиями. Затем по выражениям (17), (18) и (19) изменяется координата X6p6 до значения -F. Так обеспечивается одновременное получение значений координат X5p6 и X6p6 в равновесном состоянии.
После выполнения условий X6p6 = -F и X5p6 = 0 оценивается значение координаты X4p6. В равновесном состоянии значение координаты X4p6 должно быть равно нулю. Если это условие не выполняется, то рассчитывается по выражениям (12) и (13) следующий четвертый пробный шаг с ранее полученными новыми начальными условиями. Затем по выражениям (14)-(19) изменяются координаты объекта X6p6, X5p6 и X4p6 до значений, соответствующих значениям этих координат в равновесном состоянии.
После выполнения условий X6p6 = -F, X5p6 = 0 и X4p6 = 0 оценивается значение координаты X3p6. В равновесном состоянии значение координаты X3p6 должно быть равно нулю. Если это условие не выполняется, то рассчитывается по выражениям (9) и (10) следующий третий пробный шаг с ранее полученными новыми начальными условиями. Затем по выражениям (11)-(19) с помощью ранее описанной методики изменяются координаты объекта X6p6, X5p6, X4p6 и X3p6 до значений, соответствующих значениям этих координат в равновесном состоянии.
После выполнения условий X6p6 = -F, X5p6 = 0, X4p6 = 0 и X3p6 = 0 оценивается значение координаты X2p6. В равновесном состоянии значение координаты X2p6 должно быть равно нулю. Если это условие не выполняется, то рассчитывается по выражениям (6) и (7) следующий второй пробный шаг с ранее полученными новыми начальными условиями. Затем по выражениям (8)- (19) с помощью ранее описанной методики изменяются координаты объекта X6p6, X5p6, X4p6, X3p6 и X2p6 до значений, соответствующих значениям этих координат в равновесном состоянии.
Если значение X1p6 превысит значение X1z, то управление U реальным объектом на очередном шаге принимает значение -Up1. Если значение X1p6 не превышает заданного значения X1z, то управление U реальным объектом на очередном шаге принимает значение Up1 с первого пробного шага. Рассчитываются координаты реального объекта X1i, X2i, X3i, X4i, X5i и X6i после выполнения очередного шага с найденным управлением.
(20)
Для последующих шагов синтез управления выполняется по аналогичной методике.
Список литературы
1. Яковенко П.Г. Методика последовательного многошагового синтеза оптимальных управлений // Известия ТПУ. - 2003. - Т. 306. №2. - С. 95-98.
Библиографическая ссылка
Яковенко П.Г. СИНТЕЗ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ НА ИМИТАЦИОННЫХ МОДЕЛЯХ // Современные наукоемкие технологии. – 2012. – № 6. – С. 53-57;URL: https://top-technologies.ru/ru/article/view?id=30782 (дата обращения: 21.11.2024).