Оптимальное управление
Оптимальное управление — это задача проектирования системы, обеспечивающей для заданного объекта управления или процесса закон управления или управляющую последовательность воздействий, обеспечивающих максимум или минимум заданной совокупности критериев качества системы [1].
Для решения задачи оптимального управления строится математическая модель управляемого объекта или процесса, описывающая его поведение с течением времени под влиянием управляющих воздействий и собственного текущего состояния. Математическая модель для задачи оптимального управления включает в себя: формулировку цели управления, выраженную через критерий качества управления; определение дифференциальных или разностных уравнений, описывающих возможные способы движения объекта управления; определение ограничений на используемые ресурсы в виде уравнений или неравенств[2].
Если управляемый объект или процесс является детерминированным, то для его описания используются дифференциальные уравнения. Наиболее часто используются обыкновенные дифференциальные уравнения вида
. В более сложных математических моделях (для систем с распределёнными параметрами) для описания объекта используются дифференциальные уравнения в частных производных. Если управляемый объект является стохастическим, то для его описания используются стохастические дифференциальные уравнения.
Реальное поведение объекта или системы всегда отличается от программного вследствие неточности в начальных условиях, неполной информации о внешних возмущениях, действующих на объект, неточности реализации программного управления и т.д. Поэтому для минимизации отклонения поведения объекта от оптимального обычно используется система автоматического регулирования.[3]
Иногда (например, при управлении сложными объектами, такими как доменная печь в металлургии или при анализе экономической информации) в исходных данных и знаниях об управляемом объекте при постановке задачи оптимального управления содержится неопределённая или нечёткая информация, которая не может быть обработана традиционными количественными методами. В таких случаях можно использовать алгоритмы оптимального управления на основе математической теории нечётких множеств (Нечёткое управление). Используемые понятия и знания преобразуются в нечёткую форму, определяются нечёткие правила вывода принимаемых решений, затем производится обратное преобразование нечётких принятых решений в физические управляющие переменные. [4]
Содержание |
[править] Оптимальное управление детерминированными системами
[править] Системы с обыкновенными параметрами
Наиболее широко при проектировании систем управления детерминированными объектами c обыкновенными параметрами, описываемыми обыкновенными дифференциальными уравнениями, применяются следующие методы: вариационное исчисление, принцип максимума Понтрягина и динамическое программирование Беллмана[1].
[править] Задача оптимального управления
Сформулируем задачу оптимального управления:
- Уравнения состояния:
(1). - Граничные условия
,
(2). - Минимизируемый функционал:
.
здесь
— вектор состояния
— управление,
— начальный и конечный моменты времени.
Задача оптимального управления заключается в нахождении функций состояния
и управления
для времени
, которые минимизируют функционал.
[править] Вариационное исчисление
Рассмотрим данную задачу оптимального управления как задачу Лагранжа вариационного исчисления [5]. Для нахождения необходимых условий экстремума применим теорему Эйлера-Лагранжа [5]. Функция Лагранжа
имеет вид:
, где
— граничные условия. Лагранжиан
имеет вид:
, где
,
,
— n-мерные вектора множителей Лагранжа.
Необходимые условия экстремума, согласно этой теореме, имеют вид:
- стационарность по u:
, (3) - стационарность по x, уравнение Эйлера:
(4) - трансверсальность по x:
,
(5)
Необходимые условия (3-5) составляют основу для определения оптимальных траекторий. Написав эти уравнения, получаем двухточечную граничную задачу, где часть граничных условий задана в начальный момент времени, а остальная часть — в конечный момент. Методы решения подобных задач подробно разбираются в книге[6]
[править] Принцип максимума Понтрягина
Необходимость в принципе максимума Понтрягина возникает в случае когда нигде в допустимом диапазоне управляющей переменной невозможно удовлетворить необходимому условию (3), а именно
.
В этом случае условие (3) заменяется на условие (6):
(6)
В этом случае согласно принципу максимума Понтрягина величина оптимального управления равна величине управления на одном из концов допустимого диапазона. Уравнения Понтрягина записываются при помощи функции Гамильтона Н, определяемой соотношением
. Из уравнений следует, что функция Гамильтона H связана с функцией Лагранжа L следующим образом:
. Подставляя L из последнего уравнения в уравнения (3-5) получаем необходимые условия, выраженные через функцию Гамильтона:
- уравнение управления по u:
, (7) - уравнение состояния:
, (8) - сопряжённое уравнение:
, (9) - трансверсальность по x:
,
(10)
Необходимые условия, записанные в такой форме, называются уравнениями Понтрягина. Более подробно принцип максимума Понтрягина разобран в книге[5].
[править] Где применяется
Принцип максимума особенно важен в системах управления с максимальным быстродействием и минимальным расходом энергии, где применяются управления релейного типа, принимающие крайние, а не промежуточные значения на допустимом интервале управления.
[править] История
За разработку теории оптимального управления Л.С. Понтрягину и его сотрудникам В.Г. Болтянскому, Р.В. Гамкрелидзе и Е.Ф. Мищенко в 1962 г была присуждена Ленинская премия.
[править] Метод динамического программирования
Метод динамического программирования основан на принципе оптимальности Беллмана, который формулируется следующим образом: оптимальная стратегия управления обладает тем свойством, что каково бы ни было начальное состояние и управление в начале процесса последующие управления должны составлять оптимальную стратегию управления относительно состояния, полученного после начальной стадии процесса[7]. Более подробно метод динамического программирования изложен в книге[8]
[править] Достаточные условия оптимальности
Достаточные условия оптимальности управляемых процессов были предложены В. Ф. Кротовым, на основе которых были построены вычислительные алгоритмы последовательного улучшения, позволяющие находить глобальный оптимум в задачах управления.
[править] Системы с распределенными параметрами
В системах с распределенными параметрами описываемый объект описывается дифференциальными уравнениями в частных производных. Теория оптимального управления в этом случае разработана лишь для отдельных видов этих уравнений: эллиптического, параболического и гиперболического типа. В некоторых простых случаях удается получить аналог принципа максимума Понтрягина.[9][10]
[править] Задача оптимального управления
- Задана область определения управляемого процесса

- Уравнения, описывающие управляемый процесс:
, где
-
- мерный вектор, описываемый управляемый процесс,
-
- мерный вектор производных вектора
по координате
,
-
- мерный вектор производных вектора
по координате
,
-
- мерный управляющий вектор. - Граничные условия для управляемого процесса:

- Задача оптимального управления состоит в том, чтобы найти такое управление
, при котором допустимое уравнениями
решение
приводит к максимуму функционала
.
[править] Оптимальное управление стохастическими системами
В этом случае управляемый объект или процесс описывается стохастическими дифференциальными уравнениями. В этом случае решение задачи оптимального управления осуществляется на основе уравнения Риккати[11].
[править] Задача оптимального управления
- Система описывается стохастическими дифференциальными уравнениями
, где
-
- мерный вектор состояния,
-
- мерный вектор управления,
-
- мерный вектор наблюдаемых переменных,
- независимые винеровские процессы с нулевыми средними значениями и заданными ковариациями приращений,
- матрицы. - Необходимо найти оптимальное управление, минимизирующее математическое ожидание функции потерь
.
[править] Примечания
- ↑ 1 2 Самойленко В. И., Пузырев В. А., Грубрин И. В. «Техническая кибернетика», учеб. пособие, М., изд-во МАИ, 1994, 280 с. ил., ISBN 5-7035-0489-9, гл. 4 «Оптимальные системы управления динамическими объектами и процессами», с. 63-113;
- ↑ Коршунов Ю. М. «Математические основы кибернетики», учеб. пособие для вузов, 2-е изд., перераб. и доп., М., «Энергия», 1980, 424 с., ил., ББК 32.81 6Ф0.1, гл. 5 «Структура и математическое описание задач оптимального управления», c. 202;
- ↑ А.Г. Александров, Оптимальные и адаптивные системы, М., Вышая школа, 1989, 263 с., ISBN 5-06-000037-0
- ↑ Методы робастного, нейро-нечёткого и адаптивного управления: Учебник / Под ред. Н.Д. Егупова, изд. 2-ое, стер., М., Изд-во МГТУ им Н.Э. Баумана, 2002, 744 с ил., ISBN 5-7038-2030-8, тир. 2000 экз, ч. 2 "Нечёткое управление"
- ↑ 1 2 3 Э. М. Галеев, В. М. Тихомиров «Оптимизация: теория, примеры, задачи», М., «Эдиториал УРСС», 2000, 320 с., ISBN 5-8360-0041-7, гл. 3 «Вариационное исчисление», п. 6 «Задача Лагранжа», с. 173—181;
- ↑ «Численные методы в теории оптимальных систем», Моисеев Н. Н., «Наука», 1971, 424 стр. с илл., гл. 2 «Численные методы расчета оптимальных программ, использующие необходимые условия экстремума», с 80 — 155;
- ↑ Беллманн Р. «Динамическое программирование», ИЛ, М., 1960;
- ↑ «Численные методы в теории оптимальных систем», Моисеев Н. Н., «Наука», 1971, 424 стр. с илл., гл. 3 «Прямые методы теории оптимального управления», с 156—265;
- ↑ Ж.-Л. Лионс Оптимальное управление системами, описываемыми уравнениями с частными производными, М., Мир, 1972, 412 c.
- ↑ Бутковский А.Г. Теория оптимального управления системами с распределенными параметрами, М., Наука, 1965
- ↑ К.Ю. Острем Введение в стохастическую теорию управления, М., Мир, 1973
[править] Литература
- Растригин Л.А. Современные принципы управления сложными объектами. - М.: Сов. радио, 1980. - 232 с., ББК 32.815, тир. 12000 экз.
- Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. - М.: Наука, 1979, УДК 519.6, - 223 c., тир. 24000 экз.
,
(2).
.
(4)
,
(5)
(6)
, (7)
, (8)
, (9)
,
(10)
, где
-
- мерный вектор, описываемый управляемый процесс,
-
,
-
,
-
- мерный управляющий вектор.
, при котором допустимое уравнениями
решение
приводит к максимуму функционала
.
, где
- мерный вектор управления,
- мерный вектор наблюдаемых переменных,
- независимые винеровские процессы с нулевыми средними значениями и заданными ковариациями приращений,
- матрицы.
.