Уравнение Беллмана

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Уравнение Беллмана (также известное как уравнение динамического программирования), названное в честь Ричарда Эрнста Беллмана, является необходимым условием для оптимальности, ассоциируемой с математическим методом оптимизации, называемым динамическим программированием. Оно записывает значение проблемы принятия решений в определённый момент времени исходя из результата принятых ранее решений и значения остающейся проблемы разрешимости, полученной в результате этих начальных выборов. Оно разбивает задачу динамической оптимизации на более простые подпроблемы, как описано принципом оптимальности Беллмана.

Принцип оптимальности Беллмана (также известный как принцип динамического программирования), названный в честь Ричарда Эрнста Беллмана, описывает действие математического метода оптимизации, называемого динамическим программированием. Он заключается в том, что на каждом шаге следует стремиться не к изолированной оптимизации функции fkk, ξk), а выбирать оптимальное управление хk* в предположении об оптимальности всех последующих шагов.

Принцип оптимальности: оптимальная стратегия имеет свойство, что какими бы ни были начальное состояние и начальное решение, последующие решения должны составлять оптимальный курс действий по отношению к состоянию, полученному в результате первого решения.