Марковский момент

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

В математике теория момента остановки или марковский момент времени связана с проблемой выбора времени, чтобы принять определённое действие, для того чтобы максимизировать ожидаемое вознаграждение или минимизировать ожидаемые затраты. Проблема момента остановки может быть найдена в области статистики, экономики и финансовой математики (связанные с ценообразованием на американские опционы). Самым ярким примером, относящимся к моменту остановки, является Задача о разборчивой невесте. Проблема момента остановки часто может быть указана в форме уравнения Беллмана и поэтому часто решается с помощью динамического программирования.

Определение[править | править код]

Случай с дискретным временем[править | править код]

Как правило, проблема момента остановки связана с двумя объектами:

  1. Последовательность случайных величин , чьё совместное распределение предполагается известным.
  2. Последовательность «вознаграждающих» функций которые зависят от наблюдаемых значений случайных величин в 1:

С учетом этих объектов, проблема заключается в следующем:

  • Вы, соблюдая последовательность случайных величин, на каждом шаге можете выбрать прекратить или продолжить наблюдение.
  • Если вы прекратите наблюдать на шаге , вы получите награду .
  • Вам нужно выбрать правило остановки, чтобы максимизировать предполагаемое вознаграждение (или, что эквивалентно, минимизировать ожидаемую потерю).

Случай непрерывного времени[править | править код]

Рассмотрим усиление процессов определённых на фильтрованном вероятностном пространстве и предположим, что это адаптирование фильтрации. Задача момента остановки состоит в том, чтобы найти время остановки которое максимизирует ожидаемый выигрыш:

где называется значением функции. Здесь может иметь значение .

Более конкретная формулировка выглядит следующим образом. Мы рассматриваем адаптированный сильный Марковский процесс , определённый на фильтрованном вероятностном пространстве , где обозначает вероятностную меру, при которой случайный процесс начинается с . Учитывая непрерывные функции и , задача оптимальной остановки:

Иногда это называется МЛС (Майер, Лагранж и супремум, соответственно) формулировка.[1]

Методы решения[править | править код]

Есть два подхода к решению проблемы момента остановки. Когда основной процесс (или усиление процесса) описывается своим безусловным конечномерным распределением, тогда соответствующий метод решения — подход Мартингала, названный так потому, что он использует теорию Мартингала, наиболее важным понятием является разработка Снелла. В дискретном случае, если горизонт планирования конечен, проблема может быть легко решена с помощью динамического программирования.

Когда основной процесс определяется семейством (условных) функций переходов приводящих к Марковскому семейству вероятностных переходов, часто могут быть использованы мощные аналитические инструменты теории Марковских процессов и такой подход называется Марковским методом. Решение обычно получается путём решения связанных задач со свободными границами (задачи Стефана).

Результат диффузии прыжка[править | править код]

Пусть будет диффузия Леви в из стохастического дифференциального уравнения

где  — -мерное Броуновское движение, это -мерная компенсированная случайная мера Пуассона, , , и заданы такие функции, что существует единственное решение . Пусть будет открытым множеством (область платежеспособности) и

время банкротства. Задача оптимальной остановки:

Получается, что при некоторых условиях регулярности,[2] выполняется следующая теорема проверки:

Если функция удовлетворяет

  • где область продолжения ,
  • на , и
  • на , где  — бесконечно малый генератор

тогда для всех . Кроме того, если

  • на

Тогда для всех и  — оптимальный момент остановки.

Эти условия могут быть записаны в более компактной форме (интегро-вариационное неравенство):

  • на

Примеры[править | править код]

Подбрасывание монеты[править | править код]

(Пример, где сходится)

У вас есть честная монета, и вы постоянно подбрасываете её. Каждый раз, перед броском, вы можете остановить бросок и получить оплату (скажем, в долларах) за среднее количество выпавших орлов.

Вы хотите максимизировать сумму, которую вам заплатят, выбирая правило остановки. Если хi (где i ≥ 1) образует последовательность независимых, одинаково распределённых случайных величин с распределением Бернулли

и если

тогда последовательности и являются объектами, связанными с этой проблемой.

Продажа дома[править | править код]

(Пример, где не обязательно сходится)

У вас есть дом, и вы хотите продать его. Каждый день вам предлагают за ваш дом, и платите , чтобы продолжать рекламировать его. Если вы продадите ваш дом в день , вы заработаете , где .

Вы хотите максимизировать сумму, которую вы зарабатываете, выбирая правило остановки.

В этом примере последовательности () является последовательностью предложений за ваш дом, а последовательность «вознаграждений» функций определяет, сколько вы будете зарабатывать.

Задача о разборчивой невесте[править | править код]

(Пример, где  — это конечная последовательность)

Рассматривается последовательность объектов, которые можно отсортировать от лучшего к худшему. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы на выбор лучшего объекта.

Здесь, если (n - некоторое большое число) — ранги объектов, и — это шанс, что вы выберете лучший объект, если прекратите намеренно отбрасывать объекты на шаге i, то и — последовательности, связанные с этой проблемой. Эта задача была решена в начале 1960-х годов. Изящное решение задачи секретаря и несколько модификаций этой задачи обеспечивают более современный алгоритм оптимальной остановки (алгоритм Брюса).

Теория поиска[править | править код]

Экономисты изучили ряд проблем оптимального момента остановки, подобных «задаче секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска особенно сосредоточена на поиске работником высокооплачиваемой работы или поиске потребителем продукции по низкой цене.

Торговля опционами[править | править код]

В торговле опционами на финансовых рынках, держатель американского опциона может осуществлять право купить (или продать) базовый актив по определённой цене в любое время до или в момент истечения срока. Таким образом, оценка американских опционов, по сути, проблема оптимальной остановки. Рассмотрим классическую модель Блэка-Шоулза и пусть будет безрисковой процентной ставкой и ставка дивидендов и непостоянство акции. Цена акций следует за геометрическим броуновским движением

В соответствии с мерой риска.

Когда параметр является бессрочным, задача оптимальной остановки

,

где функция выигрыша для опциона вызова и для опциона ставки. Вариационное неравенство

для всех где это граница физических упражнений. Решение известно[3]

  • (Бесконечный вызов) где и
  • (Бесконечная ставка) где и

С другой стороны, когда конечный срок действия конечен, задача связана с двумерной задачей о свободной границе без известного решения замкнутой формы. Однако могут быть использованы различные численные методы. См. Модель Black-Scholes # Американские опционы для различных методов оценки здесь, а также Fugit для дискретного дерева на основе расчета оптимального времени для тренировки.

См. также[править | править код]

Ссылки[править | править код]

  1. Peskir, Goran; Shiryaev, Albert  (англ.). Optimal Stopping and Free-Boundary Problems (неопр.). — 2006. — Т. Lectures in Mathematics. ETH Zürich. — ISBN 978-3-7643-2419-3. — doi:10.1007/978-3-7643-7390-0.
  2. Øksendal, B.  (англ.); Sulem, A. S. Applied Stochastic Control of Jump Diffusions (неопр.). — 2007. — ISBN 978-3-540-69825-8. — doi:10.1007/978-3-540-69826-5.
  3. Karatzas, Ioannis; Shreve, Steven E.  (англ.). Methods of Mathematical Finance (неопр.). — 1998. — Т. 39. — ISBN 978-0-387-94839-3. — doi:10.1007/b98840.