интересно
Предыдущая | Содержание | Следующая

Стохастическая задача в классе синтеза без комиссии

Рассмотрим вспомогательную стохастическую задачу без комиссии (случай О) в постановке в). Обращение к этой задаче определяется оценкой по теореме 2 интересующей нас задачи в) в постановке случая G и простотой выкладок.

- векторы, компоненты которых есть количества облигаций номеров j , j - 1,2,К , N, в портфеле после акта принятия решения на сессиях номеров t , t —соответственно.

Функционал имеет вид (ст , h^_x ) .

Оптимальная задача в этом случае, в силу Марковости процесса цен и типа ограничений, будет иметь вид


Определим WT (ст , h^_x ) = (Мст , h^_x ) и выпишем последовательно для этой задачи уравнения Беллмана [86].

Шаг 1. При выборе h^_x на сессии Т — для каждой пары ст _х , hj_2 решаем задачу линейного программирования

Решение данной задачи находится в одной из вершин, найдем некоторую jT_x -ю :

Подставим это соотношение в функционал рассматриваемой на этом шаге задачи и получим выражение для оценки оптимального значения функционала общей задачи, если процесс начинается с

точки hj_2 при цене ст _х :

Наряду с этой прямой задачей линейного программирования рассмотрим двойственную ей задачу. Она имеет вид

- двойственная скалярная переменная.

В силу определения процесса изменения цен видно, что двойственная переменная (рТ 1 зависит только от сТ1, т.е.

Фт - = <Pt-i (ct-i ) ■

мы решаем задачу

В силу предшествующего замечания относительно (рт_х эта задача также есть задача линейного программирования:

Вершина jT_2, где достигается решение этой задачи, находится из соотношения

Выпишем здесь двойственную задачу

Оптимальное значение оценки функционала общей задачи для состояния ст _2, Щ_ъ запишется в виде

Решение этой задачи имеет вид

решаем задачу

Вершина jT_3 находится из соотношения

С h+ =(c h+ ) ^h+ = (сг-з А-4)

Ст-ъ ,]Т_г

Оптимальное значение оценки конечного функционала задачи запишется в виде

двойственной к этой задачи будет:

Рекуррентные соотношения для коэффициентов в функционалах прямых задач или оптимальные значения двойственных переменных запишутся так:

Шаг Т. На сесии 0 решаем задачу

Доказател ъстео

Утверждение следует непосредственно из уравнений Беллмана в случаях Е и О, поскольку в случае О ограничения имеет вид

(с Т ,hЈ ) = (cT , hj ), а в случае Е - имеет вид

Также из приведенных выше соотношений следует справедливость утверждения.

Теорема 4. Локально-оптимальная задача, т.е. случай, когда на каждом шаге решается задача оптимизации стоимости портфеля только на шаг вперед, близка к исходной задаче в точной постановке, если все (pt близки к константам (в тривиальном случае к единице).

Заметим, что рассматриваемая задача, несмотря на простую запись, содержит в себе все трудности изучаемого нами класса задач управления. Приведем примеры того, что промежуточные цели

W(ct , h+t_x ) могут быть нелинейными функциями, а решение многошаговой задачи не совпадает с серией последовательно решаемых локальных задач с прогнозом на шаг вперед.

Замечание 1. Пример нелинейности промежуточных целей.

Пусть на рынке, на каждой торговой сессии представлены два вида бумаг (бумага 1 и бумага 2). Рассмотрим три последовательные торговые сессии (три шага управления: шаг 1, шаг 2 и шаг 3). Начальный капитал 5^=1. Векторы цен на шаге 1: С 2 (1,1); на шаге 2: с2(с21,1), где с21- случайная величина с известным распределением, принимающая значения в интервале [2,4]; на шаге 3: с3(с31,2), где сЪ1 = С21, т.е. реализация случайной величины с21 на шаге 1. Критерий управления таков, как и для общей задачи: M(c3,h2+), в нашем случае M(c31h2Ґ1 +2/г22) . Комиссия (плата за каждый шаг) полагается равной нулю, следовательно, на шаге / е 1,2:

. Найти управления hf , h2, доставляющие максимум критерию, т.е.

Решим задачу последовательно шагом назад, на каждой сессии максимизируя текущие оценки критерия W(ct , h+t_x ) . Рассмотрим шаг 2. На шаге 2 цена бумаги 1 (реализация случайной величины с21)

фиксирован и возможные значения определяются из начальных условий. Необходимо найти

, заметим, что

Максимизируемый критерий и ограничительное условие есть линейные формы, множество ограничений есть выпуклый многогранник. Поэтому на шаге 2 решается классическая задача линейного программирования

Решение задачи находится в вершинах многогранника линейных ограничений, т.е. в нашем случае в одной из двух точек:

и равен

. Это означает, что на шаге 2 весь капитал

вкладывается в бумагу 2, вне зависимости от структуры портфеля в начале (до принятия решения) на шаге 2.

Рассмотрим шаг 1.

Необходимо найти

в точке (1,0) и

и

, при которых

Теперь рассмотрим предложенную выше задачу с одним дополнительным ограничением на управление: /Јj <3.

Также решим задачу последовательно шагом назад, на каждой

сессии максимизировав критерий W(ct , h^_x ) .

Шаг 2.

Решим задачу линейного программирования

, решение достигается в вершине нового многогранника ограничений

, но не в крайней точке первичного многогранника. Это приводит к тому, что текущая оценка критерия имеет две ветви:

Если изобразить графически в координатах с21, h^l кривую перехода от одной ветви к другой, то эта гипербола

проходит выше

располагается в интервале [2,4].

2 Отсюда мы получаем, что при h^1 e [0, ] необходимо решить

, где математическое ожидание

необходимо решить задачу

, где математическое ожидание М 2 вычисляется как сумма математических ожиданий на двух отрезках:

Оптимальное значение критерия определится как

Замечание 2. Пример несовпадения локальной и многошаговой оптимизации

Сессий - три, бумаг - две, комиссии нет. На нулевой сессии цена обеих бумаг 1. Инвестор на нулевой сессии платит единицу и по выбору получает или бумагу 1, или бумагу 2.

На первой сессии два равновероятных варианта цен.

Вариант 1: (4,1).

Вариант 2: (0,1).

На второй сессии цены бумаг зависят от того, какой вариант реализовался на первой сессии.

Если реализовался первый вариант, то цены (0,0).

Если реализовался второй вариант, то цены (4,4).

Критерий - математическое ожидание конечного капитала.

Проведем анализ операции. Если инвестор на первой сессии выбирает бумагу 1, то его ожидаемый капитал после этого шага равен 2. Однако после второго шага он гарантировано разорен. Если игрок выбирает на первом шаге бумагу 2, то после этого шага его капитал равен 1. После второго шага с равной вероятностью его результат равен либо 0, либо 4, т.е. математическое ожидание результата равно 2. Таким образом, локально оптимальным на первом шаге является выбор бумаги 1, а оптимальным - выбор бумаги 2.

Локально оптимальная стратегия является оптимальной, если фазовое состояние системы полностью определяется случайным фактором и не зависит от выбора управлений (от них может зависеть текущий доход). Если "почти "н е зависит, то локально оптимальная "почти" оптимальна, т.е. может идти речь о приближенном решении. В рассматриваемом случае это так, если после каждой операции взимается комиссия и затем текущий доход изымается из оборота.

Если фазовое состояние зависит от управления, то "расстояние" между локально оптимальной и оптимальной стратегиями может быть сколь угодно велико, вне зависимости, детерминированный это вариант или случайный.