Задачи оптимального наблюдения
Разъясним сказанное подробнее с помощью построения оптимальной программы наблюдения для следующей модельной задачи. Пусть движение системы и процесс наблюдения за ним описывается скалярными уравнениями. Предположим теперь, что существуют несколько интервалов (t" s,), не примыкающих друг к другу, где h0(t) = 1. Покажем, что это приводит к противоречию. Установим, что Y (t) убывает при s, < t… Читать ещё >
Задачи оптимального наблюдения (реферат, курсовая, диплом, контрольная)
Задачи оптимального наблюдения могут быть поставлены следующим образом. Имеется ненаблюдаемое движение x (t) и наблюдаемый процесс y (t) — Распределение вероятностей процесса y (t) зависит от некоторого количества изменяемых параметров. Требуется выбрать указанные параметры таким образом, чтобы оценка вектора x (t) по результатам наблюдений у (s), 0 < s < t, была бы в некотором смысле оптимальной.
Наиболее изучена указанная задача для случая, когда уравнение движения и процесс наблюдения за ним линейны и имеют вид (3.37), (3.38). Предположим далее, что матрица g (t), именуемая составом измерений, и матрица ст0(Г), именуемая точностью измерений, могут изменяться в некоторых пределах. Требуется выбрать эти матрицы таким образом, чтобы минимизировать дисперсию величины q’x (T), где q — заданный нулевой вектор. Вычисляя, получим, что дисперсия величины q’x (T) равняется q’x{T)q, где матрица D (T) описывается уравнением (3.50). Поэтому выбор оптимальных программных функций a0(t) и g (t) осуществляется в результате решения задачи оптимального управления детерминированной системой (3.50).
Разъясним сказанное подробнее с помощью построения оптимальной программы наблюдения для следующей модельной задачи. Пусть движение системы и процесс наблюдения за ним описывается скалярными уравнениями.
Постоянные a, a, aj Ф 0 — заданы, а стандартные винеровские процессы? и взаимно независимы. Случайная гауссовская величина х0 не зависит от процессов ?, и Е,0, причем ее математическое ожидание т0 и дисперсия D0 > 0 заданы.
В каждый момент времени наблюдатель может либо производить наблюдение, либо нет, причем суммарная длительность времени проведения наблюдения задана и равна Г0. Другими словами, функция h (t) в уравнении наблюдения (3.64) равна либо нулю, либо единице, причем.
Функцию h (t) надлежит выбрать так, чтобы минимизировать функционал.
где условная дисперсия величины x (t) дана при условии, что проведено наблюдение y (s), 0 < s < t.
Оптимальный закон наблюдения в этой задаче формулируется следующими утверждениями.
1. Если a > 0, то существует такое число tj < ТТ0, что оптимальный закон наблюдения /i0(t) равен fr0(t) = 1 при t е (f1; + Т0] и h0(t) = 0.
Для te (tj, tj + Г0].
- 2. Если а < 0, но 0 < D0 < -2a)_Ia2, то также существует только один интервал t е (t1; tj + Т0], где /i0(t) = 1.
- 3. Если а < 0 и D0 > -(2a)_1a2, то найдется такое 50, что h0(t) = 1 при 0 < t < s0 и при Т — Т0 + 50 < t < Т, а для t е (s0, Т-Т0 + s0) функция h0(t) = 0.
Для доказательства рассмотрим последовательно все три случая.
Положим z (t) = С учетом (3.50) получаем следующее уравнение для z (t):
Минимизируемый функционал примет вид.
В силу принципа максимума Понтрягина, применяемого к задаче (3.66), (3.67), где в качестве управления берется h (t), имеем.
где постоянная С выбирается так, чтобы выполнялось условие (3.65), a Y (t) удовлетворяет уравнению.
Записывая решение (3.69) по формуле Коши, заключаем, что Т (0 > 0,.
Предположим теперь, что существуют несколько интервалов (t" s,), не примыкающих друг к другу, где h0(t) = 1. Покажем, что это приводит к противоречию. Установим, что Y (t) убывает при s, < t < ti+1. Обозначим.
В силу уравнения (3.68) и сделанного предположения имеем Поскольку.
то из уравнения (3.69) следует, что
Но в силу уравнений (3.66) и (3.69) поэтому в силу уравнения (3.71).
Однако монотонное убывание Y (t) при s, — < t < ti+1 противоречит из-за уравнения (3.68) предположению о том, что (ti+1, s;+1] — интервал наблюдения. Тем самым утверждение 1 установлено.
Пусть zT(t) — решение уравнения (3.69) при V (t) = 0, t > т и начальном условии zt(t) = z0. Ввиду уравнения (3.66) функция zt(t):
- — монотонно возрастает, если Zq1 >-s2(2a)_1 >0;
- — монотонно убывает, если 0<�гцг <-s2(2a)_1, причем lim zx (t) < < -2aa2, t —" «о. Ясно также, что если z0 = z (т), то
Предположим теперь, что существует несколько не примыкающих друг к другу интервалов наблюдения (t" s,). Из уравнения (3.66) вытекает оценка.
Действительно, если D0 < -a2(2a)-1, то оценка (3.73) следует из неравенства (3.72) при т = 0 и свойств z0(t), в силу которых z0(t) > -2сг2, 0 < t < Т. Если же D0 = -ст2(2а)-1, то из уравнения (3.66) следует, что z (s(0 > -2аа~2. В силу (3.72) при т = s, заключаем, что оценка (3.73) справедлива. Из выражений (3.66), (3.73) и равенства h0(t) = 0 при 5; < t < ti+1 получаем, что z0(t)=0. Значит, в силу уравнений (3.70), (3.72) сопряженная переменная Y (t) монотонно убывает при s, < t < ti+1.