Главная страница » Электрика в театре » Свойства нелинейных систем

1 ... 13 14 15 16 17 18 19 ... 42

где

HpHp{p{t\ х(0, u(0, 0=/о(х, u, 0 + Р^*(х, u, t). (1.2-8)

Если рассматриваемая задача включает вырожденный случай, для которого Ро=0, то необходимо использовать гамильтониан (1.2-4) и канонические дифференциальные уравнения (1.2-6). Более простая формулировка окончательных результатов получается в том случае, когда вместо уравнений (1.2-6) используются канонические уравнения (1.2-7).

Некоторые теоремы принципа минимума. Ниже сформулирован принцип минимума в несколько модифицированной форме [5*].

1. Принцип минимума для автономных систем в задаче с закрепленными концами. Пусть нелинейное уравнение состояния автономной системы с фиксированной конечной точкой х.(Т) и свободным временем Т имеет вид

х = f(x, U).

функционал стоимости

/= о(х(0. m)dt

о

не зависит явно от времени t, а зависит только от конечного момента Т.

Необходимое условие оптимальности можно сформулировать следующим образом: для того чтобы управление и (л;), переводящее систему из начального состояния х(0) в конечное состояние хСГ) вдоль оптимальной траектории х^С/), было оптимальным, необходимо существование непрерывной ненулевой вектор-функции v{t), такой, что решения р ГО и х^ (t) канонических дифференциальных уравнений

P(0 = -(P W. х (0. и'()) ах

удовлетворяют граничным условиям х'(0) = х(0), х\Т) = х(Г) и min (p W. х^). и(0) = Я(Р'(0. х (0. W).



где

Hp(р it), х (О, и it)) = 0; 0<t<T.

Обычно роСО = 1- (Вместо слова min можно писать inf.)

Исходя из канонических уравнений (1.2-7), можно получить необходимое условие оптимальности управления и (t), которое состоит в существовании ненулевой непрерывной вектор-функции р^СО, такой, что решения p°(t) и x(t) канонических дифференциальных уравнений

(0=iP4i), х (0, ut)),

P4t) = - {P4t), х (0, u (0)

удовлетворяют граничным условиям х (0) = х(0), х (Г) = х(Г) и

пйпЯ,(р'(0, х (0, U (0) = Яр(р (0. х (0, (О)-

Функция состояния в правой части этого равенства тождественно равна 0:

Hp (р (О, X it), и (О = О, О < < Т.

2. Принцип минимума для автономных систем в задаче с подвижными концами. Рассмотрим случай свободного времени Т, Пусть уравнение автономной системы имеет вид

x = f(x, и),

а множество цели С -гладкое т-мерное многообразие в пространстве Функционал стоимости, как и раньше, задается формулой

г

/ = 1/о(х(0, u(0)rf-о

Необходимое условие оптимальности вектора управления u>(t), переводящего систему из начального состояния х(0) в конечное состояние х(Т) из множества цели С вдоль оптимальной траектории, состоит в существовании непрерывной ненулевой вектор-функции р^СО. такой, что решения р СО и х<>(1) канонических дифференциальных уравнений

x (0 = -ajf (Р ()



удовлетворяют граничным условиям х (0) = х (0), х (7) = U е

где

Я^ (Р (0. х (О, и (0) = 0. О < < Г.

Кроме того, в соответствии с условием трансверсальности вектор piT) ортогонален к касательной плоскости множества цели С в точке х^Т), т. е.

pOT(7)v = 0.

Здесь V-произвольный вектор в касательной плоскости Тс:

= 0 (/=1, 2, т).

где Лг(х)=0 (i=l, 2, .... т)-уравнения выпуклого множества цели С, для которого т компонент вектора х(Т) не являются свободными. Если все компоненты свободны, т=0 и С=£ , то р(Т) = 0.

3. Принцип минимума для неавтономных систем в задаче с закрепленными концами. Пусть х=/(х, и, t)-уравнение неавтономной системы с функционалом стоимости

/ = [/о(х(0. t)dt.

Необходимое условие оптимальности управления и (t), переводящего систему из начального состояния х(0) в конечное состояние х(Т) вдоль оптимальной траектории (t), состоит в существовании непрерывной ненулевой вектор-функции pCOi такой, что решения р (О и x(t) канонических дифференциальных уравнений

{t)-i.v4t), x(0,u (0.4

P W = - Ж^ЧИ 4t). u W, t)

удовлетворяют граничным условиям х'(0) = х(0) х'(Г) = х(Г) и соотношению

штЯ.(р (4 х (0, и(0. i)fpiP4th x (O.u (0.O.

и<=и



где

т

Hp{p it), х-СО- uHt), ) = - J iv4h x W, пЦ.), )dx,

Яр(р (7), х^СГ), и^Г), 7) = D

и время Т свободно.

4. Принцип минимума для неавтономной системы с переме-щающейся конечной точкой. Пусть и (t) - допустимый вектор управления, который переводит заданную выше неавтономную систему из начального состояния х(0) в конечное состояние х(Т) вдоль оптимальной траектории х^ХО и точка хСГ^в момент времени t=T принадлежит множеству цели h(t), где h(t) - непрерывно дифференцируемая функция t. В этом случае заданное множество цели представляет собой некоторую кривую линию. Необходимое условие оптимальности управления и (О состоит в существовании ненулевой непрерывной вектор-функции р (0. для которой Р^СО и х^СО удовлетворяют каноническим дифференциальным уравнениям Гамильтона с начальным условием х (0)=х(0) и конечным условием x(T)=h(l); кроме того, для оптимального управления и (/) гамильтониан должен быть минимальной функцией состояния, которая удовлетворяет соотношениям

ЯЛрПП х (7), и (7), г) = рОТ(7)

(р^.), х (.), u (.))rf dh

где конечное время Т незакреплено.

5. Принцип минимума для неавтономных систем с движу-и^имся множеством цели. Пусть и (О - вектор допустимого управления, который переводит рассмотренную выше неавтономную систему [31] вдоль оптимальной траектории х^ (t) из начального состояния (х(0), 0) в конечное состояние (х(Т), Т), принадлежащее предписанному множеству цели С, где С - гладкое выпуклое множество размерности -f-ln+1, включая также размерность времени.

В рассматриваемом случае время Т также свободно. Необходимое условие оптимальности управления VL(t) состоит в существовании ненулевой непрерывной вектор-функции p.fO. такой, что р^.СО и х р) являются решениями канонических диф-



ференциальных уравнений Гамильтона с начальным условием хО(0)=х(0) и конечным условием {\>(Т), Г) s С и гамильтониан для оптимального управления ut) достигает минимума (точной нижней грани), причем для этой минимальной функции состояния

т

т

при

т

H.irfiiT), х (7), ичп Т) = мт)Н>ЧП П

где m=n - k, Т - конечное время, у, (i=l, 2, m) -координаты вектора касательной v и hi {х, t)=0 (i=l, 2.....m)-

уравнения множества цели С.

Если множество С заполняет все пространство и всю временную область, то

т

и

р(р (Г), х (Г), и (7), П = 0.

В первом случае из условия трансверсальности

р т(7)у(Г) = 0

и соотношения

(хПГ), Г)У(Г) = 0 (/ = 1, 2, т)

следует, что р (Г) является линейной комбинацией векторов grauhi(х (Т), T){i=l, 2, га). Во втором случае (при условии, что множество С заполняет целиком пространство Е

и всю временную область)

р (Г) = 0.

6. Принцип минимума для неавтономных систем с закрепленным временем. Пусть и ( О-вектор допустимого управления, который переводит рассмотренную выше неавтономную систему вдоль оптимальной траектории х^ (t) из начального состояния х(0) в



а) фиксированное конечное состояние х(Т), Т,

б) множество цели С = (Ci, Т) или

в) множество цели С={Е', Т),

где время Т фиксировано. Необходимое условие оптимальности управления u(t) состоит в том, что это управление должно удовлетворять каноническим дифференциальным уравнениям Гамильтона с начальным условием х'(О)=х(0) и конечным условием

(а) х (7) = х(7),

(б) х (7)( С,

(в) х (7)-любое

и, кроме того, гамильтоновская функция состояния для этого управления достигает минимума в то время, как вектор р^(Т) является:

произвольным в случае а), трансверсален kCi в точке х^СГ) в случае б) и является нулевым, р^СГ) = О, в случае в). Заметим, что условие

Hpipt), хЩ), и (О, t) = Hpip4n хЧЛ, и (7), Т)-

удовлетворяется автоматически и, следовательно, не содержит полезной информации.

7. Принцип минимума для неавтономных систем с конечной стоимостью . Уравнение неавтономной системы и функционал стоимости имеют вид

k(0 = f(x(0, u(0, t),

т

I = K(x (Т), 7) -f I /о (X it), u (t), t)dt.

Будем считать, что функция К имеет непрерывные частные производные до второго порядка по х и /. Кроме того, предполагается, что время Т свободно. Так как

т

К{х (7), 7) = /<(х(0), 0) + [-К (X (t), t)

и

/С (X (t), О = (X it), t) kit) + (X it), t) =

= g (x(0. t) fix it). Hit), t) + ixit), t).



функционал записывается в виде

/ = /С(х(0), 0) + /

где

т

/1= J l/o(xW, U(0, t) + {x{t), t)f{x{t), ll{t), t) +

+iMt), t)\dt

и минимизация суммы /, первое слагаемое которой равно постоянной величине, эквивалентна минимизации h.

Теперь можно сформулировать необходимое условие оптимальности управления и*(/), которое состоит в существовании ненулевой непрерывной вектор-функции V°{t), такой, что xo(t) и Р^СО являются решениями канонических дифференциальных уравнений Гамильтона с начальным условием х*(0)=х(0) и конечным условием х^СГ) еС (или х* (Г)-любое); кроме того, функция состояния должна достигать минимума и

т

H,{v4t), xt), VP it), t) = Vi{T)ixT), T)-

-(хПГ),/)-! [-(P (x). x.), ux), .)-f t

+S(x4), )

Win x (n и (Г), 7) =

-ЛТ)(хЧП Т)-{хЧП Т),

где hi(x, i) = 0, (1, 2, m) - уравнения множества цели С. По условию трансверсальности в рассматриваемом случае в момент времени Т вектор

р<(7)--(х (7), Т)

ортогонален к множеству цели С.

Если множество С заполняет все пространство Е и содер-

жит всю временную область, то Яр(р<(), х<(0, и (О, 0= -ж^)



Я^Ср-СГ), хЦТ), и (Г), 7) = -(хЧ7), Т), тогда как

р<(Г)=-(х<(Г), Т).

Замечания о суи{ествовании и единственности оптимальных и экстремальных управлений. В конкретных задачах, прежде чем применять принцип минимума (максимума), необходимо убедиться в существовании оптимального управления [105, 158, 168, 211, 230-232], что, как правило, довольно трудно. Утверждение, согласно которому для любой физической задачи заведомо существует оптимальное управление, является спорным. Первое и безусловно необходимое условие математической оптимизации для любой физической задачи состоит в разрешимости соответствующей математической задачи. Иначе говоря, сначала требуется выяснить, является ли разрешимой данная математическая задача, и только после этого переходить к проверке на адекватность математической модели (математической формулировки физической проблемы) рассматриваемой реальной ситуации. Математическая постановка физической задачи нередко содержит ряд допущений, которые, как следует из физических соображений, снижают достоверность полученного на их основе математического решения. Кроме того, в силу ограниченности принятых допущений любое математическое решение должно быть проверено с точки зрения физического смысла. Приступая к решению задачи оптимизации, инженер прежде всего стремится определить экстремальные управления, удовлетворяющие необходимым условиям. Если оптимальное управление существует, то тогда найдется по крайней мере одно экстремальное управление. Обратное, вообще говоря, неверно. Наличие одного или нескольких экстремальных управлений совсем не означает, что будет существовать и оптимальное управление.

Из существования оптимального и единственности экстремального управлений следует единственность оптимального управления (хотя из единственности оптимального управления единственность экстремального не следует). Существование нескольких оптимальных управлений предполагает наличие нескольких экстремальных, но не наоборот. Предположим теперь, что некоторая задача имеет оптимальное решение для каждого ограниченного конечного момента времени Т. Более того, допустим, что оптимальное управление существует также в предельном случае, когда Т-оо. Существование оптимального управления для каждого момента Т (включая Т-оо) означает, что оптимальное управление существует даже в том случае, когда



конечный момент времени Т неопределен, хотя обратное в об щем случае неверно.

Допустим, что для каждого фиксированного конечного состояния существует оптимальное управление. Отсюда вытекает существование оптимального управления также в том случае, когда конечное условие задано замкнутым выпуклым (компактным) множеством цели С в евклидовом пространстве Е . Обратное утверждение может быть неверным.

По сравнению с необходимым условием применять достаточ-. ное условие оптимальности гораздо труднее.

Пусть рассматриваемый объект управляем и наблюдаем (разд. 5, ч. V). Предположим также, что гамильтоновская функция состояния нормальна, т. е. выражение (1.2-8) имеет единственный минимум при управлении u(t) = u (t) s U, Пусть минимизируемый функционал

т

У(х, U, ) = 1/о(х(х), и(т), x)dz, (1.2-9)

где У(х, U, 0) == /. Кроме того, определим

т

5(хО, t) = min У(х, U, t) = min J Л (x (x), u (x), т) dx. (1.2-10) После этого найдем производную 5(х , () по времени:

dt ах т dt ахв'г их , U , г; .

Используя выражение (1.2-10), получим, что левая часть этого равенства будет равна -h{x(t), и СО, 0. следовательно,

f-f/o(x , u , ) + -f(x , u , 0-=0 (1.2-11)

и, как следует из условия (1.2-8),

X , и , ) = 0. (1.2-12)

dS dt

Ниже при рассмотрении динамического программирования будет показано, что существует функция S, удовлетворяющая дифференциальному уравнению в частных производных (1.2-12), градиент которой dSldx совпадает с переменной,сопряженной

для вектора управления и .

Если функция Н нормальна, уравнение (1.2-12) называется дифференциальным уравнением Гамильтона - Якоби.

Если уравнение (1.2-12) имеет решение, удовлетворяющее Граничному условию 5(х, t)=-0, ((х, t)C), то и -оптималь-



ное управление и

J{x {t), u it), t) = S{x>{t), t), 0<t<T. (1.2-13)

Таким образом, понятие нормальности усиливает необходимое условие принципа минимума (максимума). К сожалению, использовать уравнение Гамильтона - Якоби непосредственно для отыскания решения сложно, и поэтому его применение, как правило, ограничивается одной проверкой. Наконец, если такая проверка затруднена, можно попытаться показать, что существует экстремальное управление и , такое, что неравенство

/(u<(0)</(u-(0) (1-2-14)

выполняется для любого экстремального управления е U.

1.3. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ АВТОНОМНЫМИ ОБЪЕКТАМИ

Линейный автономный объект управления с сосредоточенными параметрами описывается уравнениями [21, 25]

i(0 = Ax(0 + Bu(0,

y(0 = Cx(0 + Du(0 -

или в сокращенном виде

i = Ах -f Bu,

y = Cx-fDu.

Предполагается, что объект управления наблюдаем, управляем и, кроме того, нормален (разд. 5, ч. V). Ограничение и е С/ на вектор управления и может быть (без ограничения общности) записано в виде

ii,-<l (у= 1, 2, г). (1.3-3)

Минимизируемый функционал

/ = [/о(х(0. u(0)cf. (1.3-4)

Гамильтоновская функция состояния задается соотношением Яр(р, X, и)=/о(х, u)-f ртк =

= /о (X, U) -f рТ Ах -f рТ Bu = /о (X, U) -f х^А^р -f uTRTp (1.3-5)

и, следовательно, дифференциальное уравнение относительно вспомогательных переменных имеет вид



1 ... 13 14 15 16 17 18 19 ... 42

© 2000-2025. Поддержка сайта: +7 495 7950139 добавочный 133270.
Заимствование текстов разрешено при условии цитирования.