Главная страница » Электрика в театре » Свойства нелинейных систем

1 ... 21 22 23 24 25 26 27 ... 42

оптимальное управление

° it) = Um sign sIi-, (3.1-18)

a время Г° с учетом равенства (3.1-16) определяется из условия

J g-(ro-0cf-j. (3.1-19)

Если на энергию управления (О наложено ограничение, задаваемое величиной Е, тогда равенство (3.1-7) выполняется при условии, что p=q=2; кроме того, из условия (3.1-2) получим, что M=YE. в этом случае, применяя равенство (3.1-17), найдем, что

u4t) = E&signE\M\, (3.1-20)

где в соответствии с выражением (3.1-16) Г° определяется из условия

\ g4T-t)dt. (3.1-21)

о

Если ограничение наложено на среднюю мощность переменной управления uP{t), то получим также, что p = q = 2 и M = YРТ°. В этом случае

иР (t) = pro . (3.1-22)

а время Т° можно определить из соотношения

g4T-t)dt= (3.1-23)

Из формулы оптимального управления (3.1-17) видно, что переменная u(t) зависит от вида весовой функции g(To - t) сопряженной системы и от предписанного значения величины i.

Эти результаты легко обобщить на случай ненулевых начальных условий.

Во всех рассмотренных случаях параметры управляемого объекта не зависели от времени. Для неавтономных систем с нулевым начальным условием вместо формулы (3.1-17) имеет место выражение

j,o() = sign , (3.1-24)

go. t)



где g{T°, О - весовая функция сопряженной системы, которая соответствует импульсной переходной функции g{t, Эта функция совпадает с выходной реакцией системы на входное возмущение b{t - Для неавтономных объектов

(3.1-25)

Уравнение (3.1-16) может выполняться для нескольких значений переменной Т, среди которых Р - наименьшее.

3.2. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ МНОГОМЕРНЫМИ ОБЪЕКТАМИ

Рассмотрим задачу оптимального управления линейным объектом с г входами и т выходами. Допустим, что этот объект является автономным. В векторной форме уравнения управляемого объекта запишутся в виде

x(0 = Ax(0 + Bu(0, у(0 = Сх(0.

(3.2-1)

Пусть известны начальное условие х(0) (например, jc (0) = 0) и желаемый (предписанный) выход i. Норму вектора управления в банаховом пространстве зададим в виде

luL = lu IlpA

Lo /=1

(3.2-2)

Предположим также, что вектор допустимого управления ограничен, т. е.

Iup<yw. (3.2-Я)

Из этого условия при р-оо следует, что

шах max Uj{f) < М,

0<i<T.

(3.2-4)

Для р=2 этому неравенству отвечает ограничение на энеогию управления в интервале [О, 7]. При р=1 это неравенство означает ограниченность интеграла, взятого в промежутке [О, Т] от суммы абсолютных значений управляющих переменных. Применительно к ракетным двигателям это соответствует общему потреблению топлива.

Известно, что решение дифференциального уравнения (3.2-П задается в виде выражения

X (О = Ф (О X (0) -f J Ф ( - ) Bu () dz. (3.2-5)



Следовательно,

у (О = С Ф (t) X (0) + I СФ( - О Ви (т) dx.

(3.2-6)

Найдем управление, минимизирующее норму (3.2-2), для которого вектор управляемых переменных совпадает в момент времени i=T с предписанным вектором i. Предполагается, что рассматриваемый объект управляем, т. е. найдется по крайней мере один управляющий вектор u(t), для которого y(T) = i. Рассмотрим вектор разности

ао{ сф(г)х(0).

Из равенства (3.2-6) получим, что

где

d= J 0(Г-х)и(т)Л,

о

о(0 = СФ(ов

(3.2-7)

(3.2-8) (3.2-9

(3.2-10)

-матрица порядка тХг.

Введем некоторый вспомогательный вектор ут wj. Кроме того, положим

wT (О = vTQ (О или QT (О V = W (0.

Применяя неравенство Гёльдера для скалярного произведения векторов-функций времени, получим с учетом соотношений (3.2-8) и (3.2-10), что

г

vTd= J wT(r-T)u(t)cfT<

< J I (Г - .) u (t)\dx < К w 11,11 u 11, (3.2-11)

где

г r л

V Т г

(3.2-12)

Согласно неравенству (3.2-11),

Ivdl Ivdl

iiwii9 llvgll,

(3.2-13)

Правая часть этого неравенства зависит от выбора вектора v. Из равенства (3.2-8) следует, что соотношение (3.2-11) выпол-ряется для любого вектора v. Следовательно, неравенства



(3.1-11) и (3.2-13) должны иметь место для произвольного вектора V. Отсюда следует, что

u,>max-jJi (3.2-14)

(IIU Ipmin = max . (3.2-15)

Исключим из рассмотрения все векторы, кроме тех, для которых vd = 1. Это возможно, так как u, не зависит от используемой формы записи (cv или v). В этом случае

.17= T (3.2-16)

Пусть v обозначает вектор v, для которого w минимальна при условии, что vTd = l. Пусть, кроме того,

II w II, = min II w II, = II Gv II,. (3.2-17)

(lluigminirrV- (3.2-18)

Тогда из соотношения (3.2-15) получим равенство

llwey.

Это соотношение выполняется всякий раз, когда неравенство

l==v Td<w ,uU (3.2-19)

полученное из неравенства (3.2-11), обращается в равенство. Неравенство Гёльдера становится равенством тогда и только тогда, когда

= djlgr signw.iT-t),Vt[0,T]. (У=1,2,...,г).(3.2-20)

Полученная система равенств аналогична соотношению (3.1-13) в одномерном случае, которое можно получить, заменив в выражении (3.2-20) вектор v на скалярную величину г)°==1 и положив wj = g/i.

Необходимость условия (3.2-20) очевидна. Для доказательства его достаточности требуется показать, что оно удовлетворяет условию (3.2-8). Чтобы найти максимум, определяемый выражением (3.2-16), запишем необходимое условие экстремума:

д jvdl w,dsignvTd-vTd-w°lg

II w IV --= - (-



Следовательно,

Умножая обе части этого равенства на sign-функцию, получим

d = Tuiirdll llr (3.2-22)

1 т.. д ..w .

Из равенства (3.2-12) найдем частную производную

о /=1

(3.2-23)

Последняя формула получена с учетом равенства

т

WjiT-.) v,g,j{T - .) = g,j{T - .), (3.2-24)

которое следует из соотношения (3.2-10).

Используя формулу (3.2-22) для определения координат d, получим из Соотношения (3.2-23) следующее выражение:

г г

о /=1

даО (7 ) sign w] (Т - т)

(llw l,)

(=1, 2, т). (3.2-25)

С учетом равенства vd = 1 и формулы (3.2-20) выражение, стоящее в квадратных скобках, можно заменить на Uj{x), следовательно,

ft = I i g,j (Т - О tij (О dx (fe = 1, 2.....т). (3.2-26)

Это выражение совпадает с формулой (3.2-8), если ее записать относительно координат dh- Следовательно, выражение (3.2-20) действительно удовлетворяет условию (3.2-8).

Определим теперь управление u(t), минимизирующее время перехода. Аналогично тому как это было сделано в одномерном случае, используем ограничение (3.2-3) и неравенство



получаемое из неравенства (3.2-19). Минимальное время Г=7 существует тогда и только тогда, когда

>] или w ,>-. (3.2-28)

Если w , является непрерывной функцией Т, то минимальное время Г равно наименьшему значению Т, для которого

lw ,= i. (3.2-29)

В случае, когда д=со, & ЦшЦ, является разрывной функцией, применимы рассуждения, которые были проведены вслед за рассмотрением формулы (3.1-16).

Если неравенства (3.2-28) не выполняются ни для одного значения времени Т, то для заданного ограничения М задача не имеет решения. В противном случае из соотношений (3.2-29) и (3.2-20) следует, что координаты вектора оптимального управления (t) задаются равенствами

u){t) = M\w]{r> - t)-4\gniiiP{T -1) (У=1, 2, г).

(3.2-30)

3..3. ОПТИМ.ЛЬНОЕ УПР.г^ВЛЕНИЕ НЕАВТОНОМНЫМИ МНОГОМЕРНЫМИ ОБЪЕКТАМИ

Соотношения (3.2-30) определяют координаты вектора оптимального управления и (t) автономным объектом. При выводе этих соотношений свойство автономности не использовалось. Поэтому результаты можно легко распространить на неавтономный объект управления

x(0 = A(0x(0 + B(0u(0, у (О = С (Ох (О-

(3.3-1)

При заданном начальном условии х(о) решение (разд. 4.2 ч. V) имеет вид

у (О = С (О Ф {t, to) X (о) + J С it) Ф (t, т) В (т) U (т) dx, (3.3-2)

о

где Ф (i. fo)~ матрица перехода неавтономного объекта. Предполагается, что в заданный конечный момент времени Т выход у(Т) совпадает с предписанным вектором i. Для вектора разности

di-C{T)0{T,to)xito) (3.3-3)



из равенства (3.3-2) получим

т

d= J G(r, т)и(т)с?т, (3.3-4)

где выражение

G(A 0 = С(ОФ(, ОВ(т) (3.3-5)

является обобщением формулы (3.2-9) на нестационарный случай. Пользуясь рассуждениями разд. 3.2, найдем по аналогии с формулой (3.2-30) координаты вектора оптимального управления

и) (i) = w. {р, t) sign < (Т\ t) (у = 1, 2, ... , г). (3.3-6) Здесь да°.(Г°, О-координаты вектора

we(ro, 0 = v G(ro, О, (3.3-7)

где v -вектор, минимизирующий норму вектора w:

(3.3-8)

при условии, что vd = 1. Время V в формуле (3.3-6) равно наименьщему значению Т, удовлетворяющему неравенству

11,>Ж (3.3-9)

Заметим, что минимальное время перехода, для которого y(70) = i и

(3.3-10)

определяется разностью 7° - t.

3.4. ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ

Координаты вектора оптимального управления при достаточно общих предположениях определяются соотношениями (3.2-30) и (3.3-6). Однако для окончательного построения оптимального управления требуется решить задачу минимизации lwg, что, как правило, достаточно трудно.

Куликовский [И, 12] показал, что в отдельных случаях можно использовать приближенные решения этой задачи.

Для простоты рассмотрим случай скалярного управления и скалярной функции w{t) и ограничимся обсуждением автономных объектов. В этом случае

w (Jt) = уТСФ (О b = g (О, (3.4-1)



где вместо матрицы В общего вида стоит матрица-столбец b размерности /г X 1-Следовательно,

111,=

Положив

будем иметь II -гаР \\д = min

(3.4-2)

Щ

= mm

\\g {t) + lgdt)fdt

(3.4-3)

где минимум определяется при условии vd = 1. Полагая по определению d = [rfj, d? , получим

г)1= -[1-V] dj.

Отсюда и из выражения (3.4-3) следует, что

(3.4-4)

II -isfi \\д = min

= mm

mm

где

г

gl(.t)

Г

\>-iit)-

г

Mt) = -

i = 2

(3.4-5)

1.(0=. Mt)=-gdt), (/ = 2, 3, ...,m).

Итак, задача определения llwH состоит в отыскании наилучшего приближения известной функции p-i(t) линейной комбинацией известных функций p-tCt), i=2, 3, ..., т. Заметим, что при 9=2 эта задача сводится к нахождению минимума среднеквадратичного отклонения. В этом случае наиболее целесообразно использовать полиномы Лежандра, а для q=l - полиномы Чебышева.

В остальных случаях координаты оптимального вектора v определяют с помощью вычислительного устройства. Реализация на ЭВМ процесса оптимизации с использованием вспомога-



тельного вектора v проще трудоемких алгоритмов решения двухточечной (начальная и конечная точки) краевой задачи в методе принципа максимума.

3.5. ЧИСЛОВЫЕ ПРИМЕРЫ

Пример 1 [13]. Рассмотрим автономный объект управления, для которого матрицы в уравнениях состояния (3.2-1) имеют вид

О О

В

о

о

в качестве управляемых переменных примем выходные переменные этого интегратора. Решая систему однородных дифференциальных уравнений с вектором начальных условий х(0), которая получается из соотношения (3.2-1) при

и(0 = [0, 2(0, Из(0Г = 0. найдем матрицу перехода

1 t fl2

Ф(0-= О 1 t

0 0 1.

Решим задачу построения оптимального управления u(t), для которого время перехода объекта из начального состояния х(0) в конечное состояние x(T)=G принимает наименьшее возможное значение и, кроме того, выполнены ограничения (3.2-3). Из формулы (3.2-9) получим

0(0 = СФ(ов =

Допустим, что начальное состояние х(0)=[-1, О, 0] . Пользуясь соотношением (3.2-7), найдем вектор d=[l. О, 0].

Предположим, что полная энергия переменных управления ограничена (р = 2, q=2), т. е.

(IIU hf = J [ 1 2 (О F +1 Из (О Р|] dt<E= АР.

о

В этом случае решение поставленной задачи сводится к минимизации выражения

II W (О 112 =

J [W2(0P + W3(0FJ



Из соотношения (3.2-10) получим

wT(О = [0; щ1 + -Vi--V+ Щ Следовательно,

г

(IIW hf = j [ -vyt Р + I г.1 + -2 + Щ

Условие vd = 1 означает теперь, что у, = 1. Отсюда следует, что

г

w 2)2 = min f Ut + щУ + (I- -bvt + щУ

Проинтегрируем и найдем частные производные по и Уг- Приравняв их нулю, получим совместную систему уравнений, решения которой имеют вид

Можно показать, что эти соотношения являются не только необходимыми, но также и достаточными условиями минимума. Подставляя эти значения в исходную формулу, найдем, что

(lwk)2=r ( + i).

Отсюда и из условия (3.2-29) получим следующее уравнение:

1 1

(7-0)3

720 Т 12

Е

Если величина Е известна, то из этого уравнения можно найти значение Р. Зная получим, пользуясь соотношениями

(3.2-ЗР), координаты вектора оптимального управления

uW) = E{-It-vi), 0<t<To,

ul{t)=E(-t),

OKtKT .

Пример 2. Допустим, что в рассмотренном выше примере вместо энергии Е фигурирует средняя мощность Р. С учетом ограничений, наложенных на мощность, и равенства Е = РТ получим следующее соотношение для определения величины

(7-0)2 J

Р



1 ... 21 22 23 24 25 26 27 ... 42

© 2000-2025. Поддержка сайта: +7 495 7950139 добавочный 133270.
Заимствование текстов разрешено при условии цитирования.