![]() |
![]() |
![]() |
|
Главная страница » Электрика в театре » Свойства нелинейных систем 1 ... 21 22 23 24 25 26 27 ... 42 оптимальное управление ° it) = Um sign sIi-, (3.1-18) a время Г° с учетом равенства (3.1-16) определяется из условия J g-(ro-0cf-j. (3.1-19) Если на энергию управления (О наложено ограничение, задаваемое величиной Е, тогда равенство (3.1-7) выполняется при условии, что p=q=2; кроме того, из условия (3.1-2) получим, что M=YE. в этом случае, применяя равенство (3.1-17), найдем, что u4t) = E&signE\M\, (3.1-20) где в соответствии с выражением (3.1-16) Г° определяется из условия \ g4T-t)dt. (3.1-21) о Если ограничение наложено на среднюю мощность переменной управления uP{t), то получим также, что p = q = 2 и M = YРТ°. В этом случае иР (t) = pro . (3.1-22) а время Т° можно определить из соотношения g4T-t)dt= (3.1-23) Из формулы оптимального управления (3.1-17) видно, что переменная u(t) зависит от вида весовой функции g(To - t) сопряженной системы и от предписанного значения величины i. Эти результаты легко обобщить на случай ненулевых начальных условий. Во всех рассмотренных случаях параметры управляемого объекта не зависели от времени. Для неавтономных систем с нулевым начальным условием вместо формулы (3.1-17) имеет место выражение j,o() = sign , (3.1-24) go. t) где g{T°, О - весовая функция сопряженной системы, которая соответствует импульсной переходной функции g{t, Эта функция совпадает с выходной реакцией системы на входное возмущение b{t - Для неавтономных объектов (3.1-25) Уравнение (3.1-16) может выполняться для нескольких значений переменной Т, среди которых Р - наименьшее. 3.2. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ МНОГОМЕРНЫМИ ОБЪЕКТАМИ Рассмотрим задачу оптимального управления линейным объектом с г входами и т выходами. Допустим, что этот объект является автономным. В векторной форме уравнения управляемого объекта запишутся в виде x(0 = Ax(0 + Bu(0, у(0 = Сх(0. (3.2-1) Пусть известны начальное условие х(0) (например, jc (0) = 0) и желаемый (предписанный) выход i. Норму вектора управления в банаховом пространстве зададим в виде luL = lu IlpA Lo /=1 (3.2-2) Предположим также, что вектор допустимого управления ограничен, т. е. Iup<yw. (3.2-Я) Из этого условия при р-оо следует, что шах max Uj{f) < М, 0<i<T. (3.2-4) Для р=2 этому неравенству отвечает ограничение на энеогию управления в интервале [О, 7]. При р=1 это неравенство означает ограниченность интеграла, взятого в промежутке [О, Т] от суммы абсолютных значений управляющих переменных. Применительно к ракетным двигателям это соответствует общему потреблению топлива. Известно, что решение дифференциального уравнения (3.2-П задается в виде выражения X (О = Ф (О X (0) -f J Ф ( - ) Bu () dz. (3.2-5) Следовательно, у (О = С Ф (t) X (0) + I СФ( - О Ви (т) dx. (3.2-6) Найдем управление, минимизирующее норму (3.2-2), для которого вектор управляемых переменных совпадает в момент времени i=T с предписанным вектором i. Предполагается, что рассматриваемый объект управляем, т. е. найдется по крайней мере один управляющий вектор u(t), для которого y(T) = i. Рассмотрим вектор разности ао{ сф(г)х(0). Из равенства (3.2-6) получим, что где d= J 0(Г-х)и(т)Л, о о(0 = СФ(ов (3.2-7) (3.2-8) (3.2-9 (3.2-10) -матрица порядка тХг. Введем некоторый вспомогательный вектор ут wj. Кроме того, положим wT (О = vTQ (О или QT (О V = W (0. Применяя неравенство Гёльдера для скалярного произведения векторов-функций времени, получим с учетом соотношений (3.2-8) и (3.2-10), что г vTd= J wT(r-T)u(t)cfT< < J I (Г - .) u (t)\dx < К w 11,11 u 11, (3.2-11) где г r л V Т г (3.2-12) Согласно неравенству (3.2-11), Ivdl Ivdl iiwii9 llvgll, (3.2-13) Правая часть этого неравенства зависит от выбора вектора v. Из равенства (3.2-8) следует, что соотношение (3.2-11) выпол-ряется для любого вектора v. Следовательно, неравенства (3.1-11) и (3.2-13) должны иметь место для произвольного вектора V. Отсюда следует, что u,>max-jJi (3.2-14) (IIU Ipmin = max . (3.2-15) Исключим из рассмотрения все векторы, кроме тех, для которых vd = 1. Это возможно, так как u, не зависит от используемой формы записи (cv или v). В этом случае .17= T (3.2-16) Пусть v обозначает вектор v, для которого w минимальна при условии, что vTd = l. Пусть, кроме того, II w II, = min II w II, = II Gv II,. (3.2-17) (lluigminirrV- (3.2-18) Тогда из соотношения (3.2-15) получим равенство llwey. Это соотношение выполняется всякий раз, когда неравенство l==v Td<w ,uU (3.2-19) полученное из неравенства (3.2-11), обращается в равенство. Неравенство Гёльдера становится равенством тогда и только тогда, когда = djlgr signw.iT-t),Vt[0,T]. (У=1,2,...,г).(3.2-20) Полученная система равенств аналогична соотношению (3.1-13) в одномерном случае, которое можно получить, заменив в выражении (3.2-20) вектор v на скалярную величину г)°==1 и положив wj = g/i. Необходимость условия (3.2-20) очевидна. Для доказательства его достаточности требуется показать, что оно удовлетворяет условию (3.2-8). Чтобы найти максимум, определяемый выражением (3.2-16), запишем необходимое условие экстремума: д jvdl w,dsignvTd-vTd-w°lg II w IV --= - (- Следовательно, Умножая обе части этого равенства на sign-функцию, получим d = Tuiirdll llr (3.2-22) 1 т.. д ..w . Из равенства (3.2-12) найдем частную производную о /=1 (3.2-23) Последняя формула получена с учетом равенства т WjiT-.) v,g,j{T - .) = g,j{T - .), (3.2-24) которое следует из соотношения (3.2-10). Используя формулу (3.2-22) для определения координат d, получим из Соотношения (3.2-23) следующее выражение: г г о /=1 даО (7 ) sign w] (Т - т) (llw l,) (=1, 2, т). (3.2-25) С учетом равенства vd = 1 и формулы (3.2-20) выражение, стоящее в квадратных скобках, можно заменить на Uj{x), следовательно, ft = I i g,j (Т - О tij (О dx (fe = 1, 2.....т). (3.2-26) Это выражение совпадает с формулой (3.2-8), если ее записать относительно координат dh- Следовательно, выражение (3.2-20) действительно удовлетворяет условию (3.2-8). Определим теперь управление u(t), минимизирующее время перехода. Аналогично тому как это было сделано в одномерном случае, используем ограничение (3.2-3) и неравенство получаемое из неравенства (3.2-19). Минимальное время Г=7 существует тогда и только тогда, когда >] или w ,>-. (3.2-28) Если w , является непрерывной функцией Т, то минимальное время Г равно наименьшему значению Т, для которого lw ,= i. (3.2-29) В случае, когда д=со, & ЦшЦ, является разрывной функцией, применимы рассуждения, которые были проведены вслед за рассмотрением формулы (3.1-16). Если неравенства (3.2-28) не выполняются ни для одного значения времени Т, то для заданного ограничения М задача не имеет решения. В противном случае из соотношений (3.2-29) и (3.2-20) следует, что координаты вектора оптимального управления (t) задаются равенствами u){t) = M\w]{r> - t)-4\gniiiP{T -1) (У=1, 2, г). (3.2-30) 3..3. ОПТИМ.ЛЬНОЕ УПР.г^ВЛЕНИЕ НЕАВТОНОМНЫМИ МНОГОМЕРНЫМИ ОБЪЕКТАМИ Соотношения (3.2-30) определяют координаты вектора оптимального управления и (t) автономным объектом. При выводе этих соотношений свойство автономности не использовалось. Поэтому результаты можно легко распространить на неавтономный объект управления x(0 = A(0x(0 + B(0u(0, у (О = С (Ох (О- (3.3-1) При заданном начальном условии х(о) решение (разд. 4.2 ч. V) имеет вид у (О = С (О Ф {t, to) X (о) + J С it) Ф (t, т) В (т) U (т) dx, (3.3-2) о где Ф (i. fo)~ матрица перехода неавтономного объекта. Предполагается, что в заданный конечный момент времени Т выход у(Т) совпадает с предписанным вектором i. Для вектора разности di-C{T)0{T,to)xito) (3.3-3) из равенства (3.3-2) получим т d= J G(r, т)и(т)с?т, (3.3-4) где выражение G(A 0 = С(ОФ(, ОВ(т) (3.3-5) является обобщением формулы (3.2-9) на нестационарный случай. Пользуясь рассуждениями разд. 3.2, найдем по аналогии с формулой (3.2-30) координаты вектора оптимального управления и) (i) = w. {р, t) sign < (Т\ t) (у = 1, 2, ... , г). (3.3-6) Здесь да°.(Г°, О-координаты вектора we(ro, 0 = v G(ro, О, (3.3-7) где v -вектор, минимизирующий норму вектора w: (3.3-8) при условии, что vd = 1. Время V в формуле (3.3-6) равно наименьщему значению Т, удовлетворяющему неравенству 11,>Ж (3.3-9) Заметим, что минимальное время перехода, для которого y(70) = i и (3.3-10) определяется разностью 7° - t. 3.4. ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Координаты вектора оптимального управления при достаточно общих предположениях определяются соотношениями (3.2-30) и (3.3-6). Однако для окончательного построения оптимального управления требуется решить задачу минимизации lwg, что, как правило, достаточно трудно. Куликовский [И, 12] показал, что в отдельных случаях можно использовать приближенные решения этой задачи. Для простоты рассмотрим случай скалярного управления и скалярной функции w{t) и ограничимся обсуждением автономных объектов. В этом случае w (Jt) = уТСФ (О b = g (О, (3.4-1) где вместо матрицы В общего вида стоит матрица-столбец b размерности /г X 1-Следовательно, 111,= Положив будем иметь II -гаР \\д = min (3.4-2) Щ = mm \\g {t) + lgdt)fdt (3.4-3) где минимум определяется при условии vd = 1. Полагая по определению d = [rfj, d? , получим г)1= -[1-V] dj. Отсюда и из выражения (3.4-3) следует, что (3.4-4) II -isfi \\д = min = mm mm где
i = 2 (3.4-5) 1.(0=. Mt)=-gdt), (/ = 2, 3, ...,m). Итак, задача определения llwH состоит в отыскании наилучшего приближения известной функции p-i(t) линейной комбинацией известных функций p-tCt), i=2, 3, ..., т. Заметим, что при 9=2 эта задача сводится к нахождению минимума среднеквадратичного отклонения. В этом случае наиболее целесообразно использовать полиномы Лежандра, а для q=l - полиномы Чебышева. В остальных случаях координаты оптимального вектора v определяют с помощью вычислительного устройства. Реализация на ЭВМ процесса оптимизации с использованием вспомога- тельного вектора v проще трудоемких алгоритмов решения двухточечной (начальная и конечная точки) краевой задачи в методе принципа максимума. 3.5. ЧИСЛОВЫЕ ПРИМЕРЫ Пример 1 [13]. Рассмотрим автономный объект управления, для которого матрицы в уравнениях состояния (3.2-1) имеют вид О О В о о в качестве управляемых переменных примем выходные переменные этого интегратора. Решая систему однородных дифференциальных уравнений с вектором начальных условий х(0), которая получается из соотношения (3.2-1) при и(0 = [0, 2(0, Из(0Г = 0. найдем матрицу перехода 1 t fl2 Ф(0-= О 1 t 0 0 1. Решим задачу построения оптимального управления u(t), для которого время перехода объекта из начального состояния х(0) в конечное состояние x(T)=G принимает наименьшее возможное значение и, кроме того, выполнены ограничения (3.2-3). Из формулы (3.2-9) получим 0(0 = СФ(ов = Допустим, что начальное состояние х(0)=[-1, О, 0] . Пользуясь соотношением (3.2-7), найдем вектор d=[l. О, 0]. Предположим, что полная энергия переменных управления ограничена (р = 2, q=2), т. е. (IIU hf = J [ 1 2 (О F +1 Из (О Р|] dt<E= АР. о В этом случае решение поставленной задачи сводится к минимизации выражения II W (О 112 = J [W2(0P + W3(0FJ Из соотношения (3.2-10) получим wT(О = [0; щ1 + -Vi--V+ Щ Следовательно, г (IIW hf = j [ -vyt Р + I г.1 + -2 + Щ Условие vd = 1 означает теперь, что у, = 1. Отсюда следует, что г w 2)2 = min f Ut + щУ + (I- -bvt + щУ Проинтегрируем и найдем частные производные по и Уг- Приравняв их нулю, получим совместную систему уравнений, решения которой имеют вид Можно показать, что эти соотношения являются не только необходимыми, но также и достаточными условиями минимума. Подставляя эти значения в исходную формулу, найдем, что (lwk)2=r ( + i). Отсюда и из условия (3.2-29) получим следующее уравнение: 1 1 (7-0)3 720 Т 12 Е Если величина Е известна, то из этого уравнения можно найти значение Р. Зная получим, пользуясь соотношениями (3.2-ЗР), координаты вектора оптимального управления uW) = E{-It-vi), 0<t<To, ul{t)=E(-t), OKtKT . Пример 2. Допустим, что в рассмотренном выше примере вместо энергии Е фигурирует средняя мощность Р. С учетом ограничений, наложенных на мощность, и равенства Е = РТ получим следующее соотношение для определения величины (7-0)2 J Р 1 ... 21 22 23 24 25 26 27 ... 42 |
© 2000-2025. Поддержка сайта: +7 495 7950139 добавочный 133270.
Заимствование текстов разрешено при условии цитирования. |