Главная страница » Электрика в театре » Свойства нелинейных систем

1 ... 37 38 39 40 41 42

I,..., in) состояние ЦпТ; Uj(kT), х{ОТ)) =х(пТ) =0 является достижимым. Величина т = п- 1 может зависеть от х(0), а Uj(kT) обозначает у-ю координату вектора u(kT). Если каждое начальное состояние системы управляемо, то сама система называется полностью управляемой. Необходимое условие нормальности многомерного объекта (6.8-1) состоит в том, что каждый подобъект этого объекта является полностью управляемым. Необходимое и достаточное условие полной управляемости импульсного объекта (6.8-2) по скалярному управлению состоит в линейной независимости п векторов

bjin Ф~{Т)Ь,{Т), ф- +ЧГ)8ДП (6.8-3)

Рассмотрим /-е уравнение системы (6.8-2). После (т-1)-итераций это равенство приводится к виду

x(kT+ тТ) = Ф \Т)

X (кТ) + 2 (Т) bj (Т) Uj (кТ+ iT-T)

(6.8-4)

Итак, множество начальных состояний x(kT), из которых можно перейти в нулевое состояние за т шагов, представляется в виде линейной комбинации

т

X (кТ) = 2 Ф- (Т) 8, (Т), (6.8-5)

где коэффициенты а^-некоторые действительные числа. Подставляя это соотношение в равенство (6.8-4), получим

х{кТ + т.Т) = Ф ЧТ)

2 Ф~Чт{Т){а, + а,+1г)

1 = 1

(6.8-6)

Переходный процесс достигнет состояния х (кТтТ) = О тогда и только тогда, когда Uk+i-1 = - o-i.

Если векторы Ф~(Г)8у(Г) (/= 1, 2, ... , /г) независимы,

то они образуют базис в пространстве состояний. В этом случае из любого начального состояния можно достичь нулевого состояния за т шагов. Таким образом, достаточное условие управляемости доказано. Для доказательства необходимости этого условия предположим противное: будем считать, что объект полностью управляем, но линейно независимыми являются только г векторов Ф^СЪб^СТ )-При таком предположении только подпространство f* пространства является управляемым. Так как не совпадает целиком с пространством Е^, то рассматриваемый объект не может быть полностью управляемым. Таким образом, мы пришли к противоречию и, следовательно, доказали не только достаточное, но и необходим9е условие.



Если, например, векторы Ф-(Т)6](Т), i=l, 2, п линейно независимы, то, умножая их на матрицу Ф, снова придем к системе линейно независимых векторов с индексом i=0, 1, п-1.

С другой стороны, многомерный импульсный объект (6.8-1) полностью управляем тогда и только тогда, когда ранг гиперматрицы

Н = [Д (Г), Ф-1 {Т) Д {Т), ..., ф- +1 (Г) А (Т)] (6.8-7)

размером пХ пг равен п, или когда матрица Н содержит п независимых векторов-столбцов.

Необходимое условие нормальности состоит в том, что все матрицы

Uj = [bj(Т), ф-1 (Т)bj(Т),..., ф- +1 iT)bj(Т)] (6.8-8) имеют ранг п.

Перейдем теперь к получению условий наблюдаемости. Говорят, что начальное состояние х(07) является наблюдаемым, если его можно определить с помощью последовательности состояний у(Т), у(21), ..., у(тТ) управляемой переменной. Число т может зависеть от начального условия х(07).

При таком квантовании многомерный объект управления полностью наблюдаем, если п векторов-столбцов гиперматрицы

G = [Ст, [СФ (Г)]т, ..., [СФ -1 (Г)]Т] (6.8-9)

размером пХпд линейно независимы или если ранг этой матрицы равен п. Для доказательства рассмотрим какой-нибудь многомерный объект. Если его выход наблюдается в моменты времени ОТ, Т, ..., пТ- Т, то

(6.8-10)

Матрица порядка qnXn является невырожденной тогда и только тогда, когда ее ранг равен п, т. е. когда объект полностью наблюдаем. В этих случаях можно отбросить qn - п строк этой матрицы и рещить полученную систему уравнений относительно п искомых начальных условий Хг(07), /=1, 2, ..., п. Очевидно, что матрица коэффициентов в выражении (6.8-10) является транспонированной по отношению к матрице, с помощью которой выражается сформулированное условие. Необходимое и достаточное условие нормальности объекта управления состоит

ут -

С

-х,{ОТ)-

у (17)

Х2 т

у{пТ~Т)

СФ -1(Г)

.хЛОТ)



в том, чтобы каждый его подобъект был полностью управляем и наблюдаем. Пусть сТ есть i-я строка матрицы с. Тогда условие управляемости г-го подобъекта состоит в невырожденности матрицы

G, = [с (Г) с, ..., [Ф -1 {Т)]Ч,\ (6.8-11)

размером nYri. Рассмотрим кратко дуальность понятий наблюдаемости и управляемости. Дуальной к системе

X (ЙГ + Г) = Ф {Т) X (кТ) + Д (Г) U (кТ\ y{kT)Cx{kT)

является система

Z i-kT-T) - фт {-Т) Z i-kT) + cv (-/Г),

у'(-6Г) = АТ( Г)г(-/Г),

которая получается в результате обращения времени.

Объект полностью наблюдаем (управляем), если дуальный к нему объект является полностью управляемым (наблюдаемым) .

Для случая импульсных систем требуется, чтобы также в объекте отсутствовали скрытые колебания, т. е. чтобы интервал квантования не мог равняться или быть кратным полупериоду колебания: Т^кл/ш, где полюс р = со±]ш.

ЛИТЕРАТУРА

1. Kalman R. Е., Bertram J. Е. А Unified Approach to ihe Theory of Sampling Systems, /. Franklin Inst, 1959. 267, pp. 405-436.

2. Kalman R. E., Bertram J. E. Control Systems Analysis and Design via the Second Method of Liapunov: Discrete-Time Systems. J. Basic Eng., 1960, D-82, pp. 394-400.

3. Bertram J. E. The Concept of State in the Analysis of Discrete-Time Control System, Proc. Joint Automatic Conference, New York University, June 1962, Paper № 11-1.

4. Chidambara M. R., Wells C. H. State Variable Determination for Digital Control, IEEE Trans. Autom. Control, 1966. AC-11, p. 326.

5. Джури E. И. Цыпкин Я. 3. Теория дискретных автоматических систем (обзор). Автоматика и телемеханика, 1970, 31, № 6.

6. KuCera V. The Structure and Properties of Time-Optimal Discrete Linear Control. IEEE Trans. Autom. Control, 1971, AC-16, pp. 375-377.

7. общность методов оптимального управления

с некоторыми понятиями теоретической

механики

Для обоснования возможностей применения вариационного исчисления, принципа Понтрягина и методов динамического про-



граммирования рассмотрим сходство этих методов с классическими методами теоретической механики.

7.1. ОСНОВНЫЕ ПОНЯТИЯ И АН.А.ЛОГИИ

Рассмотрим вначале консервативные системы [45*, 63*, 69*. 104*, 130*, 145*].

Обобщенные координаты. Первоначально в теоретической механике, а впоследствии в теории электричества и электромеханике обобщенные векторы Лагранжа q = [qi, <?2. ., QnV и их производные по времени - обобщенные векторы скорости q = [9j, 2, .. ., qn] -были применены для описания динамики системы. Координаты qi (f=l, 2, ..., п) вектора q называются обобщенными координатами, а координаты qt (f=l, 2, ..., п) вектора q - обобщенными скоростями. С помощью обобщенных координат можно описать, например, перемещение при поступательном движении (производная от перемещения есть скорость), угловое смещение при вращении (в этом случае производная совпадает с угловой скоростью), заряд в электрической цепи (производная от заряда есть ток) или полный поток индукции (производная определяет напряжение). Обобщенные координаты можно определить также и для других систем, однако в более сложных случаях придется использовать несколько различных наборов таких координат. Например, для описания движения в трехмерном пространстве потребуется использовать три обобщенные координаты и соответственно три скорости. Описание электромеханических систем включает обобщенные координаты и скорости, которые содержат две группы переменных для механических и электрических величин.

Функция Лагранжа. Функцией Лагранжа L(q, q) называется разность между кинетической 7(q, q) и потенциальной (q) энергиями системы

I(q, q)r(q, q)-t/(q). (7.1-1)

Потенциальная энергия U(q) зависит только от обобщенных координат, тогда как кинетическая энергия T{q, q) может зависеть от обобщенных координат и обобщенных скоростей (например, для центробежного регулятора, рассмотренного в примере 3, разд. 1.2, ч. II и примере 2, разд. 1.5, ч. II), однако в простейших системах эта энергия зависит только от обобщенных скоростей.

Обобщенные импульсы и силы. Частная производная кинетической энергии Т по вектору скорости q называется обобщенным импульсом:

p(q.q)4, (7.1-2)



который можно также записать через функцию Лагранжа (7.1-1):

P(q,q)-. (7.1-3).

Производная потенциальной энергии U по обобщенному вектору q называется обобщенной силой:

f(q). (7.1-4)

Если кинетическая энергия не зависит от q, т. е. Г = r(q), то вектор силы можно также определить с помощью функции Лагранжа

* (Ч) = - 41 (q, q) = (q) - (q). (7.1-5)

Следует отметить, что обобщенная сила f является результирующей всех сил, действующих внутри системы. Другие силы (внешние силы и силы трения) рассмотрены ниже.

Нахождение функции Лагранжа. Пусть импульс и потенциальная энергия известны. При этом, как правило, возникает задача нахождения функции Лагранжа. Кинетическая и потенциальная энергии соответственно равны

Т{% q)4l%(q, qv)qv= f 2 ft(q, чМч.ь (7.1-6)

о о 1 = 1

и (q) 4 J (qv) qv = / 2 Л (qv) dq (7.1-7)

о о ё = 1

(в этих равенствах переменные интегрирования отмечены индексами V и у). Численные значения этих интегралов не зависят от пути интегрирования от нулевой точки до точек q или q в соответствующей системе координат. Путь интегрирования удобно выбрать так, чтобы его последовательные отрезки были параллельны координатным осям. Это возможно, так как обе функции Т а и являются функциями состояния, а согласно основному свойству функций состояния, их значения не зависят от способа вычислений, т. е. от пути интегрирования. Последнее утверждение, однако, справедливо только в том случае, когда

dPi (q. q) dpj (q, q) (71-8)

dqj dqi

И

dfi (q) dfj(q) .



т. е. когда якобианы dp/dq и dijdq симметричны. Приведенные выше соотношения можно также использовать для проверки правильности выбора импульса и силы. Отметим, что эти соотношения определяют только необходимые, но не достаточные условия определения векторов р и f.

7.2. УРАВНЕНИЕ ЛАГРАНЖА

Рассмотрим теперь эвристический вывод уравнения Лагранжа и некоторые вопросы, связанные с областью применимости этого уравнения. Это уравнение представляет собой систему п дифференциальных уравнений второго порядка, описывающих динамику системы через обобщенные координаты Qi и обобщенные скорости Qi. Для иллюстрации начнем с того, что рассмотрим систему п точек с постоянными массами М{. Допустим для простоты, что каждая частица движется вдоль какой-нибудь координатной реи и что оси взаимно ортогональны. По закону Ньютона

-§tPi = i ( = 1 2, ), (7.2-1)

где PiMiXi-количество движения /-й частицы, F-результирующая всех действующих на частицу сил. Систему уравнений (7.2-1) можно записать в векторной форме

p(x) = F, (7.2-2)

где F-вектор силы, р(х) = Мх-вектор количества движения, а матрица М = diag [М-, М2, . ., ЛГ ]. Пусть эту же систему требуется описать в координатной системе д^, д^, Если

новые координаты не зависят от производных старых координат, то формулы перехода можно задать некоторым (обычно нелинейным) соотношением

x = x(q). (7.2-3)

Производная вектора в старой системе координат

= --(4,4) (7-2-4)

зависит от координат этого вектора в новой системе и от вектора скорости.

Кинетическая энергия системы равна

п



где М = diag [TWi, yWg,..., М„]. Из выражений (7.2-4) и (7.2-5) следует, что кинетическая энергия Т=Т{ц, q). Используя равенство

(7.2-6)

найдем производную кинетической энергии относительно вектора q:

t?7(x(q. q)) dq

дк dT

P(X). (7.2-7)

Последнее равенство в выражении (7.2-7) получено заменой порядка дифференцирования. Аналогично

dT{k{q. q)) di dT

dq dx dq

rPW = -aP(x). (7.2-8)

При выводе этой формулы мы воспользовались равенством

Найдем теперь производную по времени от выражения (7.2-8):

dTJxjq. q)) dq

d дх

[dt dq \

Согласно формуле (7.2-7), первый член в правой части выражения (7.2-10) равен дТ/дц. Опуская обозначения сложной функции и преобразовывая выражение (7.2-10) с учетом равенств (7.2-7) и (7.2-2), получим

dT{q, q) dq

дТ{ц. q) x

Введем вектор обобщенной силы Q:

тогда уравнение Лагранжа запишется в виде

dT{q, q) о

или

d dt

dT{q. q) dq

(7.2-11)

(7.2-12)

(7.2-13) (7.2-14)



Полученная система, как уже упоминалось выше, действительно состоит из п дифференциальных уравнений второго порядка, которые могут быть нелинейными.

Разложение силы на составляющие. При выводе уравнения Лагранжа предполагалось, что рассматривается свободная консервативная система. Учтем теперь, кроме того, потери и демп- фирование. Обобщенные силы Qi обычно представляются следующей комбинацией трех составляющих:

Qi = -fi-dt + k:, (7.2-15)

где /г-внутренние силы, J-силы демпфирования, внешние силы, а в векторной форме

Q = - f - d + к. (7.2-16)

Выше показано, что внутренние силы можно определить равенством (7.1-4). Согласно этому определению, сила i действует на частицы, потенциальная энергия которых отлична от нуля. Поэтому эта сила появляется со знаком минус в разложении силы Q.

При наличии только вязкого трения силы демпфирования описываются выражением

di==biqi (/=1, 2,..., п). (7.2-17)

Вводя диссипативную функцию Рэлея, получим

(Ч) = i 2 = Т (7.2-18)

где В = diag [b, Ь^ ..., й„]. В этом случае силы демпфирования можно записать в виде

d = -. (7.2-19)

Силы демпфирования препятствуют движению, поэтому в разложении силы Q по формуле (7.2-16) перед вектором d поставлен знак минус. Компонента ki вектора внешних сил считается положительной, если ее направление способствует возрастанию координаты Qi. Используя формулы (7.1-4) и (7.2-19) и перенося члены из одной части равенства в другую, запишем уравнение Лагранжа в следующем виде:

d dt

дТЫ. q)

дТЫ. q) ,dUW dD(s) (



или более подробно

дТ{д. q)

.nq.q)+ , (/=1,2,...,

(7.2-21)

Вводя функцию состояния (7.1-1), получим следующую запись векторного уравнения Лагранжа:

или

dL (q, ф

dLjq. ip

dLjq, q) dD{k) q da

dD{q)

= k,

(7.2-22)

ki (/=1, 2, .... ft).

(7.2-23)

Уравнения состояния Гамильтона. Если система консервативна или, другими словами, свободна от потерь и на нее не действуют никакие внещние силы, то уравнение Лагранжа (7.2-22) упрощается и принимает вид

d dt

dL (q. q)

dL (q. q)

(7.2-24)

Это соотношение можно привести к другому виду, если использовать функцию Гамильтона Н{ц, р) от обобщенного вектора q и вектора количества движения р. По определению

И{4, p)4pTq(q, p)-i:(q, q(q, р)).

Найдем полный дифференциал от этой функции:

Я(ч, p)=-q + # =

= рТ dti -Ь qT dp - Jq - dq.

(7.2-25)

(7.2-26)

Подставляя формулу (7.1-3) в уравнение (7.2-24), придем к равенству

. dq

(7.2-27)

Кроме того, используя выражение (7.1-3), найдем, что первый и четвертый члены в правой части равенства (7.2-26) взаимно уничтожаются. Сравнивая коэффициенты при оставшихся членах в равенстве (7.2-26), получим с учетом формулы (7.2-27)



канонические уравнения Гамильтона

dg дИ (q, р) dt dp

dp dNip. q) (7.2-28)

dt dq

Из этих уравнений следует, что

dfi JH j>dp dt - aqT dt+- dt

Таким образом, в консервативной системе во время движения функция Гамильтона сохраняет постоянное значение.

Дадим физическую интерпретацию гамильтониану. Для этого рассмотрим его первый член. Используя формулу (7.1-2), находим

Pq = q, (7.2-30)

а используя выражения (7.2-5) и (7.2-4), получим

ThMl-n (7-2-31)

и, следовательно,

т tfxT(q) rfx(q) 2 24

aqT - Ч dq qT (7.2 32)

Последнее равенство получено с учетом того, что матрица квадратичной формы (7.2-31) (произведение трех матриц) симметрична. Из равенств (7.2-30) и (7.2-32) имеем

pTq = 2r.

Таким образом, используя определение гамильтониана [выражение (7.2-25)] и определение функции Лагранжа [выражение (7.1-1)], получим

И{ц, p) = 2T~{T-U)=T + и. (7.2-33)

Отсюда видно, что гамильтониан представляет собой общую энергию консервативной системы, которая равна сумме кинетической и потенциальной энергий.

Принцип Гамильтона. Отметим, что, согласно уравнению Лагранжа (7.2-24), функция Лагранжа L(q, q) удовлетворяет дифференциальному уравнению Эйлера - Лагранжа, которое дает необходимое условие экстремума функционала

/ = 11 (q, q) di = / [Т (q, q) - t/ (q)] dt. (7.2-34)



1 ... 37 38 39 40 41 42

© 2000-2024. Поддержка сайта: +7 495 7950139 добавочный 133270.
Заимствование текстов разрешено при условии цитирования.