·

Engenharia Mecatrônica ·

Controle e Servomecanismos

Send your question to AI and receive an answer instantly

Ask Question

Preview text

1 Número 02 Fevereiro 2011 Notas de Aula de Controles e Servomecanismos Volume 2 Ana Pavani 2 APRESENTAÇÃO Estas notas de aula têm o objetivo de complementar o material apresentado nos livros de referência da disciplina ENG 1417 Controles e Servomecanismos bem como de servir de guia à ordem na qual os tópicos serão ministrados Elas cobrem assuntos referentes às técnicas clássicas de controle e também aqueles referentes ao controle moderno Considerando que cada vez mais há implementação de controle através de circuitos digitais é apresentada a parte referente a sistemas a tempo discreto As notas são apresentadas em quatro volumes para que os arquivos não excedam 15 MB Há um volume anexo contendo três artigos sobre assuntos complementares que foram desenvolvidos pelos alunos da turma citada no último parágrafo Foram dedicados e criteriosos revisores destas notas os alunos de graduação Bernard Pereira de Oliveira Engenharia Elétrica e Eduardo Oest Moreira Engenharia de Controle e Automação estagiários do LAMBDA Laboratório de Automação de Museus Bibliotecas Digitais e Arquivos do Departamento de Engenharia Elétrica que trabalham no projeto dos Livros Interativos de Engenharia Elétrica Uma grande contribuição às notas foi dada pela turma de ENG1417 Controles e Servomecanismos em 20141 Os alunos críticos e contributivos deram sugestões e resolveram vários exemplos no MATLAB A turma era composta por Alexandre Sheng Hsien Su Bruna dos Guaranys Martins Camila Schuina Neves Carlos Adalberto Samayoa Frederico Kos Botelho Isabela Cunha Maia Nobre Marcelo Maceira de Almeida Neves Roberto Bandeira de Mello M da Silva e Stella Salim Gouvea Roberto Bandeira de Mello M da Silva monitor da disciplina em 20142 resolveu os exemplos do Critério de Nyquist utilizando o MATLAB 3 SUMÁRIO Volume 1 01 Introdução Controles e Servomecanismos 02 Os sistemas lineares e os modelos por variáveis de estado 03 Sistemas compostos 04 Propriedades dos sistemas Volume 2 05 Controlabilidade 06 Observabilidade 07 Estabilidade Volume 3 08 Raízes de polinômios 09 Método de Nyquist 10 Método do Lugar das Raízes Volume 4 11 Realimentação de estado aplicada ao problema do controle modal 12 Observador de Luenberger 13 Especificações no domínio do tempo técnicas clássicas 14 Especificações no domínio da freqüência técnicas clássicas 15 Controle PID Volume de Anexos 16 Obtenção de equações dinâmicas em formas canônicas a partir da função de transferência 17 Método do Lugar das Raízes para dois parâmetros variáveis 18 Rastreamento de uma referência 4 Capítulo 5 CONTROLABILIDADE DO VETOR DE ESTADO I Objetivo O objetivo deste capítulo é apresentar a propriedade da controlabilidade que diz respeito à maneira como as variáveis internas estado do sistema respondem aos estímulos aplicados através da entrada Esta propriedade está vinculada à estrutura de entrada do sistema ie à parte do sistema que é responsável pela transmissão de informação da entrada para as variáveis internas Diferentes autores utilizam diferentes definições para sistemas que exibem a propriedade sobre todos os modos de seu vetor de estado sobre alguns deles ou nenhum deles As possíveis classificações Controlável Não Controlável Completamente Controlável Parcialmente Controlável Não Controlável Completamente Controlável Controlável Não Controlável Comparando as três classificações concluise que os primeiros elementos de cada umas delas são equivalentes O último da primeira e os dois últimos da segunda e da terceira também o são A próxima seção trata de uma definição de controlabilidade e como a mesma se relaciona com as classificações mencionadas II Definições de Controlabilidade As definições de controlabilidade apresentadas a seguir são bastante conhecidas Alguns autores as chamam de controlabilidade completa A primeira delas é a definição que se aplica aos sistemas a tempo contínuo lineares e invariantes no tempo A segunda é a que se aplica aos sistemas a tempo discreto lineares e invariantes no tempo Para que as definições possam ser introduzidas repetemse as equações dinâmicas para as duas classes de sistemas anteriormente mencionadas A equação dinâmica que modela o sistema linear invariante no tempo causal multivariável e a tempo contínuo foi determinada no segundo capítulo e é x0 B ut x0 xt A dt dxt 1a D ut C xt yt 1b Definição 1 Controlabilidade do Vetor Estado de um Sistema Linear Invariante no Tempo e a Tempo Contínuo O vetor de estado xt do sistema modelado pela equação dinâmica 1ab é dito controlável em t t0 se existir uma função contínua por partes ut que seja capaz de transferir o estado inicial 0 x t0 x para qualquer estado final arbitrário xf x tf no tempo t tf Se todos os estados x t0 forem controláveis em um intervalo de tempo finito 0 t t 0 f o sistema é classificado como completamente controlável para seus estados A definição 1 é de acordo com 01 5 Considerese a equação dinâmica que modela o sistema linear invariante no tempo causal multivariável e a tempo discreto que foi determinada no segundo capítulo e é x0 B uk x0 A xk 1 xk 2a D uk C xk yk 2b Definição 2 Controlabilidade do Vetor Estado de um Sistema Linear Invariante no Tempo e a Tempo Discreto O sistema de ordem n representado pela equação 2ab é dito completamente controlável se para x0 x0 e qualquer vetor arbitrário f x existir um índice N finito e uma seqüência de entradas u0 u1 1 uN tal que se esta seqüência for aplicada ao sistema então xf xN A definição 2 é de acordo com 02 Qualquer uma das definições apresentadas impõe somente que o estado desejado seja atingido em tempo finito não havendo restrição no tamanho do intervalo no qual se dá a transição do estado inicial para o estado final Existem outras definições de controlabilidade que consideram esta duração 03 No estudo de Controles e Servomecanismos considerarseão somente as definições para as quais a duração do intervalo de tempo desde que finita é irrelevante As definições conceituam os sistemas lineares e invariantes que são controláveis Do ponto de vista prático porém as mesmas são de pouca utilidade Observese que não é possível determinar a partir delas se um sistema é controlável pois seria necessário que todos os pares 0 xf x fossem testados com o intuito de determinar se existe uma excitação capaz de realizar a transição É interesse do engenheiro a utilização de métodos que permitam determinar as propriedades dos sistemas de uma maneira sistemática e passível de ser algoritmizada Por esta razão procurase estabelecer uma expressão matemática para o conceito de controlabilidade Com a finalidade de a mesma ser o mais prática possível ela deve ser estabelecida em função dos parâmetros do modelo do sistema Esta determinação acontece nas próximas seções Antes de passar às próximas seções porém são apresentados dois exemplos Exemplo 1 Seja um sistema linear invariante no tempo e a tempo discreto modelado pela equação a diferenças finitas a seguir 10 uk x0 0 1 xk 0 05 1 1 xk 1 0 xk 1 1 yk Foi escolhida uma condição inicial qualquer sem qualquer critério O mesmo será feito com o estado final a ser atingido escolhido como o vetor 50 100 xk f Como ainda não foi determinado um método analítico e o sistema é a tempo discreto podese utilizar o método numérico para obter a solução Não é conhecida a seqüência de amostras da variável de 6 entrada e nem quantas amostras serão necessárias ou seja não se sabe qual é o valor de f k para fazer a transição do estado inicial ao estado final Passase à solução numérica u0 1 0 5 10 u0 1 0 10 0 05 1 1 x1 0 Suponhase inicialmente que se deseja atingir o valor escolhido para estado final em kf 1 Assim igualase a expressão anterior ao estado final desejado 50 100 u0 1 0 5 x1 10 55 90 u0 1 0 Só há uma variável a determinar e são duas as condições uma para cada componente do vetor de estado no instante final Assim em uma etapa não é possível fazer a transição Passase então à segunda etapa A passagem à segunda etapa é a introdução de mais um grau de liberdade na solução pois há mais uma variável a determinar u1 1 0 u0 1 0 5 10 05 1 1 0 u1 1 x1 0 05 1 1 x2 0 50 100 u1 1 0 u0 05 1 125 x2 5 A expressão anterior tem duas variáveis a determinar para que o estado final iguale o valor desejado logo pode ser explicitada 625 95 u1 1 0 u0 05 1 Resolvendose a equação se obtém 95 u0 e 110 u1 Assim foi possível determinar a seqüência de duas amostras da variável de entrada que permitem a transição do estado original para o final Exemplo 2 Seja um sistema linear invariante no tempo e a tempo discreto modelado pela equação a diferenças finitas a seguir 10 0 uk x0 1 xk 2 05 0 0 xk 1 05 k 1 1 x yk Observese a título de curiosidade que esta equação está na forma em que a matriz de estado é diagonal Tem porém a característica de ter os dois autovalores iguais Suponhase que o estado final desejado é o mesmo do exemplo 1 50 100 xk f Como no caso anterior recorrese à solução por recorrência 7 u0 1 2 5 0 u0 1 2 10 0 05 0 0 x1 05 Suponhase como no exemplo anterior que se deseja atingir o valor escolhido para estado final em kf 1 Assim igualase a expressão anterior ao estado final desejado 50 100 u0 1 2 5 x1 0 55 100 u0 1 2 Também como no exemplo anterior só há uma variável a determinar e são duas as condições uma para cada componente do vetor de estado no instante final Assim em uma etapa não é possível fazer a transição Passase então à segunda etapa u1 1 2 u0 1 2 5 0 05 0 0 05 u1 1 x1 2 05 0 0 x2 05 50 100 u1 1 2 u0 05 1 25 x2 0 A expressão anterior tem duas variáveis a determinar para que o estado final iguale o valor desejado logo pode ser explicitada 525 100 u1 1 2 u0 05 1 Resolvendose a equação se obtém u0 2 u1 100 e 525 05 u0 u1 Multiplicase a segunda expressão por dois e se obtém 105 u0 2 u1 Assim percebese que há duas relações iguais entre as amostras da entrada mas igualadas a valores numéricos distintos Assim não há solução possível não é possível fazer a transferência de um estado para o outro Isto acontece porque as equações que compõem a equação de estado têm as partes recursivas iguais e há somente uma entrada Observese que estes dois problemas levaram a resultados distintos III Expressão Matemática da Controlabilidade para Sistemas Lineares Invariantes no Tempo e a Tempo Discreto O propósito desta seção é estabelecer uma expressão matemática para determinar a controlabilidade de um sistema linear invariante no tempo e a tempo discreto cujo modelo matemático é a equação dinâmica 2ab Esta equação tem por estado inicial x0 x0 e supõese que o estado final a ser atingido é f f x x k Seja o instante final designado por kf N A equação de estado 2a é resolvida por recorrência a partir de k 0 e até k N B u0 A x B u0 A x0 x1 0 8 A B u0 B u1 x A B u1 B u0 A A x B u1 A x1 x2 0 2 0 3 B u2 A B u1 A B u0 x A B u2 A B u0 B u1 A A x B u2 A x2 x3 2 0 3 0 2 1 B uN 2 A B uN B u2 A B u1 A B u0 A x A xN N 3 N 2 N 1 N 0 Suponhase que é na última expressão que se deseja atingir o vetor de estado especificado Logo igualase a última expressão a ele f N 3 N 2 N 1 0 N x 1 B uN 2 A B uN B u2 A B u1 A B u0 A x A xN 4 A expressão 4 pode ser reescrita 1 B uN 2 A B uN B u2 A B u1 A B u0 A v x A x N 3 N 2 N 1 2 0 N f 5 Na expressão 5 o vetor 2 v é conhecido e as parcelas da soma que está no lado direito da expressão não o são pois cada uma contém uma amostra desconhecida da entrada que é a variável que se deseja determinar Explicitese a equação a resolver 1 B uN 2 A B uN B u2 A B u1 A B u0 A v N 3 N 2 N 1 2 6 A definição de 2 v permite uma interpretação interessante Ele representa a diferença que existe entre o valor desejado f x e o valor que teria caso a entrada não fosse aplicada N x0 A Este último vetor é a solução homogênea do vetor de estado para a dada condição inicial Examinese o lado direito de 6 para constatar que ainda que as parcelas sejam não determinadas em cada uma delas existem fatores conhecidos parâmetros do sistema Separemse as partes conhecidas das não conhecidas ao se escrever a expressão sob forma matricial 2 2 N 2 N 1 2 u U 1 N u 2 N u 1 u 0 u B A B B A B A v 7 A matriz U2 e o vetor 2 u escritos por blocos ladoalado no caso da matriz e empilhados no caso do vetor A partir de 7 é possível formalizar as definições da matriz e do vetor pN n N 2 N 1 2 x B A B B A B A U R R 8 9 pN 2 1 N u 2 N u 1 u 0 u u R 9 Com as definições feitas foi possível separar elementos conhecidos dos desconhecidos A matriz U2 tem todos os seus elementos conhecidos já que é composta dos parâmetros do sistema enquanto o vetor 2 u tem todos os seus elementos desconhecidos pois é formado pela seqüência de amostras do vetor de entrada que deve ser determinado Sumarizamse os resultados em 2 2 2 U u v 10 O propósito da solução do problema de controle em consideração é determinar a sequência de controles uk que permita transferir o estado inicial x0 para o estado final f x Assim a incógnita do problema é o vetor 2 u Observese porém que N seja um número a ser arbitrado é conveniente que se estabeleçam condições para ele Para tal recorrese a um resultado da Álgebra Linear que requer duas definições preliminares Utilizamse as matrizes de entrada e de estado nas definições Definamse as matrizes pn n n 2 n 1 1 x B A B B A B A M R R 11a pN n N 2 N 1 2 x B A B B A B A M R R 11b Cabe observar que nas duas matrizes 11ab o número de linhas é n dimensão do vetor de estado e conseqüentemente do espaço de estado Da Álgebra Linear buscase o Lema 1 Lema 1 Para qualquer N n o posto de 11b é igual ao posto de 11a A prova do Lema 1 está nos livros de Álgebra Linear Utilizando o resultado do Lema 1 percebese que a recorrência pode ser levada até o passo 1 n k no qual se obtém a relação 1 1 1 U u v 12 Em 12 os vetores e matriz são 0 n f 1 x A x v 13 pn n n 2 n 1 1 x B A B B A B A U R R 14 10 pn 1 1 n u 2 n u 1 u 0 u u R 15 E a condição para a transferência de estados poder ser realizada independentemente de quais sejam x0 e f x é que o posto de 1 U seja máximo ie seja n Com isto fica garantido que o sistema de equações representado por 13 tenha n linhas linearmente independentes para garantir a solução Isto porque 1 v é um vetor de dimensão n e para que o estado seja controlável é necessário que ele seja levado ao ponto f x desejado logo que as n componentes sejam iguais às especificadas Por esta razão são necessárias n equações linearmente independentes Como a matriz 1 U não está na forma mais comum de escrever uma matriz de produtos definese a matriz U que é chamada de Matriz de Controlabilidade do modelo e sobre a qual recai a condição que determina se o sistema é controlável Definição 3 Matriz de Controlabilidade do Sistema Linear Invariante no Tempo e a Tempo Discreto A matriz de controlabilidade de um sistema linear invariante no tempo e a tempo discreto é pn n n 2 n 2 x B A B A A B B U R R 16 Teorema 1 Condição de Controlabilidade do Sistema Linear Invariante no Tempo e a Tempo Discreto A condição de controlabilidade de um sistema linear invariante no tempo e a tempo discreto 2ab é que a sua matriz de controlabilidade 16 tenha posto n ou seja U n 17 A prova deste teorema é deixada como exercício aos alunos IV Expressão Matemática da Controlabilidade para Sistemas Lineares Invariantes no Tempo e a Tempo Contínuo O entendimento da controlabilidade no caso dos sistemas lineares invariantes no tempo e a tempo discreto é bastante intuitivo como visto na seção anterior Para o casos dos sistemas a tempo contínuo a matriz e a condição de controlabilidade são as mesmas mas a demonstração é bastante diferente 11 Teorema 2 Condição de Controlabilidade do Sistema Linear Invariante no Tempo e a Tempo Contínuo A condição de controlabilidade de um sistema linear invariante no tempo e a tempo contínuo 1ab é que a sua matriz de controlabilidade pn n n 1 n 2 x B A B A A B B U R R 16 tenha posto n ou seja U n 17 Prova do teorema 2 A equação de estado 1a do sistema linear invariante no tempo e a tempo contínuo foi determinada no capítulo 2 Para o caso multivariável ela é dada pela expressão B u d e x e B u d t t x t x t 0 At 0 At t 0 0 18 Em 18 x0 é o estado inicial e ut é o vetor de entrada Seja f x o estado final desejado a ser atingido em um tempo final que será chamado de f t Para que a passagem de um estado ao outro se realize no tempo final aplicase a função de controle ft 0 ut t A expressão 18 é então adequada para o tempo final específico B ut dt e x e t B ut dt t x t x f t 0 t Atf t 0 Atf f t 0 f 0 f f 19 É somente através de 19 que se pode processar a transição de estados Esta expressão possui dois termos que são conhecidos e um que não é Na próxima expressão serão agrupados do lado esquerdo da equação os dois termos conhecidos ficando do lado direito somente aquele que não se conhece é a mesma lógica que foi usada no caso do tempo discreto B ut dt e x t x f t 0 t Atf 0 f f 20 Definase o vetor v pela diferença entre os dois vetores que se encontram no lado esquerdo da equação 20 Como ambos são conhecidos e constantes este o será B ut dt e x t x v f t 0 t Atf 0 f f 21 Esta última expressão 24 torna claro que o propósito da determinação de ft 0 ut t é poder gerar neste intervalo de tempo finito o vetor v dado pela diferença entre o ponto final desejado f x e aquele no qual estaria caso não fosse aplicada a entrada 0 f x t Ressaltase que este último é a solução homogênea para o vetor de condições iniciais em consideração Suponhase que a condição de posto da 17 matriz de controlabilidade U do enunciado do teorema não seja verdadeira e substituase a exponencial de matriz do integrando de 21 por sua expressão em Série Maclaurin A equação 21 se modifica para 12 B ut dt t tf A 3 1 t tf A 2 1 t A t I v f t 0 3 3 2 2 f 22 B ut dt t tf A 3 1 B ut dt t tf A 2 1 t B ut dt A t I B ut dt v f t 0 3 3 f t 0 2 2 f t 0 f f t 0 23 ut dt t f t 3 1 A B ut dt t f t 2 1 A B t ut dt t AB IB ut dt v ft 0 3 3 ft 0 2 2 ft 0 f ft 0 24 A partir da expressão 24 constatase que v é dado por uma combinação linear das colunas das matrizes B AB A2B A3B Isto ocorre porque após a determinação de cada uma das integrais as funções do tempo se tornam vetores de números reais e constantes Pela suposição que foi feita de que a matriz U não possui posto n então ainda que se considerassem as infinitas matrizes 0 ArB r pelo Lema 1 não haveria vetores linearmente independentes para compor a base e expressar o vetor v Assim existirá sempre um vetor v linearmente independente das matrizes e que portanto não poderá ser expresso por 24 não podendo pois ser atingido Como v não pode ser determinado a transição do estado inicial para o estado final não se dá e o sistema não é controlável Considerese agora que o posto da matriz U é n Neste caso mostrase que o sistema é controlável Inicialmente definase a matriz K dt B B e e K ATt T ft 0 At 25 Provase que a matriz de 25 é não singular para qualquer 0 tf através dos passos que seguem Suponhase que é um vetor tal que 0 K 26 Podese então escrever 0 TK 27 Substituindose 25 em 27 0 dt B B e f t 0 e K ATt T At T T 28 Definase o vetor ATt BTe 29 Substituase 29 em 28 0 dt K f t 0 T T 30 Ao examinarse 30 percebese que o integrando é uma forma quadrática logo é sempre não negativo Para que o integrando seja nulo é necessário que seja a origem Logo 33 implica em 13 t t 0 t B e f 0 At T T 31 t t 0 t B t tf A 3 1 t tf A 2 1 t A t I f 0 3 3 2 2 f T T 32 De 32 podem ser extraídas as expressões 0 TB 0 T AB 33 0 B A 1 n T A partir de 33 concluise que é ortogonal a todos os vetores de U Como por suposição o posto de U é completo ie é n então só pode ser o vetor nulo visto que há em U n vetores linearmente independentes Pelo Lema Fundamental da álgebra linear a matriz K é não singular Isto porque para 30 ser verdadeiro é necessário que seja o vetor nulo para qualquer tempo implica em que K seja não singular Suponhase que se deseja estabelecer uma expressão para t0 t f ut t A expressão sugerida é v e K B e ut Atf 1 ATt T 34 Substituindo 34 em 32 se obtém v dt e K B B e e v Atf 1 ATt T f t 0 t Atf 35 v dt e K B B e e e v Atf 1 ATt T ft 0 At A ft 36 Analisando 36 percebese v e K 1 Atf não são funções de t e que podem ser tirados da integral desde que se preserve a ordem dos produtos visto que são matrizes e vetores Logo a expressão pode ser reescrita como v e K B B e e e v Atf 1 ATt dt T ft 0 At A ft 37 A expressão entre colchetes em 37 é igual a K dada por 28 Logo podese substituir a expressão entre colchetes por K v v e e v e K K e v Atf Atf Atf 1 Atf 38 Logo a entrada proposta verifica a igualdade mostrando que o resultado da operação do lado direito da expressão 21 com a entrada proposta é igual ao lado esquerdo Logo o sistema é controlável e o estado final pode ser atingido CQD 14 Com este teorema se obtém a expressão que permite determinar se um sistema linear invariante no tempo e a tempo contínuo é controlável Como no caso dos sistemas a tempo discreto lineares e invariantes no tempo a expressão permite determinar a controlabilidade a partir dos parâmetros do modelo não havendo necessidade de se chegar a calcular qualquer tipo de resposta Exemplo 3 Considerese o circuito do exemplo do capítulo 2 cuja equação dinâmica foi determinada tanto literalmente quanto com números A equação dinâmica determinada foi 0 i 0 Q x0 ut L 1 0 t x L R LC 1 1 0 dt dxt C x t 0 C 1 yt 1 Valores serão atribuídos aos parâmetros e às condições iniciais para permitir o cálculo das soluções L 1 H 3 R C 05 F 100 C QC0 1 A i 0 1 100 x0 ut 1 0 t x 3 2 1 0 dt dxt 0 xt 2 yt Temse pois o modelo de estado que permitirá calcular a matriz de controlabilidade Neste caso a matriz definida em 16 tem duas características 1 há um vetor de entrada ao invés de uma matriz e 2 a ordem do sistema é 2 Logo a matriz se torna 2 2 x b A b U R R 3 1 1 0 U 1 U Assim o posto da matriz de controlabilidade é cheio e o sistema é controlável Este exemplo é muito interessante pois podese fazer uma análise adicional Voltese à equação de estado literal e determinese a matriz de controlabilidade LC R L 1 L 1 0 U 2 L 1 U 15 Assim o posto da matriz de controlabilidade é cheio e o sistema é controlável independentemente dos valores dos elementos do circuito É a estrutura que garante a controlabilidade V Expressão Matemática da Controlabilidade para Sistemas Lineares e Invariantes no Tempo Os resultados das seções III e IV mostram que a maneira de se determinar se um sistema linear e invariante no tempo é controlável independe de o sistema ser a tempo contínuo ou discreto Viuse que as matrizes de controlabilidade são iguais nos dois casos Assim é possível generalizar a expressão Seja um sistema linear e invariante no tempo cujas matrizes são a quádrupla A B C D É possível determinar a condição de controlabilidade deste sistema através da matriz de controlabilidade U pn n n 1 n 2 x B A B A A B B U R R 16 Se o posto de U for n então o sistema em consideração é completamente controlável Caso o posto não seja n mas n n 0 1 então podese analisar a controlabilidade sob outro enfoque Definição 4 Índice de Controlabilidade Seja um sistema linear e invariante no tempo cujas matrizes são A B C D O índice de controlabilidade é 1 n posto da matriz de controlabilidade U 1 n 1 n 2 n B A B A A B B U 39 Quando o índice de controlabilidade é n a dimensão do espaço de estado então o sistema é completamente controlável As próximas seções continuarão tratando de controlabilidade sem fazer distinção entre sistemas a tempo contínuo e a tempo discreto visto que os resultados independem dos tempos mas são decorrentes da linearidade Por esta razão para não haver repetições alguns resultados serão deduzidos para o tempo contínuo e outros para o discreto VI Controlabilidade e as Diferentes Representações por Variáveis de Estado No capítulo 2 foram estudadas as transformações de similaridade Consideremse a equação 1ab aqui repetida por conveniência e outra dela obtida por uma referida transformação x0 B ut x0 xt A dt dxt 1a D ut C xt yt 1b x P 0 x ut P B t x A dt xt d 0 1 1 40a D ut t x C yt 40b 16 Na equação 40ab as matrizes são A P 1 P A 41a B P B 41b P 1 C C 41c As equações 1ab e 40ab têm as suas variáveis de estado relacionadas por P xt t x 42a t Q x t x P xt 1 42b P1 Q 42c Com os resultados do capítulo 2 podese estabelecer a relação entre as matrizes de controlabilidade das duas representações por variáveis de estado Seja U a matriz de controlabilidade da equação 42a Ela é computada através da expressão pn n n 1 n 2 x B A B A B A B U R R 43 Como a matriz de controlabilidade de 1a já foi estabelecida e é dada por 16 podese passar ao estabelecimento das relações entre ambas Em 43 substituemse as matrizes por suas transformações 41ab pn n 1 n 1 1 n 2 1 x P B P A P P B P A P P B P A P P B U R R 44 Na expressão 44 identificamse séries de produtos P1P que são a identidade Sejam os produtos substituídos pelas identidades para se obter B A B A A B P B B P A B P A P A B B P U n 1 n 2 n 1 n 2 45 U P U 46 Chegouse a uma expressão que é o produto da matriz de mudança de base P pela matriz de controlabilidade da equação original antes da transformação O objetivo é determinar a relação entre os postos das duas matrizes de tal forma a extrair as informações sobre o sistema ser controlável ou não e em caso de não ser qual o índice de controlabilidade do sistema Para tal recorrese à Desigualdade de Sylvester 17 Desigualdade de Sylvester Seja o produto de duas matrizes 1 M2 M M que possuem como dimensão comum n O posto da matriz produto satisfaz à desigualdade 2 1 2 1 M M mín M n M M 47 A Desigualdade de Sylvester será aplicada à expressão 46 e a dimensão que as matrizes possuem comum é n P U mín U n P U 48 A matriz de mudança de base é quadrada e inversível sendo o seu posto n Assim a expressão 48 pode ser reescrita como U n mín U n n U 49 U n mín U U 50 Porém como a matriz de controlabilidade possui somente n linhas podendo possuir n ou mais colunas seu posto será no máximo n Logo examinando 50 podese escrever U U U 51 Concluise que U U 52 Observese que o resultado em 52 é esperado visto que a propriedade é do sistema e não da equação que o representa VII Controlabilidade e as Formas Canônicas Controláveis Esta seção tem por objetivo apresentar duas formas especiais da equação dinâmica que podem ser escritas para sistemas controláveis As relações entre uma delas e a função de transferência que conforme visto no capítulo 2 é única é também apresentada Um produto importante deste estudo é a possibilidade de saber que um sistema é controlável quando sua equação dinâmica estiver em uma das formas Outro é poder passar da forma à função de transferência e viceversa A Algumas Relações Entre U U1 e o Vetor b Para facilitar as próximas subseções algumas relações são exploradas Elas são referentes ao caso monovariável quando a equação de estado se transforma em 18 0 0 x b uk xk A xk 1 xk 53a d uk c xk yk 53b Então a matriz de controlabilidade é n n n 1 n 2 x b A b A A b b U R R 54 Ainda que existam as formas canônicas para sistemas multivariáveis elas são mais complexas e fogem ao escopo da disciplina Pela condição de controlabilidade 16 U n Isto implica que a matriz de controlabilidade seja inversível Como a matriz é n x n isto implica em que todas as suas colunas seja linearmente independentes levando o seu determinante a ser não nulo Representese a matriz de controlabilidade por suas colunas e a sua inversa por suas linhas como segue n n n 1 n 2 1 x U R R 55 n n n 1 n 2 1 1 x U R R 56 Façase o produto de 56 e 55 para obter a matriz identidade n n n 1 n 2 1 n 1 n 2 1 1 x I U U R R 57 Da expressão 57 é possível concluir que j i 0 j i 1 i j 58 Mas sabese que a primeira coluna da matriz de controlabildiade é o vetor de entrada 19 1 j ou i i 0 1 j 1 i b i 1 i 59 Assim podese concluir que o vetor de entrada é ortogonal a todas as linhas da matriz 1 U exceto a primeira Este é um resultado importante e por ora não será usado mas será útil mais adiante no capítulo B Primeira Forma Canônica Controlável A primeira forma será estudada utilizando a equação dinâmica do caso a tempo discreto Considerese a equação 53ab e a ela se aplique uma transformação de similaridade Executase o mesmo que foi feito de 40a a 42c mas a um sistema monovariável a tempo discreto P x 0 uk x b k x A 1 xk 0 60a d uk k x c yk 60b Nas equações 60ab como no caso anterior as matrizes são A P 1 P A 61a b P b 61b P 1 c c 61c As equações 60ab e a que lhe deu origem têm as suas variáveis de estado relacionadas por P xk k x 62a k Q x k x P xk 1 62b P1 Q 42c Considerese agora que a matriz Q é a matriz de controlabilidade U Assim podese escrever k U x xk 63 E substituir na equação dinâmica 60ab x U 0 uk x b k x A 1 xk 0 1 64a d uk k x c yk 64b As expressões 41abc passam a ser A U U A 1 65a 20 b U b 1 65b U c c 65c Analisamse as entidades de parâmetros de 64ab Iniciase pelo vetor de entrada Utilizandose o resultado 59 podese concluir que o vetor de entrada é o primeiro vetor da base ortonormal no espaço de dimensão n e b 1 66b Analisase a matriz de estado Considerese inicialmente o produto A b b A A b A b b A b A A b A b A U A Q n n 1 2 n 1 n 2 67a Completase agora o produto em 65a A b b A A b A b A U U n n 1 2 n 1 n 2 1 1 67b Porém utilizando as duas maneira de escrever a matriz de controlabilidade 54 e 55 podese transformar 67b em A n A U U n 3 2 n 1 n 2 1 1 68 1 2 3 4 3 n 2 n 1 n n 1 a 1 0 0 0 0 0 0 a 0 1 0 0 0 0 0 a 0 0 1 0 0 0 0 a 0 0 0 0 0 0 0 a 0 0 0 0 1 0 0 a 0 0 0 0 0 1 0 a 0 0 0 0 0 0 1 a 0 0 0 0 0 0 0 A U U 69 21 As primeiras n 1 colunas de 69 são facilmente compreendidas se 58 for utilizada os vetores da base ortonormal aparecem deslocados porque os produtos são de índices uma unidade diferente dos de 58 Resta então a última coluna com elementos que não são ou da submatriz identidade de dimensão n 1xn 1 ou da linha superior de dimensão n 1 contendo zeros Devido a isto os elementos na última coluna de 69 são os negativos dos coeficientes do polinômio característico da matriz 69 escritos na ordem inversa Como a transformação de similaridade não muda os autovalores e logo o polinômio característico então a última coluna contém os coeficientes do polinômio característico que é comum a ambas as matrizes A prova desta afirmativa é deixada como problema O vetor de saída não será examinado porque não apresenta qualquer característica especial e esta forma não será a mais usada Isto ocorre porque o vetor de saída nada tem a ver com a controlabilidade do vetor de estado Os resultados da matriz de estado A U U A 1 e do vetor de entrada e b 1 permitem caracterizar a primeira Forma Canônica Controlável Relembrase que ela foi obtida utilizando a transformação 63 C Segunda Forma Canônica Controlável Existe uma segunda Forma Canônica Controlável que pode ser obtida utilizando outra matriz de transformação de similaridade Esta é a forma mais usada portanto será a mais explorada Para se chegar a esta nova transformação examinemse as matriz de controlabilidade e sua inversa dadas por 55 e 56 aqui repetidas por conveniência n n n 1 n 2 1 x U R R 55 n n n 1 n 2 1 1 x U R R 56 Para que se determine a nova matriz de transformação é necessário que se escolham n vetores linearmente independentes Os vetores serão calculados a partir da última linha de U1 por multiplicação por potências consecutivas da matriz A sendo a inicial a potência 0 zero O conjunto de vetores é n nA 2 nA 1 n nA 70 Os vetores do conjunto são linhas Inicialmente devese verificar que sejam linearmente independentes pois sem esta característica não podem formar uma base Para a verificação suponha se que existe um conjunto de n constantes 1n i i tais que n 1 n n n 2 n 3 n 2 n 1 0 A A A R 71 Pósmultipliquese 71 pelo vetor b para obter 22 0 b A b A A b b 1 n n n 2 n 3 2 n n 1 72 Na expressão 72 observase que os últimos fatores de cada uma das parcelas exceto a última são as colunas da matriz de controlabilidade Porém a sua inversa foi definida por linhas e cada linha era um i sendo n a última das linhas A partir de 58 podese afirmar que n é ortogonal a todas as colunas da matriz de controlabilidade exceto a última e ainda que o produto da última linha pela última coluna é a unidade Logo das n parcelas da expressão as n 1 primeiras se anulam e resta 0 b A n 1 n n n 73 A expressão 73 permite mostrar que n 0 Logo eliminandose a correspondente parcela de 71 se obtém n 2 n n 1 n 2 n 3 n 2 n 1 0 A A A R 74 A partir de 74 repetese o procedimento de pósmultiplicação de cada parcela porém com o fator de multiplicação sendo Ab Utilizandose os mesmos passos anteriores mostrase que 0 n 1 75 Eliminase então a última parcela de 74 e a expressão restante é multiplicada por A2b Repetese a análise e constatase que 0 n 2 76 Fazemse os passos adicionais até mostrar que para que a condição 71 seja satisfeita é necessário que 0 n n 1 2 1 77 O resultado 77 é a prova que os vetores do conjunto 70 são linearmente independentes Logo este conjunto de vetores pode constituir uma base e pode ser usado para a matriz de transformação de similaridade Escolhase a matriz de mudança de base n n 1 n n 2 n n n n x A A A P R R 78 As relações entre a variável original e a transformada são as mesmas que têm sido usadas aqui repetidas por conveniência tanto em termos das matrizes e vetores de parâmetros das equações como dos vetores de estado P xk k x 62a 23 k Q x k x P xk 1 62b P1 Q 42c A P 1 P A 61a b P b 61b P 1 c c 61c Cada vetor e matriz de parâmetros será analisado Iniciase como no caso anterior com o vetor de entrada b A b A b A b b A A A b 1 n n 2 n n n n 1 n n 2 n n n n 79 Lembrando que as os produtos dos últimos dois fatores de cada linha de 79 são as colunas da matriz de controlabilidade e também examinando as relações entre elas e os vetores n apresentadas em 58 podese escrever e b n 80 Para determinar a forma da matriz A utilizase o mesmo raciocínio da subseção anterior e chegase à expressão 81 1 2 3 4 3 n 2 n 1 n n 1 a a a a a a a a 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 P A P 81 A forma da matriz 81 é chamada de companheira e aparece também em equações dinâmicas cujas variáveis de estado tenham sido escolhida por regra de cadeia como no exemplo 3 do capítulo 2 24 D Relação Entre a Segunda Forma Canônica Controlável e a Função de Transferência A segunda Forma Canônica Controlável é a mais usada Por esta razão para ela será apresentada a relação com a função de transferência Nesta subseção utilizase a equação dinâmica do sistema a tempo contínuo Suponhase que tenha sido feita a mudança de base com a matriz de transformação 78 e tenha se chegado à nova equação dinâmica 0 1 2 3 4 3 n 2 n 1 n n Px 0 ut x 1 0 0 0 0 0 0 0 t x a a a a a a a a 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 dt xt d 82a d ut t x c c c c c c c c yt n 1 n 2 n 3 n 4 3 2 1 82b A função de transferência pode ser obtida da segunda Forma Canônica Controlável através de d a s a s a a s a s a s s c c s c s s c s c s c s H n 1 n 2 2 n 3 n 3 2 n 2 1 n 1 n 1 2 2 3 3 n 2 n 2 n 1 n 1 n n 83 Como é fácil constatar a função de transferência pode ser obtida por inspeção da Forma Canônica Controlável assim como a Forma Canônica Controlável pode ser escrita por inspeção da função de transferência desde que a parte racional polinomial seja estritamente própria No caso de a função de transferência ser uma função própria fazse a divisão dos polinômios para chegar à forma de 83 E Sistemas com Índice de Controlabilidade Inferior a n Como visto anteriormente neste capítulo existem sistemas cuja matriz de controlabilidade não possui posto cheio assim eles têm índice de controlabilidade n1 n Neste caso é importante que possam ser separados os elementos do vetor de estado que são controláveis e podem ser levados a valores desejados e os que não são e não podem ser levados a valores desejados Esta subseção apresenta a transformação de similaridade que permite particionar o vetor de estado em partes controlável e não controlável Seja a equação de estado de um sistema a tempo contínuo x0 B ut x0 xt A dt dxt 1a D ut C xt yt 1b E seja a sua matriz de controlabilidade mn n n 1 n 2 x B A B A A B B U R R 16 Suponhase que ao determinar o posto da matriz de controlabilidade constatese que 25 n n U 1 84 Assim o sistema não é completamente controlável Uma parte de seu vetor de estado será controlável e outra não Haverá Subespaço controlável de dimensão 1 n correspondendo às variáveis de estado que podem ter seus valores arbitrariamente escolhidos Subespaço não controlável de dimensão n n1 correspondendo às variáveis de estado que não podem ter seus valores arbitrariamente escolhidos Suponhase inicialmente que a transformação de similaridade foi aplicada e o vetor resultante é particionado como n NC C t x t x t x R 85 Na expressão 85 as dimensões das partições são 1 n C t x R 86a 1 nn NC t x R 86b Sejam as entidades da transformação de similaridade adaptadas para o caso a tempo contínuo apresentadas a seguir P xt t x 62a t Q x t x P xt 1 62b P1 Q 42c A P 1 P A 61a b P b 61b P 1 c c 61c A matriz que permite que as componentes controláveis e não controláveis sejam separadas é Q dada por As primeiras 1 n colunas são quaisquer 1 n colunas linearmente independentes da matriz de controlabilidade As demais n n1 colunas são quaisquer que tornem Q não singular 26 Com a matriz Q e sua inversa determinadas aplicase a transformação de similaridade e chegase ao vetor de estado na forma 85 A correspondente equação dinâmica é 0 C NC 12 C Px 0 ut x 0 B t x A 0 A A dt dxt 87a D ut t x C C yt NC C 87b Na equações 87ab Na matriz de estado C A é quadrada n x n 1 1 NC A é quadrada x n n n n 1 1 12 A é qualquer n x n n 1 1 e o bloco de zeros é x n n n 1 1 Na matriz de entrada C B é n1 x p e o bloco de zeros é x p n n 1 Na matriz de saída C C é q x n 1 e NC C é q x n n 1 Alguns comentários sobre 87ab são pertinentes A matriz de estado está particionada em blocos que são quadrados na diagonal principal Fora da diagonal principal os blocos serão quadrados somente no caso em que a dimensões dos subespaços controlável e não controlável forem iguais O bloco abaixo da diagonal principal é de zeros O conjunto de autovalores da matriz de estado é a união dos conjuntos de autovalores das submatrizes da diagonal principal Isto ocorre devido ao bloco de zeros Os autovalores de C A são os da parte controlável do sistema Os autovalores de NC A são os da parte não controlável do sistema A matriz de estado através do bloco de zeros mostra que as componentes controláveis do vetor de estado não estão presentes para formar as derivadas das componentes não controláveis do vetor de estado O bloco de zeros na matriz de entrada correspondendo às componentes não controláveis mostra que as variáveis de controle não estão conectadas às componentes não controláveis As duas observações anteriores levam à conclusão que as variáveis de controle não afetam as componentes não controláveis nem direta e nem indiretamente através de outras variáveis de estado Por esta razão estas componentes são não controláveis VIII Controlabilidade a Partir das Formas Diagonal e Canônica de Jordan As formas diagonal e Canônica de Jordan propiciam uma maneira muito simples de determinar se os sistemas por elas representados são controláveis A determinação pode ser feita por inspeção ou requerendo muito poucos cálculos Cada uma das duas formas será tratada separadamente a seguir A Sistemas na Forma Diagonal Considere que o sistema está representado pela equação 1ab porém com a matriz de estado na forma diagonal No caso a equação dinâmica se modifica para 27 0 np n2 1 n 2p 22 21 1p 12 11 n 2 1 x ut x0 b b b b b b b b b xt a 0 0 0 a 0 0 0 a dt dxt 88a D ut C xt yt 1b As condições de controlabilidade nesta forma são Caso todos os autovalores da matriz de estado sejam distintos o sistema será controlável se entre os vetores linha que compõem a matriz de entrada não existir um vetor nulo No caso do sistema monovariável não poderá existir um elemento nulo Se existirem autovalores repetidos na matriz de estado então além da condição anterior é necessário que na matriz de entrada as linhas que correspondem aos autovalores repetitivos formem um conjunto de vetores linearmente independentes Observese que tais condições ainda que não tenham sido demonstradas são de fácil compreensão pelos fatos apresentados a seguir Quando há a representação na forma diagonal é porque as variáveis de estado usadas são desacopladas umas das outras Como conseqüência do item anterior não há passagem de informação entre as variáveis de estado Assim a informação da entrada deve se transmitir de forma direta a cada uma das variáveis Uma linha de zeros na matriz de entrada implica que a correspondente variável de estado não recebe informação da entrada diretamente Como as variáveis de estado são desacopladas não há informação da entrada através das outras variáveis de estado Logo a variável de estado é não controlável Quando a matriz de estado possui autovalores repetitivos isto significa que estão em consideração duas ou mais dependendo da multiplicidade variáveis de estado que possuem a mesma forma de evolução no tempo pois possuem modos iguais Estas variáveis só se diferenciarão pelas entradas Assim se a matriz de entrada tiver linhas linearmente dependentes correspondendo aos autovalores repetitivos isto implicará que as variáveis de estado terão soluções linearmente dependentes o que impede que sejam levadas a valores arbitrários Logo o sistema não será controlável Como encerramento desta subseção podese estabelecer três procedimentos de inspeção rápida da equação dinâmica Eles são A existência de uma linha de zeros na matriz de entrada mesmo inexistindo repetitividade dos autovalores implica em sistema não controlável Uma análise posterior determinará o índice de controlabilidade A existência de um autovalor de multiplicidade r p indica que o sistema é não controlável pois não há como ter r vetores linearmente independentes em um espaço de dimensão p Quando houver autovalores repetitivos a condição necessária para a controlabilidade é que o número de variáveis de controle entradas seja no mínimo igual ao maior número de repetitividades B Sistemas na Forma Canônica de Jordan Resultado conhecido da Álgebra Linear a Forma Canônica de Jordan é uma forma quase diagonal que é atingida por mudanças de base nos casos em que havendo autovalores repetitivos não é possível diagonalizar a matriz de estado Isto ocorre quando as variáveis associadas aos autovalores repetitivos não são desacopláveis A Forma Canônica de Jordan é diagonal por blocos ou seja ela possui blocos ao longo de sua diagonal principal e zeros fora dela Para cada um dos blocos que não for de dimensão 1 x 1 além dos autovalores na diagonal principal há cadeias de número 1 em diagonais paralelas à principal ou na imediatamente acima ou na imediatamente abaixo dependendo de qual Forma Canônica de Jordan se usa No escopo destas notas será usada a que tem as cadeias de 1 na diagonal imediatamente acima da principal 28 A forma de uma matriz como a descrita é Ar 0 0 0 A 0 0 0 A 2 1 89 Os blocos ao longo da diagonal principal têm a forma i 0 0 0 1 i 0 0 0 0 i 0 0 0 1 i 90 Autovalores não repetitivos estão associados a blocos 1 x 1 nos quais só há o auto valor Definamse alguns símbolos r número de autovalores distintos na matriz de estado símbolo já usado em 89 i n multiplicidade do autovalor i símbolo já usado em 90 i A uma submatriz n i x n i contendo somente o autovalor na diagonal principal e o número 1 ou zeros fora dela i B o correspondente segmento n i x p da matriz de entrada i C o correspondente segmento q x n i da matriz de saída i x o correspondente segmento n i x 1 do vetor de estado Associase cada autovalor distinto a um subsistema Assim existem r subsistemas no sistema Um observação é importante r 1 i ni n 91 A expressão geral da Forma de Canônica de Jordan é 0 2 1 2 1 x ut x0 Br B B xt Ar 0 0 0 A 0 0 0 A dt dxt 92a D ut Cr xt C2 C yt 1 92b É claro de 92ab que os subsistemas são desacoplados uns dos outros Observese que todos os blocos de A fora da diagonal principal são nulos Devido a esta característica cada subsistema de pode ser examinado separadamente como um sistema independente Um subsistema genérico é analisado Para tal é abandonado o termo de conexão direta já que o mesmo não influencia a controlabilidade isto só vale para esta análise na solução do sistema este termo não pode ser dispensado Seja a equação dinâmica correspondente a um subsistema genérico i S 0 i i i i i i x B ut x 0 x t A dt x t d 93a 29 C x t y t i i i 93b O termo de conexão direta foi abandonado para esta análise porque não influencia a controlabilidade e deveria haver um rateio de sua influência para representar cada um dos subsistemas O que há de importante em 93a é que esta matriz é também particionada em blocos Cada bloco contém o autovalor i na diagonal principal e o número 1 logo acima dela A inexistência de um 1 na diagonal acima é o que caracteriza a separação entre blocos de Jordan do mesmo autovalor Definamse alguns símbolos s número de blocos de Jordan no iésimo subsistema ij n dimensão do jésimo bloco de Jordan no iésimo subsistema Aij matriz de estado nij x nij do jésimo bloco de Jordan no iésimo subsistema contendo os autovalores na diagonal principal o número 1 na diagonal logo acima dela e zeros fora delas Bij o correspondente segmento nij x p da matriz de entrada Cij o correspondente segmento q x nij da matriz de saída ij x o correspondente segmento nij x 1 do vetor de estado Uma observação é importante s 1 j i nij n 94 Com as definições apresentadas as equações 93ab podem ser reescrita de forma mais aberta 0 i i 2 i 1i i 2 i 1i i x ut x 0 Bir B B x t Air 0 0 0 A 0 0 0 A dt x t d 95a Cir x t Ci2 C y t i 1i i 95b Em 95a um bloco de Jordan tem a seguinte matriz de estado 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 A i i i i i i ij 96 Uma análise da submatriz em 96 permite constatar que todas as variáveis de estado pertencentes a um bloco de Jordan são acopladas através da cadeia de números 1 sobre a diagonal principal No entanto os blocos de Jordan de um mesmo autovalor são desacoplados pois o que separa um bloco do outro é a descontinuidade na cadeia de números 1 Existem duas condições de controlabilidade a do sistema como um todo 92ab e a de cada subsistema 95ab 30 O sistema 92ab será controlável se todos os subsistemas 95ab i 1 n forem controláveis O subsistema 93ab i 1 n será controlável se o conjunto de vetores correspondentes às últimas linhas de cada um dos blocos Bij for linearmente independente Como conseqüência podese concluir que o número de variáveis de entrada dever ser no mínimo igual ao número de blocos de Jordan no subsistema que possuir o maior número de blocos de Jordan Alguns comentários são interessantes após a apresentação das condições de controlabilidade A variável de estado correspondente ao último elemento do bloco de Jordan não recebe informação de qualquer outra variável de estado Assim a única maneira pela qual pode receber informação da entrada e ser controlada é através da última linha do correspondente bloco Bij Esta linha não pode ser nula aliás se fosse violaria a condição de independência linear Todas as equações de estado que correspondem às últimas linhas dos blocos de Jordan de um subsistema são iguais a menos das entradas Assim para que elas possam ter respostas independentes condição para a controlabilidade é necessário que as linhas a elas correspondentes no bloco da matriz de entrada sejam linearmente independentes As linhas correspondentes em ordem de baixo para cima em blocos de Jordan de um mesmo subsistema são iguais a menos da entrada Para que recebam informações independentes no entanto como são excitadas pelas variáveis de estado que as sucedem basta que estas recebam informações independentes Isto é garantido pela condição sobre as últimas linhas das partições blocos da matriz de entrada Em subsistemas na forma de Jordan existe sempre fluxo de informações entre variáveis de estado de baixo para cima devido à forma dos blocos de Jordan Caso a outra forma tivesse sido usada a informação fluiria de cima para baixo Esta forma tal como a diagonal é de fácil análise em termos de controlabilidade IX Considerações Finais Assim encerrou o estudo da propriedade da Controlabilidade A seguir será estudada a Observabilidade que será bem mais simples por ser dual da Controlabilidade e utilizar os mesmos passos X Referências 01 Benjamin C Kuo Automatic Control Systems PrenticeHall Estados Unidos 1984 02 David G Luenberger Introduction to Dynamic Systems Wiley Estados Unidos 1979 03 Chi T Chen Introduction to Linear System Theory HRW Estados Unidos 1970 XI Exercícios Propostos Os exercícios propostos têm o objetivo de fixar os conceitos e exercitar a manipulação das expressões e relações entre as funções 31 01 Resolva o exemplo 1 fazendo com que o estado inicial seja um vetor genérico 0 x e o estado desejado de saída um vetor genérico f x Verifique que é possível sempre fazer a transição de um para o outro em duas etapas ou seja com duas amostras da entrada 02 Demonstre o Teorema da Condição de Controlabilidade do sistema linear invariante no tempo e a tempo discreto representado pelas relações 16 e 17 03 Prove que a última coluna de 69 contém os negativos dos coeficientes do polinômio característico da matriz escritos na ordem inversa 04 Aplique a relação entre equação dinâmica e função de transferência às equações 82ab para obter 83 32 Capítulo 6 OBSERVABILIDADE DO VETOR DE ESTADO I Objetivo O objetivo deste capítulo é apresentar a propriedade da observabilidade que diz respeito à maneira como as variáveis internas estado do sistema se combinam para gerar as saídas Esta propriedade está vinculada à estrutura de saída do sistema ie à parte do sistema que é responsável pela transmissão de informação das variáveis internas para as de saída Diferentes autores utilizam diferentes definições para sistemas que exibem a propriedade sobre todos os modos de seu vetor de estado sobre alguns deles ou nenhum deles As possíveis classificações Observável Não Observável Completamente Observável Parcialmente Observável Não Observável Completamente Observável Observável Não Observável Comparando as três classificações concluise que os primeiros elementos de cada umas delas são equivalentes O último da primeira e os dois últimos da segunda e da terceira também o são A próxima seção trata de uma definição de observabilidade e como a mesma se relaciona com as classificações mencionadas O estudo da observabilidade seguirá em paralelo ao que foi feito para a controlabilidade II Definições de Observabilidade As definições de observabilidade apresentadas a seguir são bastante conhecidas Alguns autores as chamam de observabilidade completa A primeira delas é a definição que se aplica aos sistemas a tempo contínuo lineares e invariantes no tempo A segunda é a que se aplica aos sistemas a tempo discreto lineares e invariantes no tempo Para que as definições possam ser introduzidas repetemse as equações dinâmicas para as duas classes de sistemas anteriormente mencionadas A equação dinâmica que modela o sistema linear invariante no tempo causal multivariável e a tempo contínuo foi determinada no segundo capítulo e é x0 B ut x0 xt A dt dxt 1a D ut C xt yt 1b Definição 1 Observabilidade do Vetor Estado de um Sistema Linear Invariante no Tempo e a Tempo Contínuo O vetor de estado xt do sistema modelado pela equação dinâmica 1ab é dito observável em t t0 se existir um tempo finito 0 f t t tal que o conhecimento de 0 tf t ut t das matrizes A B C e D do modelo e da saída 0 tf t yt t for suficiente para determinar xt 0 Se todos os estados forem observáveis para um tempo ft o sistema é classificado como completamente observável A definição 1 é de acordo com 01 33 Considerese a equação dinâmica que modela o sistema linear invariante no tempo causal multivariável e a tempo discreto que foi determinada no segundo capítulo e é x0 B uk x0 A xk 1 xk 2a D uk C xk yk 2b Definição 2 Observabilidade do Vetor Estado de um Sistema Linear Invariante no Tempo e a Tempo Discreto O sistema de ordem n representado pela equação 2ab é dito completamente observável se existir um índice N finito tal que o conhecimento das saídas y0 y1 1 yN das matrizes A B C e D do modelo e das entradas u0 u1 1 uN for suficiente para determinar o estado inicial x0 x0 A definição 2 é de acordo com 02 Qualquer uma das definições apresentadas impõe somente que o estado inicial seja determinado em tempo finito não havendo restrição no tamanho do intervalo para o qual se processe a determinação do estado inicial a partir do conhecimento da saída da entrada e dos parâmetros do modelo Existem outras definições de observabilidade que consideram esta duração 03 No estudo de Controles e Servomecanismos considerarseão somente as definições para as quais a duração do intervalo de tempo desde que finita é irrelevante As definições conceituam os sistemas lineares e invariantes que são observáveis Do ponto de vista prático porém as mesmas são de pouca utilidade Observese que não é possível determinar a partir delas se um sistema é observável pois seria necessário que todos os pares de seqüências de entrada e de saída uk e yk fossem testados com o intuito de determinar se existe a possibilidade de conhecer o estado inicial É interesse do engenheiro a utilização de métodos que permitam determinar as propriedades dos sistemas de uma maneira sistemática e passível de ser algoritmizada Por esta razão procurase estabelecer uma expressão matemática para o conceito de observabilidade Com a finalidade de a mesma ser a mais prática possível ela deve ser estabelecida em função dos parâmetros do modelo do sistema Esta determinação acontece nas próximas seções Antes de passar às próximas seções porém são apresentados dois exemplos Exemplo 1 Seja um sistema linear invariante no tempo e a tempo discreto modelado pela equação a diferenças finitas a seguir 0 2 0 1 x uk x0 x 1 xk 0 05 1 1 xk 1 0 xk 1 1 yk O seu estado inicial é desconhecido Conhecemse a seqüência de amostras de entrada e a seqüência de amostras de saída 95 u0 e 110 u1 10 y0 e 90 y1 34 Como ainda não foi determinado um método analítico e o sistema é a tempo discreto podese utilizar o método numérico para obter a solução Passase à solução numérica 10 x x x 1 x 1 y0 0 2 0 1 0 2 0 1 Na expressão anterior há duas incógnitas e uma única relação Recorrese à segunda relação 90 x 1 x 1 1 x 1 x 1 1 y1 2 1 2 1 Ao acrescentarse a nova equação acrescentamse duas novas incógnitas o que não resolve o problema Como as entradas são conhecidas podese expressar as novas incógnitas em função das anteriores e da entrada 95 05 x x x 95 1 0 05 x x x u0 1 0 x x 05 1 1 1 0 x 0 2 0 1 0 2 0 2 0 1 0 2 0 2 0 1 Substituindo na expressão de y1 se obtém 90 95 05 x x x x 1 x 1 y1 0 2 0 1 0 2 2 1 Das expressões de y1 e de y1 podem ser tiradas as equações 10 x x 0 2 0 1 5 x 05 x 0 1 0 2 Resolvendo as duas equações se obtém 10 x0 0 Assim foi possível determinar as duas componentes do vetor de condições iniciais Exemplo 2 Seja um sistema linear invariante no tempo e a tempo discreto modelado pela equação a diferenças finitas a seguir 0 2 0 1 x uk x0 x 1 xk 2 05 0 0 xk 1 05 k 1 1 x yk Observese a título de curiosidade que esta equação está forma na em que a matriz de estado é diagonal Tem porém a característica de ter os dois autovalores iguais O seu estado inicial é desconhecido Conhecemse a seqüência de amostras de entrada e a seqüência de amostras de saída u0 10 e 20 u1 35 10 y0 e 5 y1 Como ainda não foi determinado um método analítico e o sistema é a tempo discreto podese utilizar o método numérico para obter a solução Passase à solução numérica 10 x x x 1 x 1 y0 0 2 0 1 0 2 0 1 Na expressão anterior há duas incógnitas e uma única relação Recorrese à segunda relação 5 x 1 x 1 1 x 1 x 1 1 y1 2 1 2 1 Ao acrescentarse a nova equação acrescentamse duas novas incógnitas o que não resolve o problema Como as entradas são conhecidas podese expressar as novas incógnitas em função das anteriores e da entrada 10 x 05 20 05 x 10 1 2 x 05 u0 05 x 1 2 x x 05 0 0 x1 05 0 2 0 1 0 2 0 1 0 2 0 1 Substituindo na expressão de y1 se obtém 5 10 05 x 20 05 x y1 0 2 0 1 Das expressões de y1 e de y1 podem ser tiradas as equações 10 x x 0 2 0 1 5 05 x 05 x 0 2 0 1 As duas equações são linearmente dependentes Não é possível resolvêlas para determinar o vetor de condições iniciais Observese que estes dois problemas levaram a resultados distintos III Expressão Matemática da Observabilidade para Sistemas Lineares Invariantes no Tempo e a Tempo Discreto O propósito desta seção é estabelecer uma expressão matemática para determinar a observabilidade de um sistema linear invariante no tempo e a tempo discreto cujo modelo matemático é a equação dinâmica 2ab Esta equação tem por estado inicial x0 x0 desconhecido e que se quer determinar Ao mesmo tempo são conhecidas as matrizes de parâmetros do modelo A B C e D e as seqüências de entrada e de saída uk e yk respectivamente A equação dinâmica 2ab é resolvida por recorrência a partir de k 0 e até k N Neste caso diferentemente do caso da controlabilidade as duas equações são resolvidas Iniciase pela saída em k 0 já que há a condição inicial do vetor de estado D u0 C x D u0 C x0 y0 0 B u0 A x B u0 A x0 x1 0 36 D u1 C B u0 C A x D u1 B u0 C A x D u1 C x1 y1 0 0 B u1 A B u0 A x B u1 B u0 A A x B u1 A x1 x2 0 2 0 D u2 C B u1 C A B u0 C A x D u2 B u1 A B u0 C A x D u2 C x2 y2 0 2 0 2 3 1 B uN 2 A B uN 3 A B uN B u1 A B u0 A A x xN 2 N2 N1 0 N D uN 1 C B uN 2 C A B uN 3 C A B uN B u1 C A B u0 C A C A x yN 2 N2 N1 0 N Suponhase que 1 N k é o último instante para o qual se computa a recorrência Então é neste passo que se quer determinar x0 x0 Com a finalidade de facilitar a visualização da solução do problema extraise de 3 o conjunto de equações de saída D u0 C x y0 0 D u1 C B u0 C A x y1 0 D u2 C B u1 C A B u0 C A x y2 0 2 3a D uN 1 C B uN 2 C A B uN 3 C A B uN B u1 C A B u0 C A C A x yN 2 N2 N1 0 N Examinandose o conjunto de equações 3a podese constatar que Cada equação do conjunto representa um conjunto de q dimensão da saída equações algébricas lineares Cada equação do conjunto possui uma parcela que contém um vetor de elementos desconhecidos o vetor de estado no instante inicial n 0 x x0 R cuja dimensão é diferente em geral maior do número de equações em cada equação do conjunto As demais parcelas de cada equação do conjunto é conhecida No caso geral q n e assim não há garantia de que somente uma equação seja suficiente para determinar n 0 x x0 R em função das parcelas conhecidas Se todas as equações de 3a forem consideradas em conjunto passase a ter N 1 q equações mas o número de incógnitas se mantém fixo em n logo aumenta a chance de resolver o problema Modificase a equação 3a de tal forma a colocar no lado esquerdo todos os termos conhecidos deixandose à direita a incógnita C x D u0 y0 0 C A x0 D u1 C B u0 y1 C A x D u2 C B u1 C A B u0 y2 0 2 4 0 N 2 N2 N1 C A x D uN 1 C B uN 2 C A B uN 3 C A B uN B u1 C A B u0 C A yN Definase um conjunto de vetores 0 N i v q i R que são as somas de todas as parcelas conhecidas que estão do lado esquerdo de cada uma das equações do conjunto 4 Substituindo os vetores em 4 se obtém C x v 0 0 37 0 1 C A x v C A x v 0 2 2 5 0 N N C A x v O conjunto de equações 5 será modificado para ser escrito sob forma vetorial através do empilhamento de seus vetores N 1q 0 1 0 N 2 0 N 0 2 0 0 N 2 1 0 V x x A C A C A C C A x C A x C A x C x C v v v v R 6 Na expressão 6 foi definida uma nova matriz n 1q N N 2 1 x A C A C A C C V R R 7 Examinandose 1 V percebese que seu número de colunas é a dimensão do espaço de estado O número de linhas pode ser maior Assim se for analisado o posto de matriz seu limite superior será n a dimensão do espaço de estado A expressão 6 representa um sistema de equações lineares que só terá solução para o vetor de incógnitas 0 x se o posto da matriz 1 V for cheio ie se existirem tantas equações linearmente independentes em 6 quantas forem as incógnitas que são as componentes de 0 x Em se tratando que a dimensão de 1 V depende de N que é um inteiro a ser estabelecido devese inicialmente determinar N para que com ele possase formular a condição de cômputo de 0 x O Lema 1 do capítulo de Controlabilidade do Vetor de Estado aqui repetido por conveniência estabelece que se o posto de 1 V não for atingido em n partições empilhadas não mais o será Assim podese reescrever a expressão 6 da forma a seguir Após ela explicitase a nova expressão de 7 38 nq 0 0 2 0 0 2 0 0 2 1 0 Vx x An 1 C A C A C C An 1 x C A x C A x C x C 1 n v v v v R 8 n nq 2 x An 1 C A C A C C V R R 9 Lema 1 Para qualquer N n o posto de 9 é igual ao posto de 7 A prova do Lema 1 está nos livros de Álgebra Linear Em 8 e 9 V é a matriz 1 V na nova dimensão A partir de 8 podese definir a Matriz de Observabilidade do sistema linear invariante no tempo e a tempo discreto Definição 3 Matriz de Observabilidade do Sistema Linear Invariante no Tempo e a Tempo Discreto A matriz de observabilidade de um sistema linear invariante no tempo e a tempo discreto é n nq 2 x An 1 C A C A C C V R R 10 Também a partir de 8 podese estabelecer a sua condição de observabilidade Ela é a condição para que 8 tenha solução permitindo determinar 0 x 39 Teorema 1 Condição de Observabilidade do Sistema Linear Invariante no Tempo e a Tempo Discreto A condição de observabilidade de um sistema linear invariante no tempo e a tempo discreto 2ab é que a sua matriz de observabilidade 10 tenha posto n ou seja V n 11 A prova deste teorema é deixada como exercício aos alunos IV Expressão Matemática da Observabilidade para Sistemas Lineares Invariantes no Tempo e a Tempo Contínuo O entendimento da observabilidade no caso dos sistemas lineares invariantes no tempo e a tempo discreto é bastante intuitivo como visto na seção anterior Para o caso dos sistemas a tempo contínuo a matriz e a condição de observabilidade são as mesmas mas a demonstração é bastante diferente Teorema 2 Condição de Observabilidade do Sistema Linear Invariante no Tempo e a Tempo Contínuo A condição de observabilidade de um sistema linear invariante no tempo e a tempo contínuo 1ab é que a sua matriz de observabilidade n nq 2 x An 1 C A C A C C V R R 10 tenha posto n ou seja V n 11 Com este teorema se obtém a expressão que permite determinar se um sistema linear invariante no tempo e a tempo contínuo é observável Como no caso dos sistemas a tempo discreto lineares e invariantes no tempo a expressão permite determinar a observabilidade a partir dos parâmetros do modelo não havendo necessidade de se chegar a calcular qualquer tipo de resposta Exemplo 3 Considerese o circuito do exemplo do capítulo 2 cuja equação dinâmica foi determinada tanto literalmente quanto com números 40 A equação dinâmica determinada foi 0 i 0 Q x0 ut L 1 0 t x L R LC 1 1 0 dt dxt C x t 0 C 1 yt 1 Valores serão atribuídos aos parâmetros e às condições iniciais para permitir o cálculo das soluções L 1 H 3 R C 05 F 100 C QC0 1 A i 0 1 100 x0 ut 1 0 t x 3 2 1 0 dt dxt 0 xt 2 yt Temse pois o modelo de estado que permitirá calcular a matriz de observabilidade Neste caso a matriz definida em 10 tem duas características 1 há um vetor de saída ao invés de uma matriz e 2 a ordem do sistema é 2 Logo a matriz se torna 2 2 x cA c V R R 2 0 0 2 V V 4 Assim o posto da matriz de observabilidade é cheio e o sistema é observável Este exemplo é muito interessante pois podese fazer uma análise adicional Voltese à equação de estado literal e determinese a matriz de observabilidade C 1 0 0 C 1 V 2 C 1 V Assim o posto da matriz de observabilidade é cheio e o sistema é observável independentemente dos valores dos elementos do circuito É a estrutura que garante a observabilidade 41 V Expressão Matemática da Observabilidade para Sistemas Lineares e Invariantes no Tempo Os resultados das seções III e IV mostram que a maneira de se determinar se um sistema linear e invariante no tempo é observável independe de o sistema ser a tempo contínuo ou discreto Viuse que as matrizes de observabilidade são iguais nos dois casos Assim é possível generalizar a expressão Seja um sistema linear e invariante no tempo cujas matrizes são a quádrupla A B C D É possível determinar a condição de observabilidade deste sistema através da matriz de observabilidade V n nq 2 x An 1 C A C A C C V R R 10 Se o posto de V for n então o sistema em consideração é completamente observável Caso o posto não seja n mas n n 0 1 então podese analisar a observabilidade sob outro enfoque Definição 4 Índice de Observabilidade Seja um sistema linear e invariante no tempo cujas matrizes são A B C D O índice de observabilidade é 1 n posto da matriz de observabilidade V 1 2 n An 1 C A C A C C V 12 Quando o índice de observabilidade é n a dimensão do espaço de estado então o sistema é completamente observável As próximas seções continuarão tratando de observabilidade sem fazer distinção entre sistemas a tempo contínuo e a tempo discreto visto que os resultados independem dos tempos mas são decorrentes da linearidade Por esta razão para não haver repetições alguns resultados serão deduzidos para o tempo contínuo e outros para o discreto VI Observabilidade e as Diferentes Representações por Variáveis de Estado No capítulo 2 foram estudadas as transformações de similaridade Consideremse a equação 1ab aqui repetida por conveniência e outra dela obtida por uma referida transformação 42 x0 B ut x0 xt A dt dxt 1a D ut C xt yt 1b x P 0 x ut P B t x A dt xt d 0 1 1 13a D ut t x C yt 13b Na equação 13ab as matrizes são A P 1 P A 14a B P B 14b P 1 C C 14c As equações 1ab e 13ab têm as suas variáveis de estado relacionadas por P xt t x 15a t Q x t x P xt 1 15b P1 Q 15c Com os resultados do capítulo 2 podese estabelecer a relação entre as matrizes de observabilidade das duas representações por variáveis de estado Seja V a matriz de observabilidade da equação 13ab Ela é computada através da expressão n nq 2 x n 1 A C A C A C C V R R 16 Como a matriz de observabilidade de 1ab já foi estabelecida e é dada por 10 podese passar ao estabelecimento das relações entre ambas Em 16 substituemse as matrizes por suas transformações 14abc 43 n nq 1 n 1 1 1 2 1 1 1 1 x P A P P C P A P P C P A P P C P C V R R 17 Na expressão 17 identificamse séries de produtos P1P que são a identidade Sejam os produtos substituídos pelas identidades para se obter n nq 1 1 n 2 1 1 n 1 2 1 1 x P A C A C A C C P A C A P C A P C P C V R R 18 n nq 1 x V P V R R 19 Chegouse a uma expressão que é o produto da matriz de observabilidade original antes da transformação pela matriz de mudança de base 1 P O objetivo é determinar a relação entre os postos das duas matrizes de tal forma a extrair as informações sobre o sistema ser observável ou não e em caso de não ser qual o índice de observabilidade do sistema Para tal como no caso da controlabilidade recorrese à Desigualdade de Sylvester Desigualdade de Sylvester Seja o produto de duas matrizes 1 M2 M M que possuem como dimensão comum n O posto da matriz produto satisfaz à desigualdade 2 1 2 1 M M mín M n M M 20 A Desigualdade de Sylvester será aplicada à expressão 19 e a dimensão que as matrizes possuem comum é n 1 1 P V mín V n P V 21 A matriz de mudança de base e sua inversa são quadradas e inversíveis sendo o seu posto n Assim a expressão 21 pode ser reescrita como 44 V n mín V n n V 22 V n mín V V 23 Porém como a matriz de observabilidade possui somente n colunas podendo possuir n ou mais linhas seu posto será no máximo n Logo examinando 23 podese escrever V V V 24 Concluise que V V 25 Observese que o resultado em 25 é esperado visto que a propriedade é do sistema e não da equação que o representa VII Observabilidade e as Formas Canônicas Observáveis Esta seção tem por objetivo apresentar duas formas especiais da equação dinâmica que podem ser escritas para sistemas observáveis As relações entre uma delas e a função de transferência que conforme visto no capítulo 2 é única é também apresentada Um produto importante deste estudo é a possibilidade de saber que um sistema é observável quando sua equação dinâmica estiver em uma das formas Outro é poder passar da forma à função de transferência e viceversa Como as formas canônicas foram estudadas com algum detalhe no caso da controlabilidade neste capítulo elas serão somente apresentadas em suas formas Como no caso anterior elas serão apresentadas para os sistemas monovariáveis Ainda que existam as formas canônicas para sistemas multivariáveis elas são mais complexas e fogem ao escopo da disciplina A Primeira Forma Canônica Observável A primeira forma canônica observável é P x 0 uk x b k x A 1 xk 0 26a d uk k x c yk 26b Nas equações 26ab como no caso anterior as matrizes são A P 1 P A 27a b P b 27b 45 P 1 c c 27c As equações 26ab e a que lhe deu origem têm as suas variáveis de estado relacionadas por P xk k x 28a k Q x k x P xk 1 28b P1 Q 28c Considerese agora que a matriz P é a matriz de observabilidade V Assim podese escrever k x V xk 1 29 Após a mudança de base a matriz e vetores são 1 2 3 4 3 n 2 n 1 n n 1 a a a a a a a a 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 A V V A 30a b V b 30b e V c c 1 1 30c Os elementos da última linha de 30a são os coeficientes do polinômio característico das matrizes A e A pois os autovalores não são modificados em uma transformação de similaridade Assim o polinômio característico permanece inalterado com a transformação A prova de que os elementos da última linha são os coeficientes do polinômio característico é deixada como um exercício para o leitor B Segunda Forma Canônica Observável Existe uma segunda Forma Canônica Observável que pode ser obtida utilizando outra matriz de transformação de similaridade Esta é a forma mais usada portanto será a mais explorada As relações entre a variável original e a transformada são as mesmas que têm sido usadas aqui repetidas por conveniência tanto em termos das matrizes e vetores de parâmetros das equações como dos vetores de estado A P 1 P A 27a b P b 27b 46 P 1 c c 27c P xk k x 28a k Q x k x P xk 1 28b P1 Q 28c O procedimento para determinar a matriz da transformação de similaridade é análogo ao da segunda Forma Canônica Controlável Após a mudança de base a matriz e vetores de parâmetros se tornam 1 2 3 4 3 n 2 n 1 n n 1 a 1 0 0 0 0 0 0 a 0 1 0 0 0 0 0 a 0 0 1 0 0 0 0 a 0 0 0 0 0 0 0 a 0 0 0 0 1 0 0 a 0 0 0 0 0 1 0 a 0 0 0 0 0 0 1 a 0 0 0 0 0 0 0 P A P A 29a b P b 27b e P c c n 1 29c Observase que tanto no casa da primeira quanto no da segunda Forma canônica Controlável o vetor de entrada após a transformação de similaridade não possui forma específica C Relação Entre a Segunda Forma Canônica Observável e a Função de Transferência A segunda Forma Canônica Observável é a mais usada Por esta razão para ela será apresentada a relação com a função de transferência Nesta subseção utilizase a equação dinâmica do sistema a tempo contínuo Suponhase que tenha sido feita a mudança de base com a matriz de transformação 78 e tenha se chegado à nova equação dinâmica 0 1 2 3 4 3 n 2 n 1 n n 1 2 3 4 3 n 2 n 1 n n Px 0 ut x b b b b b b b b t x a 1 0 0 0 0 0 0 a 0 1 0 0 0 0 0 a 0 0 1 0 0 0 0 a 0 0 0 0 0 0 0 a 0 0 0 0 1 0 0 a 0 0 0 0 0 1 0 a 0 0 0 0 0 0 1 a 0 0 0 0 0 0 0 dt dxt 30a d ut t 0 1 x 0 0 0 0 0 0 yt 30b 47 A função de transferência pode ser obtida da segunda Forma Canônica Observável através de d a s a s a a s a s a s s b s b s b b s b s s b s H n 1 n 2 2 n 3 n 3 2 n 2 1 n 1 n n 1 n 2 2 n 3 n 3 2 n 2 1 n 1 31 Como é fácil constatar a função de transferência pode ser obtida por inspeção da Forma Canônica Observável assim como a Forma Canônica Observável pode ser escrita por inspeção da função de transferência desde que a parte racional polinomial seja estritamente própria No caso de a função de transferência ser uma função própria fazse a divisão dos polinômios para chegar à forma de 31 D Sistemas com Índice de Observabilidade Inferior a n Como visto anteriormente neste capítulo existem sistemas cuja matriz de observabilidade não possui posto cheio assim eles têm índice de observabilidade n1 n Neste caso é importante que possam ser separados os elementos do vetor de estado que são observáveis e podem ter seus valores na condição inicial determinados e os que não são e não podem ter seus valores na condição inicial determinados Esta subseção apresenta a transformação de similaridade que permite particionar o vetor de estado em partes observável e não observável Seja a equação de estado de um sistema a tempo contínuo x0 B ut x0 xt A dt dxt 1a D ut C xt yt 1b E seja a sua matriz de observabilidade n nq 2 x An 1 C A C A C C V R R 10 Suponhase que ao determinar o posto da matriz de observabilidade constatese que n n V 1 32 Assim o sistema não é completamente observável Uma parte de seu vetor de estado será observável e outra não Haverá Subespaço observável de dimensão 1 n correspondendo às variáveis de estado que podem ter seus valores no instante inicial determinados Subespaço não observável de dimensão n n1 correspondendo às variáveis de estado que não podem ter seus valores no instante inicial determinados Suponhase inicialmente que a transformação de similaridade foi aplicada e o vetor resultante é particionado como 48 n NO O t x t x t x R 33 Na expressão 33 as dimensões das partições são 1 n O t x R 34a nn1 NO t x R 34b Sejam as entidades da transformação de similaridade adaptadas para o caso a tempo contínuo apresentadas a seguir P xt t x 28a t Q x t x P xt 1 28b P1 Q 28c Após a transformação a matriz e os vetores se tornam A P 1 P A 27a b P b 27b P 1 c c 27c A matriz que permite que as componentes observáveis e não observáveis sejam separadas é P dada por As primeiras 2 n linhas são quaisquer n2 linhas linearmente independentes da matriz de observabilidade As demais n n2 linhas são quaisquer que tornem P não singular Com a matriz Q e sua inversa determinadas aplicase a transformação de similaridade e chegase ao vetor de estado na forma 33 A correspondente equação dinâmica é 0 NO O NO 21 O Px 0 ut x B B t x A A 0 A dt dxt 35a D ut t 0 x C yt O 35b 49 Na equações 35ab Na matriz de estado O A é quadrada n x n 1 1 NO A é quadrada x n n n n 1 1 21 A é qualquer x n n n 1 1 e o bloco de zeros é n x n n 1 1 Na matriz de entrada O B é n1 x p e NO B é x p n n 1 Na matriz de saída O C é q x n 1 e o bloco de zeros é q x n n 1 Alguns comentários sobre 35ab são pertinentes A matriz de estado está particionada em blocos que são quadrados na diagonal principal Fora da diagonal principal os blocos serão quadrados somente no caso em que as dimensões dos subespaços controlável e não controlável forem iguais O bloco acima da diagonal principal é de zeros O conjunto de autovalores da matriz de estado é a união dos conjuntos de autovalores das submatrizes da diagonal principal Isto ocorre devido ao bloco de zeros Os autovalores de O A são os da parte observável do sistema Os autovalores de NO A são os da parte não observável do sistema A matriz de estado através do bloco de zeros mostra que as componentes não observáveis do vetor de estado não estão presentes para formar as derivadas das componentes observável do vetor de estado O bloco de zeros na matriz de saída correspondendo às componentes não observáveis mostra que as componentes não observáveis não estão conectadas às componentes observáveis As duas observações anteriores levam à conclusão que as variáveis de saída não são afetadas pelas componentes não observáveis nem direta e nem indiretamente através de outras variáveis de estado Por esta razão estas componentes são não observáveis VIII Observabilidade a Partir das Formas Diagonal e Canônica de Jordan As formas diagonal e Canônica de Jordan propiciam uma maneira muito simples de determinar se os sistemas por elas representados são observáveis como no caso do estudo da controlabilidade A determinação pode ser feita por inspeção ou requerendo muitos poucos cálculos Cada uma das duas formas será tratada separadamente a seguir A Sistemas na Forma Diagonal Considere que o sistema está representado pela equação 1ab porém com a matriz de estado na forma diagonal No caso a equação dinâmica se modifica para 0 n 2 1 x B ut x0 xt a 0 0 0 a 0 0 0 a dt dxt 36a D ut C xt yt 36b As condições de observabilidade nesta forma são Caso todos os autovalores da matriz de estado sejam distintos o sistema será observável se entre os vetores coluna que compõem a matriz de saída não existir um vetor nulo No caso do sistema monovariável não poderá existir um elemento nulo 50 Se existirem autovalores repetidos na matriz de estado então além da condição anterior é necessário que na matriz de saída as colunas que correspondem aos autovalores repetitivos formem um conjunto de vetores linearmente independentes Observese que tais condições ainda que não tenham sido demonstradas são de fácil compreensão pelos fatos apresentados a seguir Quando há a representação na forma diagonal é porque as variáveis de estado usadas são desacopladas umas das outras Como conseqüência do item anterior não há passagem de informação entre as variáveis de estado Assim a informação da entrada deve se transmitir de forma direta a cada uma das variáveis Uma linha de zeros na matriz de entrada implica que a correspondente variável de estado não recebe informação da entrada diretamente Como as variáveis de estado são desacopladas não há informação da entrada através das outras variáveis de estado Logo a variável de estado é não observável Quando a matriz de estado possui autovalores repetitivos isto significa que estão em consideração duas ou mais dependendo da multiplicidade variáveis de estado que possuem a mesma forma de evolução no tempo pois possuem modos iguais Estas variáveis só se diferenciarão pelas entradas Assim se a matriz de entrada tiver linhas linearmente dependentes correspondendo aos autovalores repetitivos isto implicará que as variáveis de estado terão soluções linearmente dependentes o que impede que sejam levadas a valores arbitrários Logo o sistema não será observável Como encerramento desta subseção podese estabelecer três procedimentos de inspeção rápida da equação dinâmica Eles são A existência de uma linha de zeros na matriz de entrada mesmo inexistindo repetitividade dos autovalores implica em sistema não observável Uma análise posterior determinará o índice de observabilidade A existência de um autovalor de multiplicidade r p indica que o sistema é não observável pois não há como ter r vetores linearmente independentes em um espaço de dimensão p Quando houver autovalores repetitivos a condição necessária para a observabilidade é que o número de variáveis obsevadas entradas seja no mínimo igual ao maior número de repetitividades B Sistemas na Forma Canônica de Jordan A Forma Canônica de Jordan foi apresentada no estudo da controlabilidade Resultado conhecido da Álgebra Linear ela é uma forma quase diagonal que é atingida por mudanças de base nos casos em que havendo autovalores repetitivos não é possível diagonalizar a matriz de estado Isto ocorre quando as variáveis associadas aos autovalores repetitivos não são desacopláveis A Forma Canônica de Jordan é diagonal por blocos ou seja ela possui blocos ao longo de sua diagonal principal e zeros fora dela Para cada um dos blocos que não for de dimensão 1 x 1 além dos autovalores na diagonal principal há cadeias de número 1 em diagonais paralelas à principal ou na imediatamente acima ou na imediatamente abaixo dependendo de qual Forma Canônica de Jordan se usa No escopo destas notas será usada a que tem as cadeias de 1 na diagonal imediatamente acima da principal A forma de uma matriz como a descrita é Ar 0 0 0 A 0 0 0 A 2 1 37 Os blocos ao longo da diagonal principal têm a forma 51 i 0 0 0 1 i 0 0 0 0 i 0 0 0 1 i 38 Autovalores não repetitivos estão associados a blocos 1 x 1 nos quais só há o autovalor Definamse alguns símbolos r número de autovalores distintos na matriz de estado símbolo já usado em 37 i n multiplicidade do autovalor i símbolo já usado em 38 i A uma submatriz n i x n i contendo somente o autovalor na diagonal principal e o número 1 ou zeros for a dela i B o correspondente segmento n i x p da matriz de entrada i C o correspondente segmento q x n i da matriz de saída i x o correspondente segmento n i x 1 do vetor de estado Associase cada autovalor distinto a um subsistema Assim existem r subsistemas no sistema Uma observação é importante r 1 i ni n 39 Como apresentado no capítulo anterior a expressão geral da Forma de Canônica de Jordan é 0 2 1 2 1 x ut x0 Br B B xt Ar 0 0 0 A 0 0 0 A dt dxt 40a D ut Cr xt C2 C yt 1 40b É claro de 40ab que os subsistemas são desacoplados uns dos outros Observese que todos os blocos de A fora da diagonal principal são nulos Devido a esta característica cada subsistema pode ser examinado separadamente como um sistema independente Um subsistema genérico é analisado Para tal é abandonado o termo de conexão direta já que o mesmo não influencia a observabilidade isto só vale para esta análise na solução do sistema este termo não pode ser dispensado Seja a equação dinâmica correspondente a um subsistema genérico i S 0 i i i i i i x B ut x 0 x t A dt x t d 41a C x t y t i i i 41b O termo de conexão direta foi abandonado para esta análise porque não influencia a observabilidade e deveria haver um rateio de sua influência para representar cada um dos subsistemas O que há de importante em 41a é que esta matriz é também particionada em blocos Cada bloco contém o autovalor i na diagonal principal e o número 1 logo acima dela A inexistência de um 1 na diagonal acima é o que caracteriza a separação entre blocos de Jordan do mesmo autovalor 52 Definamse alguns símbolos s número de blocos de Jordan no iésimo subsistema ij n dimensão do jésimo bloco de Jordan no iésimo subsistema Aij matriz de estado nij x nij do jésimo bloco de Jordan no iésimo subsistema contendo os aultovalores ma diagonal principal o número 1 na diagonal logo acima dela e zeros fora delas Bij o correspondente segmento nij x p da matriz de entrada Cij o correspondente segmento q x nij da matriz de saída ij x o correspondente segmento nij x 1 do vetor de estado Uma observação é importante s 1 j i nij n 42 Com as definições apresentadas as equações 41ab podem ser reescrita de forma mais aberta 0 i i 2 i 1i i 2 i 1i i x ut x 0 Bir B B x t Air 0 0 0 A 0 0 0 A dt x t d 43a Cir x t Ci2 C y t i 1i i 43b Em 43a um bloco de Jordan tem a seguinte matriz de estado 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 A i i i i i i ij 44 Uma análise da submatriz em 44 permite constatar que todas as variáveis de estado pertencentes a um bloco de Jordan são acopladas através da cadeia de números 1 sobre a diagonal principal No entanto os blocos de Jordan de um mesmo autovalor são desacoplados pois o que separa um bloco do outro é a descontinuidade na cadeia de números 1 Existem duas condições de observabilidade a do sistema como um todo 40ab e a de cada subsistema 43ab O sistema 40ab será observável se todos os subsistemas 43ab i 1 n forem controláveis O subsistema 43ab i 1 n será observável se o conjunto de vetores correspondentes às primeiras colunas de cada um dos blocos Cij for linearmente independente Como conseqüência podese concluir que o número de variáveis de saída dever ser no mínimo igual ao número de blocos de Jordan no subsistema que possuir o maior número de blocos de Jordan Alguns comentários são interessantes após a apresentação das condições de observabilidade 53 A variável de estado correspondente ao primeiro elemento do bloco de Jordan não transmite informação a qualquer outra variável de estado Assim a única maneira pela qual pode passar informações à saída e ser observada é através da primeira coluna do correspondente bloco Cij Esta coluna não pode ser nula aliás se fosse violaria a condição de independência linear Todas as equações de estado que correspondem às primeiras colunas dos blocos de Jordan de um subsistema são iguais a menos das saídas Assim para que elas possam transmitir informações independentes condição para a observabilidade é necessário que as colunas a elas correspondentes no bloco da matriz de saída sejam linearmente independentes As colunas correspondentes em ordem da esquerda para a direita em blocos de Jordan de um mesmo subsistema são iguais a menos da saída Para que transmitam informações independentes no entanto como são excitadas pelas variáveis de estado que as sucedem basta que estas transmitam informações independentes Isto é garantido pela condição sobre as primeiras colunas das partições blocos da matriz de saída Em subsistemas na forma de Jordan existe sempre fluxo de informações entre variáveis de estado de baixo para cima devido à forma dos blocos de Jordan Caso a outra forma tivesse sido usada a informação fluiria de cima para baixo Esta forma tal como a diagonal é de fácil análise em termos de observabilidade IX Considerações Finais Assim encerrou o estudo da propriedade da Observabilidade X Referências 01 Benjamin C Kuo Automatic Control Systems PrenticeHall Estados Unidos 1984 02 David G Luenberger Introduction to Dynamic Systems Wiley Estados Unidos 1979 03 Chi T Chen Introduction to Linear System Theory HRW Estados Unidos 1970 XI Exercícios Propostos Os exercícios propostos têm o objetivo de fixar os conceitos e exercitar a manipulação das expressões e relações entre as funções 01 Demonstre o Teorema da Condição de Observabilidade do sistema linear invariante no tempo e a tempo discreto representado pelas relações 10 e 11 02 Prove que a última coluna de 29a contém os negativos do coeficientes do polinômio característico da matriz escritos na ordem inversa 54 Capítulo 7 ESTABILIDADE I Objetivo A estabilidade é um dos assuntos mais importantes da disciplina de Controles e Servomecanismos Ela é chave para vários estudos subseqüentes associados à dinâmica dos sistemas Por esta razão áreas ligadas à Engenharia Elétrica a estabilidade permeia sistemas de energia circuitos elétricos e eletrônicos sistemas de telecomunicações e filtros digitais por exemplo O objetivo deste capítulo é apresentar a propriedade da estabilidade Existem várias definições de estabilidade algumas associadas somente às variáveis internas do sistema variáveis de estado enquanto outras dizem respeito à relação entradasaída única e exclusivamente Este capítulo considera três definições duas delas dizendo respeito às variáveis internas e a terceira à relação entradasaída Para que possam ser entendidas as definições que se referem às variáveis de estado tornase necessário que se introduza o conceito de pontos de equilíbrio o que é feito na próxima seção II Pontos de Equilíbrio O conceito de pontos de equilíbrio é associado ao vetor de estado em geral de um sistema homogêneo ie sem excitação Ele vale tanto para sistemas lineares como para sistemas não lineares ainda que na disciplina de Controles e Servomecanismos seja somente aplicado a sistemas lineares e invariantes no tempo Serão considerados os casos de sistemas nos tempos contínuo e discreto Definição 1 Ponto de Equilíbrio de um Sistema Homogêneo Um ponto xe do espaço de estado x de um sistema dinâmico sem excitação externa é um ponto de equilíbrio se tiver a propriedade que uma vez o estado o tendo atingido nele permanecer para todos os tempos futuros A definição é clara em não limitar a natureza dos sistemas podem ser lineares ou não lineares variantes ou invariantes no tempo e no tempo contínuo ou no discreto A única imposição desta definição por ser de um sistema homogêneo é que não haja entrada Nas próximas seções e subseções devido ao escopo da disciplina limitam o estudo aos sistemas lineares e invariantes A Pontos de Equilíbrio de Sistemas Lineares Invariantes a Tempo Discreto e Homogêneos Como está em consideração o estudo dos pontos de equilíbrio do vetor de estado de sistemas homogêneos considerese a equação de estado homogênea de um sistema linear invariante no tempo e a tempo discreto x0 A xk x0 1 xk 1 A partir da definição 1 podese escrever que um ponto de equilíbrio deve satisfazer a relação e e A x x 2 De 2 concluise que para o sistema linear invariante e a tempo discreto a origem é sempre um ponto de equilíbrio visto que esta expressão é sempre satisfeita para 0 A 0 3 55 Examinese a existência de outros pontos de equilíbrio que não sejam a origem estabelecendo a condição de sua existência n e e 0 A x I x R 4 n e 0 A x I R 5 Observese que o que se busca é a existência de um ponto xe diferente da origem Logo é necessário que se estabeleçam as condições de sua existência De 5 concluise que para que xe 0 exista é necessário que 0 A I det 6 Com a finalidade de se compreender o significado de 6 recorrese à expressão que define o par autovalorautovetor de uma matriz quadrada i i i v Av 7 onde i v é o iésimo autovetor e i o seu correspondente autovalor Esta expressão pode ser reescrita como n i i 0 I v A R 8 Para que a expressão 8 tenha uma solução diferente do vetor nulo é necessário que 0 I det A i 9 Comparandose 6 e 9 constatase que 6 é uma expressão do tipo 9 com o autovalor igual à unidade Assim concluise que Conclusão 1 Ponto de Equilíbrio Fora da Origem em um Sistema Linear Invariante no Tempo a Tempo Discreto e Homogêneo A condição para que um sistema linear invariante no tempo a tempo discreto e homogêneo tenha um ou mais pontos de equilíbrio fora da origem é que sua matriz de estado tenha um ou mais autovalores unitários Quando a matriz possuir pelo menos um autovalor unitário o autovetor a ele correspondente será um ponto de equilíbrio Como um autovetor é definido por sua direção então o número de pontos de equilíbrio será infinito Caso existam dois autovalores unitários seriam duas direções dois autovetores de pontos de equilíbrio sendo então um plano de equilíbrio B Pontos de Equilíbrio de Sistemas Lineares Invariantes a Tempo Contínuo e Homogêneos Como está em consideração o estudo dos pontos de equilíbrio do vetor de estado de sistemas homogêneos considerese a equação de estado homogênea de um sistema linear invariante no tempo e a tempo contínuo x0 xt x0 A dt dxt 10 56 A partir da definição 1 podese escrever que um ponto de equilíbrio deve satisfazer a relação A xe dt dxe 11 Porém por definição um ponto de equilíbrio é aquele no qual o estado chega e permanece a menos que receba um estímulo externo Logo a derivada em 11 deve ser nula 0 A xe 12 Como no caso anterior a origem sempre satisfaz 12 0 A 0 3 Também como no caso anterior examinese a existência de outros pontos de equilíbrio que não sejam a origem estabelecendo a condição de sua existência Voltandose ao par autovalorautovetor apresentado em 79 constatase que a condição para que 12 tenha uma solução diferente da trivial é que 0 det A 13 Para que 13 seja verdadeira é necessário que a matriz A tenha no mínimo um autovalor nulo Assim concluise que Conclusão 2 Ponto de Equilíbrio Fora da Origem em um Sistema Linear Invariante no Tempo a Tempo Contínuo e Homogêneo A condição para que um sistema linear invariante no tempo a tempo contínuo e homogêneo tenha um ou mais pontos de equilíbrio fora da origem é que sua matriz de estado tenha um ou mais autovalores nulos Quando a matriz possuir pelo menos um autovalor nulo o autovetor a ele correspondente será um ponto de equilíbrio Como um autovetor é definido por sua direção então o número de pontos de equilíbrio será infinito Caso existam dois autovalores nulos seriam duas direções dois autovetores de pontos de equilíbrio sendo então um plano de equilíbrio C Comentário Com a apresentação da definição de pontos de equilíbrio e suas condições para os casos dos sistemas lineares e invariantes tanto a tempo contínuo quanto discreto podese passar às definições de estabilidade III Definições de Estabilidade Conforme mencionado anteriormente dois tipos de definições de estabilidade são apresentados neste capítulo O primeiro tipo diz respeito a conceitos de estabilidade associados à evolução do vetor de estado do sistema quando são usadas variáveis internas de estado O segundo tipo considera somente a evolução da saída estando pois associado à relação entradasaída A Definições de Estabilidade Associadas ao Vetor de Estado Iniciase o estudo com as definições associadas ao vetor de estado Elas estão associadas ao comportamento do vetor de estado e independem da natureza da variável tempo 57 Definição 2 Ponto de Equilíbrio Assintoticamente Estável AE O ponto de equilíbrio xe de um sistema linear e invariante no tempo é dito Assintoticamente Estável AE se qualquer que seja a condição inicial o vetor de estado tender a xe à medida que o tempo crescer Se à medida que o tempo crescer o vetor de estado tender a infinito o ponto de equilíbrio é dito instável A definição 2 estabelece categorias para pontos de equilíbrio quando a solução tende a ele ou dele se afasta infinitamente Existe outra situação no entanto que é aquela em que nenhum dos dois tipos de comportamentos ocorre Para esta situação existe a definição que se segue Conheça um pouco sobre Aleksandr Lyapunov 18571918 visitando a Wkipedia httpenwikipediaorgwikiAleksandrLyapunov Definição 3 Ponto de Equilíbrio Estável no Sentido de Lyapunov ESL O ponto de equilíbrio xe de um sistema linear e invariante no tempo é dito Estável no Sentido de Lyapunov ESL se qualquer que seja a condição inicial o vetor de estado ainda que não tendendo ao ponto de equilíbrio xe dele não se afaste tendendo a infinito Ou seja o vetor de estado se mantém dentro de uma região limitada do espaço de estado As definições 2 e 3 dizem respeito ao comportamento do vetor de estado e cobrem as três possibilidades existentes retorno ao ponto de equilíbrio afastamento em direção ao infinito ou confinamento em uma região limitada do espaço de estado A seguir é apresentada uma definição associada à relação entradasaída B Definição de Estabilidade Associada à Relação EntradaSaída Esta definição diferenciase das anteriores em dois aspectos O primeiro é que ela é associada ao comportamento descrito por uma relação entradasaída O segundo é que ela contempla o comportamento na presença da entrada enquanto as outras diziam respeito ao ponto de equilíbrio logo sem excitação aplicada ao sistema Definição 4 Estabilidade BIBO BoundedInput BoundedOutput Um sistema linear e invariante no tempo é dito ser BIBOestável se toda a entrada limitada aplicada sobre o sistema previamente relaxado gerar uma saída limitada O que esta definição tem em comum com as outras duas é que elas não especificam se os sistemas são a tempo discreto ou contínuo As duas primeiras se aplicam a quaisquer sistemas enquanto a terceira é restrita aos sistemas lineares mas há total independência da natureza da variável tempo Esta última definição é a que é comumente conhecida como estabilidade C Comentários A partir das três definições apresentadas é construído o estudo da estabilidade na disciplina de Controles e Servomecanismos As seções que seguem metodizam a abordagem da estabilidade tendo como objetivo permitir a análise de um sistema no que diz respeito a esta propriedade Interessa ao engenheiro como nos casos da controlabilidade e da observabilidade poder determinar se um dado sistema exibe esta propriedade 58 em conformidade com o conceito adequado ao caso a partir da análise de seus parâmetros feita de forma sistemática e se possível algoritmizável para poder ser calculada por computador A próxima seção trata formulação das expressões matemáticas que caracterizam as definições de estabilidade IV Expressões Matemáticas das Definições de Estabilidade Esta seção tem por finalidade determinar expressões matemáticas para cada uma das definições de estabilidade tanto para sistemas a tempo contínuo como a tempo discreto Cada uma das subseções que seguem aborda a formulação das expressões de cada uma das definições de estabilidade apresentadas Este é o passo que antecede o estabelecimento de um método algoritmizável de determinação da existência ou não de um dos tipos de estabilidade em um sistema A Expressões Matemáticas da Estabilidade Assintótica AE Para que possam ser estabelecidas as expressões matemáticas para a estabilidade assintótica é necessário que os sistemas a tempo contínuo e a tempo discreto sejam analisados separadamente Isto acontece porque as expressões que permitem calcular o vetor de estado em função de suas condições iniciais são distintas nos dois casos 1 Sistemas a tempo discreto Para que possa ser estabelecida a expressão matemática para a Estabilidade Assintótica de um sistema a tempo discreto é necessário que se considere 1 cuja solução homogênea é conhecida pois foi determinada no capítulo 2 A x 0 k x 0 k x k h 14 Desejase estabelecer um conjunto de condições sobre a matriz A de tal forma a expressar a Estabilidade Assintótica em função de suas características Para tal considerese a transformação de similaridade que diagonaliza a matriz P xk k x 15a k Q x k x P xk 1 15b P1 Q 15c Com a escolha adequada da matriz de mudança de base chegase a x P 0 x P B uk P k x P A P 1 k x 0 1 1 1 16 Na qual a matriz de estado é 0 0 0 0 0 0 a 0 0 0 a 0 0 0 a A P P A n 2 1 n 2 1 1 17 Assim podese escrever 59 0 k x k x 18 Considerase que está em questão a existência de um único ponto de equilíbrio logo este é a origem pois como concluído anteriormente se existir mais de um ponto de equilíbrio o número deles será infinito Examinase 18 para concluir que a matriz é diagonal tendo cada elemento não nulo como um de seus autovalores na potência k os termos da diagonal principal são os modos Se k x convergir para o ponto de equilíbrio então xk também o fará visto que a relação entre eles é de uma transformação de similaridade ou seja dois conjuntos de coordenadas para um mesmo ponto Ainda de 18 concluise que a condição para que k x tenda para a origem é que a matriz k tenda para a matriz nula com o k crescente Como cada termo da diagonal principal é um dos modos do sistema para que os modos sejam decrescentes é necessário que os autovalores da matriz de estado estejam dentro do círculo de raio unitário do plano complexo Relembrase que os autovalores de uma matriz não são alterados com a transformação de similaridade ou seja os autovalores de A e de são os mesmos Conclusão 3 Condições para Estabilidade Assintótica de um Ponto de Equilíbrio de um Sistema Linear Invariante no Tempo a Tempo Discreto e Homogêneo Para que o único ponto de equilíbrio origem de um sistema linear invariante no tempo e a tempo discreto seja Assintoticamente Estável é necessário que 0 lim k k 19 Para que 19 se verifique é necessário que 0 i 1 n lim k i k 20 A condição 20 só se verifica se 1 i 1 n i 21 Ou seja é necessário que todos os autovalores da matriz de estado do sistema tenham módulo menor do que a unidade o que equivale a dizer que devem estar todos localizados dentro do círculo de raio unitário do plano complexo A partir desta conclusão formulase o teorema a seguir Teorema 1 Condição de Estabilidade Assintótica do Ponto de Equilíbrio do Vetor de Estado de Sistema Linear Invariante no Tempo e a Tempo Discreto A condição necessária e suficiente para que o ponto de equilíbrio origem do sistema 1 seja Assintoticamente Estável é que todos os autovalores da matriz A tenham módulo menor do que a unidade ie todos eles devem estar dentro do círculo de raio unitário do plano complexo Caso pelos menos um dos autovalores esteja fora do círculo de raio unitário o ponto de equilíbrio é instável Uma observação é importante No caso de a matriz A possuir autovalores repetidos os modos correspondentes a eles podem ser do tipo k i k i k k i k2 k i k 1 r onde r é a multiplicidade do autovalor 60 Sabese que quando 1 i 1 n i os modos serão todos decrescentes com o k crescente Isto porque a série geométrica decresce predominantemente sobre as potências de k 2 Sistemas a tempo contínuo Para que possa ser estabelecida a expressão matemática para a Estabilidade Assintótica de um sistema a tempo discreto é necessário que se considere 10 cuja solução homogênea é conhecida pois foi determinada no capítulo 2 e t x0 t x0 t x A h 22 Desejase estabelecer um conjunto de condições sobre a matriz A de tal forma a expressar a Estabilidade Assintótica em função de suas características Para tal considerese a transformação de similaridade que diagonaliza a matriz P xt t x 23a t Q x t x P xt 1 23b P1 Q 23c Com a escolha adequada da matriz de mudança de base chegase a x P 0 x P B ut P t x P A P dt t x d 0 1 1 1 24 Na qual a matriz de estado é 0 0 0 0 0 0 a 0 0 0 a 0 0 0 a A P P A n 2 1 n 2 1 1 17 Assim podese escrever 0 e t x k x 25 Considerase que está em questão a existência de um único ponto de equilíbrio logo este é a origem pois como concluído anteriormente se existir mais de um ponto de equilíbrio o número deles será infinito Examinase 25 para concluir que a matriz é diagonal tendo cada elemento não nulo como a exponencial de seus autovalores vezes t os termos da diagonal principal são os modos Se t x convergir para o ponto de equilíbrio então xt também o fará visto que a relação entre eles é de uma transformação de similaridade ou seja dois conjuntos de coordenadas para um mesmo ponto Ainda de 25 concluise que a condição para que t x tenda para a origem é que a matriz t e tenda para a matriz nula com o t crescente Como cada termo da diagonal principal é um dos modos do sistema para que os modos sejam decrescentes é necessários que os autovalores da matriz de estado estejam no semiplano aberto da esquerda do plano complexo Relembrase que os autovalores de 61 uma matriz não são alterados com a transformação de similaridade ou seja os autovalores de A e de são os mesmos Conclusão 4 Condições para Estabilidade Assintótica de um Ponto de Equilíbrio de um Sistema Linear Invariante no Tempo a Tempo Contínuo e Homogêneo Para que o único ponto de equilibro origem de um sistema linear invariante no tempo e a tempo contínuo seja Assintoticamente Estável é necessário que 0 e t lim t 26 Para que 19 se verifique é necessário que 0 i 1 n lim e i t 27 A condição 27 só se verifica se 0 i 1 n Re i 28 Ou seja é necessário que todos os autovalores da matriz de estado do sistema tenham parte real negativa o que equivale a dizer que devem estar todos localizados dentro semiplano aberto da esquerda do plano complexo A partir desta conclusão formulase o teorema a seguir Teorema 2 Condição de Estabilidade Assintótica do Ponto de Equilíbrio do Vetor de Estado de Sistema Linear Invariante no Tempo e a Tempo Contínuo A condição necessária e suficiente para que o ponto de equilíbrio origem do sistema 10 seja Assintoticamente Estável é que todos os autovalores da matriz A tenham parte real negativa ie todos eles devem estar dentro do semiplano aberto da esquerda do plano complexo Caso pelos menos um dos autovalores esteja fora do semiplano aberto da esquerda o ponto de equilíbrio é instável Uma observação é importante No caso de a matriz A possuir autovalores repetidos os modos correspondentes a eles podem ser do tipo i e i t e i t2 e e i t 1 r onde r é a multiplicidade do autovalor Sabese que quando 0 i 1 n Re i os modos serão todos decrescentes com o t crescente Isto porque a série função exponencial decresce predominantemente sobre as potências de t B Expressões Matemáticas da Estabilidade no Sentido de Lyapunov ESL Como foi visto na seção anterior os teoremas apresentados não consideram cada um deles um caso que pode ocorrer No que diz respeito ao teorema para sistemas a tempo discreto não há menção da situação em que os autovalores estão sobre o círculo de raio unitário no plano complexo Z Já para os sistemas a tempo contínuo a situação indefinida é aquela em que os autovalores estão sobre o eixo imaginário no plano complexo S Para abordar estas duas situações são apresentadas as subseções que seguem 62 1 Sistemas a tempo discreto No caso de a matriz A possuir um ou mais autovalores sobre o círculo de raio unitário a solução de 18 tem componentes que ainda que não sejam decrescentes não são crescentes mantendo a amplitude estacionária Este é o caso coberto pela definição de estabilidade no sentido de Lyapunov ESL Um sistema linear invariante no tempo e a tempo discreto é estável no sentido de Lyapunov se ainda que não tendo seus autovalores dentro do círculo de raio unitário no plano complexo Z tenha alguns sobre o círculo sendo que as localizações dos mesmos não devem ser coincidentes ie de uma forma geral não devem existir autovalores repetitivos sobre o círculo de raio unitário Para que seja estável no sentido de Lyapunov no entanto a matriz A do sistema não pode possuir qualquer autovalor fora do círculo fechado de raio unitário 2 Sistemas a tempo contínuo No caso de a matriz A possuir um ou mais autovalores sobre o eixo imaginário a solução de 25 tem componentes que ainda que não sejam decrescentes não são crescentes mantendo a amplitude estacionária Este é o caso coberto pela definição de estabilidade no sentido de Lyapunov ESL Um sistema linear invariante no tempo e a tempo contínuo é estável no sentido de Lyapunov se ainda que não tendo seus autovalores dentro do semiplano aberto da direita no plano complexo S tenha alguns sobre o eixo imaginário sendo que as localizações dos mesmos não devem ser coincidentes ie de uma forma geral não devem existir autovalores repetitivos sobre o eixo imaginário Para que seja estável no sentido de Lyapunov no entanto a matriz A do sistema não pode possuir qualquer autovalor fora do semiplano fechado da esquerda ou seja no semiplano da direita 3 Comentários Em ambos os casos das subseções anteriores os autovalores que se localizam sobre as fronteiras circunferência de raio unitário e eixo imaginário geram soluções que são oscilantes excetuandose autovalores no ponto 1 para o caso discreto e no ponto 0 para o caso contínuo Tanto no caso das oscilações como nos outros dois recém mencionados as amplitudes são constantes As freqüências das oscilações são dependentes das localizações dos autovalores tanto para sistemas a tempo contínuo como a tempo discreto Relembrase que quando os autovalores forem complexos aparecerão aos pares conjugados devido os sistemas sob consideração serem reais Convém relembrar que no caso de autovalores repetitivos nas fronteiras podem levar ou não a modos crescentes dependendo de estarem ou não em partes desacopladas do sistema Sobre este caso não é possível fazer uma afirmativa a priori C Expressões Matemáticas da BIBOEstabilidade Neste caso como nos anteriores os sistemas a tempo discreto e os sistemas a tempo contínuo devem ser tratados separadamente Isto ocorre porque são diferentes as relações matemáticas que expressam a saída em função da entrada em cada um dos casos ainda que o conceito que embasa as soluções seja único o da linearidade com a conseqüente convolução Voltase a considerar a situação que representa a relação entradasaída para o caso monovariável que é o que será estudado em termos da BIBOestabilidade Figura 1 Relação entradasaída sinal de entrada sistema e sinal de saida para o caso monovariável Sistema u y 63 Neste caso ignoramse as variáveis de estado considerandose somente entrada e saída Pela definição da BIBOestabilidade a entrada em consideração deve ser aplicada sobre o sistema relaxado logo está em consideração somente a solução particular 1 Sistemas a tempo discreto Dos resultados de Sinais e Sistemas buscase a relação entre entrada e saída representada pelo somatório de convolução k 0 r 0 hk uk r k yk 29 O conceito de estabilidade BIBO é tal que se a entrada satisfizer à relação 0 k N uk 30 Então a saída deve satisfazer à relação 0 k M yk 31 Considerese o valor absoluto da relação 29 0 k k 0 r uk r hr yk 32 Sabese que o valor absoluto do somatório não excede o somatório dos valores absolutos então pode se modificar 32 da forma a seguir 0 k hr uk r uk r hr yk k 0 r k 0 r 33 Como a entrada é um sinal limitado 33 pode ser reescrita como 0 k hr N Nhr yk k 0 r k 0 r 34 Pela condição da estabilidade BIBO 31 é necessário que a saída se mantenha inferior ou igual ao limite superior M para o tempo crescente Ou seja a saída deve ser limitada para todo o tempo Logo podese escrever 0 k hr M N k 0 r 35 Definase N P M 36 A expressão 35 pode ser modificada para 0 P k hr k 0 r 37 Mas como mencionado a expressão 37 deve ser válida quando o tempo tende a infinito logo a relação que segue deve ser respeitada 64 hr P lim k r 0 k 38 A condição 38 impõe que lim hk 0 k 39 Voltase à resposta impulsional Sabese que ela é escrita como a soma ponderada dos modos que estão presentes na relação entradasaída Estes serão os que podem ser obtidos da função de transferência irredutível ou caso a resposta impulsional seja calculada a partir do modelo de estado os modos correspondentes ao subespaço controlável e observável Em 39 substituase hk pela soma ponderada dos modos 0 lim k 0 i k i i k 40 A satisfação de 40 requer que 0 lim k i k 41 Para que 41 seja satisfeita é necessário que todos os autovalores da matriz da parte controlável e observável do sistema que são os pólos da função de transferência tenham módulo menor do que a unidade Logo podese escrever a expressão que segue 1 i 1 n i 42 Logo chegase à conclusão que segue Conclusão 5 Condições para BIBOEstabilidade de um Sistema Linear Invariante no Tempo a Tempo Discreto Para que um sistema linear invariante no tempo e a tempo discreto seja BIBOEstável é necessário que hr P lim k r 0 k 38 Para que 38 se verifique é necessário que lim hk 0 k 39 A condição 39 só se verifica se 0 lim k i k 41 Implicando em 1 i 1 n i 42 Ou seja é necessário que todos os autovalores da matriz de estado da parte controlável e observável do sistema que são os pólos de sua função de transferência tenham módulo menor do que a unidade o que equivale a dizer que devem estar todos localizados dentro do círculo de raio unitário do plano complexo 65 2 Sistemas a tempo contínuo Como no caso dos sistemas a tempo discreto dos resultados de Sinais e Sistemas buscase a relação entre entrada e saída representada pela integral de convolução 0 d t h ut t y t 0 43 O conceito de estabilidade BIBO é tal que se a entrada satisfizer à relação 0 t N ut 44 Então a saída deve satisfazer à relação 0 t M yt 45 Considerese o valor absoluto da relação 43 0 d t h ut yt t 0 46 Sabese que o valor absoluto da integral não excede a integral do valor absoluto do integrando então podese modificar 46 da forma a seguir 0 h ut d t h ut d yt t 0 t 0 47 Como a entrada é um sinal limitado 47 pode ser reescrita como 0 N h d t h N d yt t 0 t 0 48 Pela condição da estabilidade BIBO 31 é necessário que a saída se mantenha inferior ou igual ao limite superior M para o tempo crescente Ou seja a saída deve ser limitada para todo o tempo Logo podese escrever 0 h d M t N t 49 Como no caso anterior definase N P M 36 A expressão 49 pode ser modificada para 0 h d P t t 0 50 Mas como mencionado a expressão 50 deve ser válida quando o tempo tende a infinito logo a relação que segue deve ser respeitada h d P lim t 0 t 51 66 A condição 51 impõe que lim ht 0 t 52 Voltase à resposta impulsional Sabese que ela é escrita como a soma ponderada dos modos que estão presentes na relação entradasaída Estes serão os que podem ser obtidos da função de transferência irredutível ou caso a resposta impulsional seja calculada a partir do modelo de estado os modos correspondentes ao subespaço controlável e observável Em 39 substituase ht pela soma ponderada dos modos 0 e lim n 0 i t i t i 53 A satisfação de 53 requer que 0 lim e ti t 54 Para que 54 seja satisfeita é necessário que todos os autovalores da matriz da parte controlável e observável do sistema que são os pólos da função de transferência tenham parte real negativa Logo podese escrever a expressão que segue 0 i 1 n Re i 55 Logo chegase à conclusão que segue Conclusão 6 Condições para BIBOEstabilidade de um Sistema Linear Invariante no Tempo a Tempo Contínuo Para que um sistema linear invariante no tempo e a tempo contínuo seja BIBOEstável é necessário que h d P lim t 0 t 51 Para que 51 se verifique é necessário que lim ht 0 t 52 A condição 39 só se verifica se 0 lim e ti t 54 Implicando em 0 i 1 n Re i 55 Ou seja é necessário que todos os autovalores da matriz de estado da parte controlável e observável do sistema que são os pólos de sua função de transferência tenham parte real negativa o que equivale a dizer que devem estar todos localizados dentro do semiplano aberto da esquerda do plano complexo 67 3 Comentários As duas subseções anteriores estabeleceram as condições matemáticas para a existência da BIBO Estabilidade em um sistema linear e invariante no tempo Algumas observações a respeito destes resultados são importantes para a compreensão dos mesmos A condição obtida para a Estabilidade BIBO é a mesma que foi estabelecida para a Estabilidade Assintótica tanto para sistemas a tempo contínuo parte real negativa como a tempo discreto módulo inferior à unidade O que se diferencia de um caso para o outro são as entidades sobre as quais se aplica a condição No caso da Estabilidade Assintótica são os autovalores da matriz de estado e no caso da BIBOEstabilidade são os pólos da função de transferência que são os autovalores da matriz de estado que pertencem à parte controlável e observável do sistema Assim quando um sistema for controlável e observável as duas condições de estabilidade são iguais e uma implica na outra Neste caso o polinômio do denominador da função de transferência é igual ao polinômio característico da matriz de estado Se o sistema for não controlável eou não observável então a existência da BIBOEstabilidade não garante a Estabilidade Assintótica pois os pólos serão um subconjunto dos autovalores da matriz de estado e garantias sobre os primeiros não têm implicações sobre os últimos No caso do sistema não controlável eou não observável a existência de Estabilidade Assintótica implica na garantia de BIBOEstabilidade pois a primeira contempla todos os autovalores da matriz de estado até mesmo os que não são pólos da função de transferência Dos comentários concluise que a Estabilidade Assintótica é um conceito mais forte do que a BIBO Estabilidade D Considerações Sobre as Expressões Matemáticas A partir dos resultados obtidos nas subseções anteriores concluise que a determinação da natureza da estabilidade que um sistema apresenta ou a conclusão de que ele não apresenta qualquer tipo de estabilidade decorre da possibilidade de conhecimento da localização de raízes de polinômios No caso dos sistemas a tempo discreto interessa a localização de raízes relativas ao círculo de raio unitário centrado na origem do plano complexo Quando estiver em consideração um sistema a tempo contínuo a localização de interesse é relativa ao semiplano aberto da esquerda do plano complexo Para que tais localizações possam ser fácil e algoritmicamente determinadas existem alguns métodos bastante utilizados e que serão apresentados no capítulo que segue É claro que as soluções numéricas são sempre possíveis desde que existam ferramentas para calcular as mesmas V Referências 01 Benjamin C Kuo Automatic Control Systems PrenticeHall Estados Unidos 1984 02 David G Luenberger Introduction to Dynamic Systems Wiley Estados Unidos 1979 03 Chi T Chen Introduction to Linear System Theory HRW Estados Unidos 1970