Sterowanie predykcyjne systemami nieliniowymi03home.agh.edu.pl/~pba/pdfdoc/Sterowanie predykcyjne...

Post on 27-Feb-2019

227 views 0 download

Transcript of Sterowanie predykcyjne systemami nieliniowymi03home.agh.edu.pl/~pba/pdfdoc/Sterowanie predykcyjne...

Sterowanie predykcyjne systemami nieliniowymiAlgorytmy z adaptacj ą wska źnika jako ści

Piotr BaniaAkademia Górniczo-Hutnicza

Katedra Automatykipba@ia.agh.edu.pl

http://home.agh.edu.pl/~pba

Seminarium Polskiego Towarzystwa Matematycznego, Kr aków – Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Google„Model predictive control” (MPC) – 343000 odno śników

„Nonlinear model predictive control” (NMPC) – 58500 od nośników

„Receding horizon control” (RHC) – 58900 odno śników

„Sterowanie predykcyjne" – 264 odno śniki

„Regulacja predykcyjna"– 243 odno śniki

Sterowanie predykcyjne stanowi przedmiot bardzo intensywnych badań

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Czym jest sterowanie predykcyjne?

Sterowanie predykcyjne (MPC – model predictive contr ol lub RHC – receding horizon control ) jest metod ą sterowania systemami dynamicznymi, polegaj ącą na cyklicznym rozwi ązywaniu odpowiednio sformułowanego zadania sterowania optym alnego (ZSO). Pocz ątkowa cz ęśćrozwi ązania (funkcji steruj ącej) podawana jest na wej ścia obiektu, po czym cał ą procedur ę powtarza si ę dla nowego aktualnie wyznaczonego stanu obiektu.

))((),())(,,( iii

Tt

t

iiii

ii TtxqdtuxLtxTuJ

ii

i

++= ∫+Wskaźnik jako ści

))(),(()( tutxftx =& Utu ∈)(

0,0,; maxminmaxmin ><≤≤∈= uuuuuRuU m

nRXtx ⊂∈)(Prawa strona ci ągła , spełnia globalny warunek Lipschitza,f(0,0)=0,

SystemX∈0

Ograniczenia na stan ko ńcowy Ω∈+ )( ii Ttx Zbiór dopuszczalnych stanów ko ńcowych

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Regulator optymalny u=k(x) mo Ŝna wyznaczy ć na drodze rozwi ązania równania Hamiltona-Jacobiego-Bellmana, jednak Ŝe znalezienie rozwi ązania jest praktycznie niemo Ŝliwe dla bardziej skomplikowanych zada ń z ograniczeniami. (Mayne et. al. 2000)

Uzasadnienie sterowania predykcyjnego

Znacznie łatwiejsze jest cykliczne rozwi ązywanie zadania sterowania optymalnego ze skończonym horyzontem przy zadanym warunku pocz ątkowym. (Mayne et. al. 2000)

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

•Pierwsze wzmianki Lee and Markus1967 Foundations of optimal control theory

•Kalman1960 – „optimality does not imply stability” ale po wprowadzeniu twardych ograniczeń na stan końcowy moŜna uzyskać stabilny regulator

•Pakiet IDCOM (identification and command) – model linowy dyskretny w postaci odpowiedzi imulsowej i kwadratowa funkcja kosztu Richalet et al. 1976

•DMC – Dynamic Matrix Control; Culter&Ramaker 1980, Prett&Gilette 1980 model liniowy dyskretny w postaci odpowiedzi skokowej , ograniczenia stanu i sterowania

•QDMC – Quadratic Dynamic Matrix Control , zadanie programowania kwadratowego z uwzględnieniem ograniczeń stanu i sterowania, model liniowy dyskretny w czasie Garcia & Morshedi 1986

•GPC – generalized predictive control – Clarke & Mothadi 1987 – model linowy dyskretny w postaci transmitancji z uwzględnieniem zakłóceń i estymacją parametrów na bieŜąco

Rozwój algorytmów predykcyjnych

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

•W systemach z czasem ciagłym przełom nastapił po opublikowaniu w 1990 r. artykułu

• Mayne & Michalska 1990 Receding Horizon Control of Non-linear Systems –ograniczenia stanu końcowego, nieliniowy model obiektu w postaci układu równań róŜniczkowych,

• Quasi infinity horizon model predictive control – Chen & Algöwer 1998 – Model nielinowy w postaci równań róŜniczkowych, kwadratowy wskaźnik jakości, funkcja kary za niespełnienie warunku końcowego, wskaźnik jakości wybrany tak aby dobrze oszacować koszt dla zadania z nieskończonym horyzontem

• Suboptimal Model Predictive Control (Feasibility Implies Stability) – Scokaert, Mayne, Rao1999 – nielinowe systemy dyskretne , suboptymalne sterowania dopuszczalne pozwalają uzyskać stabilność

• Bania 2007 –QTO-RHC Quasi Time Optimal Receding Horizon Control suboptymalnyalgorytm predykcyjny dla systemów ciągłych w czasie dla zadań czasooptymalnych

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Zastosowania algorytmów predykcyjnych

•Przemysł chemiczny, petrochemiczny, metalurgia•Lotnictwo•Robotyka•Loty kosmiczne

•Qin & Badgwel 1997 An overview of industrial model predictive control technology• Morari & Lee 1999 Model predictive control : Past, present and and future•Mayne et al. 2000 Constrained model predictive contr ol: Stability and optimality •Tatjewski P. 2002 Sterowanie zawansowane obiektów p rzemysłowych•Maciejowski J. M. 2002 Predictive control

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Przykład 1.1.2. Utrata stabilności. Weźmy prosty system liniowy (niestabilny)

0,)0(,)(),(),()()( 0 ≥=∈+= txxRtutxtutxtx& . (1.1.5)

Niestabilno ść w sterowaniu predykcyjnym

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

1. Sterowanie i trajektoria składaj ą się z kawałków sterowa ń i trajektorii b ędących rozwi ązaniami kolejnych ZSO.

2. Rozwi ązanie uzyskane po zamkni ęciu sprz ęŜenia zwrotnego mo Ŝe być istotnie róŜne od rozwi ązania problemu sterowania w chwili pocz ątkowej.

3. Wydłu Ŝenie horyzontu sterowania powoduje, Ŝe trajektoria systemu zamkni ętego zbli Ŝa się do optymalnej trajektorii uzyskanej w chwili pocz ątkowej

4. Skracanie horyzontu z lewej strony powoduje Ŝe trajektoria systemu zamkni ętego jest równa optymalnej trajektorii uzyskanej w chwili początkowej (przy braku zakłóce ń).

5. Rozwi ązania kolejnych problemów ZSO mog ą się od siebie znacznie ró Ŝnić RóŜnice pomi ędzy rozwi ązaniami kolejnych ZSO staj ą się pomijalnie małe przy odpowiednim wyborze horyzontu T i liczby ρρρρ.

6. Zbyt krótki horyzont mo Ŝe spowodowa ć utrat ę stabilno ści.

7. Wprowadzenie funkcji kary za niespełnienie warunku ko ńcowego pozwala ustabilizowa ć system nawet przy krótkich horyzontach.

Wnioski z przykładów

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Cel badań

Skonstruowa ć uniwersalny stabilny i odporny algorytm sterowania predykcyjnego umo Ŝliwiaj ący realizacj ę zadań:

•Sterowania czasooptymalnego,•Sterowania docelowego,•Stabilizacji po osi ągni ęciu otoczenia celu,

przy mo Ŝliwie niskim nakładzie oblicze ń.

Algorytmy predykcyjne były zwykle stosowane do stabilizacji systemów nieliniowych.Przedstawiony cel badań stanowi znaczące poszerzenie zakresu stosowalności algorytmów predykcyjnych i nie był dotychczas analizowany w literaturze.

Uzasadnienie

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

A. Wymagania „sztywne”1. Stabilność ( w odpowiednim sensie)2. Odporność (w odpowiednim sensie)

B. Sterowanie czasooptymalne (docelowe) i stabiliza cja są trudne do pogodzenia w jednym algorytmie

Stabilizacja • Celem jest minimalizacja odchyłek stanu

w otoczeniu punktu równowagi• Synteza regulatora na podstawie

lokalnego modelu linowego, mniejsza wraŜliwość na zakłócenia

• Na ogół nieskończony horyzont sterowania• Przy nieskończonym horyzoncie

implikuje stabilność AP.

Sterowanie optymalne i docelowe1. Celem jest osiągnięcie zadanego

stanu końcowego 2. DuŜa wraŜliwość rozwiązań optymalnych 3. Zadanie ze skończonym horyzontem4. Na ogół nie implikuje stabilności AP

(Kalman 1960) – optimality does not implies stability)

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

X(t)*

i X(t )*i-1

X Ti(t+ )i i

Start adaptacji gdy trajektoria osiąga zbiór B

Strategia stabilizacji Strategia czasooptymalna lub docelowa

Adaptacja wska źnika jako ści:Doprowadzi ć system do otoczenia celu i stopniowo zmienia ć strategi ę sterowania „wł ączając” do wska źnika jako ści składnik stabilizuj ący (np. całka z kwadratu odchyłek stanu)

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Zadanie sterowania optymalnego musi by ć rozwi ązywane on-line

co czas δδδδ !!!

PODSTAWOWY PROBLEM

C. Minimalizacja nakładu oblicze ń

Wniosek

NaleŜy wykorzystać rozwiązania suboptymalne do redukcji nakładu obliczeń oraz maksymalnie uprościć zadanie sterowania optymalnego

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

DuŜy nakład obliczeń, zadanie nieskończenie wymiaroweniepotrzebne iteracje pod koniec procesu optymalizacji,ale gwarantowana stabilność.

Redukcja nakładu obliczeń, prostszy problem sterowania,moŜliwość przerwania obliczeńpo znalezieniu rozwiązania dopuszczalnego.

Niskowymiarowa parametryzacja sterowania za pomocą wielomianów trzeciego stopnia.

Sterowanie optymalne z punktu do punktu

Zadanie oryginalne

Suboptymalne sterowanie dopuszczalne, z punktu do zbioru końcowego.

Zadanie przekształcone

Czy sterowania suboptymalne zachowują stabilność i odporność?

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Lemat 2.3.1.Zachodzi implikacja WS1 WS3.⇒

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Rozwiązania zmierzają do kuli K(0,R(ε)) i pozostają w tej kuli,Promień kuli jest tym mniejszy im mniejsze są zakłócenia

Wpływ zakłóceń Przewidywana poprawa przy braku zakłóceń

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Wnioski

•Stosowanie rozwiązań suboptymalnych nie narusza stabilności i odporności algorytmu predykcyjnego

•Procedura Π moŜe zakończyć obliczenia gdy

W praktyce optymalizujemy aŜ do wyczerpania limitu czasu

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Algorytm QTO-RHC (Quasi Time Optimal Receding Horizon Control )Zmienna strategia sterowania

Adaptacja wskaźnika jakości,regularne przejście od sterowania czasooptymalnego do stabilizacji

Ograniczenie stanu końcowegojest realizowane przez dobórwspółczynnika kary ρ.

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

•W początkowej fazie sterowanie jest zbliŜone do czasooptymalnego;

•Po osiągnięciu zbioru B (zadawanego przez uŜytkownika) rozpoczyna się adaptacja wskaźnika jakości, algorytm przechodzi do fazy stabilizacji zwiększając współczynnik εi i włączając do wskaźnika jakości człon stabilizujący;

•Horyzont zmierza do wartości minimalnej Tmin;

•Wskaźnik jakości zmierza do zera;

•Współczynnik kary ρ ulega zmianie co najwyŜej raz;

•JeŜeli funkcja podcałkowa we wskaźniku jakości jest kwadratowa i prawa strona równań stanu jest afiniczna względem sterowania, to sterowania generowane przez algorytm zmierzają do rozwiązań problemu liniowo – kwadratowego ze skończonym horyzontem sterowania dla systemu zlinearyzowanego w otoczeniu zera.

Regulator zmierza asymptotycznie do regulatora LQ

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Algorytm optymalizacji MSE - Monotone Structural Evolution(Korytowski, Szymkat, Turnau)

Algorytm MSE jest bezpośrednią metodą rozwiązywania zadań sterowania optymalnegodla systemów opisywanych równaniami róŜniczkowymi zwyczajnymi przy ograniczeniach stanu i sterowania.

Struktura sterowania: łuki graniczne, wewnętrzne, singularne oraz punkty podziału

•Łuk graniczny : wartość sterowania i końce przedziału, 2 parametry;•Łuk wewnętrzny: wielomian stopnia 1 lub 3 oraz końce przedziału – max. 6 parametów;•Łuk singularny: us(x,ψ) końce przedziału, dwa parametry ;

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

•Przy ustalonej strukturze sterowania poszukuje się metodami gradientowymi (BFGS)minimum wskaźnika jakości Q(p), gdzie p jest wektorem parametrów sterowania•Gradient wskaźnika jakości wylicza się na drodze numerycznego całkowania równań stanu i równań sprzęŜonych •W trakcie optymalizacji wywoływane są procedury generacji i redukcji

•Generacja szpilkowa – wstawienie nowego „krótkiego” łuku•Generacja jednowęzłowa – wstawienie nowego węzła •Generacja płaska – wstawienie łuku wewnętrznego na łuku granicznym•Generacja wielomianowa – zwiększenie o 2 stopnia wielomianu opisującego dany łuk wewnętrzny

Efektywność generacji: Przyrost kwadratu normy gradientu przed i po generacjiWarunki generacji – czy dana generacja jest dopuszczalna i minimalnie efektywna

•Po generacji następuje zmiana struktury sterowania i zmiana wymiaru przestrzeni decyzyjnej

•Proces poszukiwania kontynuuje się w nowej przestrzeni aŜ do następnej generacji bądź spełnienia warunków koniecznych optymalności

•Procedury redukcji – usuwanie łuków o zerowej długości – zmiana struktury

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

1. Sterowanie początkowe oraz antygradient wskaźnika jakości

2. Generacja szpilkowa na drugim sterowaniu

3. W następnej iteracji nowy łuk „poszerza” się

4. Po kilkunastu iteracjach wystąpiła redukcja pierwszego łuku oraz generacja nowego łuku granicznego na końcu

Przykład generacji szpilkowej

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

1. Sterowanie tuŜ przed generacją 2. Efektywność generacji jednowęzłowej

3. Wstawienie nowego węzła w punkcie o maksymalnej efktywności

Przykład generacji jednowęzłowej

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

•Niski wymiar przestrzeni decyzyjnej zwykle <100 dobierany dynamicznie w trakcie procesu optymalizacji

•Szybka zbieŜność w porównaniu z metodą strzałów

•Wskaźnik jakości monotonicznie maleje w kolejnych iteracjach

•MoŜliwość zastosowania w czasie rzeczywistym

•Wada – duŜy nakład pracy analitycznej – wyznaczenie równań sprzęŜonych i wzorów na sterowania singularne

•Przy większej liczbie sterowań (>4) znacząco rośnie nakład obliczeń

Własności metody MSE

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Kąt wahadła

PołoŜenie wózka

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Porównanie z regulatorem LQ

Pokaz

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Pokaz

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Maksymalizacja stosunku masy końcowej do początkowej

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007Pokaz

Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Dziękuję za uwagę