À REDE NEURAL COM DINÂMICA INTERNA - fei.edu.br · onde k é o instante de amostragem, A é de...

6
Depart. de Engenharia Elétrica Univ. Federal do Pará Belém-Pará [email protected] 40. SBAI- Simpósio Brasileiro de Automação Inteligente , São Paulo, SP, 08-10 de Setembro de 1999 IDENTIFICAÇÃO DE SISTEMAS ORIENTADOS À BLOCOS ATRAVÉS DE REDE NEURAL COM DINÂMICA INTERNA R. C. L. de Ollveíra', F. M. de Azevedo'', J. M. Barreto", J. A. L. Barreiros! lLab. de Controle e Sistemas 2Grupo de Pesquisa Eng. 3Depart. de Informática e Biomédica Estatística Depart. de Engenharia Elétrica Univ. Federal de Santa Catarina Univ. Federal de Santa Catarina Florianópolis - Santa Catarina Florianópolis - Santa Catarina [email protected] azevedotãgpeb.ufsc.br Keywords : non-linear process, neural networks, block- oriented systems, identification. Resumo - Processos dinâmicos não-lineares orientados à blocos são identificados através de uma rede neural artificial (RNA) com dinâmica interna, a partir das medidas de entrada e saída do processo . Palavras Chaves: process os não-lineares, rede neural, sistema orientado à blocos, identificação. Abstract - Identifícation of biock-oriented nonlinear systems is achieved by a new rnodel of Iocally recurrent globaIly feedforward neural network only with input/output measurements . 1 INTRODUÇÃO modelos não-lineares formados pela combinação de blocos não-lineares estáticos e blocos dinâmicos lineares (Billings e Fakhouri, 1978). Exemplos destes modelos são : modelo de Wiener (Sbárbaro e Johansen, 1997), modelo de Hammerstein (Âstrõm e Wittenmark, 1995), modelo Wiener-Hammerstein (Haber e Unbehauen, 1990) e modelo Hammerstein-Wiener (Bai, 1998), como observados na figura a seguir . Oin1mia Uour H NIk>L.inearid1dcE.stática Ca)Modelo &:: W.o.I..bearidadcEsWic.a H Oicl.Jn)QLine.tr F+- (b)MMdodeHm::menr;tcio Dtn1mk:&U neu H NJ<>.l.louri dade&Ulica H Dln1mica Lln e.v F (c) Modclode Wlcncr-lWnmc:nttln NJo.Uneatidide EcWia H Dinlmk:a11Dcar H Nao.UDClridadc:: ERMk:z A complexidade e diversidade dos sistemas não-lineares podem ser consideradas como .as razões para a não existência de uma teoria geral de identificação não-linear (Sj õberg, 1995). Devido a estes fatos é importante estudar · e desenvolver métodos para identificar classes de sistemas não-lineares. Existem basicamente duas linhas mestras no desenvolvimento de métodos para identificar processos não-lineares. A primeira delas é o uso de uma descrição geral para representar o processo não-linear. Típicas representações não-lineares gerais são as séries de Vo ltem e expansão de Wiener (Schetzen, 1980), e as RNA's (Sjõberg, 1995). O uso prático destes modelos envolve a decisão de quais termos da s érie.de Volterra e da expansão de Wiener serão utilizados, ou então qual a topologia da rede neural, para uma dada aplicação . Não existem receitas para guiar esta seleção da estrutura do modelo não-linear quando ausência de conhecimento sobre .0 processo identificado (BilIings e Chen, 1995). A segunda linha é considerar classes especiais de modelos não- lineares, tais como sistemas bilineares (Dunoyer et alii, 1997), sistemas affine (Liu e Celikovsky, 1997), etc. Uma das classes de sistemas não-lineares mais estudadas é aquela que considera 197 Figura 1 - Modelos Não-Lineares orientados à blocos Nestes modelos apenas os sinais de entrada e de saída são disponíveis . Todos os outros sinais intermediários não são disponíveis. Estes modelos são do tipo caixa-cinza porque existe o conhecimento prévio da sua estrutura. Estes modelos podem servir para aproximar processos que são encontrados em algumas aplicações importantes , tais como : controle de pH (pajunen, 1994), fluxo de fluidos (Zhang e Bai, 1996), sistemas lineares com sensores não-lineares (Doeblin, 1983), dentre outros. 2 IDENTIFICAÇÃO DE PROCESSOS ORIENTADOS À BLOCOS ' Estes modelos orientados à blocos são identificados por métodos paramétricos e não-paramétricos. Os métodos paramétricos tratam a não-linearidade como sendo do tipo polinomial finita, de ordem conhecida e o sistema com uma única entrada. Neste caso, o algoritmo de identificação das partes lineares e não-lineares são dependentes computacionalmente, ou seja, os parâmetros de uma parte são

Transcript of À REDE NEURAL COM DINÂMICA INTERNA - fei.edu.br · onde k é o instante de amostragem, A é de...

Page 1: À REDE NEURAL COM DINÂMICA INTERNA - fei.edu.br · onde k é o instante de amostragem, A é de dinâmica nx n, B éo v r entradanxl, u(k) é de entrada , x(k) éo vetor de estados

Depart. de Engenharia ElétricaUniv. Federal do Pará

Belém-Pará[email protected]

40. SBAI- Simpósio Brasileiro de Automação Inteligente , São Paulo, SP, 08-10 de Setembro de 1999

IDENTIFICAÇÃO DE SISTEMAS ORIENTADOS À BLOCOS ATRAVÉS DEREDE NEURAL COM DINÂMICA INTERNA

R. C. L. de Ollveíra', F. M. de Azevedo'', J. M. Barreto", J. A. L. Barreiros!lLab. de Controle e Sistemas 2Grupo de Pesquisa Eng. 3Depart. de Informática e

Biomédica EstatísticaDepart. de Engenharia Elétrica Univ. Federal de Santa Catarina

Univ. Federal de Santa Catarina Florianópolis - Santa CatarinaFlorianópolis - Santa Catarina [email protected]

azevedotãgpeb.ufsc.br

Keywords : non-linear process, neural networks, block-oriented systems, identification.

Resumo - Processos dinâmicos não-lineares orientados àblocos são identificados através de uma rede neural artificial(RNA) com dinâmica interna, a partir das medidas de entrada esaída do processo .

Palavras Chaves: processos não-lineares, rede neural, sistemaorientado à blocos, identificação.

Abstract - Identifícation of biock-oriented nonlinear systems isachieved by a new rnodel of Iocally recurrent globaIlyfeedforward neural network only with input/outputmeasurements .

1 INTRODUÇÃO

modelos não-lineares formados pela combinação de blocosnão-lineares estáticos e blocos dinâmicos lineares (Billings eFakhouri, 1978). Exemplos destes modelos são : modelo deWiener (Sbárbaro e Johansen, 1997), modelo de Hammerstein(Âstrõm e Wittenmark, 1995), modelo Wiener-Hammerstein(Haber e Unbehauen, 1990) e modelo Hammerstein-Wiener(Bai, 1998), como observados na figura a seguir .

Oin1mia Uour H NIk>L.inearid1dcE.stática

Ca)Modelo &::

W.o.I..bearidadcEsWic.a H Oicl.Jn)QLine.tr F+-(b)MMdodeHm::menr;tcio

Dtn1mk:&UneuH NJ<>.l.louri dade&Ulica H Dln1mica Llne.vF(c) Modclode Wlcncr-lWnmc:nttln

NJo.Uneatidide EcWia HDinlmk:a11DcarHNao.UDClridadc:: ERMk:z

A complexidade e diversidade dos sistemas não-linearespodem ser consideradas como .as razões para a não existênciade uma teoria geral de identificação não-linear (Sjõberg, 1995).Devido a estes fatos é importante estudar · e desenvolvermétodos para identificar classes de sistemas não-lineares.

Existem basicamente duas linhas mestras no desenvolvimentode métodos para identificar processos não-lineares. A primeiradelas é o uso de uma descrição geral para representar oprocesso não-linear. Típicas representações não-lineares geraissão as séries de Voltem e expansão de Wiener (Schetzen,1980), e as RNA's (Sjõberg, 1995). O uso prático destesmodelos envolve a decisão de quais termos da série.de Volterrae da expansão de Wiener serão utilizados, ou então qual atopologia da rede neural, para uma dada aplicação . Nãoexistem receitas para guiar esta seleção da estrutura do modelonão-linear quando há ausência de conhecimento sobre .0processo identificado (BilIings e Chen, 1995).

A segunda linha é considerar classes especiais de modelos não-lineares , tais como sistemas bilineares (Dunoyer et alii, 1997),sistemas affine (Liu e Celikovsky, 1997), etc. Uma das classesde sistemas não-lineares mais estudadas é aquela que considera

197

Figura 1 - Modelos Não-Lineares orientados à blocosNestes modelos apenas os sinais de entrada e de saída sãodisponíveis . Todos os outros sinais intermediários não sãodisponíveis. Estes modelos são do tipo caixa-cinza porqueexiste o conhecimento prévio da sua estrutura.

Estes modelos podem servir para aproximar processos que sãoencontrados em algumas aplicações importantes , tais como :controle de pH (pajunen, 1994), fluxo de fluidos (Zhang e Bai,1996), sistemas lineares com sensores não-lineares (Doeblin,1983), dentre outros.

2 IDENTIFICAÇÃO DE PROCESSOSORIENTADOS À BLOCOS '

Estes modelos orientados à blocos são identificados pormétodos paramétricos e não-paramétricos. Os métodosparamétricos tratam a não-linearidade como sendo do tipopolinomial finita, de ordem conhecida e o sistema com umaúnica entrada. Neste caso, o algoritmo de identificação daspartes lineares e não-lineares são dependentescomputacionalmente, ou seja, os parâmetros de uma parte são

Page 2: À REDE NEURAL COM DINÂMICA INTERNA - fei.edu.br · onde k é o instante de amostragem, A é de dinâmica nx n, B éo v r entradanxl, u(k) é de entrada , x(k) éo vetor de estados

(8)

Camada de Salda. Camada de Entrada Camada In\Crn1cdiária

Por conter neurônios com dinâmica linear e com não-linearidade estática o modelo neural da figura 3 estácompletamente adequado para implementar modelos deprocessos orientados à bloco s. A figura a seguir mostra como arede neural implementa os quatro modelos da figura 1.

Existem na literatura trabalhos que utilizam RNA's naidentificação de processos orientados à blocos (Al-Duwaish etalii, 1996). Entretanto nestes trabalho a RNA é do tipofeedforward multicamadas estática, e serve para identificarapenas a parte não-linear estática do processo, a parte dinâmicalinear é identificada através de um modelo ARMA com o usodo algoritmo dos mínimos quadrados recursivos.

ou,

Figura 3. RNA com dinâmica interna

4 IDENTIFICAÇÃO NEURAL

y(k) =N[W,x(k -I),u(k -I)] (9)

que formaliza o modelo dado pelas equações (1) e (2) . Oalgoritmo de aprendizado (De Oliveira et alii, 1997) ajustará oselementos de W de tal forma que N(.) "" <1>(.).

O uso da rede neural com dinâmica interna na implementaçãode modelos para processos orientados à blocos tem as seguintescaracterísticas : método de identificação unificado para osmodelos da figura 1; método de identificação que devido atopologia das RNA's serve para identificar sistemas SISO eMIMO; a partir da capacidade de aproximação não-linear dasRNA's, não existe restrições quanto ao tipo de não-linearidadeestática presente no processo; permite a identificaçãosimultânea dos blocos dinâmicos lineares e dos blocos não-lineares estáticos. A aplicabilidade da identificação neural paraesta classe de processos é ilustrada através de vários exemplossimulados.

5 EXEMPLOS SIMULADOSO procedimento de identificação neural é mostrado na figura 5. Para validar o modelo gerado pela RNA com dinâmicainterna, é utilizado um conjunto de testes de validação propostopor BilIings e Chen (1995). Estes testes são representados poralgumas estimativas de funções correlações .amostradas, quedeterminam a qualidade do modelo encontrado.

(1)(2)

(3)

(4)

(5)

(6)

sarda.r----,

40. SBAI- Simpósio Brasileiro de Automação Inteligente, São Paulo, SP, 08-10 de Setembro de 1999

considerados constantes enquanto os parâmetros da outra parte com,são determinados (Ãstrõm e Wittenrnark, 1995) .

net x y

Figura 2 - Modelo de neurônio artificialDado um processo, representado por,

x(k + I) =.Ax(k)+ Bu(k)=

Na tentativa de superar alguns destes problemas e apresentarum método de identificação unificado para os quatro modelosnão-lineares mostrados na figura 1, este trabalho apresenta ummodelo neural com dinâmica interna como uma alternativapara a modelagem de processos orientados à blocos.

A RNA utilizada inclui neurônios dinâmicos, responsáveis peladinâmica linear, e neurônios estáticos, responsáveis pela não-linearidade estática. O algoritmo que ajusta os parâmetros daRNA, de forma a tomar a saída da rede igual a saída doprocesso, é do tipo backpropagation.

A figura 2 mostra um modelo geral do neurônio artific ial (DeAzevedo , 1997) . Este modelo possibilita a inclusão dedinâmica através da função de ativação, responsável peloestado do neurônio, e apre senta a função de saída estática quegera o sinal de sa ída do neurônio. Uma RNA com dinâmicaintern a, que utiliza este modelo de neurônio é vista na figura 3.

Embora estes métodos de identificação, paramétricos ou não-paramétricos, tenham sido desenvolvidos para sistemasorientados à blocos, os mesmos não são aplicadosindistintamente para os quatro tipos de modelos da figura 1.Por exemplo, os procedimentos de identificação desenvolvidospara o modelo de Wiener-Hammerstein (Billings e Fakhouri,1978), modelo de Hammerstein (Rangan et alii, 1995) emodelo de Wiener (Sbárbaro e Johansen, 1997) não se aplicamaos modelos de Hammerstein-Wiener, devido a existência deduas não-linearidades. Já o método desenvolvido para omodelo de Hammestein s6 se aplica ao modelo de Wiener se anão-linearidade deste for inversível (Greblick, 1992).

3 RNA COM DINÂMICA INTERNA

onde k é o instante de amostragem, A é a matriz de dinâmicanxn, B é o vetor entradanxl, u(k) é o sinal de entrada, x(k) é ovetor de estados nxl, y(k) é o sinal de saída, e <D(.) é a funçãonão-linear de saída que realiza o mapeamento 1, omesmo pode ter um modelo representado pela RNA da figura3. Da figura 3 tem-se que,

S;(k)=h[x;(k)]1)= qlJei(1q+... ...+

+ Tttt(k:)net;(k) = wh/l(k)

ou,

O sinal de saída da RNA será,

y(k) =1WSh[Ax(k - 1) +W1u(k-I)] (7)

198

Page 3: À REDE NEURAL COM DINÂMICA INTERNA - fei.edu.br · onde k é o instante de amostragem, A é de dinâmica nx n, B éo v r entradanxl, u(k) é de entrada , x(k) éo vetor de estados

40. SBAI- Simpósio Brasileiro de Automação Inteligente, São Paulo, SP. 08-10 de Setembro de 1999

(12)

coletadas para um sinal .de entraàa do tipo senoidal comomostrado na equação abaixo (NA é o número de amostras).

j2sen( 2 k tr )+0.2 ,kSlOOll(k) = NAl 4

(2ktr )2sen -- +0.2 ,k>lOONAl2

A RNA utilizada é formada por 4 camadas de neurônios : aprimeira camada apresenta um único neurônio com funçãoativação identidade, significando um neurônio estático, efunção de saída do tipo tangente hiperbólica; a segunda camadatem dois neurônios com função ativação do tipo equação adiferenças de primeira ordem, onde a entrada do neurônio éafetada pelo estado do próprio neurônio, equações (13) e (14),e função de saída do tipo tangente hiperbólica;

xj(k+l) =aiixj(k) +net;(k) (13)

A=[oJl O] (14)O 0 22

a terceira camada contem seis neurônios com função ativaçãoidentidade, significando neurônios estáticos, e função de saídado tipo tangente hiperbólica; a última camada tem um úniconeurônio com função ativação identidade, significando umneurônio estático, e função . de saída do tipo tangentehiperbólica.

A identificação se deu em duas etapas : uma sessão detreinamento, onde a RNA teve os seus pesos ajustados emfunção dos dados coletados e outra sessão onde foi calculada aestimativa das funções correlações amostradas. Os resultadossão mostrados a seguir. A figura 6 mostra o comportamento daRNA após o treinamento (195077 iterações) e a figura 7 mostraa estimativa das funções correlações cruzadas. O modelo éadequado se todas as estimativas estiverem entre as linhastracejadas, que é a banda de confiança (Billings et alii, 1992).

5.2 Modelo de Wiener

&<nd,

(b)RNA implementando um modelo de Hammerstein

(c) RNA implementando um modelo de Wiener-Hammerstein

(a) RNA implementando um modelo de Wiener

(d) RNA implementando um modelo de Hammerstein-WienerFigura 4 - RNA com dinâmica interna implementandomodelos dinâmicos não-lineares orientados à blocos

»(»

O processo não-linear do tipo Wiener de segunda ordem édescrito abaixo,

XI (k +I) = -D.7XI (k)+ O.2X2 (k)+ u(k) (f5)x2(k + l ) =0.3xl(k) -0.6x2(k )

Y(k ) = sen((xI (k»)2 )+d(k) (16)o.tu

Sn al d. Salda do Proc. sso (_>. Sk\ald. Sa ldada RNA( )

0.00 40.01:1 ao.oo 120.00 160.00 200.00lnstanlt de AlnOltragel':'l

Figura 6 - RNA após de aprendizado, para o modelo deHammerstein-Wiener

Fig. 5. Identificação neural

5.1 Modelo de Hammerstein-Wienero processo não-linear do tipo Hammerstein-Wiener de segundaordem é descrito por,

Xj(k +1) = -D.7Xj(k)+O.ltanh[u(k)] (lO)(k+1)= (k) +O.21atlh[u(k)]

y(k) = [Xj(k)J' +d(k) (11)

onde k é o instante de amostragem, x(k) é o vetor de estados,u(k) é o sinal de entrada, y(k) é o sinal de saída e d(k) é asequência de ruído de medida. O ruído é simulado por umasequência pseudo-aleatória de distribuição normal com média0.0 e variância 0.0003. Este valor de variância foi escolhidopara que o ruído não deformasse completamente o sinal desaída. O conjunto de treino é formado por 200 amostras

0.00

;;;:[ ....ª

' .00

199

Page 4: À REDE NEURAL COM DINÂMICA INTERNA - fei.edu.br · onde k é o instante de amostragem, A é de dinâmica nx n, B éo v r entradanxl, u(k) é de entrada , x(k) éo vetor de estados

40. SBAI- Simpósio Brasileiro de Automação Inteligente, São Paulo, SP, 08-10 de Setembro de 1999

l ':C:J::] ":c:::J:!OO o 2OO :!m o an

Figura 7· Funções Correlações: Phi1=l1>a;('r); Pbi2=l1>ue('t");Pbi3=l1> 'Z ('t"H Phi4=l1> 'Z 2('t"); Pbi5=l1>e(f71)('t")

u e u e

o ruído é simulado de maneira análoga ao caso anterior,apenas modificando-se a variância para 0.05, O conjunto detreino é formado por 200 amostras coletadas para um sinal deentrada do tipo senoidal como mostrado na equação abaixo;

)+O.2,k $100 (17)u(k ) = (2kfr )

1.3sen -- -nz.mcoNAl2

A RNA utilizada é formada por 4 camadas de neurônios : aprimeira camada apresenta um único neurônio com funçãoativação identidade e função de saída do tipo linear comsaturação (saturação igual a 100); a segunda camada tem doisneurônios com função ativação do tipo equação a diferenças deprimeira ordem, onde a entrada do neurônio é afetada pelosestados de todos os outros neurônios dinâmicos, equações (18)e (19), e função de saída do tipo tangente hiperbólica;

Xl (k+ I)=alJxI (k)+aI2x2(k)+lletl (k) (18)X2(k+I)=a2lxI (k) +a22x2(k)+net2(k)

A = [ a11 a12J (19)a21 a22

a terceira camada contem dez neurônios com função ativaçãoidentidade e função de saída do tipo tangente hiperbólica; aúltima camada tem um único neurônio com função ativaçãoidentidade e função de saída do tipo linear com saturação(saturação igual a 100).

Como anteriormente, a identificação se deu em duas etapas :treinamento e cálculo da estimativa das funções correlaçõesamostradas. A figura 8 mostra o comportamento da RNA apóso treinamento (26852 iterações) e a figura 9 mostra aestimativa das funções correlações cruzadas.

Sinal d. Salda doProeeuo(_)a Slnald. Saldada ANA( )

" 'JI," ,1\ ,

I V'

•. o - - N b - - - -- - -. f - - _.

.1 .1·:200 · tOO o 100 200 -200 ·100 o 100 200-Q. - - Q. - --

·1 .1-:DO -tce o '00 200 -2)0 ·100 o 100 200

Q.. • •_ •

•1o $0 "XI 1:lO 200

Figura 9 - Funções Correlações: Phi1= <1Ia;('t"); Phi2= <f>ue('t") ;

Phi3=l1> 'Z ('t"); Phi4=<f> 'Z 2('t"); Phi5=l1>e(f71)('t")U € u s

5.3 Modelo de Hammersteino processo não-linear do tipo Hammerstein de segunda ordemé descrito pelas equações abaixo,

xI(k+l) =O.8Xl(k)- X2(k)+ /[u(k)] (20)x2(k + 1)=O.15xI(k)+ O.3/ [u(k )]y(k)= xI(k)+d(k) (21)/[u]=u-0.9u2 +0.35u3 (22)

o ruído é simulado de maneira análoga ao da seção 5.1, apenasmodificando-se a variância para 0.3. O conjunto de treino éformado por 200 amostras coletadas para um sinal de entradaigual ao da equação (17).

A RNA utilizada é formada por "5 camadas de neurônios : a "primeira camada apresenta um único neurônio com funçãoativação identidade e função de saída do tipo linear comsaturação (saturação igual a 10); a segunda camada contemnove neurônios com função ativação identidade e função desaída do tipo tangente hiperbólica; a terceira camada apresentaum único neurônio com função ativação identidade e função desaída do tipo tangente hiperbólica; a quarta camada tem doisneurônios com função ativação do tipo equação a diferenças deprimeira ordem, onde a entrada do neurônio é afetada pelosestados de todos os outros neurônios dinâmicos, equações (18)e (19), e função de saída do tipo tangente hiperbólica ; a últimacamada tem um único neurônio com função ativaçãoidentidade e "função de saída do tipo linear com saturação(saturação igual aIO).

( " \ ' \ I

V Jl O t iO 200

Inl tl.ntl d. AmOllflg.m

Figura 10 - RNA após aprendizado para o modelo deHammerstein

I I I I40 !O 120 180

InstantadI Amostragam

I'"

Figura 8 - RNA após aprendizado para o modelo de Wiener

200

Page 5: À REDE NEURAL COM DINÂMICA INTERNA - fei.edu.br · onde k é o instante de amostragem, A é de dinâmica nx n, B éo v r entradanxl, u(k) é de entrada , x(k) éo vetor de estados

40. SBAI- Simpósio Brasileiro de Automação Inteligente, São Paulo, SP, 08-10 de Setembro de 1999

(31)

(30)'EB" ,EO - - - ;;oB----Q. - ll... - - - ---

.20) .100 o 100 200 ..200 ·UI) o 100 200;;:8--- -Q,. - - -- o. - -- - . - - -

.100 o 100 200 -HO o 100 200

-----.-a.. - - .__ .-

-,o 50 UJJ 1Sl 200

Figura 11 - Funções Correlaçõe: Phil=<I>a:(T); Phi2=<I>u,(T);Phi3=<I> ; (T); Phi4=<1> Z 2(T); Phi5=<I>..I )(T)

U E U e "Dl

Como nos casos anteriores, a identificação se deu em duasetapas : treinamento e cálculo da estimativa das funçõescorrelações amostradas. A figura 10 mostra o comportamentoda RNA após o treinamento (7074 iterações) e a figura 11mostra a estimativa das funções correlações cruzadas.

5.4 " Modelo de Wiener-Hammersteino processo não-linear do tipo Wiener-Hammersteinde segundaordem é descrito abaixo,

xl (k +1) =o.8xfck) -:Xi (k)+u(k) (23)xi (k + 1) =O.15x f (k )+03u(k) .

y l (k) = J(r:) (24)

j(x:)= xl - ]2 +o.3skP. (25)

outros neurônios dinâmicos, equações (30) e (31), e função desaída do tipo tangente hiperbólica;

xl 2(k+I)=a112xI2(k)+allx/(k)+lletI2(k)X22(k+ I) = a212Xl2(k)+a222x22(k)+ llet22(k)

A ="[aI12 all ]2 2 2a21 a22

a última camada tem uni único neurônio com função ativaçãoidentidade e função de saída do tipo linear com saturação (nívelda saturação igual alO).

Como nos casos anteriores, a identificação se deu em duasetapas : treinamento e cálculo da estimativa das funçõescorrelações amostradas. A figura 12 mostra o comportamentoda RNA após o treinamento (2 iterações) e a figura 13 mostra aestimativa das funções correlações cruzadas.

1.0 Sinal d. Sa lda do ProCfSSO(_ ) • Sinal da Sald. da RNAI )

tO 120lnstan le de

Figura 12 • RNA após aprendizado para o modelo deWieIier-Hammerstein

a terceira camada apresenta um único neurônio com funçãoativação identidade e função de saída do tipo tangentehiperbólica; a quarta camada contem seis neurônios comfunção ativação identidade e função de saída do tipo tangentehiperbólica; a quinta camada apresenta um único neurônio comfunção ativação identidade e função de saída do tipo tangentehip.erbólica; a sexta camada tem dois neurônios com funçãoativação do tipo equação a diferenças de primeira ordem, ondea entrada do neurônio é afetada pelos estados de todos os

o ruído é simulado de forma análoga ao da seção 5.2 . Oconjunto de treino é igual ao da seção 5.3 .

A RNA utilizada é formada por 7 camadas de neurônios : aprimeira camada apresenta um único neurônio com funçãoativação identidade e função de saída do tipo linear comsaturação (saturação igual a 10); a segunda camada tem doisneurônios com função ativação do tipo equação a diferenças deprimeira ordem, onde a entrada do neurônio é afetada pelosestados de todos os outros neurônios dinâmicos, equações (28)"e (29), e função de saída do tipo tangente;

x/(k+l) =alI1xl1(k)+a121X21(k)+net/(k) (28)X21(k+ I) = a 211xi I (k)+a221X21(k)+net21(k)

A =[aIl1 a 121] (29)1 1 1

a21 a22

x f (k +1) /(k)

+ I)

y (k) = x[(k) +d(k )

(26)

(27)--- ----0.. - o. . _. _._-

4-200 -100 o 100 200 -200 .100 o 100 200

·200 .ico o 100 200 .200 _100 o 100 200

0. . • - - - _. _ --

.,50 tOO 150 200

Figura 13 • Funções Correlações: Phil=<I>,,(T);Phi2=<1lu,(T) ;Phi3=<I> z (T)ÕPhi4=1Il Z 2(T) ;Phi5=<I>E(&)(T)

U E u E

6 DISCUSSÃOOs resultados apresentados demostram a utilidade deste novomodelo neural para a identificação dos importantes sistemasorientados a blocos. O teste de validação, embora na literaturatenha sido utilizado apenas para modelos neurais com dinâmicaexterna, também é adequado para redes com dinâmica interna.As pequenas discrepâncias encontradas em algumas funções<I>'s são irrelevantes devido ao pequeno número de pontos forado intervalo de confiança. É conveniente lembrar que emborana tarefa de identificação do processo não-linear feito pela redeneural com dinâmica interna, envolva o aprendizado porexemplos, . para que este modelo possa ser utilizado compresteza é necessário algum conhecimento sobre o processo a

201

Page 6: À REDE NEURAL COM DINÂMICA INTERNA - fei.edu.br · onde k é o instante de amostragem, A é de dinâmica nx n, B éo v r entradanxl, u(k) é de entrada , x(k) éo vetor de estados

40. SBAI - Simpósio Brasileiro de Automação Inteligente, SãoPaulo,SP, 08-10 de Setembrode 1999

ser identificado. Esta necessidade de conhecimento se faz em Greblick.i, W. (1992) . Nonpararnetric Identification of Wieneraplicações que envolvam redes neurais ou em outras Systems. IEEE Trans. on Infonnation The01Y, VoI. 38,abordagens para a identificação de processos dinâmicos No. 5, pp. 1487-1493.(Ninnes e Goodwin, 1995).

7 REFERÊNCIASBIBLIOGRÁFICASSjõberg J. (1995) . Non-Linear System Identification with

Neural Networks. Ph.D Thesis, Department ofElectricalEngineering, Linkõping University, Sweden.

Schetzen, M. (1980). The Volterra and-Wiener Theories ofNonlinear Series.Wiley, NY.

Billings, S. A and S. Chen (1995) . Chaper 11- NeuralNetworks and System Identification. In G. W. Irwin, K.Warwick and K. J. Hunt (ed.), Neural NetworksApplication in Control. pp. 229--251, IEE ControlEngineering Series 53, The Institution of ElectricalEngineers, London, United Kingdom.

Dunoyer, A, L. Balmer, K. J. Burnham and D: J. G. Jarnes(1997) . On the Discretization of Single-Input Single-Output Bilinear Systems . Int. J. Control, VoI. 68, No. 2,pp.361-372.

Liu, X. and S. Celikovsky (1997) . Feedback Control of AffineNonlinear. Singular Control Systems. Int. J. Control,VoI. 68, No. 4, pp . 753--774.

BiIlings , S. A and S. Y. Fakhouri (1978). Identification of aClass of Nonl inear Systems using Correlation Analysis .Proc. IEE, 125, pp. 691-697.

Sbárbaro, D. and T. A Johansen (1997). Multiple localLeguerre models for modelling nonlinear dynamicsystems of the Wiener class. IEE Proc.-Control TheoryAppl.,VoI. 144, No. 5, pp. 375-380.

Âstrõm, K. J. and B. Wittenmark (1995) . Adaptive Control,CA: Addison-Wesley, NY.

Haber , R. and H. Unbenhauen (1990). Structure Identificationon Nonlinear Dynamic Systems - A Survey .of Input-Output Approaches. Automatica, VoI. 26, No. 4, pp.651-677.

Bai, E.-W. (1998) . An Optimal Two-Stage IdentifieationAlgorithm for Hammerstein-Wiener Nonlinear Systems .Automatica, VoI. 34, No. 3,pp. 333--338.

Pajunen, G. (1994) . Application of Model Reference AdaptiveTechnique to the Identification and Control of Wienertype Nonlinear Processes. Doetoral Dissertation,Depart. of Electrical Engineering, Helsink University ofTechnology, Helsink, Finland.

Zhang, Y. K. and E. W. Bai (1996) . Simulation of SpringDischarge from a Limestone Aquifer in Iowa.Hydrogeol. J., VaI. 4, pp. 41-54.

Doeblin, E. O. (1983). Measunnent Systems .McGraw HiIl Int.,Auckland, New Zealand. .

Rangan, S., G. Wolodk.in and K. Poulla (1995) . IdentificationMethods for Hammerstein Systems. Proc. CDC, pp.697-702, New Orleans.

202

De Azevedo F. M. (1997) . Uma Proposta de Modelos Formaisde Neurônios e Redes Neurais. Anais do III CongressoBrasileiro de Redes Neurais, pp. 140-140,Florianópolis, SC.

De Oliveira, R. C. L., F. M. De Azevedo e J. M. Barreto(1997). Identificação Neural Não-Linear UtilizandoNeurônios Dinâmicos. Anais do lI! Simpósio Brasileirode Automação Inteligente - Ill SBA!, Vitória, ES , pp.418--423.

Al-Duwaish, H., M. N. Karim and V. Chandrasekar (1996).Use of Multilayer Feedforward Neural Networks inIdentification and Control of Wiener ModeI. IEE Proe.-Control Theory Appl., VaI. 143, No. 3, pp. 255-258.

Ninnes , B. and G. C. Goodwin (1995) . Estimation of ModelQuality. Automatica, VaI. 31, No. 12, pp. 1771-1797.