Ma q Boltzmann

Máquina de BoltzmannFundamentos e aplicações

Aprendizado de Máquina

Lídia Bononi Paiva Tomaz

Referências• Redes Neurais: Princípios e Práticas

▫Simon Haykin

• Pattern Classification:▫Richard O. Duda▫Petter E. Hart▫David G. Stork

• Inteligência Artificial▫Stuart Russell▫Peter Norvig

Tópicos

•Definição•Redes Neurais Recorrentes•Modelo Estocástico de um Neurônio•Características da Máquina de Boltzmann•Neurônios da Máquina de Boltzmann•Recozimento Simulado•Aprendizado de Boltzmann•Aplicações

Definição

•A Máquina de Boltzmann é um tipo de redes neurais recorrentes estocásticas inventadas por Geoffrey Hinton e Terry Sejnowski - 1986

Redes Neurais Recorrentes

•São redes neurais com um ou mais laços de realimentação.

Modelo Estocástico de um neurônio•Permite-se que um neurônio assuma

apenas um de dois estados:▫+1 para o estado “ligado”▫- 1 para o estado “desligado”

•A decisão de mudar o estado do neurônio é probabilística.

Características•Utiliza conexões sinápticas simétricas em

seus neurônios:▫A conexão sináptica simétrica do neurônio i

para o neurônio j é representada por wij, comwij = wji para todo (i,j)

•Possui uma função de energia E cujo seu valor é determinado pelos estados particulares ocupados pelos neurônios individuais da máquina.

Função de energia

E = função de energiaxj = estado do neurônio j;w kj = peso sináptico conectando o neurônio j ao neurônio k;j ≠ k = significa que nenhum dos neurônios da máquina tem auto-realimentação

Neurônios da Máquina de Boltzmann

•Se dividem em dois grupos funcionais:▫visíveis e ocultos.

•Neurônios visíveis:▫Fornecem uma interface entre a rede e o

ambiente no qual ela opera.▫Durante a fase de treinamento da rede

(aprendizagem supervisionada), os neurônios visíveis estão todos presos a estados específicos determinados pelo ambiente.

•Neurônios ocultos▫Sempre operam livremente▫São usados para explicar as restrições

subjacentes contidas nos vetores de entrada do ambiente.

Mínimo global

Se tomarmos uma caixa contendo uma paisagem e uma bola de gude, poderíamos começar agitando o caixa vigorosamente no início e depois, gradualmente, reduzir a quantidade de agitação. A idéia é que em qualquer período, deve haver apenas a energia suficiente na caixa para agitar a bolinha para a cavidade mais profunda.

Recozimento Simulado• Tem por objetivo convergir a função para um mínimo

global.

• Se diferencia dos algoritmos de otimização por que:▫ Não fica preso necessariamente em mínimos locais, pois é

sempre possível uma transição para fora de um mínimo local quando o sistema opera a uma temperatura diferente de zero.

▫ O recozimento simulado é adaptativo no sentido de que as características grosseiras do estado final do sistema são vistas a altas temperaturas, enquanto que os detalhes finos do estado aparecem em temperaturas muito baixas.

Recozimento simulado•Valor inicial da temperatura T é escolhido

suficientemente alto;

•T não é uma temperatura física (pseudotemperatura);

•Em geral a função de decremento é definida por:▫Tk = αTk-1, k = 1, 2, ...▫onde α é uma constante menor que, mas

próxima, à unidade como 0,8 e 0,99.

Aprendizado de Boltzmann

•Tipo de aprendizado:▫Não supervisionado▫Supervisionado

Aprendizagem de Boltzmann

•Consiste em duas fases:▫Fase positiva:

Nesta fase a rede opera na sua condição presa, isto é, os neurônios visíveis estão todos presos a estados específicos determinados pelo ambiente.

▫Fase negativa: Nesta segunda fase, é permitido que todos os

neurônios (visíveis e ocultos) operem livremente.

•Operação:▫Escolha aleatória de um neurônio (j);

▫Altera-se o estado do neurônio de sj para –sj em alguma temperatura T, com probabilidade dada por:

•∆E = Variação de energia da máquina resultante da troca realizada pela função de energia:

∆Ej = ∑k wjksk

•T = temperatura

Exemplo

0,2 0,3

Exemplo

0,2 0,3

w11 w12 w13w21 w22 w23w31 w32 w33

Exemplo

0,2 0,3

w11 w12 w13w21 w22 w23w31 w32 w33

0 0,2 0,30,2 0 0,40,3 0,4 0

Exemplo

0,2 0,3

w11 w12 w13w21 w22 w23w31 w32 w33

0 0,2 0,30,2 0 0,40,3 0,4 0

Temperatura: 10 α=0.8 p >= 0.5 = 1; p < 0.5 = -1

Exemplo

•Para neurônio 1:

•∆E1 = ((0,2 * 1) + (0, 3 * (-1))) = -0,1

•p1 = (1/(1+exp(-(-0,1)/10) ))= 0,4975

•p1 < 0,5 logo o estado do neurônio 1 é -1.

Exemplo

0,2 0,3

w11 w12 w13w21 w22 w23w31 w32 w33

0 0,2 0,30,2 0 0,40,3 0,4 0

Temperatura: 8 p >= 0.5 = 1; p < 0.5 = -1

Exemplo

•∆E2 = ((0,2 * (-1)) + (0, 3 * (-1))) = -0,6

•p2 = (1/(1+exp(-(-0,6)/8) ))= 0,4812

Exemplo

0,2 0,3

w11 w12 w13w21 w22 w23w31 w32 w33

0 0,2 0,30,2 0 0,40,3 0,4 0

Temperatura: 6,4 p >= 0.5 = 1; p < 0.5 = -1

Exemplo

•∆E3 = ((0,2 * (-1)) + (0, 3 * (-1))) = -0,7

•p2 = (1/(1+exp(-(-0,7)/6,4) ))= 0,4726

Exemplo

•Se a rede executar por tempo suficiente, alcançara um ponto de baixa energia chamado ponto de equilíbrio térmico.

•Pode-se estimar a distribuição de probabilidade sobre as unidades visíveis, na fase em que a rede executa livremente, calculando as atividades médias < S > de todas as unidades visíveis.

Aprendizado de Boltzmann

•Distância de Kullback-Leibler:

•onde ▫Pα – distribuição dos neurônios visíveis▫Pβ – distribuição dos neurônios ocultos

Aprendizado de Boltzmann• Para aproximar as distribuições de

probabilidades Pα e Pβ, basta minimizar a função G:

• onde▫<sisj>+ (probabilidade dos neurônios i e j

estarem ativos)▫<sisj>- (probabilidade dos neurônios i e j

estarem inativos )

•Variação dos pesos:▫Suponha que pjk

- represente a correlação entre os estados dos neurônios j e k, com a rede na sua condição presa.

▫Suponha que pjk+ represente a correlação

entre os estados dos neurônios j e k, com a rede na sua condição livre.

•A variação ∆ωkj aplicada ao peso sináptico ωkj do neurônio j para o neurônio K é definada por (Hinton e Sejnowski, 1986)

∆ωkj = η(ρkj- - pkj

+), j≠k

•η = taxa de aprendizagem•ρkj

- e pkj+ assumem valores entre -1 e +1.

Algoritmo

1. Atribuir valores iniciais aos pesos que reflitam o problema;

2. Atribua valor à constante de redução de temperatura (preferencialmente entre 0.8 e 0.99);

3. Atribuir valor inicial à temperatura;

4. Atribuir valores aleatórios aos nós (0,1 ou -1,1);

5. Aplicar a fase “presa” a partir da fórmula de probabilidade;

6. Aplicar a fase “livre” a partir da fórmula de probabilidade;

7. Ajustar os pesos sinápticos;

8. Ajustar a temperatura;

9. Repetir os passos 5-8 até a temperatura chegar perto de 0 (zero)1. Deixar que o sistema atinja um equilíbrio;2. Um mínimo global deve ter sido encontrado.

Desvantagem

•Caso a redução da temperatura seja pequena (desejável) a fase de treinamento fica muito lenta.

Aplicações

•Reconhecimento de padrões

•Problemas de otimização

•Exemplos:▫ http://lotsacode.wordpress.com/2010/09/14/sharprb

m-restricted-boltzmann-machines-in-c-net/

Resumo• Rede neural recorrente, onde cada nó é conectado a

outro, mas não a si mesmo;

• Nós têm saída binária (1 ou-1 / 0 ou 1);

• Os pesos são simétricos;

• A rede é constituída de nós visíveis e ocultos;

• A aprendizagem pode ser supervisionada ou não supervisionada;

• A ativação do nó é estocástico.

Ma q Boltzmann

Documents

Transcript of Ma q Boltzmann

industry.macaotourism.gov.mo · o to Q 00 Q to to 00 Q to Z Z O to to O O Z Q O Z tri O Q tri 00 O Z o Q . a Z Q Z Q Q o Z Q Q O Z o N O Q O o Q O O o O O O O O O c O o O O opeppu

MINISTÉRIO DO MEIO AMBIENTE Lima Campos, MA 38, Itapecuru Mirim, MA 39, Bacabeira, MA 40, Cantanhede, MA 41, Pirapemas, MA 42, Rosário, MA 43, Fortuna, MA 44, Senador Alexandre Costa,

Andando - estudosdabiblia.net que isso significa ... O Proceder dos Peregrinos A o m esmo t empo que Pe dr o no s cha ma à ... E n q uto lg ém te tafaze r o ecredi D s q r q ...

U M G RUPO, U MA S OLUÇÃO ! I NDÚSTRIAS A LIMENTAR & B EBIDAS Q UÍMICA, C OSMÉTICA E V ITIVINÍCOLA A PRESENTAÇÃO C ORPORATIVA.

Ecuacion de Boltzmann de discos r´ ´ıgidos auto-impulsados ... · Descriptores: Teor´ıa cin ´etica; movimiento Browniano; sistemas auto-organizados. We present a Boltzmann kinetic

2.c Criterios-18-05 - laboratoriodematematica.weebly.com · Q A Q Q Q A Q Q Q Q Q Q P A P AP A P A P Resposta: Ficaram 8 tostas sem nada. (Há evidência de que o aluno identifica

Confira a autenticidade no endereço ...sindconstrucivilsaoluisma.com.br/media/arquivos/... Batista/MA, São José De Ribamar/MA, São Luís/MA, São Vicente Ferrer/MA, Tutóia/MA,

Bogor Agricultural University (IPB) · 2020. 10. 13. · Cryer (2008) merumuskan beberapa model umum ARIMA sebagai berikut : Model ARIMA (0,0,q) atau MA(q) ... adalah barisan sebaran

ENTRAR // ENTER NEWSLETTER€¦ · NEWS. LETTER. DEZEMBRO // DECEMBER. q q q p q p p p q p q p. ICA Vertical.tif. NEWS. LETTER. DEZEMBRO // DECEMBER. q q q p p p p p p p q p. ICA

resultado professor auxiliar 01 - parnamirim.pe.gov.br · Colocação 39 82 11 Q 14 Q 15 Q 16 Q 172 209 22 Q 23 g 27g 32 Q 35 Q Secretaria Municipal de EDUCAÇÅO Parnamirim - PE

III. CONDUTORES (Modelo de Sommerfeld ). 3.1 Distribuições Estatísticas Maxwell-Boltzmann Fermi-Dirac Em equilíbrio: = E F Energia [eV] (*)

COMUNIDADES IDENTIFICADAS - palmares.gov.br · MA Mirinzal 2106805 Aranha MA Mirinzal 2106805 Brasilia MA Mirinzal 2106805 Currupira MA Mirinzal 2106805 Deserto MA Mirinzal 2106805

Avaliação do Método de Lattice Boltzmann aplicado a ...

P rog ra ma 2 3 ma io 2 4 ma io 2 5 ma io - icm.ft.lisboa ...icm.ft.lisboa.ucp.pt/resources/Imagens/CITER/eventos/(23.05.2017) O... · P rog ra ma 2 3 ma io P rog ra ma 2 4 ma io

Q/Qmod Q (m 3/s) 4 - fenix.ciencias.ulisboa.pt · max +Q res Período com turbina-mento à plena carga, ou seja, com Qmax Período com turbinamento com Q tal que Q min Q Q max Qmin

Q U E I MA D U R A S - hu.ufsc.br · escarro carbonáceo, dispneia, queimadura das vibrissas, insuficiência respiratória (necessidade de intubação oro traqueal). C ... Oxigenação:

Lei de Radiação de Stefan-Boltzmann Experimentos de Física Quântica Turma 2014-1.

Máquina de Boltzmann Fundamentos e aplicações Aprendizado de Máquina Lídia Bononi Paiva Tomaz.

24 dias letivos D S T Q Q S S D S T Q Q S S D S T Q Q S S

EJEMPLO - IPN Curricular... · o o O o c 0 O O c Q o c O O o Q Q Q c o o Q Q Q o Q o o c Q o O m z o o . Created Date: 20200305110415Z