Aprendizagem e Recompensa
-
Upload
pamela-priscyla-deodato -
Category
Documents
-
view
128 -
download
0
Transcript of Aprendizagem e Recompensa
APRENDIZAGEM E RECOMPENSA
Dr. Flávio Freitas Barbosa
Aprendizagem
“mudança relativamente duradoura de comportamento resultante da experiência”.
Behaviorismo
J.B. Watson
Estudo da mente:
Não-científico
Apenas ambiente
E-R
Skinner
Condicionamento Clássico
Condicionamento Clássico
EI RI
EN + EI
EC RC
Condicionamento clássico: aversivo ao som
Contigüidade
Extinção
Recuperação espontânea
Generalização do estímulo
Condicionamento Clássico
Condicionamento de segunda ordem
EC1 EC2 RC
Mais do que contigüidade
Significado evolutivo
Prontidão biológica (fobias)
Perspectiva cognitiva
Predição e expectativa
Modelo de Rescorla-Wagner
Condicionamento operante
“é o processo de aprendizagem em que as conseqüências de uma ação determinam a
probabilidade de ela ser realizada no futuro”
Condicionamento operante
E. Thorndike
Lei do efeito
Associação entre um comportamento e sua
conseqüência REFORÇO
Ação + reforço positivo
Aumenta a freqüência da ação que gera o reforço
PUNIÇÃO a ação deixa de ser realizada
Ação + reforço negativo
Aumenta a freqüência da ação que evita o reforço
CONDICIONAMENTO OPERANTE
Condicionamento operante
Modelagem
Reforçar sucessivas aproximações
Reforços primários
Comida, água
Reforços secundários
Dinheiro, nota 10 (condic. Clássico)
Condicionamento operante
Limitações biológicas Predisposições inatas
Distinção aquisição-desempenho
Aprendizagem sem reforço
Mapas cognitivos (E. Tolman)
insight
Condicionamento operante
Mapas cognitivos
Figure 6: Error curves for HR, HNR, HNR-R.
Aprendizagem por observação
Aprendizagem por imitação
Modelação
Reforço vicário
Neurônios-espelho
Aprendizagem por observação
Aprendizagem por observação
Qual é a base biológica da recompensa?
Condicionamento Operante
Comportamento Espontâneo
Recompensa
Aumento
Estimulação elétrica cerebral
Auto-administração de drogas de abuso
Vias Dopaminérgicas
Teoria de D. Hebb (1949)
“When an axon of cell A is near enough to excite cell B and
repeatedly or persistently takes part in firing it, some growth
process or metabolic change takes place in one or both cells such
that A's efficiency, as one of the cells firing B, is increased.”
Ativação
Reverberação
Plasticidade
“traço”
dica
evocação
Teoria de D. Hebb (1949)
Reverberação no circuito
Plasticidade sináptica
Redes neurais distribuídas