当前位置: 首页 > 期刊 > 《心理科学进展》 > 2008年第5期
编号:11685085
反馈负波及其理论解释(2)
http://www.100md.com 2008年10月1日 《心理科学进展》 2008年第5期
     3.1 强化学习理论

    Miltner等人认为这种错误反馈诱发的负偏向可能反映的是一个错误觉察机制。这种机制不局限于特定任务和特定的错误,可以由对不同的错误处理而激活,如选择反应时任务中错误的选择、Go-NoGo任务中错误的动作、或在他们研究中错误的时间估计等。Holroyd等人发展了Milmer等的观点,他们认为错误相关负波是当负性强化学习的信号通过中脑多巴胺系统传输到ACC时产生的,并且这种信号被ACc用来调整当前的行为。具体的过程是:基底神经节参与评价当前的事物,如果错误的行为反应造成的当前事件比期望差,多巴胺神经细胞就会引起相位减弱的活动,多巴胺系统将这些信息传输到ACC,由于多巴胺能的减弱不能抑制ACC上神经元的活动,此时就产生了较大波幅的脑电负波,如果当前事件比期望的要好,中脑多巴胺神经细胞就会引起相位增加的活动,此时在ACC上就不能产生脑电负向偏转。基底神经节就把这样两种信息分别利用并调整对下一次结果的预期,因此系统就逐渐地学会对奖赏和惩罚的早期预警。同时,多巴胺信号都被用做强化学习的信号传输到前额叶运动皮层,寻求合适的行为的调整。

    对于这几个不同的认知加工阶段,都有很多直接或间接的实验支持。本文从以下方面阐述了关于这个理论的实验支持。

    第一,评价系统是按照二元分类的规律来将当前的事件分成“好”和“坏”两种结果 ......
上一页1 2 3下一页

您现在查看是摘要页,全文长 5168 字符