(三)强化的程序
强化程序(schedule of reinforcement)是指在建立操作条件反应时,对反应进行强化的不同方式。
根据强化的组织和实施方式不同,可以把强化程序分为连续强化(continuous reinforcement)和间歇强化(intermittent reinforcement)。连续强化是对有机体的每一次正确反应都给予强化。但是在日常生活中,并不是每次做出操作条件反应以后都会获得奖赏(强化)的,绝大多数时候我们只获得部分奖赏(强化)。正如斯金纳所言:“当我们去溜冰或滑雪时,我们并不是总能找到好的冰地或雪地;当我们打电话给朋友时,朋友并不是总在家。因此,在工业和教育方面,几乎总是以间歇强化为其特征的。”所以,斯金纳着重研究了间歇强化。
所谓间歇强化又称部分强化(partial reinforcement),是根据一定的反应次数决定的比例或时间间隔给以强化。因此,间歇强化可以分为间隔强化(interval reinforcement)和比率强化(ratio reinforcement)。
间隔强化根据时间间隔的安排,又可以分为固定时距强化(或定时强化fixed-interval reinforcement,简称FI)和变动时距强化(或可变间隔强化variable-interval reinforcement,简称VI)。固定时距强化指按照一定的固定时间间隔,对操作反应实施强化,如每隔5分钟或20分钟给予一次强化,而不管有机体在这一段时间内做出了多少反应。例如每工作3小时付给酬劳100元,便是一种固定时距强化。在动物实验中发现,强化的时间间隔越短,动物的反应越快;时间间隔越长,动物的反应越慢。另外,反应的频率随着接近强化点时间的长短而不同,开始时反应的频率很低,甚至不出现反应,而越接近强化的时间点,反应越快。由此我们可以明白为什么计时付工资容易出现磨洋工现象。变动时距强化是指按照变化的时间间隔进行强化,如每40分钟内随机安排5次强化。例如,老板每隔一段时间给工人发红包,但每次间隔时间是不定的。由于不知道强化什么时候发生,就需要一直保持着某一种行为,因此,变动时距强化能够避免固定时距强化的弊端,有利于行为反应的保持。